新闻
打造企业生态系统孵化器  建设企业智慧成长生态城

呼和浩特网站制作|特别的数据库

发布于:2013-07-11 浏览:3005

 

迄今为止,蜘蛛程序已经爬过了网页,搜索引擎已经分析了网页的标记和文本。下一步是创建搜索索引库,一个特别设计的数据库,搜索引擎用它来为任何搜索请求快速查找匹配的网页。

 

 一个搜索引擎“想起”什么词在哪个网页,是通过把词和网页存储在搜索索引库中。在最简单情况,一个搜索索引库有一个含有每一个词的记录,跟着是含有这个词的所有网页的列表。因此,当在百度搜索“呼和浩特网站制作的时候,百度搜索引擎查看它的索引库,先找到“呼和浩特网站制作”的记录,再找到网页的列表。

 

当一个搜索引擎正在创建搜索索引库,它检查蜘蛛程序发现的每个网页中那些独特的词,检查每一个词是否已在索引库中存有记录。如果有记录,就在记录的末尾加上这个网页的网址(URL)如果没有记录,那么一个包含有那个网址的新记录被创建。现在,实际的网址会占据索引库的大量空间,因此搜索引擎将每个网址转换成一个独特的数字,也存储在索引库中。

 

搜索引擎额外地储存关于每个页面的元数据。用以显示搜索结果。因此,它存储了网址,标题,和任何必要的信息摘要(能够显示出哪里找到的搜索项)这样,当这条记录需要被显示为搜索结果的时候,所有的信息已经在其索引中了。

行业新闻http://www.nmgf.net/TradeList.html