来源(久久网络-网络学堂)

From: http://www.99net.net/study/know/614111923.htm

搜索引擎学问多

--------------------------------------------------------------------------------
2003-4-10 16:54:00

搜索引擎应该是一个很老的概念,但在目前由于网络的不断成长,搜索引擎有了很大发展,目前主流发展趋势是:基于网站的搜索和基于网页的搜索,特别是后者开始被越来越多的网站重视,由此也诞生了不少专门负责搜索引擎支持的网络公司。以往的门户网站是以搜索为基础的,它们的搜索引擎一般是自行开发的对网站的搜索,搜出来的结果是网站,而目前许多网站开始与专业搜索引擎提供商合作推出了网页内容的搜索,搜出的结果是网页。下面我们以刚刚改版的新浪网搜索引擎为例,详细介绍一下搜索。

登录新浪搜索(http://search.sina.com.cn)后,你可以看到“分类检索”和“关键词查询”两种查找方法。

“分类检索”是从搜索首页按照树型的主题分类逐层点击来查找所需信息的方法。如果我们想看看小说,但又不是很明确具体是哪一部小说,就可以采用分类检索。在首页目录中点击“文学艺术”,再选“文学”目录点击进入,页面中列出的是文学目录的细分目录,下面列出的是属于文学目录的网站。文学的子目录“各类文学”中的“小说”目录。同样,这时页面上部列出的是小说目录的细分目录,下面列出的是属于小说目录的网站。

但是如果我们明确目的,只想找一部具体的小说,那就可以选择“关键词查询”方式进行搜索。关键词搜索结果分别是目录、网站、内容等,默认的是综合搜索,其包含的内容有目录、网站、内容、商品等,如果只要单独的一种结果, 新浪搜索首页的搜索框下边有一排选择按钮可供选择。在别的页面中则可在下拉框中加以选择。同时,为了便于查阅,查询字串以醒目的红色显示。

网页的相关检索功能:当使用关键词查询网页检索时,除得到相应的检索结果之外,还提供“相关检索”功能,它能大大提高搜索效率,减少找到有效信息所花费的时间。

搜索结果的排列顺序:检索结果是根据与查询要求相匹配的结果的质量来进行排列相关的分类目录和网站。质量越高,排列位置越靠前。其中新闻检索的结果是按日期排序,日期越新的新闻排列位置越靠前。

搜索论坛:网友如果在搜索过程中有什么问题、不便或者是心得,都可以到论坛中去寻求答案或进行交流。

免费代码:是新浪搜索直接向各网友提供的免费搜索代码,网友可以直接把代码放到自己的网页上,这样该网页上就有了一个功能强大的搜索工具。

网页搜索的工作原理

网页搜索起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章的每一个词,建立以词为单位的文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。

Link: http://www.asm32.net/article_details.aspx?id=649