搜索引擎大致由哪三个部分组成

搜索引擎大致由搜索系统、索引系统、检索系统三个部分组成。搜索系统用于用来自动爬行和抓取网页;索引系统的主要功能是理解搜索器所采集的网页信息,并从中抽取索引项;检索系统的功能是快速查找文档,进行文档与查询的相关度评价,对要输出的结果进行排序。

本教程操作环境:windows10系统、Dell G3电脑。

所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。

搜索引擎大致由搜索系统、索引系统、检索系统三个部分组成。

1、搜索系统--搜索器:

搜索器也叫网络蜘蛛,是搜索引擎用来爬行和抓取网页的一个自动程序,在系统后台不停歇地在互联网各个节点爬行,在爬行过程中尽可能快的发现和抓取网页。

2、索引系统--索引器:

它的主要功能是理解搜索器所采集的网页信息,并从中抽取索引项。

3、检索系统--检索器:

其功能是快速查找文档,进行文档与查询的相关度评价,对要输出的结果进行排序。

搜索引擎的工作过程,一般分为五个步骤:

(1)从互联网上抓取网页,利用能够从互联网上自动收集网页的网络蜘蛛程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

(2)由网页分析程序对收集回来的网页进行分析,提取相关网页信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度。

(3)然后用这些相关信息建立网页索引数据库。

(4)用户通过查询接口输入查询条件,检索程序在索引数据库中检索,从网页索引数据库中找到符合该关键词的所有相关网页。

(5)页面生成系统将搜索结果的链接地址和摘要等内容组织起来返回给用户。

以上就是搜索引擎大致由哪三个部分组成的详细内容,更多请关注html中文网其它相关文章!

赞(0) 打赏
未经允许不得转载:html中文网首页 » 其他答疑

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

前端开发相关广告投放 更专业 更精准

联系我们

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏