以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  [分享]搜索引擎-原理、技术与系统【pdf格式】  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=76122)


--  作者:hongjunli
--  发布时间:7/22/2009 5:59:00 PM

--  [分享]搜索引擎-原理、技术与系统【pdf格式】
【内容简介】
本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和技术资料,对广大从事网络技术、Web站点的管理、数字图书馆、Web挖掘等研究和应用开发的科技人员也有很高的参考价值。
【目录信息】
前言
第一章引论
第一节 搜索引擎的概念
第二节 搜索引擎的发展历史
第三节 一些茂名的搜索引擎
第二章 WEB搜索引擎工作原理和体系结构
第一节 基本要求
第二节 见面搜集
第三节 预处理
第四节 查询服务
第五节 体系结构
第三章 WEB信息的搜集
第一节 引言
第二节 网页搜集
第三节 多道搜集程序并行工作
第四节 如何避免网页的重复搜集
第五节 如何首先搜集重要的网原则页
搜集
第七节 本章小结
第四章 对搜集信息
......


--  作者:jdz2008
--  发布时间:7/24/2009 3:49:00 PM

--  
这是好东西啊,找了好久了
--  作者:Humphrey
--  发布时间:7/27/2009 9:13:00 AM

--  
是全书的电子版,还是样章呢?
李大哥也研究搜索引擎?!太强了!!!
--  作者:jdz2008
--  发布时间:7/27/2009 8:15:00 PM

--  
你自己下的看下就知道了,楼主帖子的章节全都有。。非常好,网上很难找到的。我才刚接触搜索这方面,好多东西不懂。
--  作者:lfrebecca
--  发布时间:9/27/2009 10:12:00 PM

--  
正在看这本书
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
62.500ms