首页 | 网站地图 | RSS订阅 | 高级搜索 | 收藏本站
默认搜索       热门关键字: lucene  nutch  eee  lucene索引维护  lucene+in+action
Google广告位置
Google AD
当前位置:搜索引擎>搜索引擎技术> 正文

  • 搜索引擎技术学习
  • 日期:2007-12-03   点击:   作者:   来源:   字体:[ ]
好久没有来csdn博客了,这都成了荒地。

       好久没有敲键盘写程序了,时间都沉寂在激烈的游戏里。

       好多同学、好友保研,找到适合的工作了,而我却在以考研的名义逃避。

       一个二流学校的学生,怀着对计算机的一丝希冀,渴望着以后的鹊起。

      感叹完了。开始正题。

      半年前偶尔的机会看到一本关于Lucene的书,当时还不知道它是什么东东呢。只知道它和java相关,是用java开发的(当时对java有强烈的兴趣,凡是和java相关的东西都会看看)。前几日,在图书馆逛的时候,又看到这本书Lucene in Action。心血来潮,随手翻了翻。

       这才知道原来Lucene是关于搜索引擎的。翻着翻着,慢慢的对他就来了兴趣。可不是嘛?平日里上网用的最多的就是Google这个巨型搜索引擎了,且一直觉着它有着不能言语的神秘。要知道,能在40B网页里在1秒内就返回搜索结果,这可不是瞎整的。

      从图书馆出来,回到宿舍上网Google。了解到原来Lucene是一个全文检索的函数库,可用来做网站站内索引和搜索。而Lucene的作者,Doug,开发的另一个项目,Nutch,才可算是一个真正的搜索引擎的应用程序。csdn上有一篇文章将这个的:Nutch 0.8笔记--Google式的搜索引擎实现 。这时才发现,原来搜索技术已经早火了很久了,我等还是落后闭塞了啊。

     随后,又看了两篇关于Google的论文:The Anatomy of a Large-Scale Hypertextual Web Search EngineThe Google File System< ,极大的开了眼界大受裨益。还有一本国内研究搜索引擎的书:搜索引擎原理、技术与系统 。另外对于java开发人员,邱哲等人写的《开发自己的搜索引擎Lucene2.0+Heritrix 》也是一本不错的书,我受它启发很深。

      现在开始对搜索技术有个大概的轮廓了,于是想趁着学习之余,在自己的电脑上搭一个小型搜索系统的平台。希望可以进一步学习和加深搜索技术,并将之应用于实践!

     就以此篇随笔为开始,向未知领域进军吧!


所有评论 关闭窗口↓ 打印本页 论坛讨论 返回列表
用户名: 新注册) 密码: 匿名评论 [所有评论]

评论内容:(不能超过250字,请自觉遵守互联网相关政策法规。

最新评论: