当前位置:  软件>java软件

搜索引擎 Nutch

    来源:    发布时间:2015-02-25

    本文导语:  Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成...

搜索引擎 Nutch[图片]

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然 不利于广大Internet用户.

Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码 搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, 而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的 费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有 动机去扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.

Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. 为了完成这一宏伟的目标, Nutch必须能够做到:

  • 每个月取几十亿网页

  • 为这些网页维护一个索引

  • 对索引文件进行每秒上千次的搜索

  • 提供高质量的搜索结果

  • 以最小的成本运作

在线Javadoc:http://www.ostools.net/apidocs/apidoc?api=nutch2.0


    
 
 

您可能感兴趣的文章:

  • 让Discuz使用Sphinx搜索引擎 DZwithSphinx
  • PHP搜索引擎 Yioop!
  • PHP的Web爬虫和搜索引擎 PhpDig
  • 搜索引擎 Compass
  • 互联网搜索引擎 ALTSE
  • 搜索引擎优化工具 Seo Panel
  • 嵌入式全文搜索引擎 Senna Search
  • 企业搜索引擎 Kneobase
  • 结构化数据的搜索引擎 Argos
  • 搜索引擎 luyfsearch
  • 分类搜索引擎接口 Psearch
  • 程序代码搜索引擎 Krugle
  • 搜索引擎是怎么工作的?
  • 桌面搜索引擎 Terrier
  • 搜索引擎平台 Hawk
  • 垂直搜索引擎 DDH
  • 搜索引擎 DataparkSearch
  • XML搜索引擎 XQEngine
  • 中文搜索引擎 zh-solr-se
  • 企业搜索引擎 Searchdaimon ES
  • android将搜索引擎设置为中国雅虎无法搜索问题解决方法
  • 开源互联网搜索引擎 ASPSeek
  • 文本搜索引擎 Zend Search Lucene
  • 搜索引擎 Summa
  • Wordpress的搜索引擎 wp-spp
  • JavaScript 搜索引擎 lunr.js
  • 谁有关于web搜索引擎的程序?
  • 后台C语言程序(搜索引擎模块) 如何和前台页面交互??? iis7站长之家
  • 迅搜全文搜索引擎 XunSearch
  • 桌面图片搜索引擎 imgSeek
  • 全文搜索引擎库 Apache Lucy
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • 送分:redhat linux 9.0运行天网搜索引擎TSE
  • 全文本搜索引擎 Egothor
  • Eclipse搜索引擎网页应用接口
  • 抢分:RedHat linux 9.0下如何运行天网搜索引擎
  • 代码搜索引擎 i.So.Code
  • PHP搜索引擎 SimpleSearch
  • 谁知道现在有没有Linux下的搜索引擎?
  • 谁知道现在有没有Linux下的搜索引擎??
  • SVN库搜索引擎 SupoSE
  • 实时分布式搜索引擎 Solandra
  • 图片搜索引擎 IMAGE-R3
  • 关于天网搜索引擎TSE的编译问题
  • php记录搜索引擎进网站的关键词
  • 搜索引擎 FlashDB
  • apache禁止搜索引擎收录、网络爬虫采集的配置方法
  • 后台C语言程序(搜索引擎模块) 如何和前台页面交互???
  • Redis加Node.js的全文搜索引擎 Reds
  • 基于lucene 4.3的知识图谱搜索引擎XunTa (一种用"知识点"来找人的搜人引擎)
  • MySQL全文搜索引擎 mysqlcft
  • PHP统计nginx访问日志中的搜索引擎抓取404链接页面路径


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3