当前位置:  软件>java软件

Web爬虫程序 CrawlZilla

    来源:    发布时间:2015-02-12

    本文导语:  crawlzilla 是一個幫你輕鬆建立搜尋引擎的自由軟體,有了它,你就不用依靠商業公司的收尋引擎,也不用再煩惱公司內部網站資料索引的問題 由 nutch 專案為核心,並整合更多相關套件,並開發設計安裝與管理UI,讓使用者更...

Web爬虫程序 CrawlZilla[图片]

  • crawlzilla 是一個幫你輕鬆建立搜尋引擎的自由軟體,有了它,你就不用依靠商業公司的收尋引擎,也不用再煩惱公司內部網站資料索引的問題
  • 由 nutch 專案為核心,並整合更多相關套件,並開發設計安裝與管理UI,讓使用者更方便上手。
  • crawlzilla 除了爬取基本的 html 檔外,還能分析網頁上的檔案,如( doc、pdf、ppt、ooo、rss )等多種文件格式,讓你的搜尋引擎不只是網頁搜尋引擎,而是網站的完整資料索引庫
  • 擁有中文分詞能力,讓你的搜尋更精準
  • crawlzilla的特色與目標,最主要就是提供使用者一個方便好用易安裝的搜尋平台,詳細可以看這裡
  • crawlzilla 使用 apache license 2.0 授權,有興趣的使用者可下載其原始碼來修改符合自己需求的自由或商業搜尋引擎

    
 
 
 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • C#取得Web程序和非Web程序的根目录的N种取法总结
  • 用jsp编写web程序到底和java serverlet编写web程序有和区别
  • 用Java开发web程序,用什么做web服务器最好?
  • Java™ Web 应用程序框架 Sitebricks
  • Web应用程序框架 Tapestry
  • Web安全测试代理程序 Acidproxy
  • 请教在linux下用什么编写web程序比较方便?
  • 救命呀。web server程序
  • C# 获取(非)Web程序根目录的可用方法
  • 桌面Web应用程序引擎 HAE
  • Web日志分析程序 Analog
  • Web 流量分析程序 TraceWatch
  • 基于Web的投票程序 ActionPoll
  • Web测验程序 jQuizMe
  • 寻求linux命令行程序远程web界面的制作方法
  • 热点调查:请问你们公司用什么团队开发工具开发Web程序的?
  • 高性能web代理程序 hyk-proxy
  • Web应用程序扫描器评估工具 wavsep
  • WEB程序如何定位文件?
  • 用UltraEdit打开tomcat的server.xml或web.xml或自己程序的web.xml,修改保存完毕后,总是弹出错误提示:"0x70c70c99"指令引用的"0x00000008"
  • 网页版爬虫 spider-web iis7站长之家
  • aria2的Web接口 a2web
  • Python3通过request.urlopen实现Web网页图片下载
  • SVN的Web管理界面 svn-web-admin
  • Web前端设计:Html强制不换行<nobr>标签用法代码示例
  • 嵌入式的Scala Web服务器 SOCKO WEB
  • Web前端开发如何利用css样式来控制Html中的h1/h2/h3标签不换行
  • Web相册 Dumi Web Gallery
  • Web前端设计:html上标<sup>标签与下标<sub>标签详解
  • 请问:authorization of web services和authenication of web services什么区别?
  • Web服务器 Gatling Web Server


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3