当前位置:  软件>C/C++软件

信息抽取组件 Minidx

    来源:    发布时间:2015-01-27

    本文导语:  Minidx 这一组件是专门为开发人员准备的,利用Minidx Extract-Text Com组件,您可以轻松的从Word,Xls,Pdf……等200多种文件格式中读取文本内容。该组件本身用C++编写,以Com组件的形式调用,您可以 在一切可以调用Com组件的开发语言中调...

Minidx 这一组件是专门为开发人员准备的,利用Minidx Extract-Text Com组件,您可以轻松的从Word,Xls,Pdf……等200多种文件格式中读取文本内容。该组件本身用C++编写,以Com组件的形式调用,您可以 在一切可以调用Com组件的开发语言中调用这一组件,快速的抽取各种文本内容。

Minidx是一个文件管理系统。它具有:
*自带超高速全文搜索引擎,瞬间找到所需要的文件
*具有自己的存储系统,安全的管理重要文档
*可存储与管理TB级别的数据,数据量的大小对系统运行的效率影响甚微
*采用IFilter抽取文本,无须安装例如Office的应用程序即可阅读内容
*基于Unicode编码,可正常输入/显示多国语言
*高亮语法显示,方便地阅读多种文档
*检索结果高亮显示,方便查看
*模糊查询,自动识别同义词 例如要查询where时,输入whe也能得到结果
*自带Web服务器,可方便的在Internet/局域网共享所管理的文档
*独立的P2P功能,可自由选择启动服务端/客户端,或者同时启动
*可以根据创建时间,修改时间,访问时间,标题,存储路径,内容等各项属性分等级,分目录地实现精确查询
*可方便设定过滤字段

搜索引擎特性:
*整个引擎非常小,由2万多行C/C++代码实现
*标准C/C++编写,几乎可以运行在所有的系统
*无需太多内存,在较低的硬件环境下也可以运行而不影响效率
*方便的集成到各种系统,利用Minidx引擎,仅仅需要添加几行代码就可以让系统具有全文检索功能
*超高速检索,百万条记录也能在毫秒内返回结果
*字,词,句检索
*条件”与”,”或”查询,以及他们的组合查询
*采用UNICODE字符集,多国语言字符串混合查询
*精确查询,甚至一个标点符号也可以精确定位


    
 
 
 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • python异常信息堆栈输出到日志文件
  • 请问:gtk有哪些信息啊,delete_event是不是个信息啊,哪有gtk信息的资料啊,帮助上有吗?
  • redhat/centos 常用信息查看命令整理
  • 用什么命令可以列出所有用户信息和组信息?
  • Ubuntu查看系统信息命令介绍
  • unix下如何知道硬件信息和软件信息?
  • Linux Kernel 'sctp_v6_xmit()'函数信息泄露漏洞
  • SQLSERVER的版本信息和SP补丁信息查看方法
  • linux下nm命令(显示可执行文件的符号信息)介绍以及常见nm命令用法举例
  • 请问linux起动时的信息被存放到哪里了?我想看看起动信息怎么办?
  • java命名空间java.util类formatter的类成员方法: 详细信息 定义及介绍
  • 硬盘上的超级块,信息节点的信息是什么时候,怎么写进去的,谢谢
  • Ubuntu ADSL上网,网络信息查看及防火墙相关配置命令介绍
  • 请问linux进程的哪些信息保存在内核里?哪些信息又保存在进程空间里?谢谢
  • hpux下如何定时采集系统的性能信息、磁盘信息?
  • 如何让java的编译时的错误信息或输出的结果信息显示在指定的窗口中
  • 请教高手:我想从路由器上取统计数据和信息来做入侵检测,我能路由器上取到那些相关的信息?
  • 怎样向已存在的文本文件中添加信息,而不影响原有信息?
  • 输出java进程的jstack信息示例分享 通过线程堆栈信息分析java线程
  • 我想做一个添加,修改,删除,查询客户信息的程序,客户信息有姓名,性别,电话,工作单位等哪位大哥哥可以帮我一下给我一个例子,我现在
  • 为扩大/u分区,divvy调整分片信息,系统差点崩溃,有如下警告信息..


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3