当前位置:  技术问答>java相关

讨论接近全文检索的思路?

    来源: 互联网  发布时间:2017-04-14

    本文导语:  我现在使用oracle,以后会扩展到多种数据库如SQL SERVER等,某一个表的历年累积数据可达几十万,而且在不断增加,且需对word文档进行检索,同时访问人数多。如果依赖于数据库的模糊检索,速度非常慢,也知道全文...

我现在使用oracle,以后会扩展到多种数据库如SQL SERVER等,某一个表的历年累积数据可达几十万,而且在不断增加,且需对word文档进行检索,同时访问人数多。如果依赖于数据库的模糊检索,速度非常慢,也知道全文检索不是太好开发,但必须要全文检索的那种效率,所以大家谈谈全文检索的开发思路?十分感谢!

|
已经有了数据库
不用它……
比较难

ref:
http://jakarta.apache.org/lucene/index.html

|
这么说吧,每个数据库厂商都应该提供出全文的扩展,例如DB2上的TSE,TIE,NET Search等等(IBM大概有相互独立的全文引擎4~5个)……如果没有提供(Oracle也提供了),你想自己开发就比较困难了。至于外挂的搜索引擎,如TRS(http://www.trs.com.cn)等基本不应该考虑。因为很容易造成数据的冗余和不同步,例如TRS就是将数据库重需要检索的所有字段全部抓到它的索引中进行索引的。

另外如果是比较大的文件就不应该被放在数据库中。十几万是个很小的数量级,再多了就不好办了。

    
 
 
 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。














站内导航:


特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

©2012-2021,,E-mail:www_#163.com(请将#改为@)

浙ICP备11055608号-3