当前位置:  数据库>oracle

使用Lucene 2.31 索引 Oracle 10g的数据库

    来源: 互联网  发布时间:2017-04-14

    本文导语: 1,使用主要技术:Lucene 2.3.1IK_CAnalyzer 1.4 中文分词HtmlParser 1.6 HTML文件/文本解析器 缺点:不能忽略的内容 2,其他实现方法: 每天做对每类做增量索引 索引内容:类型,URL,TEXT内容,标题,作者,时间。 3,在Oracle 10g上建表: ...

1,使用主要技术:
Lucene 2.3.1
IK_CAnalyzer 1.4 中文分词
HtmlParser 1.6 HTML文件/文本解析器 缺点:不能忽略的内容



2,其他实现方法:

每天做对每类做增量索引 索引内容:类型,URL,TEXT内容,标题,作者,时间。

3,在Oracle 10g上建表:

-- Create table
create table IZ_SEARCH_ENGINE
(
  ID             NUMBER not null,
  INDEX_DIR      VARCHAR2(50),
  TYPE           VARCHAR2(500),   类型
  TYPE_DESC      VARCHAR2(50),  类型注释
  TABLE_MAXVALUE VARCHAR2(50), 某表最大值
  TABLE_SQLS     CLOB,  (最某表没有被索引的SQL语句,如select .... from XXX where id>#ID# ,  #ID# 取自TABLE_MAXVALUE )
  STATUS         VARCHAR2(20) default 'offline', 暂时无用
  TYPE_TRUETYPE  VARCHAR2(50) 暂时无用
)










4,建立索引的JAVA关键代码:

String INDEX_DIR = “/home/xue24_index_book”; //指定索引目录
IndexWriter writer = new IndexWriter(INDEX_DIR, new IK_CAnalyzer(), true); //准备索引区,并指定分词分析器
Document doc = new Document(); //实例化新document
doc.add(new Field(“type”, “社区”, Field.Store.YES, Field.Index.TOKENIZED)); //为document设置字段:type
doc.add(new Field(“title”, “标题标题” Field.Store.YES, Field.Index.TOKENIZED)); //为document设置字段:title
writer.addDocument(doc); //将该document加入索引目录
writer.optimize();  //优化
writer.close();  //关闭索引






5,搜索的JSP关键代码:

String INDEX_DIR_BOOK = "/home/xue24_index/book";
String INDEX_DIR_BBS = "/home/xue24_index/bbs";

Searcher[] searchers=new Searcher[2];
searchers[0] = new IndexSearcher(INDEX_DIR_BOOK);
searchers[1] = new IndexSearcher(INDEX_DIR_BBS);

Searcher searcher = new MultiSearcher(searchers);
MultiFieldQueryParser queryParser = new MultiFieldQueryParser(new String[] {"title","content","author" }, new IK_CAnalyzer());
Query query = queryParser.parse(keyword); //分析查询

Hits hits = searcher.search(query);//  搜索索引
out.println(“共找到结果:”+hits.length());
for(int i=0;i


    
 
 

您可能感兴趣的文章:

  • SQL Server 索引结构及其使用(一)--深入浅出理解索引结构第1/4页
  • sql server对索引的使用
  • 解决多级索引速度慢的问题可否像解决多级页表那样使用TLB?
  • mysql中索引使用不当速度比没加索引还慢的测试
  • oracle10g全文索引自动同步语句使用方法
  • bitmap 索引和 B-tree 索引在使用中如何选择
  • C#入门之索引器使用实例
  • 在Oracle中监控和跟踪索引使用情况
  • 结构化文档全文索引的使用方式,以DB2 TIE为例,讲解一下结构化文档的全文索引的使用方法,希望对我的另一个帖子起到抛砖引玉的作用。
  • mysql5.6.19下子查询为什么无法使用索引
  • SQLSERVER全文目录全文索引的使用方法和区别讲解
  • SQL_Server全文索引的使用实例演示
  • 深度揭露Oracle索引使用中的限制
  • SQL Server 索引结构及其使用(二) 改善SQL语句第1/3页
  • MySQL索引使用全程分析
  • oracle 索引不能使用深入解析
  • SQL优化基础 使用索引(一个小例子)
  • MySQL索引类型总结和使用技巧以及注意事项
  • SQLSERVER如何查看索引缺失及DMV使用介绍
  • Sql Server 索引使用情况及优化的相关Sql语句分享
  • mysql数据库下载安装教程和使用技巧
  • 大家在UNIX下都使用什么数据库?使用什么做数据开发?
  • mongodb 数据库常用命令使用实例
  • 请问:在使用oracle数据库作开发时,是使用pro*c作开发好些,还是使用库函数如oci等好一些啊?或者它们有什么区别或者优缺点啊?
  • 请教在linux系统开发环境下,有没有db和dbf数据库引擎,如何使用这个数据库?
  • 使用php语句将数据库*.sql文件导入数据库
  • 使用JDBC连接数据库时Class.forName()语句的使用疑问
  • 如何使用jsp显示数据库中的数据?
  • 收缩后对数据库的使用有影响吗?
  • 当发布的程序中含有数据库的使用时,...?
  • 如何强制删除或恢复SQLServer正在使用的数据库
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • 在Python3中使用urllib实现http的get和post提交数据操作
  • 请教高高手:如何规划和创建数据池?并使用数据池?有资料也行
  • 使用jquery局部刷新(jquery.load)从数据库取出数据
  • oracle数据库删除数据Delete语句和Truncate语句的使用比较
  • 我时用jdbc打开数据库,使用后是否要显示的关闭数据库,还是等java的垃圾回收器来处理。
  • 超级菜鸟问题:使用VMware安装linux会删除硬盘上的数据吗?
  • 关于数据报套接字的使用
  • 如何使用ip_queue_xmit接口发送数据包
  • 请问使用SELECT()函数怎么监测串口发送数据?
  • 为什么socket程序使用gdb调试执行就接受不到数据了呢?
  • sql server 使用ntile获取数据的例子
  • 使用udp,连续发送大数据发生丢包亲情况
  • linux下如何使用磁带机备份数据
  • 在ACC下不使用循环怎样实现,读取文件指定行的数据.
  • 请问在红旗Linux多功能服务器版上(不是数据库服务器版)能否正常安装使用Oracle?红旗Linux数据库服务器版要比红旗Linux多功能服务器版贵
  • 使用TCP协议通讯,如果有很多种数据要传输,如:注册信息等,在C++中,我们可以使用结构,java中通常大家又是如何打包的呢?
  • SQL Server 2008无日志文件如何使用MDF文件附加数据库
  • 使用EntityBean将中文存入数据库时出现乱码,如何解决?
  • 请问:FTP工具或者命令怎么设置,让数据路和控制路都使用默认的21端口
  • 请问如何使用c++开发数据库客户端程序?
  • 使用X manager连接oracle数据库的步骤
  • C++ I/O 成员 tellg():使用输入流读取流指针
  • 在测试memset函数的执行效率时,分为使用Cash和不使用Cash辆种方式,该如何控制是否使用缓存?
  • C++ I/O 成员 tellp():使用输出流读取流指针
  • 求ibm6000的中文使用手册 !从来没用过服务器,现在急需使用它,不知如何使用! 急!!!!!
  • Python不使用print而直接输出二进制字符串
  • 急求结果!!假设一个有两个元素的信号量集S,表示了一个磁带驱动器系统,其中进程1使用磁带机A,进程2同时使用磁带机A和B,进程3使用磁带机B。
  • Office 2010 Module模式下使用VBA Addressof
  • c#中SAPI使用总结——SpVoice的使用方法
  • windows下tinyxml.dll下载安装使用(c++解析XML库)
  • 使用了QWidget的程序,如何使用后台程序启动它?


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3