当前位置:  数据库>oracle

基于Oracle的大数据导入方案探索

    来源: 互联网  发布时间:2017-05-14

    本文导语: 数据导入功能在报表项目中是经常可见的,因为它是报表数据展示的基础,但对于大量数据的导入,真正从性能、效率等方面兼顾的方案却很少有。最近在南航广西数据服务平台的项目开发中,我需要设计一个能快速将40多万条...

数据导入功能在报表项目中是经常可见的,因为它是报表数据展示的基础,但对于大量数据的导入,真正从性能、效率等方面兼顾的方案却很少有。最近在南航广西数据服务平台的项目开发中,我需要设计一个能快速将40多万条数据导入Oracle数据库的方案,为了实现导入的高效,我通过在网上收集资料以及动手实践测试,得出了一些分析总结与大家分享探讨。

谈到数据导入功能的实现,无可厚非应该包括两个过程,首先是数据文件的上传,其次是数据的导入。

一、数据文件上传

文件上传本应该是与导入无关,但它处于数据导入功能的一个环节,其效率也显得有些重要。对于传统项目,文件上传通常采用Struts等框架实现的文件上传机制以及一些开源的文件上传组件,比如SmartUpload等,通过Html中类型为File的Input标签将数据文件获取,通过流的形式发送服务端,最后由服务端获取流并写入文件,如此实现了文件从客户端到服务器的上传过程,这些方式我们都可以将其统一称为Web文件上传。

Web文件上传是通过Http协议实现的文件流传输,其受限于Web数据传输的瓶颈,基于Http协议传输的数据在传输的速度上有一定影响,首先可能出现数据文件请求超时需要数据重传;其次在每秒能传输的字节数在Web方式里受到限制;最后,由于Web在传输数据文件之前需要将数据文件转化为数据流,通过Web的File标签实现的文件流化效率很低,通过对比试验发现,同样对一个50M的文件流化,用Web的File标签流化的时间要大于采用IO方式流化所消耗的时间,也就是说,对于大数据文件,要将其通过Web标签流化再传输,可能会有很长一段时间是处于发送请求状态,甚至会因为这个过程的时间持续较长而造成网络请求超时。这可能是优酷等类似的网站上传视频不采用Web方式的一个原因。

除了Web方式,可以考虑使用Applet,作为一个客户端小程序嵌入到网页中,以IO的方式读取本地数据文件,然后通过Socket将文件流发送到服务端。这种方式从效率上比Web方式有明显的改进,首先是通过IO将文件转化为文件流的效率提升,其次数据通过Socket方传输式,是一种基于TCP协议的网络传输,去除了Web下Http协议对文件传输的限制,通过TCP协议直接从网络的传输层进行数据通信,传输速度上必然会更快。综上,采用Applet加Socket实现网络文件上传性能优于Web方式。

然而,Applet实现的网络文件上传又并非最优,原因在于Applet在运行时受到沙箱的限制。出于对客户机和服务器的保护,web中的applet程序只能运行在限制的沙箱中,其受到很多安全策略的限制,在applet中不能直接访问客户端本地文件系统,除非使用applet授权,采用数字签名的方式使applet能确认该客户端系统是可信的。这样一来,要使用该功能的客户机系统都需要安装安全证书,在项目的部署上就显得十分繁琐。

以上方式都各有弊端,最终,通过和用户协商,我们决定借助外部的FTP工具,使用开源的文件传输工具让用户将数据文件直接传到服务器指定目录下,在网站系统上就只执行数据文件列表加载。另外,目前也有在web上嵌入FTP功能的插件,其通过activeObject的形式嵌入web,实现类似ftp的文件上传功能,打算抽空继续研究。


    
 
 

您可能感兴趣的文章:

  • oracle数据库导出和oracle导入数据的二种方法(oracle导入导出数据)
  • oracle 数据泵导入导出介绍
  • oracle10g 数据备份与导入
  • 求高手指点shell导入.dat文件到ORACLE数据库
  • 怎样把solaris系统下oracle数据导入access中??请教!!急~
  • 用Oracle管理服务器将数据导入与导出
  • 使用工具 plsqldev将Excel导入Oracle数据库
  • Linux环境中Oracle数据导入与导出备份操作
  • oracle的导入导出注意事项及心得分享
  • oracle数据库导入导出命令使用方法
  • Oracle的导入导出的问题
  • Oracle 下导入txt的shell脚本以及配置
  • Oracle统计信息的导出与导入
  • 浅析Oracle对象和数据的导入导出
  • Oracle数据库密码重置、导入导出库命令示例应用
  • 利用导出/导入功能实现重新组织Oracle数据库表空间
  • Oracle 数据库导出(exp)导入(imp)说明
  • HTML教程 iis7站长之家
  • Oracle:SQL Loader的导入文本数据
  • Oracle与Access表之间的导入和导出
  • Oracle9i 动态SGA,PGA特性探索
  • 探索ORACLE之ASM概念(完整版)
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • Linux安装Oracle 11时报错DISPLAY解决方案
  • Lucene和Oracle的集成方案 LDI
  • Oracle 数据库容灾复制解决方案分析Shar Plex
  • 请问哪里有 小性机 +linux +oracle 的配置方案?
  • oracle怎么删除用户提供解决方案
  • Oracle为IBM大型机服务器提供Linux方案
  • 【求助】RHEL5.1 下安装Oracle 10.2g出现问题:指定数据库方案口令后卡住了,不能安装
  • oracle远程复制及异地容灾的技术解决方案
  • Oracle时间精确到时、分、秒处理方案
  • 账户方案系统角色多管齐下保障Oracle的安全
  • Oracle 10g的DBA无法登录解决方案
  • 深入探讨:oracle中方案的概念以及方案与数据库的关系
  • 错误信息:java.lang.ClassNotFoundException: oracle.jdbc.driver.OracleDriver,求解决方案!
  • ORA-28002 Oracle 11g存在密码过期问题解决方案
  • Oracle中如何插入特殊字符:& 和 '(多种解决方案)
  • 初学Oracle最经常碰到的错误及解决方案
  • 关于Oracle 数据库的配置方案说明
  • oracle保留两位小数解决方案
  • oracle 分页问题解决方案
  • oracle 数据库数据迁移解决方案
  • Oracle 12c发布简单介绍及官方下载地址
  • 在linux下安装oracle,如何设置让oracle自动启动!也就是让oracle那个服务自动启动,不是手动的
  • oracle 11g最新版官方下载地址
  • 请问su oracle 和su - oracle有什么不同?
  • Oracle 数据库(oracle Database)Select 多表关联查询方式
  • 虚拟机装Oracle R12与Oracle10g
  • Oracle数据库(Oracle Database)体系结构及基本组成介绍
  • Oracle 数据库开发工具 Oracle SQL Developer
  • 如何设置让Oracle SQL Developer显示的时间包含时分秒
  • Oracle EBS R12 支持 Oracle Database 11g
  • Oracle 10g和Oracle 11g网格技术介绍


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,