当前位置:  软件>C/C++软件

文件打包工具 dedup util

    来源:    发布时间:2015-01-12

    本文导语:  dedup util是一款开源的轻量级文件打包工具,它基于块级的重复数据删除技术,可以有效缩减数据容量,节省用户存储空间。该工具生成的数据包内部数据部局(layout)如下:--------------------------------------------------|  header  |  unique...

dedup util是一款开源的轻量级文件打包工具,它基于块级的重复数据删除技术,可以有效缩减数据容量,节省用户存储空间。该工具生成的数据包内部数据部局(layout)如下:
--------------------------------------------------
|  header  |  unique block data |  file metadata |
--------------------------------------------------

数据包由三部分组成:文件头(header)、唯一数据块集(unique block data)和逻辑文件元数据(file metadata)。其中,header为一个结构体,定义了数据块大小、唯一数据块数量、数据块ID大小、包中文件数量、元数据在包中的位置等元信息。文件头后紧接就存储着所有唯一的数据块,大小和数量由文件头中元信息指示。在数据块之后,就是数据包中文件的逻辑表示元数据,由多个实体组成,结构如下所示,一个实体表示一个文件。解包时根据文件的元数据,逐一提取数据块,还原出当初的物理文件。
逻辑文件的元数据表示:
-----------------------------------------------------------------

|  entry header  |  pathname  |  entry data  |  last block data |

-----------------------------------------------------------------

逻辑文件的实体头中记录着文件名长度、数据块数量、数据块ID大小和最后一个数据块大小等信息。紧接着是文件名数据,长度在实体头中定义。文件名数据之后,存储着一组唯一数据块的编号,编号与唯一数据块集中的数据块一一对应。最后存储着文件最后一个数据块,由于这个数据块大小通常比正常数据块小,重复概率非常小,因此单独保存。
dedup util目前处于pre-alpha开发阶段,支持文件打包、解包、追加文件、删除文件、罗列包中文件等功能。初步的测试结果显示,即使在不明确数据是否具备较高重复率的情况下,dedup技术也能较明显地减少数据包的数据量,产生的数据包比Tar工具的要小。


    
 
 

您可能感兴趣的文章:

  • Linux 命令 打包文件是.tsv的,打包成.tar.gz
  • servlets 能打包成.jar文件吗?打包之后又是怎样调用呢?
  • 请教关于利用java把文件打包的问题,希望能够得到简单的回答,在线等待结帖
  • 能用JBuikder将一个包文件直接编译并打包成*.jar文件吗?
  • 请问怎么把一个文件夹打包成.war,.jar或者.ear文件?
  • C 实现多个文件的打包和解压
  • 如何将自己开发的类打包(生成.jar文件)
  • Linux下大文件如何打包?
  • 如何将某几个文件打包成一个git的压缩包文件?
  • 怎样打包成war文件,用什么工具可以?
  • 我想在用Java对若干文件打包,象Linux中的tar文件,不用压缩!!怎么做?
  • 在fedora8下,打包的文件夹传入虚拟机ubuntu下解压出现问题
  • CentOS Linux里,如何使用命令打包特定的文件?
  • 用JBuilder写的程序怎么打包成.exe文件?
  • 如何将java application 打包成.exe 和 .bin 文件?
  • 请教如何将一个目录下所有内容打包成tar.gz格式的文件
  • 在freebsd下打包的文件在windows下怎么解包?
  • 打包文件的问题
  • 如何把某个目录下所有的cpp 、 c文件tar打包?
  • 怎样打包jar,能使生成的jar文件双击后执行该程序?
  • windows/windows 7/windows 8 下打开查看、修改及保存超大(GB级)文本文件及其它类型文件的工具-PilotEdit
  • 请问Visual Pax Archive文件应该用什么工具打开?那里有这种工具的下载?
  • 我想问一下,java生成的.class文件能不能通过某种工具生成.exe文件?
  • 请问有将class文件转换为可执行文件(如Windows下的exe文件)的工具吗?
  • windows下有沒有把.sgml文件轉換成.html文件的工具呀?
  • 后缀名是wdl的文件可以用什么工具打开,它是什么文件
  • 请问各位linux开发大虾,linux下有类似VC中depends的工具可以查看文件调用了哪些so文件吗?
  • 用什么工具可以把JAVA的.CLASS文件反编译成.JAVA文件??
  • 哪位有可以下载 linux 下阅读 pdf文件 和 chm 格式文件的工具地址啊?
  • 用secureCRT 在终端只能看目录下的部分文件,看不到的那部分文件也不是隐藏文件,而在别人的机器上用相同的用户,相同的secureCRT工具都能看得到
  • 请问:linux下有没有可以要开.pdf文件的软件或者工具啊,现在碰到很多.pdf文件根本不能看啊
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • C++ I/O 成员 eof():如果处于文件结尾处则返回true
  • Shell脚本如何递归现实一个文件夹中的文件(文件夹中含有文件夹)
  • WinDows8最新版文件夹加密
  • 求命令:什么命令可以把文件夹下所有的文件按修改时间先后排出来,包括子文件夹里的文件。
  • sharepoint 2010 使用STSNavigate函数实现文件下载举例
  • [提问]Linux下如何把多个.a文件编译一个.so文件,或者把多个.so文件编译成一个.so文件
  • python异常信息堆栈输出到日志文件
  • 请问:proc中的头文件中能包含头文件吗?(感觉如果头文件中包含头文件的话,在链接时就会有错误啊)
  • Centos6下安装Shell下文件上传下载rz,sz命令
  • 我要实现当进程打开文件时,根据文件名判断是否符合要求,符合后处理文件,再把文件返回给进程,怎么实现啊
  • 在MyEclipse中设开启xml文件自动提示和自动完成功能
  • vi 中编辑两个文件,怎样从其中一个文件拷一段内容到另一个文件中。(同时打开两个文件)
  • 修改配置真正解决php文件上传大小限制问题(nginx+php)
  • 怎么统计一个文件夹下有多少个文件(不包括文件夹)
  • 修改配置真正解决php文件上传大小限制问题(apache+php)
  • 请教高手一个简单问题:给定一个文件名,如何去查找该文件正在被几个程序使用,并怎么样才可以切断这个文件与正在打开该文件的程序之间的
  • MyEclipse如何查看和设置文件编码格式相关操作
  • linux 下的 .a 文件 .o 文件 是什么文件?各有什么作用?
  • 使用libpcap读取tcpdump抓取的文件并解析c代码实例
  • 如何用socket一次传输多个文件,如何确定文件一个文件结束
  • 设置sharepoint 2010文档库中的 pdf文件在浏览器中访问的打开方式
  • 如何删除某个目录下除了指定文件夹之外的所有文件和文件夹


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    论坛 iis7站长之家