当前位置:  软件>java软件

流式处理和分析平台 DataTorrent

    来源:    发布时间:2014-12-19

    本文导语:  DataTorrent是一个实时的流式处理和分析平台,它每秒可以处理超过10亿个实时事件。 与Twitter平均每秒大约6000条微博相比,最近发布的DataTorrent 1.0似乎已经超出了需求,它每秒可以处理超过10亿个实时事件。他们在一个包含37个...

DataTorrent是一个实时的流式处理和分析平台,它每秒可以处理超过10亿个实时事件。

Twitter平均每秒大约6000条微博相比,最近发布的DataTorrent 1.0似乎已经超出了需求,它每秒可以处理超过10亿个实时事件。他们在一个包含37个节点的集群上进行了测试,每个节点256GB内存、12核超线程CPU。在CPU达到饱和之前,DataTorrent声称已经实现了线性扩展,而CPU达到饱和时处理速度为每秒16亿个事件。Phu Hoang是DataTorrent的联合创始人和CEO,他告诉InfoQ,在同样的硬件上,他们的解决方案在性能上比Apache Spark要高“好几个数量级”。

DataTorrent基于Hadoop 2.x构建,是一个实时的、有容错能力的数据流式处理和分析平台,它使用本地Hadoop应用程序,而这些应用程序可以与执行其它任务,如批处理,的应用程序共存。该平台的架构如下图所示:

流式处理和分析平台 DataTorrent[图片]

StrAM(Streaming Application Master)是一个本地的YARN Application Master,负责管理将要在Hadoop集群上执行的逻辑DAG(Directed Acyclic Graph),包括资源分配、分区、扩展、调度、Web服务、运行时更改、统计、SLA执行、安全等等。

在架构示意图的上层,用户应用程序作为已连接的算子和/或应用程序模板存在。算子的示例有InputReceiver(模拟接收输入数据)、Average(针对指定维度的键计算数据平均值)、RedisAverageOutput(将计算好的平均值写入Redis数据存储)、SmtpAvgOperator(发送电子邮件警报)。这些算子是Malhar库的一部分,该库包含了超过400个这样的算子,并在GitHub上开源。用户可以根据需要编写其它算子。


    
 
 

您可能感兴趣的文章:

  • docker源码分析之容器日志处理与log-driver实现
  • 分布式日志处理和关联分析引擎 MassLogProcess
  • 图像处理和分析 Leptonica
  • 医学影像处理与分析 MITK C++
  • 数据集成、处理分析和勘探平台 KNIME
  • Java的图像处理和分析库 ImageJ
  • 兄弟们,请帮帮忙吧,关于LINUX 的调度和时钟中断处理代码的分析!在线等待啊。。。:(
  • 解决Java调用BAT批处理不弹出cmd窗口的方法分析
  • 深入分析C++中执行多个exe文件方法的批处理代码介绍
  • SQL SERVER函数之深入表值函数的处理分析
  • C++算法之海量数据处理方法的总结分析
  • 基于Mysql的IP处理函数inet_aton()与inet_ntoa()的深入分析
  • sql server中使用with(nolock)处理死锁的分析
  • SQL Server和Oracle并行处理比较分析
  • PHP mysqli扩展库 预处理技术的使用分析
  • android 网络连接处理分析
  • 深入分析C#中处理和键盘相关事件的详解
  • jquery处理json数据实例分析
  • JQEasy-ui在IE9以下版本中二次加载的问题分析及处理方法
  • 解析bitmap处理海量数据及其实现方法分析
  • OpenCV 2.4.3 C++ 平滑处理分析
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • c/c++预处理命令预#error介绍
  • 关于linux内核中信号处理的问题?(信号处理的时间)
  • c/c++预处理命令预#undef介绍
  • 如何让批处理文件执行完毕后窗口不关闭,批处理文件直接点击执行
  • c/c++预处理命令预#pragma介绍
  • 视频处理问题,用批处理对视频进行打码
  • c/c++预处理命令预#line介绍
  • 请问如何在unix批处理中得到批处理参数!read吗?急在线等待!
  • c/c++预处理命令预#include介绍
  • 在linux上怎么编写一个模块来提供某个中断的中断处理程序呢?而且有哪些中断可以自己添加中断处理程序呢?
  • Python 3 Tkinter教程之事件Event绑定处理代码实例
  • 信号处理函数里面用CRT函数可能导致"信号触发-处理"死循环吗?
  • c/c++预处理命令预#,##使用介绍
  • 我想编一个把javac和java连起来用的批处理文件,请批处理文件中的参数怎么表示?
  • c/c++预处理命令预#if, #ifdef, #ifndef, #else, #elif, #endif介绍
  • 为何信号处理没有及时被处理呢?
  • c/c++预处理命令预#define语法和例子
  • 在编写驱动程序的时候,timer处理中,遇到了其他某timer处理例程以外的代码的执行。请指点,各位
  • c/c++预处理命令之预定义变量
  • 我准备做个批处理文件来删除某文件夹下后缀为Txt的文件,可系统一次执行不完,还要手动敲一个回车,怎么处理?
  • Python异常处理基础知识
  • 批量处理JDBC语句提高处理速度


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3