当前位置:  软件>java软件

开源机器学习项目 Oryx

    来源:    发布时间:2015-02-22

    本文导语:  Oryx的目标是帮助Hadoop用户搭建并部署能够实时查询的机器学习模型,例如垃圾邮件过滤和推荐引擎。随着数据的不断流入,Oryx还将支持自我更新。 无论从建模还是部署,Oryx都可以随需扩展,Owen认为这是Oryx与Hadoop的传统“甜...

Oryx的目标是帮助Hadoop用户搭建并部署能够实时查询的机器学习模型,例如垃圾邮件过滤和推荐引擎。随着数据的不断流入,Oryx还将支持自我更新。

无论从建模还是部署,Oryx都可以随需扩展,Owen认为这是Oryx与Hadoop的传统“甜蜜点”——探索性分析和运营性分析最大的不同。

Owen认为传统的在Hadoop上部署机器学习的技术——Apache Mahout已经走到尽头。

“Mahout受制于第一代MapReduce只能处理批任务的局限,用户需要做大量的工作才能搭建并让机器学习系统运转起来,而Myrrix重写 了Mahout,解决了所有老问题。如果Mahout还有药可救,Cloudera就不会收购Myrrix。Oryx差不多有90%的代码都来自 Myrrix,也有一些代码来自Cloudera”Owen说道。

人人都能使用的开源推荐引擎?

Oryx的定位不是机器学习算法的程序库,Owen关注的重点有四个:回归、分类、集群和协作式过滤(也就是推荐)。其中推荐系统非常热门,Owen正在与几个Cloudera的客户合作,帮他们使用Oryx部署推荐系统。

将Oryx打造成开发推荐系统的标准化工具的做法将使这个项目赢得极大关注,因为推荐系统几乎已经成了主流网站的标配,无论是电商还是内容网站都需要推荐系统提高网站的用户体验和转化率。但是推荐引擎技术目前面临的最大问题就是缺乏标准和开源工具。

致力于推荐技术标准化的公司不仅是Oryx一家,另外一家云计算创业公司Mortar Data也在积极推动用户推荐引擎技术的开发,并展现其开源推荐框架的优点。其他一些公司注入Expect Labs虽然没有开源,但试图通过人工智能API接口实现推荐系统的自动化。

目前还不是一个产品

Owen认为Cloudera的所有客户(以及绝大多数的Hadoop用户)最终都想要部署运营型机器分析系统——不仅仅是推荐,Oryx将来有可能成为实现工具,但目前Oryx还只是一个实验性项目。

目前Owen还在花费大量时间担当Apache Spark目的贡献者,他想重写Oryx,将Spark而不是MapReduce作为主要的处理框架,因为Spark已经成为下一代大数据应用的热门技术。由于性能 和速度优于MapReduce,且更加容易使用,Spark目前已经拥有一个庞大的用户和贡献者社区。这意味着Spark更加符合下一代低延迟、实时处 理、迭代计算的大数据应用的要求,包括基于Oryx开发的实时机器学习系统。

介绍内容来自IT经理网


    
 
 

您可能感兴趣的文章:

  • 开源机器人平台 RobotCub
  • 开源机器人技术中间件 OpenRTM-aist
  • 开源机器学习编译器 Milepost GCC
  • 新手如何加入开源项目 有什么好的c++,java 开源适合新手 请指点!
  • 开源物理项目 OSP
  • 如何加入到一个开源项目中?
  • 开源项目管理软件 Gantt Project
  • 想参与一下开源项目,请大家介绍下.
  • 参与开源项目
  • 开源硬件项目 OLINUXINO
  • 开源RSS聚合项目 BilboPlanet
  • 开源项目名检查工具 OSPNC
  • 开源项目的利用问题
  • Oracle关闭SUN的开源项目
  • 谁能介绍几个开源的QT项目?
  • 找开源项目
  • 国内负责的ICANN开源项目 Restful Whois
  • Symbian平台的开源项目 Bergamot
  • 有谁参与了开源项目或者知道一点的?
  • linux有哪些比较适合学习的开源的项目啊,最好网络相关的
  • 开源驱动项目 Nouveau
  • 大家有没什么开源项目介绍?
  • 那里有反病毒的开源项目?
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • tcmalloc内存泄露优化c++开源库下载,安装及使用介绍
  • apache的开源小组怎么生存的?比如struts的开源小组,他们的成果被商用也没人付钱
  • 建议建立一个面向开源软件组织和准备参与开源组织者的交流通道
  • 飞思卡尔I.MX53处理器硬件开源 联永羲和开源硬件系统
  • 开源软件和不开源软件哪个质量更高?
  • 开源爱好者进来
  • 开源专家:企业级开源软件大盘点
  • 企业不用开源产品的原因??
  • [讨论]自由软件之于开源软件
  • linux开源软件
  • 开源力量ConcourseConnect
  • 开源门户平台 GateIn
  • 开源CRM软件 Daffodil CRM
  • linux下的软件都必须是开源的么
  • 开源VPN软件 Freelan
  • 开源潜水设备 OpenROV
  • 开源串口通信程序 linucom
  • 免费开源图形API Mesa3D
  • 开源Flash播放器 Lightspark
  • 开源硬件 IP 核心 OpenCores
  • 开源CAD/CAE工具 FreeCAD


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3