您当前的位置是:  首页 > 新闻 > 国际 >
 首页 > 新闻 > 国际 >

GitLab开源数据分析解决方案Meltano

2018-08-03 14:23:08   作者:   来源:CTI论坛   评论:0  点击:


  不少中小型企业因为缺乏工程师,而无法进行数据分析的工作,而Meltano功能涵盖整个数据科学的生命周期,最终目的是让企业内每个人都可以轻易上手,着手进行数据分析。
  程式码托管服务GitLab释出数据科学团队的解决方案Meltano,可用於处理数据的提取、载入和转换等工作。Meltano并没有与GitLab原本的服务綑绑在一起,而是成为一个单独产品,目的在於填补通用数据应用在不同部门间的鸿沟,让企业达成客户支援、产品团队、销售与行销等工作。
  GitLab提到,他们遇到跟大多数企业一样的问题,在工程部门拥有大量的数据,但是要将这些数据应用在实际解决业务问题,仍有一大段距离。於是GitLab开发了Meltano来克服这个难题,Meltano解决方案提供建模、提取、载入、转换、分析、笔记本与协作等功能,也就是说整个数据科学的生命周期,都是Meltano的支援范围。
  GitLab数据分析团队从外部资源取得了大量数据,并转换成可用格式,提供给公司内的其他业务部门使用者,并最终根据数据进行结果预测。GitLab表示,与多数数据团队相同,他们目前还是透过一系列的步骤与各自独立的工具来完成这个目标,整个流程并不顺畅也没有达到足够稳定的水准。
  他们希望可以使用最佳实践的方法,来进行数据分析的工作,所有工作都使用开源工具,并能够进行版本控制,还可以对数据到视觉化的分析工作管线进行追踪。GitLab提到,Meltano的最终目标就是要让企业内每个人都可以轻易上手,并着手进行数据分析,而不仅是数据科学家。
  GitLab数据分析师Emilie Burke提到,许多中小型企业无法进行数据分析的工作,是因为他们团队中缺乏工程师,只能透过现存的工具产生报告,但是在依赖这些孤立的数据时,也就代表无法进行跨功能的分析。他举例,像是店家进行促销活动,接收到了许多帐号申请的邮件,但是却无法与Shopify的数据交叉比对,知道那些申请者有在Shopify购买商品,除非後端的数据能够串接起来。
  Meltano作为一个开源工具,企业不需要投入太多的资源来建立数据分析团队。目前Meltano还只支援Postgres,而Snowflake正在开发中,但是Meltano需要能够支援更多数据库类型,因此GitLab团队邀请有意愿的贡献者可以加入开发Meltano的行列。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题