APP下载

GitLab开源资料分析解决方案Meltano

消息来源:baojiabao.com 作者: 发布时间:2024-04-20

报价宝综合消息GitLab开源资料分析解决方案Meltano

程式码托管服务GitLab释出资料科学团队的解决方案Meltano,可用于处理资料的提取、载入和转换等工作。Meltano并没有与GitLab原本的服务捆绑在一起,而是成为一个单独产品,目的在于填补通用资料应用在不同部门间的鸿沟,让企业达成客户支援、产品团队、销售与行销等工作。

GitLab提到,他们遇到跟大多数企业一样的问题,在工程部门拥有大量的资料,但是要将这些资料应用在实际解决业务问题,仍有一大段距离。于是GitLab开发了Meltano来克服这个难题,Meltano解决方案提供建模、提取、载入、转换、分析、笔记本与协作等功能,也就是说整个资料科学的生命周期,都是Meltano的支援范围。

GitLab资料分析团队从外部资源取得了大量资料,并转换成可用格式,提供给公司内的其他业务部门使用者,并最终根据资料进行结果预测。GitLab表示,与多数资料团队相同,他们目前还是透过一系列的步骤与各自独立的工具来完成这个目标,整个流程并不顺畅也没有达到足够稳定的水准。

他们希望可以使用最佳实践的方法,来进行资料分析的工作,所有工作都使用开源工具,并能够进行版本控制,还可以对资料到视觉化的分析工作管线进行追踪。GitLab提到,Meltano的最终目标就是要让企业内每个人都可以轻易上手,并着手进行资料分析,而不仅是资料科学家。

GitLab资料分析师Emilie Burke提到,许多中小型企业无法进行资料分析的工作,是因为他们团队中缺乏工程师,只能透过现存的工具产生报告,但是在依赖这些孤立的资料时,也就代表无法进行跨功能的分析。他举例,像是店家进行促销活动,接收到了许多账号申请的邮件,但是却无法与Shopify的资料交叉比对,知道那些申请者有在Shopify购买商品,除非后端的资料能够串接起来。

Meltano作为一个开源工具,企业不需要投入太多的资源来建立资料分析团队。目前Meltano还只支援Postgres,而Snowflake正在开发中,但是Meltano需要能够支援更多数据库类型,因此GitLab团队邀请有意愿的贡献者可以加入开发Meltano的行列。
 

 

2018-08-03 10:31:00

相关文章