APP下载

梅西百货的大数据分析法Hadoop的优势与特色

消息来源:baojiabao.com 作者: 发布时间:2024-05-29

报价宝综合消息梅西百货的大数据分析法Hadoop的优势与特色

不管是针对即时定价或是即时预测顾客购物喜好,都需要大量的消费者资料数据当作基础,那么梅西百货究竟收集了哪些使用者的数据呢?根据 Macy’s.com 的“WHAR WE COLLECT & SHARE”一节描述,梅西百货会搜集的使用者资料分为下面几种,包括使用者主动提供的资讯(Information you provide)、透过科技搜集的资讯(Technology-Enabled Collection Services)以及交易资讯(Transaction Information)。

梅西百货的巨量数据分析,收集了哪些个人资料?

使用者主动提供的资讯包括,顾客在线上或实体商店时,创造个人设定档、登记、下订单或参与各种活动时提供的资料,举例来说会包括姓名、地址(账单与邮寄地址)、邮递区号、电子邮件账号、电话号码、手机号码、信用卡号码、生日与安全问题等资料,都是属于使用者主动提供的资讯。

利用科技搜集的资讯包括,当使用者连上梅西百货网站、使用他们的行动装置 App、在线上商店购买使用它们的Wi-Fi 服务、iBeacon 服务时,所有会自动纪录的资料,像是 Cookie 、浏览资料、连网装置资讯、所在地点资讯等等。

交易资讯则包含了,使用者曾经购买了哪些商品,购买的时间与日期,这次交易是在线上或线下进行的。

梅西百货的大数据处理与分析解决方案:Hadoop

为什么梅西百货需要 Hadoop?随着使用者能透过各种装置,以各种方式,不论是线上的行动装置、电脑或实体店面,以及需要分析的接触点(touch point)越来越多,自 2010 年以来,能够分析的数据已经增加数百倍,因此亟需要能够进行大数据处理与分析的解决方案。

巨量资料具有几个特征,首先是资料量庞大,就算是单一公司的资料,都可能单日就上看 TB或 PB,再来就是资料产生的速度快,同时也需要极快的处理速度才能运算,另外就是资料具备多样性,包括传统的数据库系统无法处理的半结构化与非结构化资料等,而梅西百货从 2010 年开始,就引入 Hadoop 云端处理平台进行巨量资料分析,梅西百货的行销分析与客户管理系统总监(Director, Marketing Analytic and CRM Systems at Macy's)- Seetha Chakrapany 认为,采用 Hadoop 云端处理平台是因为传统的资料处理架构与资料处理解决方案不够弹性,也不够敏捷以处理大量且多样的资料,处理历史资料需要花费很高的成本,计算能力有限制,扩充成本高,也不能处理非结构化的资料。

为什么要采用 Hadoop 来做智慧商业(BI)呢?首先可以用 Hadoop 单一档案架构处理各种使用情境,而且 Hadoop 平台整合了资料,处理与工具的整个生态炼,并可以集分析、实验、分析结果产出于单一平台,例如你有一个想法,可以直接在Hadoop 平台上分析巨量数据是否能验证你的想法,并且套用在商业决定上以及测量效果等,最后相较于传统的数据库解决方案,Hadoop 整体的建置成本也较低,扩充越多的服务器就可以取得相对越多的效能,增加的成本与增加的效能是等比例增加的。

Seetha Chakrapany 也认为 Hadoop 就操作面上带来的优势就包括,第一是可以在 BI 的测试/实验循环,一直到产出的流程间快速进行,第二平台上的资料品质、管理与安全性也有保障,,第三是具备可接受的稳定度与稳健性水准,且能符合各种服务水准协议,最后是具备多等级的自动化能力,只需要一些些的人为介入即可。

如果我们看梅西百货的巨量数据分析架构蓝图, 包括顾客本身、订单、产品、网站点击、行销资料以及其它外部资料都是巨量数据分析的资料来源,并且在 Hadoop 上进行资料储存、管理、处理、保全,处理过程也因应不同的用途而适用各种工具,例如用EPIPHANY做行销活动管理/最佳化,用 SAS、R 语言做资料分析,用 Kxen 、Kiji、H2O.ai、Mahout、Salford System 做进阶分析/模组化,用 Tableai、AtScale 做资料视觉化/资料探勘,最后包括行销人员、商业人员、产品管理人员、分析师、资料科学家,以及其它部门都能从中得到想要的资讯。

顾客隐私与经济效益 巨量数据分析的两难或双赢

就如同在巨量数据分析架构蓝图看到的,巨量数据分析首要的就是能有各式各样、各种类的数据,然而舆论经常对于梅西百货收集顾客资料有微词,担心这些顾客资料会被滥用,但是梅西百货认为,顾客资料收集以及提供更完美的购物体验是一体两面的事,因为如果梅西百货不收集大量资料,并做巨量数据分析,如何得知顾客究竟喜欢哪些商品,如何在下次光临线上购物网站或线下实体商店时,提供顾客最想要的商品呢?梅西百货认为它们是以一种负责任的态度在进行顾客的资料收集与分析使用,对顾客来说,它们可以提供顾客最想要的商品或者商品的广告,对梅西百货来说,自然也能提高商品销售量,对顾客以及对梅西百货两者都是双赢的。

有些人认为大数据会侵犯到个人隐私,你觉得这样收集用户资讯合理吗?

2018-05-17 22:33:00

相关文章