易点天下CTO王一舟:联邦学习+图像AI+公有云 助力数字广告精准度提升革命
新冠疫情的突然袭击,让全球经济都笼罩着极大的不确定性,但是以5G、深度应用互联网、大数据、人工智能为代表的“新基建”则展露了不同于传统行业的顽强生命力,成为了经济发展的新引擎。
据媒体报道,作为中间服务商的广告营销企业,素来有国民经济的“晴雨表”之称,同样经营羸弱,尤其是线下广告企业。但与之相反,主要“战场”在线上的数字营销市场受到疫情的影响较小,尤其是主要客户群体来自短视频、游戏等行业的数字营销企业,收入不降反增。
“新基建“如何与数字营销行业结合,发酵出助推中国企业国际化的更大助推力?
在2020阿里云线上峰会“云基建”持续助力互联网企业出海专题中,易点天下网络科技股份有限公司(以下简称“易点天下”)CTO王一舟结合公司与阿里云的合作过程,分享了数字营销企业在全球化服务过程中面临的技术挑战和成功经验。
他提到:“现在的数字广告精准度还有很大的提升空间,公有云的加入,不仅为企业节省了大量成本,还让海量数据存储、灵活调用以及数据价值最大化的挖掘效率都迅速提升,我们也有了更多的精力去完善分析模型,帮助更多企业精准触达全球潜在用户。”
一、全球化服务,带来了全球化数字资产管理的技术挑战
易点天下是一家企业国际化智能营销服务商,其为客户提供全球营销推广服务,通过效果营销、品牌塑造、垂直行业解决方案等一体化服务,帮助企业在全球范围内高效地获取用户、提升品牌知名度、实现商业化变现。
作为全球领先的第三方独立广告服务商,易点天下拥有丰富的全球媒体资源。平台数据覆盖全球200多个国家和地区, 目前累计服务客户超过2,000家,其中包括阿里巴巴、腾讯、网易、字节跳动、快手、爱奇艺等知名企业。
全球化的业务特点,给易点天下带来了三大技术挑战:
● 首先,面对同一广告主在全球不同市场、不同广告主在全球同一市场的需求相关性和相似性,易点天下必须打通上下游数据,才能满足其营销需求。同时,服务的过程也必须保持一致性,不能因为市场差异导致了服务的区别。
● 另外,诞生在全球不同区域的原生数据,在统一的数据治理过程中就需要完成跨Region的数据采集、管理,这对网络、存储等多个环节都提出了更高要求。王一舟提到:“全球网络用户突破40亿,高峰期我们要承受每秒百万次的业务请求,这对每个数据中心和节点的并发处理能力要求是非常高的。同时,全球不同国家用户因为时区和行为差异导致了交错出现的波峰波谷,在数据需求低时,还需要及时缩容来控制成本。”
● 第三,数据驱动业务不是以数据采集为目标的,而是以运算、反哺业务决策、真正帮助广告主以更低成本获取用户为目标的。所以,在庞大的数据规模下,如何有效实施离线运算,给业务进行辅助支持也是非常重要的环节。
二、启用阿里云全球数据中心,完成基础设施部署
易点天下为了实现全球服务的一致性,在技术上,就要完成不同国家和区域的本地化部署,同时,数据中心的选取还必须同时满足两大需求:
出于产品和运维的需求,易点天下需要不同地区数据中心,云原生服务的能力保持一致,且可以保障业务资源足够稳定,网络质量高效辐射至周围用户。
出于业务指标的要求,比如归因场景下要求毫秒级的归因统计、分钟级的实时报表,易点天下则对启动的数十个技术中心之间的数据通信的可靠性有着非常严格的要求。
在这两方面,阿里云非常好地满足了易点天下的实际需求。在合作过程中,易点天下几乎启用了阿里云全球所有的数据中心,完成全球基础设施部署、满足数据要求。
三、数据落盘只是最简单的一步,重点是如何使用
因为广告主分布行业不同、国家不同,目标不同,比如电商以下单成交为目标,游戏类客户以安装为目标,所以不同的日志数据之间如何治理分析就很重要。
不同场景下,要支撑运营团队去做不同时间维度的聚合报表,电商再营销场景去实时更新用户竞价清单以及竞价预测模型,在应用类用户新增场景下又要去做用户相关度的分析。不同场景构建不同服务,也会有数据冗余和资源的浪费。
易点天下基于阿里云构建了全球统一数据计算中心,数据多方接入、统一汇聚、集中计算。
启用了基于阿里云DLA+OSS的多源混合计算之后,首先实现了绝大多数数据运算场景的运存分离,把绝大多数原始日志放在OSS之上,在背后使用不同的云原生服务或自建服务去检索这些原始日志,一方面可以降低存储成本,另一方面也提升了数据的一致性和有效性。
为了更好的释放运维管理成本,易点天下逐渐将完全自建的独立集群过渡到混合式自建预留式集群+弹性EMR,目前,绝大多数任务已经实现按需运行在EMR集群之上,每天数据量读取超百T,支撑全球业务的数据计算分析业务。目前,仅通过1-2个运维人员就可以完成每天数百封业务报表、数百个业务模型的重新分析更新、数百个特征的筛选、提取和评估,每天超百亿次流量预测和广告推荐。
四、联邦学习+图像AI+公有云 助力数字广告精准度提升
易点天下CTO王一舟在演讲中提到,目前数字广告的精准度从技术层面来看还是很低的:“举个不完全准确的例子,现在网友几乎每看100个广告物料才会有一次点击,每100个广告点击才可能有一个成单。其中原因很多,我们也一直致力于提升转化漏斗的比例,比例越高一方面意味着对用户的打扰就越少,另一方面也有助于商业变现效率的提高以及每个广告主获客成本的降低。”
未来,易点天下将建立覆盖面更广且更为安全的数据分析平台,例如通过Federal Learning(联邦学习)及区块链技术的方式跨客户跨行业进行数据分析和建模,在保护客户数据安全的前提下,提升客户的效果营销精准度。
在图片、短视频为王的时代,易点天下计划利用NLP、图像AI技术在理解用户需求的前提之下实现创意物料的加工、组装、拼接和展示,避免人工制作的高成本的同时,真正能做到千人千面的广告投放。
要实现以上目标,一定需要大量的运算资源和IT资源,现在的公有云就提供了非常好的底座。易点天下将持续投资弹性运算平台,加大container / serverless computing / 云原生大数据平台等技术的使用比例,提升单位成本下数据处理和模型训练的能力,为提高数据处理广度和深度提供底层资源的有效支撑,以提升我们在不同场景下的资源利用率,提高服务效能、降低服务成本。