Snowflake与星环科技小记
这次来聊一个基础层的产品:数据库或数据仓库等。
关于Snowflake,已经有不少相关的介绍和讨论,并且在技术和产品层面做了一定深度的探讨(部分参考链接附于文末)。
由于技术层面较为复杂,部分内容需要推敲,不对其过多展开,更多总结一些能够看到的核心要点。欢迎行业内专家交流讨论。
01
云时代数据管理产品:多模型和云原生数据管理平台
星环科技在科创板招股书中提到了3代数据管理产品的演进迭代。
图:数据管理软件主要技术演变和代表公司
来源:星环科技招股书
1)第一代关系型、集中式:非常清晰的数据关系,代表公司是典型的“去IOE”公司,Oracle、IBM、Microsoft。
2)第二代非关系型、分布式:针对互联网上大量不同结构和形式的数据(图片、时间、动作、文本等),产生了图数据库、文档数据库等NoSQL数据库,代表厂商是MongoDB、Cloudera、Elastic。
3)第三代多模型、云原生:一方面,从单一模型转为多模型,由于单一模型各自在不同的单独数据库中,当综合处理分析时,则需要搬迁或融合,非常麻烦,多模型则可以统一处理不同类型数据。另一方面,云计算普及度快速提升,云原生的数据库能够在云端快速延展储存和计算能力,同时加快数据分析和对商业的洞察。Snowflake便是最著名的代表。
星环Transwarp也将自己列在了第三代多模型和云原生数据管理产品中。
另外,对于市场而言,
数据管理软件产品,理论上应该是个典型的大中型客户市场。小公司通常数据量小,且数据管理和分析相对较弱;只有中大型公司存在较为复杂的数据管理和分析需求。
也就是说,这应该是个典型的大KA生意,主要针对大客户营销,客单价高、续约率高,销售费用通常也占比高。
02
Snowflake:一个多云数据管理的平台型产品
Snowflake的业务逻辑是相当有想象力的,有几个明显的优点:
1)能够同步对接3大公有云平台,并且统一管理
Snowflake是3大公有云的经销商(AWS、微软Azure、谷歌云),用户可以直接在Snowflake上下单购买3大公有云的基础设施,非常便捷,并且能够在Snowflake上对这些云和数据统一管理、分析计算。
2)可以将存储与计算分开,加快分析
Snowflake在3大公有云的基础上,能够将存储与计算分开,当数据科学家对数据进行分析时,计算量猛增(相对没有计算和分析的情况而言),此时Snowflake可以根据计算量,快速提升计算算力(而不会一小时、一天后才能得到数据计算结果)。
3)由于数据滚雪球效应,可以不断叠加数据分析功能,BI、AI等
在客户持续不断增长、以及客户在Snowflake上的数据持续不断增长后,Snowflake相当于企业的一个重要数据平台,而Snowflake也提供了不少易使用、内嵌的工具,方便分析人员直接在Snowflake平台上展开分析,而不是传统得导出数据、处理数据再分析。
同时,也包括能够在环境中使用较为熟悉得SQL语言,并且连接了不少市面上现成的分析工具厂商。
4)甚至可以相对安全得数据交易
Snowflake在招股书中讲了一个新冠数据分享的例子:一个数据分析公司在Snowflake市场上销售关于新冠相关的数据,有几百家公司购买了数据,用于分析对公司经营的影响。
根据介绍描述,这种数据交易在Snowflake的环境中,而非直接下载数据,购买数据的用户有了在Snowflake环境中使用该数据的权利,并且可以直接分析。
图:Snowflake数据交易
来源:Snowflake招股书
Snowflake基于3大公有云提供的一系列产品。
图:Snowflake平台
来源:Snowflake Presentation
19-21年快速增长:20年CAGR 170%+、21年CAGR 120%+。
图:Snowflake 2019-2021财年数据
来源:年报
03
星环科技:本土化的云原生多模型厂商
星环科技的产品和落地非常有本土化特色。
国内有几个特点:
1)数据库很大的替换需求来自国资的“去IOE”,而国资的要求大多为私有云。
2)国内云计算仍在发展,多云特点看起来不明显,用1-2个云的公司可能是主流。
3)对数据分析的要求:在2C业务中,对智能推荐和营销相关的数据分析需求更旺盛,而其他领域的数据分析使用频率有待确认。
这从星环所服务的客户名单中能感受到,大部分以数据量庞大的金融机构、或者与民生相关的领域,以及业务庞大的头部企业。
图:星环科技部分客户名单
来源:星环科技招股书
产品层面,包含了大数据与云基础软件(和后面的关系型数据库的区别是?)、分布式关系型数据库、数据开发分析工具,以及应用层产品、软硬件产品(作为提升营收的一种方法)。
图:星环科技产品布局
来源:星环招股书
星环科技最新状态显示仍在反馈中。