大模型黄金时代,AI独角兽逐梦的曙光来临
近几个月,AI大模型扎堆出现,有人将之称作“百模大战”。
创新工场董事长兼CEO李开复表示:“AI大模型是中国不容错过的历史机遇。通过发展AI大模型,中国可以推动创新产业的发展,实现科技与经济的双重红利。”
启明创投合伙人周志峰也认为,中国与美国对于AI通用底座大模型的生态环境非常不同,中国有很多独特的机会。除了高技术壁垒、高人才密度和高资本需求的大模型方向,年轻创业者、垂直产业老兵、AI界大咖在技术和应用多个维度都有不同的创业机会。
的确,过去几个月里国内互联网企业、科技巨头和高校院所展开了一轮关于大模型的“军备竞赛”。3月,在OpenAI发布GPT-4大模型后,百度正式发布“文心一言”。
随后的整个4月可以被称为“大模型的发布月”,华为“盘古”、360“智脑”、商汤“日日新SenseNova”、知乎“知海图AI”、昆仑万维“天工”等等密集发布。
部分没有赶上这波热潮的企业则先把上线日期公布了出来,提前“卡位”,字节跳动自研的大模型计划今年9月上线,京东“言犀”最晚也在年内推出。
大厂之外,众多“大佬”也密集入局。3月,前阿里技术副总裁贾扬清宣布离职阿里,未来创业方向为AI大模型底层技术相关,目前第一轮融资已经到位。4月,出门问问创始人李志飞宣布推出AI大语言模型“序列猴子”。更早前,原美团联合创始人王慧文一条朋友圈传播甚广,“5000万美元,带资入组,不在意岗位、薪资和title,求组队。”表明了他的决心。
一位业内人士形容大模型热潮是“这几乎赶上了2000年左右的互联网创业潮,没有人想错过这班车”。
除了这些众所周知的企业和大佬,还有更多创业者在赶来的路上。
“据不完全统计,中国10亿以上参数规模的大模型已经发布了79个,从地区来看北京和广东最多,自然语言处理是大模型研发最活跃的领域。”在中关村论坛上,中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耕披露了中国人工智能大模型的情况。
一位投资人告诉我们,现阶段投资机构一般把AIGC投资分为应用层、模型层、基础层三个层面。
基础层包括算力、存储、数据,每个领域都有传统企业把守,新玩家基本进不去。所以大模型创业的机会,属于大厂和明星公司。而应用层的创业属于脑洞大、有想法的创业者,也属于那些在垂直领域有独到见解的观察者,这也是很多人选择加入创业潮的原因。
场子热起来后,众多投资机构也加入其中。数据显示,2020年GPT-3发布的两年内,全球创投机构对AI企业的投资增长了4倍,仅2022年就有13.7亿美元的融资。
“百模大战”,创业者如何“突围”
一位AI行业投资人告诉我们,对于参与到AI大模型竞争中的企业来说,无论是大厂还是创业团队,竞争几乎是全方位的,技术、资金、产品、运营、市场、人员配置等,缺一不可。
对于创业团队来说,起步初期最大的问题就是缺乏资金和技术支持,这让很多创业团队踌躇不前。
因为大模型的技术特点决定了高昂的研发门槛和持续的资金消耗。以ChatGPT为例,2018年OpenAI在训练GPT-1时,所用到的参数数量和数据训练量分别为1.17亿和5GB。但在2020年训练GPT-3时,以上两项数字则分别增长到1750亿和45TB(1TB=1024GB),GPT-4的训练参数量更是高达1.6万亿。
另据OpenAl发布的相关数据显示,训练13亿参数的GPT-3XL模型一次消耗的算力约为27.5PF-days,训练1750亿参数的完整GPT-3模型则会消耗算力3640PF-days(即每秒一千万亿次计算,要运行3640个整日)。
以GPT-3模型消耗的算力3640PF-days为例,若按照单个500P中心项目的总投资为30.2亿元来计算,若想要保证ChatGPT的正常运行,则至少需要投入7-8个数据中心,所产生的总成本超过200亿元。
显然,这是大部分初创团队不敢轻易尝试的生意。
资金层面,最终一、二、三等奖的获奖团队,将分别有机会获得总值人民币1000万元、500万元、200万元的早期投资;技术层面,将为参赛团队提供可稳定调用的文心大模型API及百度智能云算力资源;人才方面,百度将为最终获奖团队,提供为期一年的AI大模型技术辅导与交流机会。
5月31日起,专注于AI方向,有意愿且有能力基于百度文心大模型搭建自己的应用,或将文心大模型与自有产品进行结合的初创团队,或是已有成型产品或demo的初创公司,均可报名参与“文心杯”创业大赛。
目前国外已经出现了DoNotPay、Jasper、Speak等AI原生应用,而国内尚未有类似的现象级产品问世。
李彦宏认为,未来,中国会有自己的生态系统,拥有自己的大语言模型和基础模型。中国会出现至少一个、也可能是两个或三个基础大模型,可以支持人们开发各种AI原生应用。美国开发者正基于ChatGPT或其他语言模型开发新应用。在中国,更多开发者将会基于文心大模型来开发AI应用。
从全球已经发布的大模型分布来看,中国和美国超过全球总数的80%,美国在大模型数量上居全球之首,中国从2020年进入大模型快速发展期,目前与美国保持同步增长态势。
尽管整个赛道呈现出一片欣欣向荣,但多家券商在研报中表示,国内大模型应用层产品进度不及预期、应用层商业模式推广不及预期等问题,以及人工智能相关政策风险。
百度创始人、董事长兼首席执行官李彦宏
李彦宏将当前的大模型生态分为三类,第一类是新型云计算公司,云计算主流商业模式将会从IaaS变为MaaS(模型即服务)。第二类是进行行业模型精调的公司,介于通用大模型和企业中间,这类企业可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。第三类是应用层的企业,基于通用大语言模型开发应用服务,这可能才是真正的机会。这其中,他最看好应用层的市场机遇。
参考海外经验来看,事实也确实如李彦宏预测。典型的案例如Jasper,其以“AI文字生成”为主打产品,通过其文字生成功能,用户可以轻松生成Instagram标题,编写TikTok视频脚本、广告营销文本、电子邮件内容等略显烧脑的重复性工作。
作为行业翘楚,Jasper去年拥有超过70000名客户,并创造了4000万美元的收入,预计到2022年底,收入将达到9000万美元,是去年收入的两倍以上。因此,这个成立于2021年1月,刚刚2岁的新公司一跃到了独角兽级别。
百度也希望与全球大模型创业团队共同成长,孵化出估值超10亿美金的独角兽企业。
“文心杯”创业大赛的正式开启,让更多创业者有机会获得来自百度的全面扶持。通过比赛,百度不仅用资金和技术把创业者“扶上马”,还将用创投的形式“送一程”。
大模型时代,不是单打独斗、跑马圈地的时代,百度希望做一个使能者,以全栈技术加持千行百业,构建一个繁荣强大、充满活力的AI生态,实现协作共赢。
为什么百度有这样的底气,因为它是全球为数不多在芯片、框架、模型、应用四层架构中有全栈式自研技术的企业。
从“昆仑芯片、飞桨深度学习平台、文心大模型到应用层”可以做到四层端到端的优化,形成高效的反馈闭环,最大程度地发挥各层的效能。这种全栈技术能力,让百度有能力、有实力做到“一站式”服务。
此外,百度内部也高度重视技术创新。李彦宏在近期的内部讲话中强调,“最近我看到一个数据,说全球算力规模,美国占34%,中国占33%,算力差不多。我要说,算力不能保证我们能够在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的,是需要自建的。”
在科技创新的大趋势下,只有能落地到业务场景的技术才是好技术。大模型落地拼的也不是营销和参数,是创新能力,而这种创新,绝对不是靠几家科技大厂能够完成的。只有依靠更多的社会化力量,促进大规模的AI应用创新涌现,让这些创新者、创业者走的更稳、更好,才能更有效的实现中国式AI生态布局,加速高水平科技赶超引领的步伐。
总结
“大模型改变了人工智能,也即将改变世界”,李彦宏如是说。
在大模型黄金时代里,各行各业都将被改变,所有的产品、服务都将被重构,这个过程中将爆发巨大的产业机会,对于任何创业团队而言这都是千载难逢的机会。
但这些刚刚起步的初创团队,不可避免地将会遇到资金、研发、技术、人才等多方位的挑战,在没有外部的帮助之下想要独立成长壮大,简直难于登天。
“文心杯”为参赛的创业者提供了一辆“快车”。
百度为参赛团队开放出文心大模型相关能力及百度智能云算力资源,并邀请来自IDG资本、百度风投、百度资本等知名机构投资人与多位百度AI专家担任评审,既能提供资金支持又能给出专业的技术指导,让创业团队起跑就“快人一步”。