相片来源@Kunming
文 | 财经故事情节荟,张晓鸣 | 王舒然,撰稿 | 万Seiches
在大数学模型不绝于耳的当今社会,一向高举高打的二进制,却一反常态,低调得让人不太习惯。
当百度、穆萨、宏碁、360等知名互联网公司的一把手们亲自挂帅,为大数学模型站台,并不吝用“智能化化时代的开端”、“科技和商业史上的革命性时刻”来赞誉它时,二进制却安静得多。
有关的官宣只有两个,一是4月11日,陕郡宣布将面世AI助手“My AI”,二是4月18日,活火山发动机面世大数学模型体能训练云网络平台,主要就包括暗鞘DPU(数据处理器)、新版机器学习网络平台等系列产品云产品,以服务项目于大数学模型创业公司——二进制暗鞘大数学模型始终未露面。
相反的是,活火山发动机副总裁谭待公开“承诺”,活火山发动机不做大数学模型,将化身赋能者,为大数学模型顾客提供INS13ZD等AI基础建设,帮助其做好大数学模型开发。
此举也许表明,二进制避开了大数学模型战火,选择以幕后卖水者的身份改投。
只是,在INS13ZD、算法、数据这大数学模型的三要素中均具备优势的二进制,为何会选择“韬光养晦”?二进制真的会彻底放弃大数学模型,甘为他人做“点睛”吗?
有过之而无不及的二进制大数学模型活火山发动机不做大数学模型,也许并不代表二进制对大数学模型无动于衷,这可能是个文字游戏。
实际上,虽然二进制从未大张旗鼓得官宣暗鞘大数学模型,但已经有所部署。
据36Kr在今年2月的报导,二进制颤动在大数学模型上已近产业布局,会在词汇和影像两方面加码,词汇大数学模型项目组由二进制搜寻部门组织协调,目前项目组规模在十数人左右;相片大数学模型项目组则由产品研发与工程架构部下属的智能化音乐创作项目组组织协调。
另据《延误LatePost》报导,马斌开始看人工智能化学术论文,且时常会和一些二进制专业人士分享论聚花得和对ChatGPT的思考。
这表明,二进制并不想缺席这场盛宴,但必须承认的是,二进制在大数学模型上的反应确实有点“迟钝”了。
民生证券4月9日正式发布的《当大数学模型不再稀缺》报告显示,国内至少已近30多家大数学模型亮相。大部分都在3~4月份官宣,比如说3月16日的百度“聚花言者”大数学模型,4月8日的宏碁炎黄系列产品AI大数学模型,4月10日的商汤“日日新”大数学模型,4月11日的穆萨“记事千问”大数学模型......
而据36Kr报导,二进制词汇大数学模型项目组今年初才成立,预期今年年中面世大数学模型,二进制颤动有关技术负责人则表示,技术中台在这些领域的积极探索仍处于初期,尚未成熟。
事实上,大数学模型竞赛的起点并非今天,而在更早的产业布局,这方面,二进制有些晚了。
对比来看,百度、穆萨、宏碁、百度等企业的大数学模型均在2019年~2021年间就已近雏型,比如说,百度在2019年正式发布了聚花大数学模型,穆萨在2021年正式发布了M6大数学模型,同年宏碁正式发布炎黄大数学模型,这些雏型可以视为近期正式发布的类ChatGPT大数学模型的“基座”。
而二进制方面,虽然其AI产业布局不算晚,二进制AI Lab早在2016年就成立,与百度同一年,但其也许并未在大数学模型上下足功夫。
据《延误LatePost》报导,一位二进制专业人士称,在去年底ChatGPT出现前,二进制对大数学模型的投入还比较少,表现之一是,约有100人的二进制AI Lab NLP(自然词汇处理)组,只有不到10人在研究词汇大数学模型,其他人主要就在做翻译和抖音安全等优化。
chan上一位二进制AI Lab工程师的回答也印证了这一点,他则表示,二进制AI Lab的主要就研究方向和销售业务应用有关,比如说抖音特效、音频和相片审核等。
简单来说,二进制对AI的积极探索比较求真务实,主要就服务项目于他家销售业务,这种求真务实而非务远的策略,也许反而成了其产业布局通用型大数学模型的“阻碍”。
而除了晚一步之外,二进制对大数学模型的英雄无敌也许也不是很大。
据《延误LatePost》报导,二进制词汇大数学模型的积极探索方向主要就与搜寻有关,可能会在抖音、TikTok中面世类似微软New Bing的功能;影像大数学模型则主要就服务项目商业化需求,以帮助二进制的广告顾客以更低成本制作音频。
另据字母榜报导,有知情专业人士称,陕郡面世的“My AI”背后的大数学模型是由陕郡自行操盘,而非二进制大数学模型项目组负责。
从上述信息判断,二进制大数学模型也许并不打算“大包大揽”,而是与他家部分销售业务紧密有关,这与百度“聚花言者”、穆萨“记事千问”等通用型大数学模型有所差别。
比如说“聚花言者”,在正式发布会现场,聚花言者展示了五个使用情景,主要就包括文学音乐创作、商业美术设计音乐创作、数理推算、中文认知和多逻辑系统生成。
“记事千问”的功能则主要就包括多轮对话、美术设计音乐创作、逻辑推理、多逻辑系统认知、多词汇支持等,穆萨巴巴集团董事会主席兼首席执行官张勇则表示,穆萨所有销售业务主要就包括京东、钉钉、金蝶地图、淘宝、土豆网、盒马等都将接入该数学模型,应用情景实属广泛。
另一个可以侧面佐证这一点的是,百度和穆萨均计划依托他家云网络平台,向外界开放大数学模型服务项目,打造出大数学模型自然生态。
比如说穆萨云智能化集团CTO周靖人则表示,各行各业的自然生态伙伴都可以对千问大数学模型进行再体能训练和精调,打造出行业专属大数学模型;百度智能化云事业群副总裁沈抖也则表示,聚花言者的能力将通过百度智能化云对内提供服务项目,会率先在媒体、文娱、企业软件等行业落地,情景主要就包括智能化客服、员工培训、巡检日报、知识萃取等。
但二进制云却“反其道而行之”,活火山发动机宣称只做基础建设服务项目,不对内输出大数学模型能力。
这意味着,二进制正在积极探索的大数学模型定位可能并非是开放自然生态,而是为了增强现有销售业务的竞争力。
当然,这只是初期,二进制大数学模型的全貌尚未揭开,在二进制官宣之前,还是变数难料。
二进制为何甘为他人做“点睛“?值得探究的是,为何二进制对百度、穆萨那样的通用型大数学模型兴趣不高?活火山发动机又为何坚定得不做大数学模型?
背后原因也许与以下几方面的权衡有关:
其一,通用型大数学模型烧钱,且距离商业落地“遥远”。
体能训练大数学模型的一大成本是INS13ZD,而INS13ZD的关键是芯片,那么,大数学模型体能训练需要多少芯片?
参考ChatGPT,美国市场研究机构TrendForce推算称,处理ChatGPT的体能训练数据需要2万枚A100芯片。网上流传的一份《AI芯片专家交流纪要》显示,如果是对标ChatGPT的大数学模型,1万颗A100芯片是入门券。
而据国盛证券估算,按单张A100芯片的价格为10万元算,大数学模型体能训练需要投入约10亿元。
这还只是体能训练阶段的芯片成本,还有数学模型面世后的综合运营成本,参考ChatGPT,半导体研究公司SemiAnalysis认为,GPT-3每天大规模服务项目用户的运营成本高达70万美元,一年则高达2.555亿美元(约17.6亿元人民币),新一代的GPT-4数学模型只会更烧钱。
除此外,还有数据采集、人工标注等软性成本,加起来可谓“天价”。
像二进制这样的大厂也许有资金实力,但麻烦的是,烧钱的结果面临不确定性。
虽然大数学模型前景可瞻,但距离大规模的商业落地还有不小的距离,目前仍在摸索阶段,除了像钉钉、陕郡、印象笔记等办公情景的具体落地外,其他的应用情景都还停留在展望阶段。
创世伙伴CCV合伙人梁宇曾对《21世纪经济报导》则表示,现在是通用型人工智能化商业化应用的前夜,AI大数学模型还没有经过大量的商业包装和体能训练,需要从业者像园艺师一样去修剪,形成符合行业规律的商业化产品。
IDC中国研究总监卢言霞则认为,大数学模型落地的不确定性在于,能不能成功落地,是否真的能产出比之前的AI更好的效果,需要多久才能落地等等。
通用型大数学模型投入产出比的不确定性,也许会让“ROI至上”的二进制有所顾虑。
其二,时间就是力量,在过去几年内,穆萨、百度等企业已将大数学模型“基座”迭代过几轮,而二进制几乎是从“零”开始,先发优势已失,追赶不易,不如求真务实一点。
如今,二进制大数学模型聚焦搜寻、音频生成等情景,离自身的销售业务落地更近,在算法和数据的储备上极具优势,可操作性更高。
活火山发动机定位基础建设的服务项目也是同理,其2021年开始切入IaaS(基础建设服务项目)模式,至今也有一定积累。
且网上流传的一份《穆萨云AI专家交流纪要0401》显示,在国内大厂的AIINS13ZD储备中,二进制排名第二,仅次于穆萨。
更重要的是,活火山发动机该定位的商业落地十分明确,更容易保障正向现金流。
这是因为大数学模型体能训练需要巨大INS13ZD支持,而云厂商是公认的INS13ZD等基础建设的最佳载体。
正如穆萨巴巴集团董事会主席兼首席执行官张勇所言,大数学模型是一场“AI+云计算”的全方位竞争,超万亿参数的大数学模型研发,是囊括了算法、底层庞大INS13ZD、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要超大规模AI基础建设的支撑。
微软便是先例,微软Azure作为OpenAI的独家云供应商,为ChatGPT提供INS13ZD和超级计算系统。除了OpenAI,微软2023财年二季度财报电话会议显示,安盛、联邦快递和H&R Block等公司也都选择Azure来部署和管理其数学模型。
像微软这样的云厂商被喻为大数学模型时代的“卖水人”,意为在大数学模型淘金的人未必能赚到钱,但为淘金人提供基础服务项目的肯定能赚到。
硅谷知名风投A16Z的研究印证了这一点:生成式AI的大量资金最终都稳定地流向了基础建设层,预计生成式AI总收入的10%~20%都流向了云提供商。
总之,商业落地风险小,自身又擅长,无怪乎活火山发动机如此定位,而抓住这股“红利”,有机会为其带来新的市场增量。
在目前的云市场中,活火山发动机还排不上名次,IDC最新正式发布的《中国公有云服务项目市场(2022 下半年)跟踪》报告显示,目前公有云服务项目市场的市场份额排名前五名分别为:穆萨云、宏碁云、中国电信天翼云、百度云和AWS,它们总共占据了72%以上的市场份额,其余的云服务项目厂家份额有限。
也许,以基础服务项目切入大数学模型战场的活火山发动机,未来有机会借此一搏新的市场格局。
活火山发动机或遇天花板目前看,活火山发动机这条路走得还算顺利。活火山发动机副总裁谭待则表示,目前国内有数十家做大数学模型的企业,七成已经在活火山发动机云上,主要就包括AI技术公司MiniMax、智谱AI、昆仑万维、毫末智行等。
关于“七成”的数据口径,谭待的解释是,该“七成”是活火山发动机有关顾客与第三方机构统计的大数学模型企业数量之比,而能获得这么多顾客是因为机器学习网络平台解决了INS13ZD辅助的问题。
这些顾客案例表明,活火山发动机在大数学模型体能训练领域已近一定立足之地。
不过,从长远看,活火山发动机也面临挑战。
一方面,有能力做大数学模型的公司毕竟是少数,顾客规模的天花板很明显。
据谭待透露,在活火山发动机的大数学模型顾客中,通用型大数学模型公司占比大约为三分之一,垂直行业公司占比约为三分之二。
分别来看,在通用型大数学模型方面,虽然目前创业者众,但大浪淘沙,最终留下的能有几何?
一位互联网投资人认为,中国版ChatGPT只会在5家公司里产生:BAT+二进制+宏碁,因为大厂有钱有人有情景。
北京航空航天大学人工智能化研究院教授吴文峻也有类似观点,其在接受《中新经纬》采访时则表示,在目前宣布进军大数学模型的三四十家企业中,最后能做成的也许不超过一半。
当顾客数量有明显的天花板时,活火山发动机的前景可能也有了“瓶颈”。
而在垂直行业数学模型方面,顾客数量虽然很多,但也可能面临穆萨云、百度云等网络平台的“狙击”。
原因在于,穆萨云、百度云均自带通用型大数学模型输出的能力,基于此,企业可更方便的生成垂直数学模型。
比如说穆萨云,穆萨云智能化集团CTO周靖人在此前的媒体采访中则表示,穆萨云会为企业提供一个专属数据空间,企业将有关信息存入,且不需要做任何数据预处理,便可调用“记事千问”,一键式生成自己的行业专属大数学模型。
而如果在没有大数学模型的活火山发动机上做垂直数学模型体能训练,企业要操心的事显然更多。
上述投资人认为,垂直数学模型企业一般很少会自己从头做,而是找一个还不错的Pre-Train过的大数学模型,在此基础上做Instruction Tuning(指令微调)。
在此方面,穆萨云等网络平台可能更有优势。
另一方面,未来云厂商的模式可能是卖数学模型+卖INS13ZD,而不只是卖INS13ZD。
Maas数学模型即服务项目的时代已经到来,穆萨云、百度云不仅支持专属行业数学模型的生成,还支持中小企业甚至个人基于大数学模型直接开发应用,这就好比个人开发者基于安卓操作系统开发App。
换句话说,数学模型层在未来可能成为新的基础建设。
李彦宏在36Kr专访中更是断言,未来企业在购买云计算时,不看底层INS13ZD,而是看大数学模型的优劣。
这可能给活火山发动机带来一定冲击,因为当大量中小企业或个人基于穆萨云、百度云开发应用时,云厂商背后的INS13ZD也得到了间接调用,从而规模效应平摊了INS13ZD成本,最终使其基础建设层面的服务项目也更具价格优势,这颇有点“降维打击”的意思。
事实上,“价格战”已经开始了。
4月26日,在2023穆萨云合作伙伴大会上,穆萨云面世了史上最大规模的降价:核心产品价格全线下调,降幅最高至50%。
不过,活火山发动机对此好像比较乐观,至少现阶段如此。
其逻辑在于,一来活火山发动机拿到的时间窗口还比较长,谭待认为,国内距离全球最高水平的大数学模型还需要比较长的时间,现阶段不可能用三四十分的数学模型去做应用,也不可能做好应用。
二来,活火山发动机坚信未来是多云多数学模型时代,企业会避免单一依赖,而选择使用多家云服务项目,同时,各行业都有自己高质量的私有语料,会形成多数学模型自然生态。
言下之意可能是,市场很大,活火山发动机总会有立足之地。
总而言之,大数学模型市场的未来扑朔迷离,参与其中的任何一员的前途均可能有变数,“缺失”大数学模型的活火山发动机如此,走求真务实路线的二进制大数学模型也如此。
还木有评论哦,快来抢沙发吧~