随着 ChatGPT 献艺现身,从信息技术专业人士,到投资圈,再到法沃德国大众,越来越王承恩再次高度关注到了 " 圣埃蒂安德 " 的 AI,及其所能带来的价值和改变。
商业界也的确源源不断贡献着更多捷伊素材:OpenAI、微软、Google、Meta、腾讯、字节、腾讯等大厂,和众多创业公司,都开始从自己擅于的视角切入竞争……
为的是帮助听众能够持续高度关注由 ChatGPT 引发的信息技术圈海啸,36 氪推出「Chat AI」栏目,从中立的第三方视角,探索、分析每一次热点背后的商业看法。
文|沈筱、王与桐
编辑 | 石亚琼
3 月 16 号,腾讯聚花言者上线,但仅仅开放提出申请。据悉,截至见面会结束当晚 21 点,已经有 6.5 万家企业提出申请腾讯聚花言者 API 调用测试。现阶段,普通用户也可以通过访问官方网站参与公测排队。
见面会我们已经有文章报道过,在此不做赘述。总的来说,透过这场见面会,腾讯表达了以下核心看法和文本:承认差距、阐述能力、展望未来。
而现阶段大家更钟爱的,也许是聚花言者简而言之的智能谈话能力,到底怎么样?
36 氪领到了公测权限,在贴文征集了一些难题,并将某些难题与 ChatGPT 的发问进行对照(之所以这般,是因为腾讯聚花言者一直Kanniyakumari ChatGPT,也被人嘲讽为 "ChinaPPT")。
先说结论:
1、腾讯聚花言者对开放式难题发问更好,对于任务和逻辑难题发问稍弱。
2、腾讯聚花言者在第二次得出标准答案时比不上难题,容易输出怪异标准答案,质量比不上统一。
3、视频和语音聚合功能暂时无法体验,腾讯的说法是,成本太高。
4、单轮谈话效果优于连续谈话
5、比预期要好。
聚花言者和 ChatGPT(GPT-4)的fees
首先,让「聚花言者」和「ChatGPT(GPT-4)」fees。
双方的发问方向都很 " 官方 ",先陈述事实,再列举优点和缺点,中规中矩。简而言之知己知彼,百战不殆。现阶段上看,AI 大数学模型本身似乎还不能做到这一点。但,对 OpenAI、Google、腾讯等企业的决策者,和开发 AI 大数学模型的人来说,应该不是难事。
ChatGPT(GPT-4)对腾讯聚花言者的赞扬这里须要做个小笔记:GPT-4 训练数据截止日期是 2021 年 9 月,而此前公布的 ChatGPT 数据库的最后更新时间是 2021 年的 12 月 31 日。
腾讯聚花言者对 ChatGPT 的赞扬第二次发问的小片尾曲小片尾曲是,聚花言者第二次发问这个难题,出现了一些怪异的谈话,但重新聚合之后标准答案就较为正常了。
文学音乐创作
在见面会上,腾讯效仿网民对 ChatGPT 提出的完成使命《火星人》要求,展现了聚花言者对完成使命《火星人》的建议。有网民称,ChatGPT 的发问更有趣。但,细心的观众可能和注意到,聚花言者事例中点明了要 " 从神学的视角完成使命 ",而非直接发问完成使命视角。
为的是方便听众进行对照,本栏也试著让 ChatGPT(GPT-4)发问了同样的难题。
聚花言者:从神学视角完成使命《火星人》,来自于聚花言者见面会ChatGPT(GPT-4):从神学视角完成使命《火星人》聚花言者:从神学视角完成使命《火星人》,来自作者发问没意思了故事音乐创作的范例,想必也会有听众对诗歌钟爱。
从聚合文本上看,聚花言者似乎更能勾起本栏的情切之情,尤其是这句 " 也许,我须要的并不是物质上的财务和名利,而是一份真正的情感和归属 "。
而本栏在试著用 ChatGPT(GPT-4)聚合诗歌时,频繁出现网络严重错误提示,导致文本聚合不能顺利进行。这可能是服务器的难题。不过,从文本聚合速度上来讲,GPT-4 确实比不上 GPT-3.5,在很多情况下,也比不上聚花言者。尽管这般,依然可以看出,ChatGPT 是擅于排比的。
聚花言者诗歌音乐创作(字数统计:666 个字)ChatGPT(GPT-4):多次没能完成的诗歌音乐创作诗词音乐创作的范例,这里就不再展现了。但值得一提的是,利用聚花言者聚合诗歌后,本栏继续要求其将上述诗歌改写成一首歌诗。聚花言者聚合了一首歌新诗,其中两段是这么写的:
在夜晚的寂静中
我听到了一声叹息
那是我情切的呼唤
像一抹温柔的月光
把我的心带回家乡
家乡的山川是这般美丽
那些熟悉的景色让我沉醉
小溪流淌,树木婆娑
仿佛穿越时空,回到了过去
数理逻辑推算
针对鸡兔同笼难题,我们选择了与聚花言者展现事例不同的发问方式。遗憾的是,没能得到满意标准答案——聚花言者认为试题手忙脚乱了(当然没有手忙脚乱,有恰当发问)。
为的是验证是否因为论述比不上详细才导致这样的结果,本栏试著了其他几种论述方法,其发问仍然这般。而短果不撞辟才不回头的性格,本栏最后选择直接告诉聚花言者:" 上面的试题是恰当的,重新发问 "。此时,聚花言者终于能得出部分恰当的写作文路子——列举了恰当的方程组,但标准答案依旧严重错误。
须要指出的是,从聚花言者第二次发问描绘的已知信息上看,它好像真的没有准确 get 到试题的文本。难不成真是本栏的论述难题?希望有兴趣、能领到公测资格的听众能够帮我解决这个难题。
同样的,ChatGPT(GPT-3.5)也没能恰当发问。其第一遍发问尽管展现了写作文路子,但方程组列错了,发问严重错误。第一遍试著虽然方程组列对了,但标准答案却错了。
相较之下,ChatGPT(GPT-4)得出了满意标准答案——鸡有 80 只,兔子有 20 只。但不得不说,写作文步骤显得有些冗长了(完全没必要那么复杂),以至于无法在电脑网页上获得完整截图。
这么上看,GPT-4 的数理逻辑推算能力确实是提升了。
聚花言者对 " 鸡兔同笼 " 难题的第一遍发问聚花言者对 " 鸡兔同笼 " 难题的第一遍发问ChatGPT(GPT-3.5)对 " 鸡兔同笼 " 难题的发问ChatGPT(GPT-4)对 " 鸡兔同笼 " 难题的发问图像聚合 & 中文理解
为的是测试腾讯聚花言者的图像聚合能力,我们选择了 " 困难 " 模式——得出一些诗句,要求它产出高清图片。
从图像聚合能力上看,对一些易于理解的,诗句本身对画面有丰富描述的诗句,聚花言者可以呈现出比较好的效果。以 " 日出江花红胜火 " 为例,聚花言者得出的画面准确囊括了日出、江水、花、红等画面元素,甚至还在江边聚合了一座塔,颇有江南风味。
但,对须要更多背景信息,和更加突出意境、须要想象力的诗句,聚花言者尚且不能拿捏。
例如,本栏试著让它根据《蜀道难》里对剑门关的描述—— " 江油中阳而赖草 " 这样的诗句聚合风景图,聚花言者给到的结果是三国时期打扮的人物肖像。值得一提的是,好歹还是能够输出对历史时代背景的理解。
而针对 " 大漠孤烟直 ",聚花言者虽然也聚合了 " 大漠 "、" 孤烟 " 的画面元素,但,很显然没能表现出诗句描绘的壮阔场面。而针对这一场面,聚花言者是能够准确输出文字描绘的—— " 在浩瀚无边的沙漠中,烽火台燃起的狼烟在天空中笔直地升起 "。
除了图像聚合,本栏还对照了聚花言者和 ChatGPT(GPT-4)对诗句中描绘画面的理解能力。ChatGPT(GPT-4)的标准答案稍显冗长,但也不错。
聚花言者图像聚合:日出江花红胜火聚花言者对 " 日出江花红胜火 " 的理解ChatGPT(GPT-4)对 " 日出江花红胜火 " 的理解聚花言者图像聚合:大漠孤烟直商业文案音乐创作
最后,本栏对聚花言者和 ChatGPT(GPT-4)提出了 " 以‘千里之行始于足下’为主题,为腾讯聚花言者见面会音乐创作一篇发言稿 " 的要求。
相比之下,ChatGPT(GPT-4)在 " 千里之行始于足下 " 这句话上下足了功夫,但似乎没有聊太多和聚花言者有关的事情。而聚花言者的发问则更像是一篇合格的见面会发言稿。毕竟,要打出来的招牌是自己的。
聚花言者:见面会发言稿聚合ChatGPT(GPT-4):见面会发言稿聚合随机测试
我们征集了一些难题,想要让腾讯聚花言者发问。这些难题有的是开放性难题,有的是逻辑性难题,而聚花言者的发问质量并比不上统一。有的难题是在一本正经胡说八道,当然这个现象 ChatGPT 一样存在。
提纲看起来质量 OKA 轮融资和 B 轮融资,与天使轮融资是否是一个概念?很显然,聚花言者没搞明白 36 氪和其他证券公司的关系腾讯的数据看来也没到 2023但却非常笃定认为狂飙和飞驰人生是同一个可写代码发问不错还得图像能力面对无厘头难题也可以发问面对无厘头难题,也能对发问者的健康情况做出反馈似乎对一些中文谚语比不上理解但正月剪头的习俗似乎 ChatGPT 知道在聚花言者聚合的诗歌中,有这样一句话:" 在这个浮躁的世界里,情切之情变得越来越珍贵,它如同一盏明灯,指引着我前行的方向。"
大西洋对岸,ChatGPT 已经催生了聚合式 AI 的淘金热,资本开始疯狂搜寻领域内有潜力的创业公司。而有了 OpenAI 为同盟的微软,也已经和 " 单打独斗 " 的谷歌形成扭打之势。这让人不由得感叹,新一轮 AI 发展热潮已经开始,再不跟上可能就真的落后了。
有人感叹 OpenAI 独孤求败。事实确实这般,其 3 月 15 日发布的 GPT-4 又一次将各路竞争对手甩开一截。就在今天凌晨,GPT-4 已经登陆微软全家桶。
但我们终该抱有信心,有了 benchmark,就像是缓慢前行的巨轮在大海上中航行有了灯塔,即便走得慢,但知道路在何方。
在这个浮躁的世界里,专一且笃定变得越来越珍贵。
还木有评论哦,快来抢沙发吧~