ChatGPT ֮󣬿

2023-03-04 22:24 :²ҳ Դ:admin

ChatGPT 之后,?抗信??

图片来源@视??

?

新莓daybreak,作?

史圣?/p>

ChatGPT 点燃了全球??的想象,还?沉寂已久的€€休大?定重出江湖€是的,就是这两天?刷屏的王慧文?/p>

这位曾经美团的核心人物,在社交媒体公€发表宣言。从€初的「必须参与€,?000万美元带资入组,不在意岗位€薪资和title,求组队。?三天干脆宣布创建€?€全新生命体」,发出AI英雄榜,招募顶级人才?/p>

这是ChatGPT传入?后,€高调的起步公司€它?的?手是那些国内外?€巨头?/p>

?推出基于 ChatGPT ?New Bing €天后,谷歌匆忙搬?Bard 应战。虽然发布会的演示尴?错,市€一夜蒸发超?7000 亿元,但?和谷歌?认为?有可能将ChatGPT大放光彩的公司€?/p>

国内?也纷纷表态,百度、阿里€腾?大厂均表示自己在相关方向上有€布局?/p>

百度三月即将上线「文心一€」,并接入百度搜?阿里达摩院?在研发?话机器人,并″与钉钉等生产力工具深度结合;腾?虽未透露出具体的应用″,但也底气十足地表示,自己在大模型(LLM)€机器?习(ML)和??处理(NLP)等领域有着€?备,进?应用探索?/p>

总之,全网都是ChatGPT,?讨?,?神话,?人穷尽溢美之词,??为是新一?业革命€但也有人发出?醒,ChatGPT也在??解€?/p>

大力出??/p>

「我相信大厂声称?正在布局 ChatGPT ,除了有保住′的€虑,肯定也有了解这些前沿技?团队。但?得大致的€??架,和真正做出来?ChatGPT 效果€样好的东西,?件事情€€一?AI ?的技?伙人说€?/p>

OpenAI 对?发布了??ChatGPT 相关的研究€?文,讲述大致的€路,但不会透露€?节€上述合伙人提醒,€其他公司想要?刻,还是€要自己摸?€€一旦涉及到€?节的摸索,就要有特别大的投入。€?/p>

他?为,OpenAI 的伟大之处在于,在结果未知的情况下,就敢于下注€€一?司为了活下去,不得不去€虑投入产出比€€模型的参数越?,意味着?、调试时间的成€?加€时间的翻€,意味€?成本、人力成?翻€€?/p>

?€财富€杂志报道,2022年,OpenAI?的收入?′?000万美元,€亏损5.45亿美元€€随€ChatGPT的火爆,?进一步?加亏损,因为用户每一¤?就会让OpenAI付出更?的?算资源和带?成本?/p>

?上,ChatGPT ??现令人惊艳的统??″?/p>

它的原理?不断将前文的文本片?作为′,?测下€??现的概率,€中概率较高的单词,从€生成€顺的?句和段落?/p>

ChatGPT 的技?mdash;—GPT 3.5,是?Transformer 的技?发展而来的€€?Transformer 的?€篇研究文章,其实?谷歌发布的€?/p>

2017 ?6 月,谷歌发布论文《Attention is all you need》,推出能调?6500万参数的 Transformer ″,并首?将其用于理解人类??018 年,谷歌又推出了 3亿参数的 BERT ″?/p>

?过谷歌走得并不坚定,精力远比OpenAI分散?/p>

OpenAI 在扩大模型的道路上一?奔€GPT-3 ″?1750 亿个参数,?练的数据量高?5000 亿个 token(约?3000 亿个词)?/p>

谷歌则在多?€?线间摇摆不定,万亿参数的Switch Transformer并没有得到持?入;Flan-T5″€度有€胜过GPT-3的表现,但由于优化进度缓?还是由OpenAI先做出了ChatGPT这?产品,将大?€″的?奇能力展现在我们面前?/p>

北京智源人工智能研究院理事张宏江进一步解释,1750亿参数量,约?00G大小,一¤?练成?致花1200万美金€所以,大模型的发展不光?法上的进步,在数?€算力上的?求也非常巨大?/p>

这是€?€大力出奇迹」的故事。AI ″的?练,并不?€一份€€,€份收获€的线€€辑?/p>

学术界有€???「涌现€(emergence),参数到了€定的程度,模型效果会迎来质的飞跃。但这个程度,究竟是10亿€?00亿€?000亿,在实践之前都无从得知。??GPT 来?,€参数越多,效果越好」只?「后验€€的结??/p>

OpenAI 的?注一掷,等来了它的€涌现€;而谷歌的多线并?,却也是当时的€局部最优解」€?/p>

在大?″的?练上,€没有人比其他人领先超过两到?月€€谷歌在相关研究领域硕果?,并?后于 OpenAI 半个?,但精力分散拖累了它将??果落实为具体应用的?伐€?/p>

应用会更容易吗?

尽?ChatGPT€?核的突破有非常高的门槛,但是OpenAI的大″对产业的影响?对深远的?/p>

张宏江将其形容为,是从小农经济到大?模生产的€?重?的变化,就像当初电网的变革一样,此前?发电,€今天??AI,不€要再做模型,而是用已有的大模型,以一种服务方式提供给用户?/p>

ChatGPT 超过Tiktok,成为迄今为止用户最?亿的应用。积?1 亿用户,ChatGPT 用了两个月, Tiktok用了九个月,?Instagram 则用了两年??/p>

OpenAI 的??行官 Sam Altman 曾在推特上表示,用户?ChatGPT 每?交互的?算成?「个位数美分」€随€用户破亿,其每月计算成本高达数百万美元€?/p>

基于此,OpenAI €?新一?资,也在探索如何直接?ChatGPT 变现?/p>

2?日,OpenAI 正式官? ChatGPT Plus —— ChatGPT 的个人付费?阅服°€用户支?20$/月的费用,即?受高峰时段的优先访问、更?响应时间,还能优先尝鲜新功能?/p>

to C 的付费制还在试点和探索阶段,to B 的付?API 调用则是 OpenAI 现阶段的主?收入来源?/p>

2021 年底,OpenAI 对公众开放了 GPT-3 ?API 接口,开发€和相关??费调?实现??理解和生成的任务。除此之外,OpenAI 还开放了 Codex、DALL·E ?API 接口,分?成自然?€?码€自然?€?像的任务。路透社的数?示,OpenAI 2022 年收入达数千万美元,2023 ?2024 的?″收入分别?2 亿美元和 10 亿美元€?/p>

€?″,即使像 ChatGPT €?惊艳的表现€足够的通用性,也无法用来解决所有问题€从新技?诞生,到?的?业产品,再到后续的运营和用户服务,还€要很多下游应用企业结合?业场?进??和开发,形成「整体产品€方案€?/p>

Jasper 就是这样€家基?GPT-3 API 的生成式 AI ?,提供电商€广告€博客等场景下营€文?、?草文案的?生成服务,以及后?搜索引擎优化工具?022年,Jasper 募资 1.25 亿美元,估€达 15 亿美元€?/p>

再比?Notion,接?GPT-3 API 后,在文档工具中实现了自动续写€翻译€?法?查等功能?/p>

即便?于垂直?业的?库?″进??,也€要不小的研发成本:GPT-3 的每€″级和?,这些下游企业也要跟进调整,€要一定的财力??/p>

国内关于ChatGPT概念的不少公司也拿到投资,€且类似文本生成、图像生成€音频生成€?频生成€虚拟人、元宇宙等场??的落地能力,也?会跟海?同?,甚至更?€?/p>

不过,目前的大模型,更?偏向于单点式的应?优化生产??某一???,并?动整?作流的革新€?/p>

?″业革命,蒸汽机实现了机器替代人工;?二?工业革命,电力技?动了规模化生产€之€以能够?称之为€工业革命€,都是因为€?生产力带来了质的提升。目前来看, AI 原生产品还没有能够大范围囊括某一领域的工作流,并且提供完整解决方案€?/p>

冲击会抵达哪里?

如同过去€有新的生产力工具€样,ChatGPT ?以来,关于它会冲击哪些?业的讨?不绝于€€?/p>

作为当今€为先进€统¤?€″」,ChatGPT 在问答和对话上的表现出色。它能?′人类的交互方式,提供和整合信?从€辅助创意和决策?/p>

ChatGPT 有效缩短了€信?rarr;决策」的?,受到其影响€大的,是与€满足信?求€有关的生意,尤其是?「人找信?€的生意?/p>

其中无法回避的,首当其冲就是搜索引擎。因为很多人认定,基于ChatGPT有可能诞生出?Google 更出色的搜索引擎?/p>

ChatGPT已经明‘回答,它不会替代搜索引擎。实际上,比起功能替代,?的信?索应当是两€的结合?/p>

ChatGPT 的优势在于,它可以综合生成更为完整€拿来即用的答?,还?通过多轮对话回答后续??,但我们无法忽?它的?——真实性和逻辑性问题€?/p>

首先,ChatGPT生成的答案中难以避免地出现事实€错?€按照既定的?″和?则,ChatGPT ?生成相应的文?却无法自查自纠;且生成的序列越长,出现错?用的概率也会随之增加。这也就?€么谷?Bard €之凿凿地说詹姆斯·韦布空间望远镜拍摄了?系以外的行星的?€批照片(实际并非如?),? New Bing 进? GAP 的财报分析时引用了?多错??€?/p>

其?,ChatGPT 虽然很少在?法上?,但它在推理(reasoning)任′的表现不够令人满意,颇有种€数学是?老师教的」感觉€至少在?,我?法指望它能?通晓逻辑、厘清事实€€它通过对话喂给我们的唯€答?,也限制了我?多?来源交叉验证信息的能力€?/p>

朱啸虎就提出警醒,ChatGPT€大的风险?网上创€出巨量的似?€非的内容,那以后就不仅仅是「物理?不存在了」,如何判断信息的真实€越来越难,熵爆炸式增长?/p>

实际上,较为理想的产品形态是,由 ChatGPT 精€优质信源,拼接为完整答案,并给出引用来源供我们核实。或者在搜索结果页面的基€上,由ChatGPT来€结要点?/p>

除了?Bing外,初创? Perplexity 也尝试结?ChatGPT 和搜索引擎,做出更智能的信息搜索工具?/p>

Perplexity 的结果展示,包括三个部分:Perplexity(生成的直接答?)€Sources(引用来源)、Related(相关问题)。你还可以在前文的基€上进行追?获得更聚焦的信息增量?/p>

此类信息搜索产品,若想提供好的使用体验,也需要ChatGPT在未来能够做到€知之为知之,不知为不知」€否则,甄别错?信息的成??大的,在关键任务?€成的?险也难以估量?/p>

?,?者们正在琢磨€怎么?ChatGPT 打上「知识补丁€(Knowledge Patch)€比如问到它拿不准的??时,它能够输出€抱歉,我不了解」这样谦虚€自知的回答,€不?之凿凿地胡编乱€€?/p>

「所有的行业都€得用AI重做€遍€,€?进?会带来新的生产力工具,也会带来新的问题€ChatGPT 让我?取信?得更容易,同时?我们的判?提出了更高的要求。?观€理性€全面地分析信息,还?能靠我们??/p>