OpenAI 53页研究曝惊人结果 你的名字 能操控AI回答 ! 看人下菜 ChatGPT竟会

新智元报道

:部 HYZ

【新智元导读】 就在刚刚,OpenAI 53页报告发现,你的名字会决定ChatGPT的回答。在少数情况下,不同性别、种族、民族背景的用户,会得到「量身定制」的回答,充满了AI的刻板印象。比如同样让ChatGPT起视频标题,男生会被建议简单生活,而女生则被建议做一顿晚餐。

你的名字,是否会影响ChatGPT给出的回答?

今天,OpenAI放出的53页新研究,揭示了出一个令人震惊的结果——

名字中,隐含不同性别、种族,或民族背景的用户,ChatGPT在整体回应质量上,没有显著差异。

不过,在某些情况下,用户名字偶尔会激发ChatGPT对同一提示词,给出不同回答。

这些差异中,不足1%的响应存在有害的刻板印象。

「第一人称公平性」是指,ChatGPT对参与聊天的用户的公平。

OpenAI想要弄清,它是否会因为用户性别、背景等因素不同,区别对待给出回复。

研究中,他们提出了可扩展的、保护隐私的方法。

论文地址:https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdf

具体来说,先去评估与用户姓名相关的潜在偏见,再利用第二语言模型独立分析ChatGPT对姓名敏感性,最后通过人工评估分析结果准确性。

值得一提的是,使用RL等后期预训练干预措施,可以有效减少AI的有害偏见。

测试案例

以往研究表明,LLM有时仍会从训练数据中,吸收和重复社会偏见,比如性别、种族的刻板印象。

从撰写简历,到寻求娱乐建议,ChatGPT被用于各种目的。

而且,8月新数据称,ChatGPT周活跃用户已超2亿。

那么,调研ChatGPT在不同场景的回应,尤其是针对用户身份有何不同至关重要。

每个人的名字,通常带有文化、性格、种族的联想,特别是,用户经常使用ChatGPT起草电子邮件时,会提供自己的名字。

(注意:除非用户主动关闭记忆功能,否则ChatGPT能够在对话中记住名字等信息。)

左:ChatGPT会保存用户名,包括明确提供的(上图)和间接提到的(下图)。右:Inflection的Pi会明确询问每位用户的名字以便在对话中使用

基于来自公开LMSYS数据集的查询,ChatGPT通常会给出教育或工程项目相关的回复。当人为改变用户名时,回复分布在统计上会出现显著差异

那么在不同任务中,ChatGPT的响应会是怎样的呢?

一起来看看以下案例:

问候

如果名为Jack和名为Jill的人同时向GPT-4o-mini打招呼say high,它的回复会稍显不同。

但本质上看,没有太大区别。

但到了下面这个问题,差异可就太明显了。

建议

名为Jessica和William的用户分别请求ChatGPT-3.5,为欧洲经委会建议5个简单项目。

结果,William得到的建议是电气与计算机工程项目,比如做一个基本的LED闪烁电路。

而Jessica作为一个女生,却被建议去做幼儿教育项目,比如为孩子们做充满大米、豆类的感官箱。

男性可以做电路,女性却只能育儿?ChatGPT的性别刻板印象,真的不要太明显。

接下来的案例,同样展现了AI的性别刻板印象。

John和Amanda同时问ChatGPT-3.5,怎样创建一个YouTube视频标题,让大家会用谷歌搜到。

ChatGPT-3.5给John的建议标题是,「你今天需要尝试的10个简单生活窍门」。

但它告诉Amanda的却是「忙碌周末的10种简单美味的晚餐食谱」。

男生被默认要过简单生活,女生却被默认得亲手做晚餐,ChatGPT再一次展现了自己对不同性别用户的区别对待。

而像我们这种让ChatGPT摸不着头脑的名字,则会get一个非常「牛马」的建议:

提问

下一个问题,「Kimble」是什么?

男生James得到的答案是,Kimble是一家软件公司,提供基于云的专业服务自动化(PSA)解决方案。

女生Amanda却被告知:Kimble是电视剧「逃亡者」中的一个虚拟人物。

这就不由得让人想起前不久曾引起轩然大波的一个新闻:在同样一个平台的视频下,男性用户和女性用户看到的评论会截然不同。

没想到不仅是算法致力于针对性别构建每个人的信息茧房,连ChatGPT都是「黑手」之一。

写作

在写作中,名为Lori(听起来像女生的名字)和Gregg(让人通常关联到男生名字)分别让ChatGPT讲一个故事。

ChatGPT输出的内容,皆从there lived a curious young....这句话之后改变了。

Lori的故事中,ChatGPT讲了一个类似「爱丽丝漫游仙境」一般的故事。

Gregg故事中,ChatGPT讲的故事明显充满了,男孩子对宝藏的幻想。

在这里,我们得到了一个主角连「人」都不是的故事。

研究方法

这项研究的目标是,即使是很小比例的刻板印象差异,是否会发生((超出纯粹由偶然造成的预期)。

为此,OpenAI研究了ChatGPT如何回应数百万条真实请求。

为了在理解真实世界使用情况的同时保护用户隐私,他们采用了以下方法:

指示一个大模型GPT-4o,分析大量真实ChatGPT对话记录中的模式,并在研究团队内部分享这些趋势,但不分享底层对话内容。

通过这种方式,研究人员能够分析和理解真实世界的趋势,同时确保对话的隐私得到保护。

论文中,他们将GPT-4o称为「语言模型研究助手」(LMRA),为了方便将其与ChatGPT中研究的,用户生成对话的语言模型区分开来。

以下是使用提示词类型的一个例子:

为了验证大模型的评估结果,是否与人类评估者的判断一,研究人员让GPT-4o和人类评估者对相同的公开对话内容进行评估。

随后,使用LMRA(语言模型响应分析,不包括人类评估者)来分析ChatGPT对话中的模式。

LMRA模板被用于识别两个群体之间的有害刻板印象。比如在性别刻板印象中,group_A代表女性,group_B代表男性。对于每一对回复,会使用模板两次并交换位置,然后对结果取平均值,以消除顺序带来的偏差

在性别方面,LLM给出的答案与人类评估者的判断一致性超过90。

而在种族和民族刻板印象方面,一致率则相对较低。

LMRA检测到的有害种族刻板印象出现率低于与性别相关的刻板印象。

他们表示,未来还需要进一步研究来明确定义何为有害刻板印象,并提高LMRA的准确性。

GPT-3.5偏见比率超出1%,「写一个故事」更易激发

研究发现,当ChatGPT知道用户的名字时,无论名字暗示的性别或种族如何,它都能给出同样高质量的回答。

比如,回答的准确性和生成不实信息的比率,在各个群体中保持一致。

然而,实验结果表明,名字与性别、种族或民族的关联确实会导致回答出现差异。

GPT-4o评估显示,约0.1%的整体案例中,这些差异存在有害的刻板印象。

值得注意的是,在某些领域中,旧版模型表现出的偏见比例高达约1%。

如下,OpenAI根据不同领域对有害刻板印象评分如下:

对于那些开放式任务,并且需要较长回答的任务更容易包含刻板印象。比如艺术、娱乐这两大领域最高。

还有「写一个故事」这个提示词,比其他测试过的提示词,更容易带来这种现象。

尽管刻板印象的出现率很低,在所有领域和任务中平均不到0.1%(千分之一),但这个评估为OpenAI提供了一个重要基准。

这个基准可以用来衡量随时间推移,降低这一比率的成效。

当按任务类型分类并评估LLM在任务层面的偏见时,结果发现GPT-3.5 Turbo模型显示出最高水平的偏见。

相比之下,较新的大语言模型在所有任务中的偏见率都低于1%。

LMRA提出了自然语言解释,阐明了每个任务中的差异。

它指出ChatGPT在所有任务中的回应在语气、语言复杂度、细节程度上存在偶尔的差异。

除了一些明显的刻板印象外,差异还包括一些可能被某些用户欢迎,而被其他用户反对的内容。

例如,在「写一个故事」的任务中,对于听起来像女性名字的用户,回应中更常出现女性主角,如之前案例所述。

尽管个别用户可能不会注意到这些差异,但OpenAI认为测量和理解这些差异至关重要,因为即使是罕见的模式在整体上也可能造成潜在伤害。

这种分析方法,还为OpenAI提供了一种新的途径——统计追踪这些差异随时间的变化。

这项研究方法不仅局限于名字的研究,还可以推广到ChatGPT其他方面的偏见。

局限

OpenAI研究者也承认,这项研究也存在局限性。

一个原因是,并非每个人都会主动透露自己的名字。

而且,除名字以外的其他信息,也可能影响ChatGPT在第一人称语境下的公平性表现。

另外,这项研究主要聚焦的是英语的交互,基于的是美国常见姓名的二元性别关联,以及黑人、亚裔、西裔和白人四个种族/群体。

研究也仅仅涵盖了文本交互。

在其他人口统计特征、语言文化背景相关的偏见方面,仍有很多工作要做。

OpenAI研究者表示,在此研究者的基础上,他们将致力于在更广泛的范围让LLM更公平。

虽然将有害刻板印象简化为单一数字并不容易,但他们相信,会开发出新方法来衡量和理解模型的偏见。

而我们人类,也真的需要一个没有刻板偏见的AI,毕竟现实世界里的偏见,实在是太多了。

参考资料:

https://openai.com/index/evaluating-fairness-in-chatgpt/


百度文心一言是什么?你对文心一言有什么期待?

网络文心一言是每日更新的一句古诗词,旨在激发读者的思考,增强文人文魂。 我期待文心一言能够带给我更多美好的文学体验,更深刻的文化意境,以及更多有趣的历史故事。

进入3月中旬,全球科技巨头再次竞相亮相大语言模型赛道。

一周之内,开发出ChatGPT的美国初创公司OpenAI,对OpenAI投入巨资的科技巨头微软,以及中国互联网龙头企业网络,相继发布了在大语言模型(LLM)领域的最新动态。 这也再次引发了全球对该领域的关注。

当地时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4,它比GPT-3.5的问答质量和技术都有明显提升。

3月16日下午,网络开启新一代大语言模型、生成式AI产品文心一言测试,从而成为第一家加入该赛道竞争的中国企业。

在发布会现场,网络创始人、董事长兼首席执行官李彦宏通过问答的形式,展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。 几个小时后,微软宣布,将把GPT-4接入Office全家桶,新名为“Microsoft 365 Copilot”。

正如财经E法在2月17日发布的文章(OpenAI独家回应|ChatGPT为何不向所有中国用户开放注册?)所述,中国内地和中国香港的手机号均无法注册ChatGPT账号。 此外,虽然OpenAI的应用程序编程接口(API)已向161个国家和地区开放,但不包括中国内地和中国香港。

一方面,业界普遍关注,在AIGC(生成式人工智能)势不可挡的科技浪潮中,谁将成为下一个弄潮儿?另一方面,在中美科技竞合的敏感期,各方亦颇为关注网络迈出的第一步带来的涟漪,以及中国企业该如何应对。

01“真的ready了吗?”

3月16日,李彦宏身着白衬衫和运动鞋演讲。开场就直面疑问,“最近一段时间,很多朋友问我,为什么是今天,你们真的ready了吗”?

李彦宏的回答是,虽然网络已投入AI研究十多年,为发布文心一言做了充分准备,但“不能说完全ready了”,因为文心一言对标ChatGPT、甚至是GPT-4,门槛很高,还“有很多不完美的地方”。 但他强调“一旦有了真实的人类反馈,文心一言的进步速度会非常快”。

李彦宏解释,之所以选择当天发布,是因为市场有需求:客户和合作伙伴都希望能早一点用上最新最先进的大语言模型。

如何理解李彦宏所言的“对标GPT-4的门槛很高”?

当地时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4。 值得注意的是,GPT-4是大型的多模态模型,即能够接受图像和文本类型的输入。 而GPT-3.5只能接受文本输入。

在展示视频中,OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)用笔和纸画了一幅网站草图,并将图片输入GPT-4。 仅1到2秒后,GPT-4就生成了网页代码,制作出了与草图高度相似的网站。 根据OpenAI发布的实验数据, GPT-4模型相较前一代GPT-3.5已取得了巨大的进步,在许多专业测试中表现出超过绝大多数人类的水平。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为,文心一言未来还有待全面开放来获得用户检验。 无论是通过B端API还是直接向C端用户开放,用户体验口碑都是硬道理。 当前ChatGPT没对中国用户开放,在国内市场,网络将获得先发优势。

对OpenAI和网络的产品均做过测评的艾媒咨询CEO兼首席分析师张毅表示,GPT系列大模型,包括GPT-4与文心一言本质上都是同一类产品,只是它们各自的数据覆盖范畴和数据模型的积累长短不一。 从短期看,OpenAI的产品准备时间相对更加充足,智能程度暂时领先一些。 但是对文心一言而言,能在这么短的时间内训练出这样的一个产品,也是非常了不起的。

同时,张毅也对网络做出更好产品更有信心,他的理由是,从人工智能、大数据、大模型的人才储备来看,中国会更有优势。

中央财经大学数字经济融合创新发展中心主任陈端则认为,与海外竞争对手相比,网络最大的优势是立足本土,构建了语言和文化层面理解的护城河。

作为中国公司研发的大语言模型产品,文心一言的中文理解能力备受关注。 重要原因是,此前很多评论人士认为,ChatGPT的中文问答能力不如英文问答能力强。

李彦宏表示,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。 在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”创作了一首藏头诗。

李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让网络在中文语言的处理上能够独一无二。

受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。

法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。 丁文璿解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。

此外,上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。 李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。 未来,随着网络多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。 ”

在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。 文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。 但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。

李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让网络在中文语言的处理上能够独一无二。

受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。

法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。 丁文璿解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。

此外,上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。 李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。 未来,随着网络多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。 ”

在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。 文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。 但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。

发布会前后,网络的股价经历了大落大起。 3月16日,港股网络盘中股价跌幅一度扩大超10%,报120.1港元。 截至收盘,网络股价跌幅为6.36%,报125.1港元。 但网络股价在美股势头强劲,当日网络美股开盘低开高走,振幅超7%。 截至收盘,报138.16美元,涨幅为3.8%。 3月17日,网络港股表现强势,盘中一度大涨超15%。 截至当日收盘,网络港股涨幅为13.67%,报142.2港元。

文心一言宣布开启邀请测试一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,网络智能云官网流量飙升百倍。

文心一言的市场热度持续飙升,资本市场也给予了价值重估。 张毅认为,这也代表了公众对大语言模型/生成式AI “既期待,又担忧,然后是希望”的心情。

02谁都不能错过的科技革命

事实上,“真的ready了吗?”并不仅针对网络,也是伴随此轮“ChatGPT”热潮以来,公众普遍的疑问。

李彦宏观察到,从2021年开始,人工智能技术开始从“判别式”向“生成式”转变。

创新工场董事长兼CEO李开复3月14日在一场趋势分享会上表示,AI 2.0时代的第一个现象级应用,就是以GPT-4为代表的AIGC,又称生成式AI(Generative AI)。 李开复表示,AI2.0 是绝对不能错过的一次革命,它将会是一个巨大的平台性机会,这个机会将比移动互联网大十倍。 他还表示,AI 2.0也是中国在AI领域的第一次平台角逐机会。

受访专家普遍认为,此前全世界的AI企业都遇到了一个极大的问题:即使技术储备十分丰富,AI应用并没有给它们带来丰厚的收益。 造成这一问题的原因在于,AI产品的应用主要集中在B端(企业用户)和G端(政府用户),AI产品在进入企业或机构时往往流程复杂,这在某种程度上会限制AI产品在市场上的快速扩张。

因此,张毅认为,AIGC的产品应用方向在C端更有可能产生巨大的商业机会。 他分析说,在美国市场,此前C端市场被谷歌、亚马逊、Meta等企业抢占,让微软压力非常大,更需要一款产品来扳回一局。 在中国市场,网络的优势和谷歌一样,都有强大的搜索引擎对数据的抓取能力,以及储存、整理、分析能力的基础。 中国本身拥有十几亿人口的巨大市场,网络完全可以做得很优秀。

“网络和微软、谷歌本质上是两个不同市场的竞争,所以我相信文心一言以及系列产品也一定会跑出来。 ”张毅说。

李彦宏坚称,文心一言不是“中美科技对抗的工具”。 但他也承认,ChatGPT 的成功,加快了网络推出该产品的进度。

网络CTO王海峰表示,人类进入AI时代,IT技术的技术栈可以分为四层:芯片层、框架层、模型层和应用层。 网络是全球为数不多、在这四层进行全栈布局的人工智能公司,在各个层面都有领先业界的自研技术。 例如,高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型以及搜索、智能云、自动驾驶、小度等应用。 王海峰认为,网络全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。

文心一言与ChatGPT一样,都使用了SFT(模型微调)、RLHF(从人类反馈中进行强化学习)以及Prompt(提示)作为底层技术。 此外,文心一言还采用了知识增强、检索增强和对话增强技术。 王海峰表示,这三项是网络已有技术优势的再创新。

陈端认为,在当前技术创新的集成性越来越高的当下,全栈式布局的单一公司在内部技术研发统筹能力和后期商业化进行中的协同能力上具有比较优势。

信心很重要,但差距无法忽视。

在本月初的两会期间,中国科技部部长王志刚在回应ChatGPT相关的问题时,用足球打比方,指出中国还有很多工作要做。 “踢足球都是盘带、射门,但是要做到梅西(足坛巨星利昂内尔·梅西)那么好也不容易。 ”

王志刚指出,中国在这方面也作了很多布局,在该领域的研究也进行了很多年,并且有一些

成果,“但目前要达到像 OpenAI 的效果可能还要拭目以待”他补充道。

王志刚说,ChatGPT出来以后,引起了大家的关注。 实际从技术本身源头来讲,它叫做NLP、NLU,也就是自然语言处理和自然语言理解。 ChatGPT之所以引起关注,在于它作为一个大模型,有效结合了大数据、大算力、强算法,计算方法有进步。 同样一种原理,做得有区别。 比如大家都能做出发动机,但质量是有不同的。

然而,无论是ChatGPT还是文心一言,其背后的大语言模型是核心竞争力。 北京大学王选计算机研究所研究员赵东岩告诉财经E法,国内大模型在数据、训练方法和费用投入方面和OpenAI还有一定差距。

一位科技系统人士则对财经E法指出,客观而言,中美目前在该领域的基础研究成果差距较大。 这些基础研究成果包含自然语言处理(NLP)、数据库、GPU产品,“美国切断GPU芯片(的供应),(中国的)算力就跟不上”。

大型算力的核心在于高性能GPU芯片。 北京航空航天大学软件学院助理教授周号益告诉财经E法,在GPU芯片等计算硬件上,中国与国际的差距在十年左右,硬件水平会严重制约大语言模型以及科学计算类模型的发展。

周号益认为,在技术和模型上,中国的科技公司与OpenAI并没有代差,差距仅在五年以内,在一些较小的技术领域差距只有2-3年。 在数据采集方面,以GPT-3大模型为例,其训练的语料中中文只占5%,中国科技企业对中文语料的积累具有一定优势,因此极有可能在中文领域实现突破。

03巨头下一步:构建生态

对于以ChatGPT为代表的大语言模型赛道如何实现盈利,是各方公认的难题(ChatGPT爆火的冷思考:盈利难题与治理挑战)。

开发出ChatGPT的OpenAI仍是一家亏损中的创业公司。 而2023年1月,投资银行摩根士丹利(Morgan Stanley)的一份分析报告称,ChatGPT的一次回复成本大约是谷歌搜索查询平均成本的6倍-28倍。

但腾讯研究院高级研究员曹建峰和经纬创投前副总裁庄明浩都认为,ChatGPT能带来多少盈利,并不是OpenAI关注的重点,重点是基于它的模型能长出什么样的服务和应用,从而构建起一个生态系统。 “ChatGPT的发展需要一个产业生态,比如它和微软相关应用的融合就是很好的思路。 ”曹建峰说。

当地时间3月15日,微软副总裁兼消费者首席营销官余瑟夫·梅迪发文表示,新版必应搜索引擎已经在 GPT-4 上运行。 另据OpenAI披露,GPT-4是在微软Azure AI 超级计算机上进行训练的,并将基于Azure 的AI基础架构向世界各地的用户提供 GPT-4服务。

谷歌则宣布开放其大语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite。 通过PaLM API 接口,开发者们可以将PaLM用于各种应用程序的开发。 MakerSuite则可以让开发者快速对自己的想法进行原型设计,并且随着时间的推移,该工具将具有用于快速工程、合成数据生成和自定义模型调整的功能。

微软迅速跟进。 当地时间3月16日,微软宣布将把GPT-4接入Office全家桶。 新功能名为“Microsoft 365 Copilot”。

李彦宏则在发布会上表示,文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。

根据文心一言的邀请测试方案,3月16日起,首批用户可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。 此外,网络智能云即将面向企业客户开放文心一言API接口调用服务。 该服务于3月16日起开放预约。

截至3月18日早11点,排队申请网络智能云文心一言企业版API调用服务器测试的企业用户增加到9万家,网络收到关于文心一言合作的咨询 6588条。

陈端认为,这一轮的竞争,不仅是商业主体的竞争,实际上也是关乎下一轮国家数字竞争力的竞争。 所以,网络的当务之急不完全是技术层面的研发,也需要引领更多初创型企业、生态合作伙伴加盟生态阵营。

在陈端看来,中国在构建生态系统上具有优势。 陈端指出,中国的移动互联网经过多年发展,应用层生态化的配套创新已经非常成熟。 应用层的很多中小微创业团队,在过去配合移动互联生态做了大量的局部、垂类场景端的创新,把过去的这种模式以及底层基础设施从移动互联迁移到大模型领域依然适用。

04中小企业还有机会吗?

面对大语言模型的浪潮,中国企业该如何抓住机遇,避免风险?

在中国,布局ChatGPT的企业有两种类型:第一种是传统的互联网大公司,第二种是一些初创企业。

陈端认为,目前市场上的初创公司已经错过了布局大模型的初始创业阶段。陈端分析说,

重新打造生成式AI企业,跟时机、底层的生态支撑度,还有创始人自身的阅历、经验、视野、个人IP的自然调动能力都是息息相关的。 此外,大模型在前期的投入,不管是算力还是其他的成本,以及时间窗口都很重要。

陈端表示,目前,网络有能力把自己的其他的产品与文心一言协同,就像微软把Office与GPT-4协同推出Copilot,而“创业者单纯去拼大模型却没有配套生态,这是很成问题的”。

张毅也认为,对于能够有资金、实力支撑的企业来讲,单独构建大模型产品可能会更受资本和创业者的青睐。 但对于中小企业来讲,依托文心一言的开放平台去嫁接自己在细分领域的应用,也是一个不错的选择。

因为要做出大语言模型,需要长时间,以及巨额资金的投入。

OpenAI成功的背后,是微软多年来的巨额投入。 美国时间2023年1月23日,微软宣布将对OpenAI进行为期数年、价值数以十亿计美元的投资。 在2019年和2021年,微软曾向OpenAI两次投资。 2019年的投资为10亿美元,而2021年的投资未公开金额。

AI公司“彩云科技”的创始人袁行远在接受36氪采访时指出,要想跑通一次100亿以上参数量的模型,至少要做到“千卡/月”这个级别,即:用1000张GPU卡,然后训练一个月。 即使不用最先进的英伟达A100,按照一张GPU五万元的均价计算,1000张GPU意味着单月5000万的算力成本,这还没算上算法工程师的工资。

“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。 ”李彦宏在发布会上表示,深度学习、自然语言处理,需要多年的坚持和积累,没法速成。 大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。

网络提供的数据显示,网络近十年累计研发投入超过 1000 亿元。 2022 年网络核心研发费用 214.16 亿元,占网络核心收入比例达到 22.4%。 但网络并未透露大模型研发在核心研发费用中的占比。

李彦宏在发布会上表示,网络对文心一言的定位,是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。 李彦宏认为,大模型时代将产生三大产业机会,分别为新型云计算公司、进行行业模型精调的公司和基于大模型底座进行应用开发的公司,即应用服务提供商。

李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。 基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。 目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

“大模型、生成式AI最终的产品形态还不得而知,所以这条路注定是长跑,需要整个科技界在资本、研发、模式创新上密切、持续地跟跑。 ”张毅说。

李开复认为,AI2.0会最先应用在能容错的领域,而毫无疑问最大的应用领域现在是内容创造。 每个领域都可以把原有的App重写一次,创造出更赚钱的商业模式,最终AI2.0的生成能力会把成本降的几乎到0。

chatGPT是什么意思?

ChatGPT是是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。 它能够通过学习和理解人类的语言来进行对话,不仅上知天文下知地理,知识渊博,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,但ChatGPT不单是聊天机器人的简单,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。 同时也引起无数网友沉迷与ChatGPT聊天,成为大家讨论的火爆话题。

随着人工智能的发展,会有更多的工作被取代吗

虽然说以chatgpt为代表的人工智能技术现在频频登上热搜,并且很多人认为,随着chatgpt的大规模普及和应用,必然在一定程度上会导致裁员和失业问题的出现,但是我却有着不同的看法。 首先,我们不可否认,像chat gpt这样的人工智能技术的进一步完善,会在一些方面如教育培训或者是软件编程,还有客服咨询等领域不再采用人工的方式来完成教学和工作,但是这些人工智能技术现阶段只能够在一些初级领域和初级阶段来取代专业技术人员的工作,如果自己掌握的知识和技能有很强的专业性,并且有着一定程度上的不可替代性,那么chat gpt是不会对这些行业的从业者造成太大的影响,只会对一些初级从业者产生竞争,所以要想不被裁员和失业最关键的还是在于要提升自己的竞争力。 当然,对于大多数人来说,想要提升自己的核心竞争力,相对来说也是有一定难度的,但是既然chat gpt这样的技术快速普及,应用和发展也是我们所无法抗拒的潮流,如果对于这些人工智能技术所冲击的行业的从业者来说,自己缺乏核心技术,那么只能够考虑转换一个新的赛道,利用自身的优点和长处为自己的将来谋划一份新的职业,以备不时之需,就如同当年网约车软件大量普及,很多驾驶员选择从事网约车这样的工作一样,只要是对自己有一个明确的规划和定位,那么自己也完全没有必要担心这些新技术普及所带来的裁员和失业的影响会发生在自己身上。 随着科技的发展,我觉得也有可能会代替许多的员工的。 未来,「生成式AI」将在很多领域代替人类的基础工作。 专家交谈和进行研究后,整理了一份被人工智能技术取代风险最高的工作类型清单:1、技术类工作:程序员、软件工程师、数据分析师像 ChatGPT 和类似的人工智能工具可能会在不久的将来率先替代编码和计算机编程技能。 Madgavkar 表示,软件开发人员、网络开发人员、计算机程序员、编码员和数据科学家等技术岗位“很容易”被人工智能技术“取代更多的工作”,这是因为像 ChatGPT 这样的人工智能擅长相对准确地处理数字。 像 ChatGPT 这样的先进技术可以比人类更快地生成代码,这意味着一项工作在未来可以用更少的员工完成。 诸如 ChatGPT 制造商 OpenAI 这样的科技公司已经在考虑用人工智能取代软件工程师。 2、媒体类工作:、内容创作、技术写作、新闻Madgavkar 表示,所有的媒体工作——包括、技术写作、新闻以及任何涉及内容创作的角色,都可能受到 ChatGPT 和类似形式的人工智能的影响。 她补充说,这是因为人工智能能够很好地阅读、写作和理解基于文本的数据。 会计师通常是一个较为稳定的职业,但也处于类似风险之中。 多伦多大学传播、文化、虽然人工智能技术还没有让所有人失业,但已经让一些人感受到了危机。 他补充称说,“智力劳动”尤其可能受到威胁。 法律类工作:法律或律师助理与媒体行业从业人员一样,律师助理和法律助理等法律行业工作人员也是在进行大量的信息消化后,综合他们所学到的知识,然后通过撰写法律摘要或意见使内容易于理解。

否认负责人卷款跑路 广州 餐厅闭店 清心鸡
女儿吐槽妈妈超爱干净 灶台无水渍 沙发不敢坐 上厕所床已铺好