大模型进入“应用爆发元年”, 落地 再次成为AI竞速关键词。
现在,阶段性成绩单随着头部企业Q2财报的公布逐渐明朗,一个趋势正在显现:
大模型商业化正在提速。
以刚刚公布的百度2024年第二季度财报为例,百度Q2季度总营收339亿元,百度核心营收267亿元,百度核心经营利润56亿元,同比增长23%,超出市场预期。
百度创始人、董事长兼首席执行官李彦宏表示:
更值得关注的是,电话会披露,文心大模型日均调用量已超6亿次,近半年来增长超10倍。同时,第二季度,与AI强相关的百度智能云业务营收同比增长14%。
更多核心数据,我们逐一拆开来看。
超6亿!文心大模型日调用量高速增长
2024年最新数据显示,文心一言累计用户规模已达3亿。
百度财报电话会进一步披露, 文心大模型日调用量超过6亿次,日均处理Tokens文本超1万亿 。与23年Q4公布的5000万次日均调用量相比, 半年增长超10倍 。
这一数据迅速引发关注——
一方面,这反映出百度在基础模型方面的快速迭代,受到了广泛的关注和认可。
财报显示,百度在6月发布文心大模型4.0 Turbo,以扩展文心系列模型的丰富性。与文心大模型4.0相比,Turbo版基于百度在数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心技术上的持续创新,以及与飞桨的联合优化,实现了更快的速度和更优的效果。
电话会上,李彦宏表示:“百度在持续扩大模型组合、增强模型能力,以满足用户的多样化需求。”
目前,文心大模型系列包括了旗舰模型文心大模型3.5和4.0、文心大模型4.0 Turbo,以及上季度推出的多款轻量级模型等。丰富的产品组合能够满足客户的不同需求,从而在性能、成本和延迟等方面实现优化。
另一方面,这也验证了价格策略对大模型使用量以及商业化的推动作用。
事实上,对于很多企业尤其中小企业来说,成本是横在探索大模型应用路途中的第一道门槛。
财报显示,二季度内,百度推出了多项大模型降价策略,让更多企业尤其是中小企业能够用上大模型。
今年5月,百度宣布ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny系列模型预置服务对客户免费开放使用。7月,百度宣布ERNIE 4.0、ERNIE 3.5两款旗舰模型大幅降价,同时,ERNIE 4.0 Turbo面向企业客户全面开放,输入和输出价格分别低至0.03元/千Tokens、0.06元/千Tokens。
在电话会上,李彦宏特别提到百度将开源的深度学习框架飞桨升级到了3.0。此次升级显著提高了飞桨框架与百度AI基础设施和文心大模型的兼容性。
也就是说,百度能够做到端到端优化,在提升模型性能的同时,不断降低模型的推理成本。这也为百度从大模型使用量的激烈竞争中脱颖而出奠定了优势。
此前,李彦宏就曾做出判断,他认为,(大模型)价格战几乎不可避免。“但某种意义上讲也不是坏事儿,当你足够低,甚至免费的时候, 就会有更多人有积极性来尝试 ,去开发各种各样的应用,大模型对于各行各业的渗透速度会更快”。
正如李彦宏所强调的,就市场本身而言,最终会回归理性,最终还是要看谁的技术更好、效率更高。就过程而言,技术的优势,也决定了竞争的可持续性。
Q2云业务营收同比增长14%,大模型落地加速
大模型业务强势增长的背后,另一个受到市场热议的点,是其背后反映出的百度在B端市场的增长表现,这意味着,在应用落地这一阶段,百度始终保持在国内大模型厂商第一梯队。
百度Q2财报数据已有所体现:
第二季度,百度云业务营收51亿元,同比增长14%, 其中AI收入占比提升至9%,高于上季度的6.9% 。
具体细分云业务增长的原因,很重要的一点是以千帆平台为代表的一站式企业级大模型平台使用量的显著增长。
电话会消息,在公共服务领域,百度与一家企业合作,帮助6000多个村庄改善基层服务,为村民提供更个性化、更高效的支持。自4月大规模落地以来,该服务的日使用量激增了30多倍,达到200多万次,帮助村民解答户籍办理、社保查询等问题。
在医疗行业,企业通过文心大模型和模型定制工具ModelBuilder训练出行业专属模型,可以辅助医生自动生成医疗记录,帮助减轻医生负担,提高临床效率,部署2个月后,医生平均诊疗患者数量增加了50%。
为了大幅简化AI原生应用的开发门槛,便于企业在行业场景高效精调出更稳定、效果更好的专用大模型, 开发AI原生应用,二季度百度持续对千帆平台上的工具链进行升级。
具体来说,二季度,模型定制工具千帆ModelBuilder迎来重大升级,引入多样化的混合训练数据集,可支撑用户微调出高性能的行业专属模型。
千帆AppBuilder也从扩展性、开放性、安全性三方面,对企业级检索增强生成(RAG)进行了全面升级,并新推出了“RAG with 百度搜索”功能,以解决传统RAG难以触及公网内容、资源,检索结果时效性不足等问题。
这种持续升级给千帆AppBuilder 和千帆ModelBuilder的使用量带来了明显提升,据电话会消息,千帆AppBuilder构建应用量已超数十万。
目前,作为全球首个一站式的企业级大模型平台,千帆平台累计已服务15万企业客户,帮助用户累计精调2.1万个大模型,在政务、电力、教育、智能车等各个行业均有落地案例。
值得一提的是,近日,IDC最新发布的《中国大模型平台市场份额,2023:大模型元年——初局》数据也显示,百度智能云大模型平台产品市场份额达到19.9%,位居第一。
可见,百度在大模型落地上已经跑在行业最前列。
大模型持续重构百度
值得关注的是,不仅是云业务,从这份财报来看, 大模型重构百度的进程仍在持续 。百度的其他业务,包括核心的搜索和广告业务,正在受到大模型技术浪潮更深远的影响。
在核心业务方面,百度搜索的“含AI量”持续提升。财报电话会显示,已有18%搜索结果由AI生成,比上一季度的11%提高了7个百分点。
李彦宏介绍,二季度以来,百度正在加快用大模型重构搜索,并取得了多项重要进展。
他表示,AI生成的搜索结果不仅能为用户提供更准确和直接的答案,还能增加以前无法获得的信息。此外,搜索新增的互动功能,支持用户通过多轮对话的方式细化需求,增强用户体验。
这也正是李彦宏在百度世界2023上提到的,文心大模型重构后,百度新搜索的内涵的进一步深化体现。他认为,AI搜索应该具备极致满足、推荐激发和多轮交互三个特点。
目前来看,重构后的AI搜索已经在用户侧收获市场认可:
据第三方“AI产品榜”发布最新数据,百度搜索“Ai智能回答”首次参选就登顶国内总榜。
另外,在AI应用的发展方向上,李彦宏最为看好智能体,并认为搜索是智能体分发的最大入口。百度作为业内最早布局智能体的大厂之一,目前已实现搜索和智能体更深层次的结合:搜索引擎可通过解读用户意图,推送最匹配的智能体,用户可以随时调用。
比如,在今年高考期间,百度推出高考智能体,仅在6月25日,就有超过1000万用户使用百度AI志愿助手填报志愿。
而基于文心智能体平台AgentBuilder构建的智能体可在百度搜索等生态内进行分发,以丰富内容生态、提升客户效率。
百度财报电话会还透露,其智能体7月日均分发次数超800百万,为5月的两倍,与搜索相结合的智能体生态正在逐渐形成。
此外,百度内部的其他业务也在被大模型持续重构,百度文库就是其中典型代表。
在大模型加持之下,百度文库已经从一款纯粹的“内容工具”转变为“生产力工具”,拥有智能PPT、智能文档、智能画本等上百项多模态AI功能。
根据量子位智库数据,百度文库今年上半年网页端访问量超过2亿,位居国内第一。极光旗下月狐数据发布的《2024年智能PPT行业市场研究分析》则指出,百度文库智能PPT市场份额已达8成,处于断层领先地位。
电话会信息,二季度,百度文库的订阅收入同比增长超过15%。公开数据显示百度文库累计AI用户数已突破1.8亿,AI功能使用次数已突破22亿次。
还有基于文心大模型的AI编程工具文心快码。据百度官方披露,百度80%的工程师已经在深度使用文心快码,整个百度30%的代码都是由文心快码生成。
如此看来,可以说, 大模型已成百度最强劲的加速引擎 。
对此,花旗银行预测,由于人工智能的转型,云计算可能会加速增长。
摩根大通表示,百度已经越来越多地将gen-AI内容放在其主要广告库存中,百度的搜索结果页面将随着时间的推移而变化:从简单查询到复杂查询;从单轮查询到多轮对话。
他们认为,从商业角度来看,这样的变化将把百度在价值链中的角色从单纯的流量导向扩展到售前咨询。如果百度顺利推进增加交易对话的流量,将在中长期内对盈利产生积极影响。
天风证券认为,公司积极推动大模型在不同场景的应用,充分挖掘大语言模型的潜在能力,通过促进企业端的应用需求带来了增量。同时应用的进步推动基础模型的创新,相辅相成地促进模型迭代,未来有望实现进一步发展。
大模型应用大潮袭来,在商业化方面,不只是百度,头部厂商们都野心勃勃,期待着AI赋予的新动能初显成效。
现在,抢先布局的弄潮儿们已经初尝果实,交出了一份颇具参考价值的答卷。
可以预见的是,大模型发展之势依然瞬息万变,在应用侧,技术落地和产品竞争的进程将愈发激烈。
但也有一点是不变的:
真正构筑起自身核心竞争力的玩家,才能走得更远。
哪家大模型的知识库最强?
目前没有一个绝对的标准来衡量哪家大模型的知识库是最强的,因为“最强”这一评价标准依赖于具体的评估维度,比如知识的广度、深度、更新速度、领域专业性、可访问性、技术支持以及实际应用效果等。 不同的大模型和知识库在不同场景下会有各自的优势。 一些知名的大模型及其背后的知识库值得关注,例如:• 阿里云通义千问:作为钉钉AI助理所基于的模型,通义千问在中文场景下表现出色,能够处理广泛的领域知识,支持多种任务,其知识库整合了阿里巴巴集团丰富的数据资源和技术积累。 • OpenAI的GPT系列:尤其是最新发布的GPT模型,如GPT-4(如果已发布的话),凭借其大规模的训练数据和复杂的生成能力,被认为在语言生成和理解方面具有很强的性能,其知识库源自互联网的广泛文本数据。 • 网络的文心一言:作为中国领先的AI公司网络的产品,文心一言在中文场景下的理解与生成能力也被业界广泛认可,其知识库整合了网络搜索引擎的庞大数据资源。 • 华为诺亚方舟实验室的盘古大模型:在多模态和垂直领域有着深厚积累,其知识库覆盖广泛,尤其是在图像、视频等多媒体内容的处理上有独到之处。 • 蓝凌智能知识管理平台:融合AI大模型、知识图谱等技术,实现知识采集、加工、存储、共享等过程的智能化支撑,覆盖智能入库、智能入图、智能搜索、智能问答、智能编写、智能采集等系列功能,并构建各类场景驱动的知识应用,全方位助力组织提升知识管理水平,增强知识效益,促进提效降本。 每个大模型和其知识库都有各自的特点和优势,选择最合适的大模型需根据具体应用场景、需求以及对模型特性的考量来决定。
文心大模型是什么
文心大模型是网络文心知识增强大模型从海量数据和多源丰富知识中融合学习,学习效率更高,效果更好。其详细内容如下:
1、数据规模:文心大模型从海量数据和多源丰富知识中融合学习,数据规模巨大。 这使得模型能够更好地捕捉到数据的复杂模式和规律,提高了模型的准确性和泛化能力。
2、知识增强:文心大模型不仅仅从原始数据中学习,还引入了知识图谱等知识库,将数据与知识融合。 这种知识增强技术有助于提高模型的理解能力和可解释性,使得模型能够更好地处理语义复杂的问题。
3、持续学习:文心大模型具备持续学习能力,能够在不断使用过程中自我优化和学习新的知识。 这使得模型能够适应不断变化的环境和任务,提高了模型的适应性和鲁棒性。
4、产业应用:文心大模型源于产业、服务于产业,针对不同行业和领域的需求,提供了多样化的模型选择和应用方案。 这使得模型能够更好地满足真实场景中的应用需求,促进了AI技术的产业化和规模化应用。
5、技术开放:文心大模型秉持开放共享的理念,提供了丰富的API接口和工具,支持第三方开发者进行二次开发和应用创新。 这有助于降低AI开发和应用的门槛,推动AI技术的普及和发展。
文心大模型的用途
1、自然语言处理:文心大模型可以应用于文本分类、情感分析、问答系统等自然语言处理任务。 例如,利用文心大模型可以自动识别新闻分类、智能客服可以自动回答用户的问题等。
2、图像处理和语音处理:文心大模型也可以应用于图像识别、图像生成等任务。 例如,利用文心大模型可以自动识别图片中的物体对图片进行风格转换等。 文心大模型还可以应用于语音识别、语音合成等任务。 例如,利用文心大模型可以自动识别用户的语音输入生成自然语音回复等。
3、推荐系统:文心大模型可以应用于推荐系统,根据用户的历史行为和兴趣爱好,自动推荐相关的内容。 例如,利用文心大模型可以自动推荐相关的文章、音乐、电影等。
4、机器翻译和智能写作:文心大模型也可以应用于机器翻译,将一种语言自动翻译成另一种语言。 例如,利用文心大模型可以实现中英互译、日英互译等。 文心大模型还可以应用于智能写作,根据给定的主题和要求,自动生成文章或文案。 例如,利用文心大模型可以自动生成新闻报道等。
百度文心一言将开启第一批内测如何申请内测?
需要通过邀请测试码在文心一言的官网体验该产品。 3月16日网络举行了一场关于大语言模型,生成式AI产品的文心一言发布会,在发布会现场,网络创始人也向我们展示了文心一言在文学创作,以及数理推算,中文理解,商业文案创作,多模态生成等5个方面使用的综合能力。 俗话说,十月怀胎,一朝分娩,过了无数次的调试,终于迎来了本次内测,文心一言是一个生成式的AI,产品目前更是国内首个开放调用的API千亿大模型,可想而知,对于该产品网络公司有多么的重视,才会花费累计超过1000亿元。 目前文心一言只能通过邀请测试码在官网体验产品,后续才会陆续开放给更多的客户,想要参与文心一言的内测,需要在3月16日开放,预约以后搜索网络智能云进入网络官网,再点击申请加入文心一言服务测试,即可以获得测试资格。 众所周知,ChatGPT现在已经火爆全球,但它的中文处理能力还存在着不足之处,然而网络文心一言的发布恰好解决了这一缺陷,网络具有中文搜索和人工智能的基础,这一个优势对于文心一言来讲是有绝大利好的,这一点来讲,就比ChatGPT占据优势,从二者的对比来看,文心一言是一种生成式的AI模型,主要可以运用在文本创作和辅助写作里面,通过对大量文本语料来学习,生成各类型的短语文章以及段落,能够清楚的表达感情段落转系以及细节描述这一点来讲,文心一言就比ChatGPT占据文本自然流畅的优势。 ChatGPT则是属于一种大规模训练的自然语言处理技术,可以通过简单的问答对话,自然也可以通过学习大规模的语料来理解生成自然语言,由于中文处理能力稍弱,这一点来讲ChatGPT就不占据优势,但两种技术所应用的场景也不完全重合,只能说在各自的领域当中,两者都具备着不同的优势和价值,不管怎么说,网络推出文心一言既是我们中国产品,则更需要所有国人的支持,向往企业能够跟上人工智能的步伐,已经是一种相当优秀的进步。