Yi 零一万物新模型

作者： 2024年10月17日快报浏览

IT之家 10 月 17 日消息，李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning 。

在盲测榜单LMSYS上，Yi-Lightning超越 OpenAI、Anthropic 所发布的GPT-4o-2024-05-13、 Claude 3.5 Sonnet， 排名世界第六，中国第一 。

零一万物表示，这是在 LMSYS 这一全球大模型必争的公开擂台上， 中国大模型首度实现 “超越 OpenAI GPT-4o ”的最佳成绩（IT之家注：此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13）。

模型性能升级之余，零一万物宣称 Yi-Lightning 的推理速度也有提升， 首包时间较上半年发布的 Yi-Large 减少一半，最高生成速度提速近四成 。同时，Yi-Lightning 实现了推理成本的进一步下降。

目前 Yi-Lightning 已上线 Yi 大模型开放平台，每百万 token 定价 0.99 元。

这是 GPT-4 发布后，AI 圈最疯狂的一周

在 GPT-4发布之后，AI领域的热度达到了前所未有的顶峰。这一周，技术革新如同狂潮般席卷而来，展现了AI技术的快速发展和应用潜力。从巨头间的激烈竞争，到新模型的不断超越，再到内部矛盾的公开，每一刻都充满了戏剧性。零一万物在一周岁庆之际，发布了千亿参数的Yi-Large模型，挑战了GPT-4的地位，李开复博士表示，其性能已超越GPT-4，预示着中国大模型正迎头赶上。 OpenAI推出了GPT-4o，一个全能型AI模型，具备文本、图片、视频和语音交互的能力，引发业内关注。 Google也不甘示弱，密集发布了一系列新产品，试图在与OpenAI的竞争中占据一席之地。首席科学家Ilya Sutskever的离职，暴露出OpenAI内部的矛盾，超级对齐团队的解散和离职协议的曝光，预示着这场AI竞赛中的复杂动态。同时，字节跳动以极低的价格发布豆包大模型，搅动了市场格局，显示出互联网巨头在AI领域的野心和布局。尽管Stability AI面临资金危机，但开源社区如Hugging Face则展现出团结互助的一面，宣布提供1000万美元的免费GPU资源，以促进AI创新的公平发展。而国产机器人公司如星动纪元和宇树科技，展示了在人形机器人领域的突破，预示着更智能的未来产品可能即将到来。这一系列的事件，无论技术革新还是管理冲突，都反映出AI技术的飞速进步和未来通用人工智能（AGI）的轮廓。然而，对于AI的未来，我们还只是在疯狂的序章，微软Build和苹果WWDC等大会将带来更多的惊喜。应用落地和实际价值，才是检验AI真正实力的关键。

零一万物最新发声：不涉及套壳、抄袭，权威榜单排名直追GPT-4

零一万物最近再次发声，回应了关于其首款开源大模型Yi的争议。此前，有质疑指出Yi可能涉及套壳LLaMA架构。对此，零一万物在官微中详细解释了其训练过程，强调大模型的发展关键在于训练得到的参数，而非架构本身。他们澄清了Yi-34B和Yi-6B模型是从零开始训练，并进行了原创性优化的，沿用LLaMA架构仅是为了测试和对比，并非有意隐瞒。在法律评估后，零一万物确认自己并未涉及套壳或抄袭。他们的努力得到了国际开发者Eric Hartford的认可，他在邮件中称赞了Yi的贡献，并在社交媒体上为零一万物辩护。近期，Yi-34B-Chat在多项权威评测中表现出色，例如在斯坦福AlpacaEval Leaderboard上，以94.08%的胜率超越GPT-4，成为英文能力排名第二的模型。在伯克利LMSYS ORG排行榜上，Yi-34B-Chat的性能与GPT-3.5相当，且在中文SuperCLUE评测中，Yi-34B Chat的胜率仅次于GPT4-Turbo，显示出强大的语言处理能力。 Yi模型在Hugging Face和魔搭社区的下载量和GitHub上的星标数量表明，其在开源社区得到了广泛认可。知名技术作家苏洋观察到，Yi及其变体模型在Hugging Face榜单上占据显著位置，显示出对开源生态的积极影响。随着新成就的累积和各方认可，零一万物的争议有望逐渐平息，期待他们在应用落地方面带来更多价值。

2024年6月LLM最新排名：Claude 3.5跃居第二！国内Yi Large第10！

在2024年6月的LLM最新排名中，Claude模型凭借其3.5的得分逆袭至第二位，这是一次值得关注的飞跃。与此同时，国内的Yi Large模型也取得了不俗的成绩，排名第十，展现出了国内AI研发的实力。这个排名由LMSYS Chatbot Arena Leaderboard提供，由伯克利、圣地亚哥和卡内基梅隆大学等顶级学府合作维护，其权威性不容小觑，截至6月26日，平台上已收录了114个AI模型，用户投票量超过138万。尽管没有全面反映国内所有模型，但已收录的国内大模型，如零一万物的Yi-Large、智谱AI的GLM-4、阿里通义千问的Qwen系列等，都在排行榜中崭露头角。其中，虽然GPT-4系列的最低排名为第20，但国内的一些大模型已经超越了某些版本的GPT-4，显示出国内AI技术的竞争力正在提升。尽管GPT-4系列未能保持一贯的优势，但竞争的激烈程度和国内模型的崛起，让整个AI领域呈现出百花齐放的态势。如果你对AI领域感兴趣，记得关注“AI信息Gap”公众号，我们将持续分享最新技术和行业洞察，一同见证AI技术的不断进步。别忘了，你的点赞是对我们最大的支持，让我们一起在AI的道路上携手前行。