IT之家 10 月 17 日消息,李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning 。
在盲测榜单LMSYS上,Yi-Lightning超越 OpenAI、Anthropic 所发布的GPT-4o-2024-05-13、 Claude 3.5 Sonnet, 排名世界第六,中国第一 。
零一万物表示,这是在 LMSYS 这一全球大模型必争的公开擂台上, 中国大模型首度实现 “超越 OpenAI GPT-4o ”的最佳成绩(IT之家注:此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13)。
模型性能升级之余,零一万物宣称 Yi-Lightning 的推理速度也有提升, 首包时间较上半年发布的 Yi-Large 减少一半,最高生成速度提速近四成 。同时,Yi-Lightning 实现了推理成本的进一步下降。
目前 Yi-Lightning 已上线 Yi 大模型开放平台,每百万 token 定价 0.99 元。
这是 GPT-4 发布后,AI 圈最疯狂的一周
在 GPT-4发布之后,AI领域的热度达到了前所未有的顶峰。 这一周,技术革新如同狂潮般席卷而来,展现了AI技术的快速发展和应用潜力。 从巨头间的激烈竞争,到新模型的不断超越,再到内部矛盾的公开,每一刻都充满了戏剧性。 零一万物在一周岁庆之际,发布了千亿参数的Yi-Large模型,挑战了GPT-4的地位,李开复博士表示,其性能已超越GPT-4,预示着中国大模型正迎头赶上。 OpenAI推出了GPT-4o,一个全能型AI模型,具备文本、图片、视频和语音交互的能力,引发业内关注。 Google也不甘示弱,密集发布了一系列新产品,试图在与OpenAI的竞争中占据一席之地。 首席科学家Ilya Sutskever的离职,暴露出OpenAI内部的矛盾,超级对齐团队的解散和离职协议的曝光,预示着这场AI竞赛中的复杂动态。 同时,字节跳动以极低的价格发布豆包大模型,搅动了市场格局,显示出互联网巨头在AI领域的野心和布局。 尽管Stability AI面临资金危机,但开源社区如Hugging Face则展现出团结互助的一面,宣布提供1000万美元的免费GPU资源,以促进AI创新的公平发展。 而国产机器人公司如星动纪元和宇树科技,展示了在人形机器人领域的突破,预示着更智能的未来产品可能即将到来。 这一系列的事件,无论技术革新还是管理冲突,都反映出AI技术的飞速进步和未来通用人工智能(AGI)的轮廓。 然而,对于AI的未来,我们还只是在疯狂的序章,微软Build和苹果WWDC等大会将带来更多的惊喜。 应用落地和实际价值,才是检验AI真正实力的关键。
零一万物最新发声:不涉及套壳、抄袭,权威榜单排名直追GPT-4
零一万物最近再次发声,回应了关于其首款开源大模型Yi的争议。 此前,有质疑指出Yi可能涉及套壳LLaMA架构。 对此,零一万物在官微中详细解释了其训练过程,强调大模型的发展关键在于训练得到的参数,而非架构本身。 他们澄清了Yi-34B和Yi-6B模型是从零开始训练,并进行了原创性优化的,沿用LLaMA架构仅是为了测试和对比,并非有意隐瞒。 在法律评估后,零一万物确认自己并未涉及套壳或抄袭。 他们的努力得到了国际开发者Eric Hartford的认可,他在邮件中称赞了Yi的贡献,并在社交媒体上为零一万物辩护。 近期,Yi-34B-Chat在多项权威评测中表现出色,例如在斯坦福AlpacaEval Leaderboard上,以94.08%的胜率超越GPT-4,成为英文能力排名第二的模型。 在伯克利LMSYS ORG排行榜上,Yi-34B-Chat的性能与GPT-3.5相当,且在中文SuperCLUE评测中,Yi-34B Chat的胜率仅次于GPT4-Turbo,显示出强大的语言处理能力。 Yi模型在Hugging Face和魔搭社区的下载量和GitHub上的星标数量表明,其在开源社区得到了广泛认可。 知名技术作家苏洋观察到,Yi及其变体模型在Hugging Face榜单上占据显著位置,显示出对开源生态的积极影响。 随着新成就的累积和各方认可,零一万物的争议有望逐渐平息,期待他们在应用落地方面带来更多价值。
2024年6月LLM最新排名:Claude 3.5跃居第二!国内Yi Large第10!
在2024年6月的LLM最新排名中,Claude模型凭借其3.5的得分逆袭至第二位,这是一次值得关注的飞跃。 与此同时,国内的Yi Large模型也取得了不俗的成绩,排名第十,展现出了国内AI研发的实力。 这个排名由LMSYS Chatbot Arena Leaderboard提供,由伯克利、圣地亚哥和卡内基梅隆大学等顶级学府合作维护,其权威性不容小觑,截至6月26日,平台上已收录了114个AI模型,用户投票量超过138万。 尽管没有全面反映国内所有模型,但已收录的国内大模型,如零一万物的Yi-Large、智谱AI的GLM-4、阿里通义千问的Qwen系列等,都在排行榜中崭露头角。 其中,虽然GPT-4系列的最低排名为第20,但国内的一些大模型已经超越了某些版本的GPT-4,显示出国内AI技术的竞争力正在提升。 尽管GPT-4系列未能保持一贯的优势,但竞争的激烈程度和国内模型的崛起,让整个AI领域呈现出百花齐放的态势。 如果你对AI领域感兴趣,记得关注“AI信息Gap”公众号,我们将持续分享最新技术和行业洞察,一同见证AI技术的不断进步。 别忘了,你的点赞是对我们最大的支持,让我们一起在AI的道路上携手前行。