可实现网页任务自动化 Project Jarvis 消息称谷歌将推出

作者： 2024年10月27日直播浏览

IT之家 10 月 27 日消息，据 The Information 报道，谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

图源 Pexels

报道称，“Jarvis”将由未来版本的谷歌 Gemini 驱动，专门针对 Chrome 浏览器进行优化。 该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本，帮助用户“自动化日常的网页任务” 。目前，该工具在执行不同操作的时候，中间会有几秒钟的间隔时间。

IT之家注意到，目前所有大型 AI 公司都在研发类似功能的模型。微软的 Copilot Vision 可以与用户讨论正在浏览的网页；苹果的 Apple Intelligence 预计将在明年具备跨多个应用程序的屏幕识别能力；Anthropic 刚刚推出的 Claude 测试版已能在计算机上执行操作；OpenAI 也在研发类似的功能。

报道称，谷歌展示“Jarvis”的计划也可能会有所变动，预计将首先向少量测试者发布，以帮助公司修复潜在的 Bug。

声明：本站内容均来自互联网，如果侵犯了您的权益请与我们联系，我们将在24小时内删除。
本文地址：https://m.szsranl.com.cn/keji312/16499.html

相关文章