AI机器人革命 Brett Adcock谈Figure 2与未来的100亿机器人世界 2万字附视频

文:Web3天空之城 · 城主

人形机器人,或者用个更流行的新词“具身智能”,是充满科幻感和吸引大众眼球的AI+机器人的尖端交叉领域。

Brett Adcock,这位Figure Robotics和Figure AI的创始人兼首席执行官,正引领着人形机器人革命的风潮。随着Figure 2机器人的发布,Adcock不仅展示了技术上的飞跃,更描绘了一个未来:到2040年,全球将会有100亿台机器人。

在这次最新的深访中,Adcock带我们走进Figure Robotics的创新世界,从Figure 2的设计迭代、硬件升级,到与OpenAI、微软、杰夫·贝佐斯和NVIDIA等科技巨头的合作,他揭示了这个新兴领域背后的复杂性与挑战。同时,Adcock对未来劳动力市场和人类社会的演变提出了远见卓识的洞见,强调机器人技术不仅仅是科技突破,更是创造富足社会的关键力量。

Adcock还谈到了中国在机器人领域的崛起,指出中国工程团队以低成本、高速度和强大的职业道德著称,这将使中国成为未来全球机器人技术的主要竞争者之一。

Figure 2的硬件升级与设计改进 :Figure 2在硬件方面进行了全面升级,包括CPU和GPU能力的三倍提升,电池容量几乎翻倍,并引入了六个高效摄像头系统,使其能够更好地感知和理解周围环境。

Figure 2的外骨骼设计承载了负荷,减轻了整体重量,提高了系统的可靠性。这种设计类似于航空领域的工程方式,显著优化了Figure 2的性能。

与OpenAI和微软的深度合作,AI集成与智能提升 :Figure Robotics通过与OpenAI、微软、杰夫·贝佐斯和NVIDIA等科技巨头的合作,成功将最先进的AI模型集成到Figure 2中,增强了机器人的智能和操作能力。这种合作标志着机器人技术向全面实用化迈出了重要一步。、

从Figure 1到Figure 2的迭代演变 :Adcock详细介绍了从Figure 1到Figure 2的快速迭代策略,特别是在硬件设计和制造效率方面的改进。他强调,通过精益制造和持续的设计优化,Figure Robotics正在将先进的机器人技术推向市场,并计划逐步扩展生产线,实现规模化生产。

未来劳动力市场与社会变革,100亿机器人愿景 :Adcock预计,到2040年,全球将有100亿台机器人,这将彻底改变劳动力市场,让人类从危险、单调的工作中解放出来。这种大规模的机器人应用不仅将显著降低商品和服务的成本,还将推动全球经济进入一个前所未有的富足时代。

系统安全与AI伦理 :在设计Figure 2时,Figure Robotics特别注重安全性,确保机器人在与人类互动时不会造成伤害。Adcock还提到,将“阿西莫夫定律”之类的道德规则纳入机器人系统是未来发展的重要方向,以确保在AI与人类的共存中保持安全和伦理的底线。

中国竞争者的崛起 :Adcock在访谈中对中国机器人领域的竞争者给予了高度评价,特别是中国工程团队在低成本、高效率生产方面的优势。他指出,中国企业以极高的职业道德和强烈的成功欲望著称,这将使中国成为未来全球机器人技术的重要竞争力量之一。随着中国机器人技术的飞速发展,中国有可能在这个领域与全球主要玩家展开激烈竞争。

主持人Peter:【精校】Figure机器人公司创始人Brett Adock专访 90分钟 2024.8 【中英】-哔哩哔哩】

https://b23.tv/qOnODdq

=Web3天空之城书面全文版=

主持人Peter:

在今天的节目中,我们将与 Figure Robotics 和 Figure AI 的首席执行官 Brett Adcock 进行深入探讨。他将带我们参观他的公司,并介绍他新推出的机器人 Figure 2。如果您在 YouTube 上观看我们的节目,我们会谈论他对埃隆的看法,以及他作为一个乐观主义者对家用机器人的展望,何时可以期待它们的普及,以及他预测到2040年地球上将有100亿台机器人。

Brett 刚刚完成了一轮融资,从 OpenAI、微软、杰夫·贝佐斯和 NVIDIA 筹集了约7亿美元。我们将讨论他如何将 OpenAI 的软件集成到他的 Figure 2 机器人中。这是一场非凡的对话,也是我最喜欢的对话之一。

很高兴见到你,我的朋友。

Brett:是的,彼得,谢谢你的邀请。

来参观你的办公室非常有趣,那是两个月前的事了,那时你还没有推出 Figure 2。我不得不说,你迭代设计的速度非常惊人。自从我在猎鹰1号看到SpaceX以来,我从未感受到过这种能量。恭喜你。

今天的焦点是Figure 2。因此,如果您不介意的话,我们是否可以在播客开始时快速浏览一下Figure 2?

当然可以,我们可以快速浏览一下车间,并顺便参观一下办公室。

欢迎来到Figure。我们现在有100多名工程师,总部设在北加州的旧金山湾区。上周我们刚刚发布了Figure 2,这是我们的第二代人形机器人。目前,我们在加州的工厂每周生产一个Figure 2机器人,现在已经有几个这样的机器人正在进行测试。

Figure 2的发布非常令人兴奋。我知道您的团队即将启动它。对于这家公司来说,成立不到两年时间,你们已经从零发展到现在的规模,速度非常快。能否谈谈Figure 1和Figure 2之间的主要区别?你们在Figure 2中做了哪些升级?

是的,Figure 2确实有几个显著的升级。首先,我们将CPU和GPU的数量增加了三倍,以提升整体计算和推理能力。其次,我们将电池容量几乎增加了一倍,达到约2.3千瓦时。电池系统安装在躯干中间,紧邻计算单元和GPU。所有的电线都被内置在机器人内部,没有外部电线、电缆或电子设备,这样设计是为了提高可靠性和整体包装的紧凑性。

此外,我们还引入了一个外骨骼结构,机器人的所有外壳实际上都承受着负载,这与我们制造第一代机器人的方式不同。这种设计更类似于航空领域的做法,比如我上一家公司Archer的飞机,外壳承受着车辆的负荷。我认为这种系统在Figure 2中非常独特。

我们还增加了六个机载摄像头,提升了机器人的感知能力,使其能够更好地观察周围环境。摄像头分别安装在机器人的头部、背部和下半身。外骨骼结构也有助于减轻机器人的整体重量。是的,基本上来说,零件越宽,刚度就越大。

我们发现,一个结构如果既能承受碰撞载荷,又能保持足够的刚度,这是理想的质量权衡。Figure1展示了一个结构和外壳共同承受载荷的情况。这种设计并不理想,因为结构的尺寸实际上是由碰撞载荷决定的,最终导致在很多方面都出现了双倍的质量。

关于机器人的手部设计,你们是否进行了改进?请展示一下它的样子。

我们现在已经开发到了第四代机器人,与前几代相比,我们做出了许多改进。包括更好的传感器、更优化的包装、更高的质量、更强的结构强度以及更快的手指速度。总体而言,我们在机器人上进行精细操作的灵活性和控制力都有了显著提升。这些改进使得机器人能够更好地执行类似人类的任务,并抓取类似人类的物体,从而提高了机器人的通用性。

Peter:

这真是太神奇了。它站立的高度大约是五英尺六英寸到五英尺七英寸之间,对吗?

brett:是的,差不多是五英尺六英寸。

非常感谢你带我们快速浏览了一下。你想回到你的会议室吗?我注意到那里有横梁,用来搬运重物。

那么,现在在这个设施内有多少个数字机器人正在运行?

目前在我们的设施里有不到10个机器人在运行。我们现在的生产速度基本上是每周制造一个。

我注意到你给我展示了Figure1,然后是Figure2,接着是Figure3的图纸。虽然不能详细谈论Figure3,但它看起来非常漂亮。你能谈谈你的快速迭代策略吗?你如何看待代际更新、重新设计和重建?因为很多公司喜欢先推出一个产品,然后修复它,并长期销售。而你的策略似乎并不是这样。

是的,我认为这里的经验法则是,通常需要至少三个硬件版本才能达到相对商业化、可靠且无错误的程度。我们的目标是在极限情况下,让问题基本上成为软件限制的问题,这意味着我们需要真正可靠的硬件,它必须是安全的、质量稳定的,并且成本低廉,同时我们能够高效地制造它。

这就像一盏灯,在第一个版本的硬件中有很多问题需要解决才能做好。这非常困难,就像要把iPhone做到完美一样。在iPhone 1的时候,它并不是世界上最棒的手机,但到了iPhone 3和4,它无疑成为了世界上最棒的手机。汽车领域的情况也是类似的。以特斯拉跑车为例,尽管它可能不是世界上最顶尖的汽车,但我个人拥有三辆特斯拉,它们表现非常出色,可能是我拥有过的最好的车。

我们目前的目标是在快速硬件迭代的过程中,研究并应用不同的启发式方法,使硬件逐步成熟,并进行所有必要的改进,以确保硬件在某个时刻达到非常成熟的状态。

回顾我们的第一代硬件(Figure1),主要任务是确保整体架构的正确性。工程系统的细节非常重要,例如电池的能量来源是什么?是液压的还是电池供电的?电池的化学成分是什么?电池的类型是圆柱形的还是棱柱形袋装的?我们如何处理这些电池的热传播问题?这些问题仅仅是关于电池本身的,而整个系统还有许多其他方面需要考虑。

在建造机器人之前,需要做出100到200个决定。你不希望处于必须在所有这些方面都做到完美的境地。我认为我们在Figure1中的大部分内容都做得不错,而在Figure2中,我们在一些决策上表现得更好。

Figure2的目标是打造一个功能齐全的机器人,集成所有必要的系统,无论这些系统是我们自己制造的还是外购的,机器人都能够正常工作。我们制造了大部分机器人的组件,包括固件嵌入式系统、控制软件、机载硬件系统、执行器、电子设备、线路、电池系统、摄像头和传感器等。因此,我们认为Figure2中的功能已经基本完成,硬件部分也已完成,这让我们感到非常兴奋。

接下来,我们的目标是如何将成本从当前水平降低一个数量级以上?如何获得制造前所未有的机器人的能力?

我知道你提到过一句话:“每个人都会拥有一个类人机器人,而劳动力将变得可选。”这确实是一个非常具有挑衅性的话题。

关于“每个人都拥有一个类人机器人”这一点,我想进一步探讨。你提到要将成本降低10倍。埃隆在价格和时间表上通常非常激进,尽管他并不总是能准确把握,但我想问的是,你是否认为这些类人机器人最终会以每公斤总重量的价格来定价?你认为在10年或20年后,这些机器人的实际成本会是多少?

我们花了一年的时间研究如何降低这些机器人的制造成本。答案实际上在于对整个物料清单成本进行自下而上的分析。我们基本上列出了大约1000个零件的清单,然后逐项分析,开始了解我们将如何在实际规模上采购这些零件,无论是自行制造还是外购,并估算我们可以获得的合同数量以及相应的价格。这非常依赖于数量。

我们知道,几乎所有的消费设备或汽车的价格都与其制造量高度相关。因此,降低消费电子产品价格的唯一真正方法就是提高产量。这是我们所知道的唯一途径。所以,如果你真的想要降低成本,就必须大规模生产这种产品。

是的,我认为在足够长的时间内,随着产量的增加,成本可以降到每台设备低于20,000美元,甚至非常便宜。

这是一个令人惊叹的想法。因为如果我租一辆价值20,000美元的汽车,每月最多只需花费100美元。那么,为什么不买两辆呢?

特别是如果这辆车还能为你赚钱,比如它可以出去工作,或者它可以完成你白天需要花时间做的事情。如果它真的能像一个真正的公用工具一样发挥作用,那么你会想要多少辆呢?

当我们第一次谈话时,我记得你说过一些令人震惊的话,但现在回想起来却非常有道理。如果我记错了,请纠正我,但我记得你曾估计,到2040年,市场上可能会有多达100亿个仿人机器人。你还坚持这个观点吗?

如果这些机器人能够完成所有人类能做的事情,我不得不认为我们将能够投入30到50亿的劳动力。而且我看不出为什么每个人不想拥有一个像汽车或手机一样的仿人机器人。也许它比汽车或手机更重要,因为它可以做你不想整天做的所有工作,比如遛狗、喝咖啡、办事、洗衣服,甚至每天回家收拾孩子的玩具。我可以让机器人每天花两三个小时收拾孩子的玩具,这完全没问题。就像每天无休止的工作一样。

是的,我可以想象。

你说的其他话也让我大开眼界。你提到,拥有这类仿人机器人是一种道德责任。因为随着我们实现通用人工智能(AGI)和数字超级智能,如果我们没有这些仿人机器人,人工智能可能会让我们按照它们的意愿行事。而如果机器人按照人工智能的指示行事,这对人类的灵魂来说会好得多。如果我说错了,请纠正我。请纠正我,如果我错了,但这是一个我以前从未听过的有趣观点。

我认为,一个相当令人沮丧的未来是:我们解决了通用人工智能(AGI),但它却被困在一个盒子里,无法在物理世界中发挥作用。为了让AGI在现实世界中做任何事情,它必须通过支付工资或其他方式要求或强迫人类去执行这些动作。我不知道你怎么看,但这似乎是一个非常令人沮丧的未来。

就像人类智慧的集体意识被困在那里,想要在物理世界中有所作为,却不得不通过工资或强制手段向人类支付费用。这种未来看起来非常可怕。

我对你写的使命宣言很感兴趣。我最近看到了你发布的一些文件。根据这些文件,Figure的使命是通过先进的人工智能扩展人类的能力。我很好奇,文件中并没有提到人形机器人,而是强调通过先进的人工智能来扩展人类的能力。你是如何走到这一步的?你最终将自己视为一家人工智能公司吗?

我们确实将自己视为一家极限人工智能公司,而极限人工智能恰好是机器人技术公司。从极限的角度来看,我们在完成使命过程中面临的所有挑战,最终大部分都是人工智能问题和障碍。我想我们现在都有一个梦想,希望有一天我们能看到这些机器人在世界上从事非常重要的工作。这对人类来说是真正需要的,有助于降低商品和服务的价格,并希望带来一个富足的世界。我认为这会释放出大量时间,让我们能够做我们真正喜欢的事情。

是的,正是如此。如果我们可以把时间花在我们真正想做的事情上,那么所有人类会如何利用他们的时间呢?

我认为这是最重要的问题之一。

在之前的采访中,我听到你谈到机器人如何实现富足时代。你认为机器人的未来会如何实现富足时代?你如何描述它?你认为它是什么样子的?你所说的富足时代是什么意思?

我认为,人形机器人的有趣之处之一在于,我们可以将这些机器人直接放入现实世界中,而无需额外的基础设施来运行它们。你可以将机器人投入劳动力市场,而不需要为它们构建新的系统、新的电子设备或其他一切。就像人形机器人可以直接融入世界一样,第二天它们就可以像人类一样开始工作了。如果我们有了机器人,从制造的角度来看,我们最终会制造出更多的机器人。我本来想问你这个问题。

这很快就会演变成一个问题:是的,今天的大多数制造业基本上可以被看作是由一堆机器和人类共同完成的。

如果我们能够实现人类级别的制造,那么理论上你就可以让机器人制造机器人。随着成本的下降,这些机器人可以被投入到世界各地的工作中。那么,这项工作的成本是多少呢?这包括你租用机器人的成本,以及土地的成本。如果你在那个设施中使用可再生能源,那么这个工作区域的成本将会非常低,而产出则会非常高。

因此,你基本上可以创造一个世界,在这个世界中,商品和服务的价格趋于零,GDP将飙升至无穷大。是的,基本上你可以要求任何你想要的东西,而这些东西对于世界上的每个人来说都是相对负担得起的。

当你观察各国的GDP时,你会发现它们随着人口和能源使用量的增加而增长,这很有趣。人口和能源就是工作的基础。因此,这似乎将成为任何想要在未来几十年生存和繁荣的国家的必备要素。我认为弄清楚这一点非常重要。

在你的使命宣言中,你提到,figure的目标是开发通用人形机器人,对人类产生积极影响,为子孙后代创造更美好的生活。这些机器人可以消除对不安全和不受欢迎的工作的需求,最终让我们过上更幸福、更充实的生活。我相信这一点。我喜欢让机器人去做那些枯燥、危险、肮脏的工作,比如打扫厕所、清洁房间,因为我认为大多数人都在从事这些工作。世界上大多数人工作并不是因为他们喜欢这份工作,而是因为他们必须工作才能获得食物或保险,无论情况如何。

但最终的问题是,我还认为这些机器人会取代更多的工作。我有一个侄女,她是一名整形外科医生,我想,别说了,机器人将成为我们最终的外科医生。你认为是否有一些工作是机器人无法承担的,如果我们愿意的话?

显然,随着时间的推移,数字和物理智能机器人将能够完成越来越多的人类擅长的工作。我认为我们在过去几个世纪里已经通过技术看到了这一趋势,但现在我们看到这一曲线的斜率正在加速,尤其是在大型语言模型领域,这种加速几乎朝着我们十年前无法想象的方向发展。

所以我认为,在足够长的时间内,我们将拥有自动化,无论是物理自动化还是数字自动化,我们能够做到的可能是人类今天可以做的大多数事情。

顺便提一下,我今天早上查了一下,美国目前有820万个职位空缺。首先,我想澄清一点,并不是说没有需求或工作机会。

我认为最大的新闻和值得祝贺的事情是你们刚刚获得的融资。对于那些不太了解的人来说,这次融资非常非凡——你们从OpenAI、微软、杰夫·贝佐斯和NVIDIA筹集了26亿美元。作为一名投资者,我也感到非常自豪。

这确实是一大笔资金。是的,我们以26亿美元的估值筹集了6.75亿美元。我们对此感到非常自豪,并且吸引了许多新投资者,包括OpenAI、微软和NVIDIA。能够得到你们的支持,我们感到非常高兴。

这笔资金将为我们提供足够的资源,使我们能够迈出下一步,实现我们的使命——将这些机器人推向商业化,并使它们真正可行。

这正是我们目前所处的阶段。我们正在发布一些很酷的视频,这当然很棒,但接下来的重大挑战是:我们如何让这些机器人真正加入劳动力队伍,并每天都在工作?

我们刚刚从宝马公司回来,在那里进行了将近两周的全面试验,一切进展顺利。宝马实际上刚刚发布了相关的新闻稿。我们计划近期内再次回到那里,继续进行有意义的工作。对此我们感到非常兴奋。这既困难又具有挑战性,因为我们在办公室里已经走出了舒适区。当我们回来时,我们充满了活力,觉得我们可以做到,这一切是可行的。

所以,是的,这里的每个人都非常激动,因为我们有机会在未来几年内尝试实现这一目标。我并不是说融资后有什么阻碍了我们。事实上,在公司目前的阶段,我们拥有比所需更多的现金。我们有像OpenAI这样的优秀合作伙伴帮助我们建立模型,有像微软这样的公司帮助我们进行训练,NVIDIA则在GPU硬件和其他模拟工作上给予了支持。

我们拥有世界上最好的人工智能机器人团队。我们现在有了第二个模型,我认为这可能是世界上最好的人形硬件。我们正在进行世界上最好的人工智能学习工作,并且已经看到了隧道尽头的一丝曙光——机器人真正能够做的事情。

所以我们现在都在为此努力工作。

你会说你们现在所做的事情只有在当前人工智能的发展状态下才有可能吗?人工智能和大量的计算能力是让这一切成为可能的关键因素吗?毕竟,我们已经谈论机器人技术超过50年了。我在高中和大学时也曾经建造过机器人。然我们可以称它们为机器人,但实际上它们远不及真正的机器人。

然而,现在是人工智能的进步让我们开始思考:是否应该承诺更多?您投入了大约1亿美元的自有资金来启动这个项目,这对企业家来说是一个重要的举措。

我认为有几件事与以往不同。首先是整个人工智能生态系统的变化。人工智能不仅仅是模型,它还包括用于训练、推理和部署的整体基础设施,例如支持大规模模仿学习和强化学习的深度学习算法。

因此,人工智能的几个关键构建模块已经成熟到可以部署这些策略的地步,比如嵌入在现实世界中的策略,而且它们能够真正发挥作用。这真是令人难以置信。

上个月,我刚刚从城里乘坐Waymo回来,那种体验非常特别。显而易见,只要有足够的数据,人工智能就可以像人类一样驾驶。我们的机器人也是如此。当你看到我们的机器人在工厂里执行我们正在研究的新一代任务时,那种感觉非常神奇。

我认为另一个重要的变化是整个硬件系统的进步。很难说10年前是否真的有可能实现现在的技术水平,比如执行器的扭矩密度、电池和电池系统的能量密度。10年前,最好的仿人机器人大多采用液压系统。这些系统的液压压力高达3000 PSI,到处都在漏液压油。是的,到处都在漏油,这使得它们很难与人类共存。如果这些系统放在人旁边,可能会对人造成致命威胁。因此,10年前的架构决策显然是错误的。

我不确定10年前是否有可能,即使有了人工智能,也能建立一个像现在这样高效的机电系统。我可能会认为那时是不可能的。我确实认为这是多种技术的融合。

明年3月,我将举办的“Abundance Summit”的主题就是“融合”。感谢你们的参与,因为我认为你们正在构建的正是融合技术的典范,这些技术使得新系统和新商业模式成为可能。

你最初是如何与OpenAI建立联系的?这是一个重要的转折点。

几年前,我认识了Sam,我们逐渐加深了了解,并在2023年一起度过了很多时间。他们最终决定重新进入机器人领域,特别是在人工智能和具体化系统方面。

现在我们在这里,就像在为我们的机器人开发下一代人工智能模型,让它真正发挥作用。他们在这方面给予了我们很大的支持。我想说,到目前为止,这个系统的表现是10分满分。我们认为它们是世界上最好的视觉语言模型。他们是全球范围内这些模型的最佳实现者。

我们目前正试图突破界限,尽可能推动这项工作在机器人领域的发展。我们才刚刚开始这项工作,就像过去几个月一样。

我认为这对他们也有很多好处。

你提到了具身人工智能。有些理论认为,除非我们能将人工智能具身化,让它们理解宇宙并进行探索,否则我们无法实现通用人工智能(AGI)。还有另一种观点认为,我们在实现AGI的过程中可能会遇到数据瓶颈,而人形机器人则是一种收集大量数据、帮助塑造未来模型的手段。你能谈谈这个吗?

我认为,越来越明显的是,某种程度上的输出行动对于我们在智能方面的下一步发展至关重要。我们在这里试图做的是,帮助完成我们从一些最好的世界模型中看到的最后一步——行动和推理。我们正在内部帮助这些模型进行研究。

归根结底,如果你能与机器人交谈,并且它能够在现实世界中执行有用的动作,这对我们在这里试图研究的世界来说将是一项不可思议的技术。无论你称之为高级人工智能、AGI,还是其他什么,这都是我们试图达到的一个重要焦点,即如何将智能动作输出到世界中并做一些有用的事情。因此,我们在人工智能方面的大部分重点都集中在这个主题上,以及如何使其尽可能具有可扩展性和可推广性。

我必须想象,GPT-4和GPT-4的多模态版本对你来说是关键,能够理解这些内容。当你开始的时候,这些技术相对来说还不存在,对吗?多模态模型还不存在。这就是你和Sam的对话内容吗?他是否参与了你内心关于未来可能发生的事情的对话?

我认为,我们最大的突破之一是,我们拥有了大型语言模型(LLM),更具体地说是视觉语言模型(VLM),这为我们在机器人技术领域提供了语义基础。我们拥有世界上的知识,比如说,这些知识以某种方式被保存下来,类似于以压缩文件的形式保存,机器人可以访问和理解。而从机器人到人类的桥梁从未真正存在过。

如果你想和自动驾驶汽车交谈,比如说,“把我放在那边路边,在右边”,世界上没有真正的语义桥梁。而现在,我们可以说已经有了。我们已经在世界上建造了这样的语义桥梁。

然而,我们真正缺乏的是这种推理、规划,或许还有来自该系统的行动,以便我们在机器人中提供有用的工作。因此,我想说,这种令人难以置信的技术已经开放,我们现在在世界上看到了许多非常酷的东西。比如,世界各地都有不同的技术和人工智能,但人们很少谈论的是,这对机器人意味着什么?这意味着机器人不仅能够理解你说的每一句话,还能明白你的意思。

我们所拥有的这一切都基于人类层面的数据,这意味着我们所掌握的所有语义世界知识都是由人类为人类编写的。对于一个看起来像人类的人形机器人来说,这是一种令人难以置信的能力,它的效率传输率非常高。

我们喜欢人类打开罐子的方式,而这种方式与机器人或人形机器人打开罐子的方式非常相似。因此,与人类工作相关的可供性水平非常高。这就像是解锁了人形机器人真正能够像一般机器人一样解决问题的能力。

我们如何与机器人对话?如何让它们输出人类可以做到的一切动作?似乎在某个时间点,我们可以真正尝试看看是否能解决这个问题。

所以你的意思是,我们将看到与机器人的正常互动就像你和人说话一样。比如你说:“你能帮我拿那个吗?”然后它会问:“你想让我拿什么?”接着你指着某个物品说:“那边的东西。”它就能理解你指的是订书机或水瓶。因此,它具备背景知识、几何知识以及所谓的位置知识。

那有多远?

是的,今天这一切都已经成为现实。它不仅仅是理解这些,还超越了所有这些因素,比如神经网络权重、塑料瓶的材料、大致的质量特性和摩擦特性,以及它将如何抓住物体的感觉。所有这些都在它的计算中。

我致力于长寿,因为我想尽可能多地看到这些技术的发展。

你工作多少小时?因为我知道你的热情,布雷特,我知道你对此的奉献精神,你就像糖果店里的孩子。你还必须平衡家庭生活。你的工作周是什么样的?

是的,我几乎每周工作七天。除了在家和妻子、孩子在一起,我几乎没有时间不工作。

你的孩子多大了?他们明白你在做什么吗?

我想我们刚刚度过了家庭日。我女儿五岁,儿子两岁。所以我们让机器人四处走动,所有的孩子都很兴奋。这真的很酷。是的,他们明白了。他们一直在谈论爸爸建造机器人。我想,是的,上周我们实际上可能有50个孩子在这里,他们看着机器人并触摸它们。是的,这很特别。

我也想到了这一点。我有两个13岁的儿子,我迫不及待地想让他们看看你在这里建造的东西。我认为他们的未来和你孩子的未来将是这样的,如果你的预测是正确的,我认为是正确的,机器人将比汽车更普遍。对。在未来,世界上可能会有十亿辆汽车和一百万辆其他类型的车辆。我们可以预见到,未来的交通工具将会发生巨大的变化。

我曾经问过一位朋友,五年后,当你在街上看到人形机器人行走时,会是什么样的感觉?他的回答很有趣,他说:“这看起来会很正常。”

确实如此。

我想分享一个有趣的现象。我们这里有很多人已经与机器人打交道很长时间了。他们会说,每当我们做出一些新奇的东西,最初大家都会感到惊讶和敬畏,但很快就会习以为常,不再关心。这种情况确实时有发生。

在我们的办公室里,最初几次看到机器人时,每个人都会停下手头的工作,拿出手机拍照,甚至在会议室里挥舞着拳头庆祝。我们有一段非常疯狂的视频,视频中每个人都围着机器人,表现得非常兴奋。我第一次走进办公室时,大家也都拿出手机拍照。但现在,这种场景已经变得司空见惯,没人再特别在意机器人离自己有多近。我们已经习惯了这些新技术,这真是令人难以置信。

我们适应新事物的速度非常快,以至于它们很快就变得无聊。我记得我第一次拿到 Model X 时,车门像翅膀一样升起,大家都在拍照并围观,但很快这就成了一件平常的事。我们很快就习惯了这些新奇的事物。

类似的情况也发生在今天使用的大型语言模型上,比如 ChatGPT。我每周都会频繁使用它,并且已经将它视为我工作流程的一部分。这种技术的使用已经变得完全正常,就像是 GPT 5 的自然扩展。

至于将这些技术及其衍生产品整合在一起,或者即将揭开神秘面纱的“草莓”项目,我目前无可奉告。

我很好奇你对Optimus、Tesla和Elon的看法。我知道你非常尊重他,既作为工程师也作为企业家。你对此有何看法?

我对Elon在过去20到30年间所做的事情感到非常鼓舞,这简直令人难以置信。我认为他们在Optimus项目上做得非常好,他们有一个非常优秀的工程团队,并且已经取得了显著的进展。我认为他们正朝着正确的方向前进。作为一个社会,我们需要整合和制造人形机器人,而他们正朝着一个非常好的方向迈进。我认为他们将成为我们真正的竞争对手。世界需要他们这样做,我也希望他们能取得成功。我认为我们正处于一个关键的时间点,现在人形机器人的窗口才刚刚打开。十年前,这一切几乎是不可能的。

如今,这将是一场竞争,核心在于如何在制造方面大规模生产产品,并在具体系统上构建和部署人工智能训练集。这将是一个至关重要的时刻,真正让这一切发挥作用。

总体而言,我认为他们会做得很好,我对他们正在解决的问题感到高兴。

我相信,当他进入这样一个新行业时,他将会在很大程度上证明其价值。

他们是否在帮助你们留住这支团队?当你们看到这些成果时,会不会感到惊叹,想知道他们是如何做到的,或者认为你们的团队更优秀?这是否为团队提供了一些游戏化的激励,还是你们只是保持开放的心态?

我们试图从一阶推理出发,做出所有决定,确保每一个决定都是正确的。这对每家公司来说都至关重要。我们有自己的使命、愿景、价值观以及我们所关心的事物。这与其他任何公司都截然不同,我们希望朝着某个方向前进,类似于矢量空间的方向,我们认为这是长期发展的正确方向。这就是我们在做决定时真正立足的地方。

从长远来看,我们会做出一些与其他团体截然不同的事情,因为我们是在真空中根据我们掌握的知识做出这些决定,并经历这些过程。

是的,我认为他们是一个非常强大的竞争对手。当然,我们想赢,我们想在各个方面展开竞争。我们的目标是在这里建立世界上最好的人形机器人公司。

由于市场几乎是无限的,地球上有足够的空间容纳两到三家重要的参与者。

我认为,我们需要更多真正的参与者。

特斯拉是一家真正的参与者,资本雄厚,工程团队出色,长期朝着正确的方向发展,快速完成高频率的迭代周期和里程碑,这些都是工程团队真正证明产品具有商业可行性所必需的。而我们在人形机器人领域所缺乏的正是这一点。

我们有很多团队已经在这个领域存在了很长时间,但看起来不会有很多参与者能够获胜。似乎只有少数人能够跨越这个鸿沟,跨越将我们推向市场所需的鸿沟。我认为,许多人会为了跨越这个鸿沟而付出巨大的代价。

我希望我们能生存下来,但现在我们还有14座山峰要攀登。从现在的状况(作为一家成立仅两年的公司)到成为具有商业可行性的真正企业,我们前面的道路非常艰难。这就是我们需要做的。我们还有几年时间,个位数的时间来证明这一点并进入市场。我们正在尽最大努力将我们的产品交付给客户并使其有用。

是的,我认为大多数人可能没有意识到你们只有两年的历史,以及你们组建的团队。在上一轮融资中,如果我回顾一下,如果你问普通人或普通技术专家或风险投资家,Elon为Optimus带来了什么优势?他在那边有一家汽车公司,可以利用它的资源。他拥有计算能力,也有充足的资本。我认为,最近一轮融资为你提供了平等的机会,尽管在某些方面可能还不完全如此。

不过,这样的论点其实并不成立,因为你可以对每一家公司都这么说,质疑它们为什么不能被颠覆。你可以说,这些都是特斯拉20年前的弱点,当时他们还没有这些资源——一个都没有。然而,尽管当时已经有一些团体在制造电动汽车,特斯拉却不知怎么地赢了。

现实生活中的情况并非如此简单。这些属性并不能决定胜负。

我并不是说它们决定了胜负,我只是说这些属性是有利的。现在你有了资本,有了OpenAI的计算能力,还有宝马等合作伙伴。

我认为,建立一家健康公司的所有基础都开始显现,这非常好,因为这些正是我们长期路线图中所需要的条件。我们只需要非常聪明地将所有这些部分组合在一起,然后在市场上生存下来,让产品发挥作用。

生存下来是商业计划的重要组成部分。

我们可以谈谈中国吗?因为我觉得这个话题非常有趣。中国在低成本劳动力的支持下取得了成功,但这种优势正在逐渐消失。我们经历了COVID-19疫情,没有人愿意继续制造产品,运输成本也在增加。因此,我一直在关注来自中国的机器人公司,因为我认为出于很多原因,比如人口老龄化、独生子女政策,以及维持制造基地的需要,机器人将变得越来越重要。我看到了Unitree和其他一些公司。你觉得中国的机器人产业怎么样?有没有看起来不错的竞争对手?

几个月前我刚从中国回来,说实话,这是我职业生涯中最好的一次访问。我去了中国大陆一些专注于制造业的公司,那里的情况简直令人难以置信。我们参观了一个工厂,我当时注意到墙上写着一些字,于是问他们那是什么。他们告诉我,那只是这栋楼的座右铭。我继续问,上面写的是什么?他们回答说:“如果你今天过得不好,就努力工作。”我当时心想,天哪,这些人简直是工作狂。他们全力以赴地建造和运输,职业道德非常高尚。整个国家都充满了竞争和取胜的决心,这让我感到震撼。

其实我去过很多次,尤其是花了很多时间参观那里的高速制造流程。这真是令人震惊。

我认为,在人形机器人领域,我们有一个人物,一个中国以外的乐观主义者。我确实认为,中国将是下一批在这一领域长期保持真正竞争力的国家之一。

我认为他们必须这样做。

我以前每年都会带一群富有的会员去中国,参观那里的顶级科技公司。我记得他们的座右铭是“996”,即每周工作六天,每天从早上9点到晚上9点。这被视为一种伟大的生活方式,也体现了他们的职业道德。

众所周知,中国在某些方面是抄袭者,确实,他们抄袭了很多东西,但同时他们也进行了许多真实的新开发工作。这也是我的经验。

我的经验是,那些人都渴望成功。他们希望以最低的成本、最快的速度实现目标,并且不惜一切代价争取成为第一。这正是初创公司的本质所在——你创办一家公司并取得成功的关键原则在于,你从一无所有开始,只有凭借纯粹的意志力才能到达成功的彼岸。

中国拥有大量这样的资源,尽管他们并不具备我们美国所拥有的所有资源。就像我们之前讨论的那样,拥有这些资源真的那么重要吗?或者说,这些资源是最终的依靠吗?

因此,我认为中国将会涌现出一些令人难以置信的机器人公司,因为他们正在进行的项目数量非常庞大。而我所看到的那种意愿是无与伦比的。

是的,我认为,就像以色列为了生存而发展出一个惊人的国防工业一样,人口不断减少和老龄化的中国、日本和韩国也需要发展出一个令人难以置信的机器人行业,才能生存、发展并维持GDP。

以Archer Public为例,这是一个令人难以置信的成功,祝贺你。在创办和运营了几年之后,你取得了突破。如果我没记错的话,你做出了巨大的承诺,投入了大量资金来创办这家公司,而你之所以能够做到这一点,是因为你之前成功退出了Vetteri和Archer。

但我认为,当我第一次听到你的演讲,并将其带到我的风险基金时,令我印象深刻的,也是我决定投资的原因,是你组建的团队。这是一群来自顶尖人工智能和机器人公司或科技公司的非凡工程师。

你能给正在创办公司的创始人一些建议吗?你也是一名技术型创始人,这一点很重要,但你是如何招募团队的?

是的,我认为,为了推出一款真正优质、高质量的产品,你需要世界上最好的团队来完成这项工作。尤其是在面对困难时,成功的几率总是很低,所以你需要全力以赴。你需要最好的团队,你需要他们每天在现场努力工作,并且要有高度的工作热情。

因此,我花了第一年的时间,基本上是在规划组织在技能方面的需求,以及最终的组织结构图需要如何设计,才能支持一个真正高效的团队来打造产品。在创业的第一年,我几乎是手工猎头整个团队。通过电子邮件和电话联系,我起草并发出录用通知书,安排共进晚餐,尝试促成合作,并进行30、60、90天的入职训练,最终让他们加入团队。我还负责领导工程决策和方向,与这些团队一起开展项目。

我认为这是一项巨大的回报,因为我们现在已经取得了显著的进展。我相信我们拥有世界上最好的团队之一。这就像滚雪球一样,我们能够吸引到各个领域的真正高素质人才。

在早期阶段,布雷特,你是如何获得第一批十几个人的?是你的信念吗?还是你的资本承诺?因为在某种程度上,你有特斯拉机器人项目,我不知道当时它是否被称为Optimus,而埃隆·马斯克往往会用他所做的事情吸引所有的注意力。你是如何说服人们离开他们原来的岗位并加入你的团队的?因为这确实是一个关键问题。

是的,早期的宣传是我们正在研究人形机器人,并肩负着利用人工智能提升人类能力的重大使命。我们相信人工智能是市场的第一要务,并认为垂直整合的硬件设计方法至关重要。我们正在世界上最大的可服务市场(TAM)中工作,几乎一半的全球GDP都与人力劳动相关。我承诺在头几年内为公司提供资金支持,因此短期内没有资金风险。

这是我第二次从零开始打造硬件团队。在Archer取得了一些成功后,我们重新开始,这次在设定团队的正确方向、使命、愿景和价值观方面做得更好。我花了大量时间与那些人交流,鼓励他们加入我们,共同打造这个商业产品,并从早期就建立最好的组织。

早期加入的员工获得了创始成员的股份,这对他们来说非常有吸引力,同时他们也得到了很好的薪水。我自己出资,这使得这家从零开始的公司在早期阶段有了资金缓冲。随着团队逐渐壮大到五六个人时,他们都是行业中的超级明星,这也降低了后来加入者的风险。

因此,我能够找到真正相信这个领域并相信我的人。很多人曾经在我之前的两家公司与我共事,也有很多新人。我的前两位员工是我曾经共事过的人,比如我在Vetteri的第一位员工和Archer的早期员工。我们三个人在第一天就开始一起工作,随后我又从Archer的老团队中吸纳了一些新人,并从波士顿动力公司和其他组织中招募了一些非常优秀的人才。在公司成立后的12个月内,我们迅速推出了自己的机器人。我们非常努力,几乎是立刻就进入了市场。回想起来,虽然当时一切看似顺利,但实际上我在WeWork的电话亭里待了整整五个月,不断打电话,试图说服一些夫妻中的一方加入我们的团队,并让他们去说服自己的配偶。这确实非常困难,我不会撒谎。

在早期阶段,或者说在达到现在的水平之前,如果问我当时是否认为我们会走到今天这个地步,我会说,我从未想过我们会不合适。我一直在关注产品在商业化路线图上的表现。我们当时还没有成功,甚至还没有开始发货。

然而,我们已经存在了大约两年多一点的时间,这在某种程度上是难以置信的。比如,看看现在用于AI系统和执行这些政策的硬件数量,再看看类人机器人,这些技术的发展大概已经有10年了,这真是令人惊叹。我们从未在办公室里停滞不前,事情总是在向前发展。虽然有时我们会遇到几天的停滞,比如几个机器人坏了,我们在修理它们时没有取得进展,或者没有取得很多有意义的进展,但大多数时候,我们的进展都相当不错。比如,如果有人离开一周,回来后会觉得这是一家全新的公司。每过一周,我们都在产生相当大的影响。所以我想说,我们远远超出了我最初对两年后情况的预期。

两年前,我很好奇,您认为哪些事情看起来很难,但结果却比预期容易?

其实,没有什么是容易的,但有些事情确实比预期要容易。好吧,也许我会从相反的角度来回答。我曾以为我们可以轻松采购到制造机器人所需的供应链,比如电子设备、电路板、电机、执行器系统、电池组系统、摄像头、灯、扬声器等。我以为我可以去阿里巴巴或亚马逊购买这些组件,比如扬声器、屏幕、灯等,然后将它们直接应用到原型上,应该是非常简单的事情。

然而,事实并非如此。即使是这些看似简单的组件,我们也不得不制作定制的扬声器,甚至为其中一些区域编写定制的固件。这远比我最初想象的要复杂得多。这简直令人难以置信,根本不可能。

因此,如果对这些扭矩传感器或其他传感器进行一些简单的研究,比如采购和进货,我就不必亲自去做这些事情。

我们制造扭矩传感器,比如这里有四个传感器,它们需要弯曲、电路板,还需要测量、校准和集成。上面还要搭载软件和固件,并且它们必须以非常高的速度工作。这一切仍然让我感到困惑,因为所有这些东西都没有成熟的供应链。这简直令人难以置信。

我假设这不是你的第一选择,你宁愿从可靠的供应商那里购买,而不是垂直整合一切。

如果某样东西很容易采购,而且市场上有多个供应商,那么每个人都会选择购买。在这种情况下,没有一个理智的人会想要自己建造机器人,维护它、进行质量保证、修复错误、支付人类工资并管理人类,这需要付出巨大的努力和成本。这简直是一件非常困难的事情。

而且,该死的人类。。

你很快就会度过人类阶段。你认为机器人制造厂占多大比例?大致是75%还是90%?无论你选择什么指标,重量或成本,我们可能会看看其中有多少是我们自己设计的。

我不知道确切的数字,但我不得不认为,目前我们为机器人设计的东西中可能占70%到80%。

控制质量和从供应商那里抽取管理费用或利润并没有什么好处。我记得我早期参观过Elon的工厂,他和一些供应商进行了交谈,因为很多供应商都是国防航空航天供应商,价格非常昂贵。他说,去他们的,我们自己做,这就是我们的态度。

我不知道我们是不是已经这样做了两年。

因此,围绕制造材料和供应链的大多数工程决策都是:让我们通过将零件放入机器人中来提高速度,让机器人进入人工智能,由人工智能工程师控制工程师,让我们完成工作。所以我们会很快做出这些决定,将这项工作外包,以便让机器人更快地启动和运行。

从长远来看,我认为我们会更好地控制供应链,降低风险,降低整个供应链的利润率。但是,是的,我想我们认为这很容易,但实际上这简直就是地狱。

那么,这件事的另一面是什么呢?你以为会很难,但最后却变得容易的事情,会不会是人工智能集成?当你开始的时候,你有没有想过你必须建立自己的人工智能模型?

我们仍然有很多自己的人工智能模型,虽然可能不是很出名,但是,我们有一个完整的人工智能团队。我们在内部进行了大量的工作,同时也与一些像OpenAI这样的组织合作,开发新模型并利用他们的VLM(视觉语言模型)来完成一些任务。这种合作对我们非常有帮助。

我认为,人工智能系统确实能够让人感到惊叹,它们的效果非常显著。你可以想象一下,在系统开发中,有多少任务需要通过硬编码的方式来完成,这类似于更经典的控制和启发式方法。而我们又能通过神经网络完成多少任务呢?

几年前,我的想法是,系统中的大部分工作——大约95%或90%——将通过启发式方法和代码来实现。当我们能够开发出性能相当的神经网络时,我们就可以用这些神经网络来替代原本由代码(如C++)实现的部分。然而,情况有些出乎意料地发生了变化。

如今,神经网络在各个方面都发挥着作用。对于一个小团队来说,即使我们没有大量的工具和基础设施,几乎可以立即开始使用各种技术,比如SLAM(同步定位与地图构建)、感知系统、物体检测器、规划系统以及语音到语音的推理系统。这些技术在整个堆栈中,从高层到稍微低层的运行效果都非常好。因此,我认为这真的是一种非常神奇的现象。

我记得你曾经跟我提到过,当你把解药放在杯子里,泡上一杯咖啡时,你当时的想法是,我们正在尝试进行编码。然后,我们让他们看别人做这件事十几次,他们就能够模仿了。我很好奇,你与Figure2互动的方式是怎样的?比如,你会说:“看我把这个东西拿起来放在这里,现在你也这样做。”这种互动是对话式的吗?还是通过视觉模型来实现的?这是一种实践的状态吗?

是的,我们就像在跟机器人说话,让它去做某件事,然后它就去做了。

你让Figure2为你做过的最有趣的事情是什么?

我们现在可以与我们的机器人对话,它已经能够执行任务了,这真是令人难以置信。就像你真的希望默认的用户界面是语音一样,你只想通过语音与它交流。

我想,当我看起来像个孩子的时候,我会有另一种思考方式:我在机器人身上。我会拿出我的手机或笔记本电脑,打开终端,试图向机器人发出命令去做某事。机器人就站在那里听着,而我感觉它只是想跟我说话。你只想把所有这些设备都收起来,然后像Figure2那样去做这件事。而我们现在正在做这件事,这太神奇了。很明显,人类或机器人的默认用户界面将是语音。你真的希望语音到语音的推理能力变得非常高效。最终,你希望能够与机器人交谈,让它通过视觉和传感器在环境中学习,并且随着时间的推移变得更好。而它们似乎确实朝着这个方向前进。

是的,我记得我们曾经认为机器人喜欢移动它们的手,然后说:“再做一次。”但是,是的,通过与它交谈并向它展示你想要的东西,如果它不理解,我们可以讨论机器人安全性的问题。你的安全意识如何?你如何确保不会出现错误的固件升级,让机器人变成超能力的杀手?有足够多的反乌托邦好莱坞电影,我想把它们带到前面。但你如何看待安全?这有多重要?阿西莫夫定律是如何进入你的脑海并付诸实践的?

有很多种方式可以思考这个问题。我们有系统安全工程方面的考虑,确保机器人在设施内走动并在人类附近工作时真正安全。这是一个整体架构,它实际上是从上到下设计的,以确保它成为一个安全的系统。最终,我们可以将一个安全的硬件系统投放到这个世界上,它基本上会在各种不同的条件下按照我们希望的方式做出反应。我认为这只是问题的一部分。就像我们需要为人类周围的环境提供安全硬件一样,网络安全和其他方面的考虑也同样重要。我们不希望任何人能够粗暴地接触机器人,控制它们,或者对它们进行潜在的恶意操作。

此外,还有其他问题需要考虑,比如当通用人工智能(AGI)出现时,这对机器人的安全会产生什么影响?

因此,我认为我们在这里做了很多工作,比如在机器人上安装低级、只读的固件,确保最低级的代码不能被覆盖。这就像你知道的“三定律”一样,更多的人可以思考如何将这些定律灌输给机器人。

如果我们现在不考虑这些问题,未来可能需要重建整个架构,这将对系统产生巨大的影响。因此,我们现在必须开始考虑所有这些因素,以便设计出更安全的系统。

现在的机器人在机械上是否已经具备足够的速度和扭矩来伤害人类?因为很多工业机器人周围都设置了防护笼等安全措施,设计上也考虑了限制它们的速度和力量。比如说,机器人不能跑得比你快,不能积累足够的速度来伤害你。

机器人通常重达150磅,无论如何,它们肯定有足够的重力势能来对人类造成伤害。如果它从楼梯上掉下来砸到你,肯定会造成伤害。因此,无论机器人是否具备扭矩感应功能,它都有可能对人类造成伤害。

我认为,如果设计不当,这个系统肯定会对人类造成伤害。或者,如果机器人出现某种故障,靠近人类并伤害到他们,这也是可能的。因此,从一开始就必须非常深思熟虑地设计系统的安全架构。我们还需要通过渐进式的方法逐步验证系统的性能。

我们的第一批机器人将在工作单元中与人类隔离。如果人类进入这些工作单元,我们将关闭机器人。随着时间的推移,我们将逐步推进,让机器人逐渐接近人类,最终实现合作。这将是一个渐进的过程。

至于时间框架,是两年还是五年?我其实不太喜欢做这样的预测。我们主要关心的是在头几年内提高系统的性能和可靠性。这可能是我们面临的最困难的挑战之一。

例如,你可能想看看一个机器人是否在全力工作,假设你有一个光幕,或者机器人周围有一个人工笼子。我认为解决协作机器人与人类并肩工作的时间问题是可以实现的,但我们现在要攀登的最难的山峰,是让机器人每天完成端到端的工作而不会失败。在机器人技术的发展过程中,局部故障是不可避免的。就像有时我可能会错过一个物体,但我会重新尝试抓住它。因此,我们可以接受局部的失败,但全局的失败是不可接受的。我们需要确保一定的性能输出。

举个例子,假设我们进入一个仓库,仓库每天需要处理一定数量的包裹,无论遇到什么样的挑战,他们都必须完成任务。如果是一群机器人在执行这些任务,他们仍然需要达到相同的性能目标。因此,即使我们错过了一个包裹,我们也必须以正确的方式准时将其送达。

我想说的是,我相信我们将在这个十年内解决这个问题,即人形机器人能够围绕人类并与他们密切互动。然而,在你看到这一点之前,你可能会先在特定的区域内看到类似的技术应用,就像Waymo在旧金山的某些许可区域内测试自动驾驶技术一样。

当然,在这些测试中,你会看到有练习司机在座位上观察一切,确保安全。类似地,自动驾驶仪在高速公路上进行操作时,也会测试新的软件更新。对于我们来说,我们现在正处于一个关键时期,我们需要证明机器人技术可以在有限的视角下发挥作用,并且是有用的。

随着时间的推移,我们必须建立正确的系统安全认证,以确保机器人可以在人类周围安全地运行。它们需要能够在人类旁边行走,将物品交给人类,并采取某些安全预防措施,确保不会以全扭矩和全速运行,以避免对人类造成伤害。

你认为,阿西莫夫定律是否应该被纳入?

我认为这些定律非常基本,例如“不要伤害人类”或“不要做一些可能导致人类受到伤害的事情”。

这些听起来像是人工智能的基本层面,确实非常重要。我们需要在机器人上设置一些只读的指令,这些指令永远不能被改变,这是必须的。

此外,拥有机器人劳动力的最大优势之一是它们可以集体学习。当一个机器人学会一项任务时,所有机器人都可以掌握这项任务。这需要某种形式的中央控制。可能会像宝马工厂那样有一个中央控制系统,或者在全球范围内设立一个任务控制中心,监视所有机器人并让它们学习。

我们希望机器人作为一个舰队,在共享的数据集上进行持续学习和训练。未来,地球上可能会有数百万甚至数十亿个机器人,它们将作为一个群体持续学习。我们正在对此进行离线训练,机器人将集体变得更聪明,形成一种集体智慧。这种集体智慧的力量类似于人类的学习过程,就像我的孩子们学会走路一样,他们通过不断尝试和失败来学习新事物,而不是仅仅避免错误。这需要花费大量时间。然而,一旦我们对某件事有了深入的了解,我们就不会轻易忘记它。我们很少会忘记如何走路或对某些事物的喜好,这种现象在历史上屡见不鲜。大多数情况下,我们确实不会忘记。

对于机器人来说,我们的最大优势之一在于,一旦一个机器人学会了某项任务,整个机器人舰队中的每个机器人都会掌握这一技能。因此,随着新事物的不断增加,机器人的学习能力将呈指数级增长,几乎像矩阵一样。我们可以通过展示来教机器人像人类一样学习,并通过推理来掌握如何完成某项任务。一旦机器人能够多次成功展示某项任务,我们就可以关闭这个学习循环,确保其有效性。这一过程还包括一个奖励系统,确保舰队中的每个机器人都能掌握新技能。

正因为如此,我认为未来的外科手术将由机器人来完成。当机器人经历了数百万次不同的手术后,它们将成为最优秀、最可靠的外科医生。

我们可以结束这个话题,稍微谈谈工作问题吗?因为我不得不考虑到,人们仍然担心机器人会抢走他们的工作。

到目前为止,我们收到了非常积极的反馈。我们的目标是能够完成许多人类不愿意做的工作。你之前在这个播客中提到过,我们有大约800万个工作岗位是人们不愿意从事的。我们希望机器人能够承担这些工作,尤其是那些对人类来说可能有害或危险的工作。

许多这样的工作都有很高的失业率和极低的留存率。我们希望通过自动化来解决这些问题。事实上,作为一个世界,我们已经在几个世纪以来逐步实现了自动化。我的家人是农民,曾经有一半的世界人口都是农民。我在农场长大,当时世界上80%的人口都是农民。如今,只有1%的人口从事农业,数量已经大幅减少。

我是在农场长大的,但没有人会因为我们不再务农而感到愤怒。你明白我的意思吗?就像现在,80%的人口不再务农,这并不是一件坏事。对于那些曾经耕田、收割玉米和大豆的人来说,这种转变是必要的。我不认为让2024年的人类回到那种状态会是富有成效的。

你还记得福岛核反应堆事故吗?当时DARPA举办了机器人挑战赛。你有没有看过那些视频?当时的机器人简直无法完成简单的任务,比如打开门或爬楼梯,场面简直令人发笑。我认为,国防部和政府是否是我们的客户或潜在客户,这是一个值得探讨的问题。

你对融入那个世界有什么感觉?

我们根本不会涉足任何与国防相关的业务。就像Intermedia Festo在线一样,我们认为民用市场的规模要比国防市场大得多。而且,我们并不想制造任何类型的战争机器,无论是动能还是非动能的。因此,我们甚至不会与这个领域的人进行对话,也不会接听他们的电话。

你对民警和安全领域有什么看法?

目前,我们不会触及这些领域。我们不想参与任何可能导致机器人对人类造成伤害的项目。我们的目标是推动工作的发展。我们认为,机器人技术可以极大地促进经济发展,降低商品和服务的成本,为世界带来积极的影响。我认为这是非常必要的。我们现在将所有的精力都集中在这个方向上。

你接下来会关注哪些行业?你基本上可以涉足每个行业,但你认为你会在哪些领域重点发展?

我们会一步一步来。我们正在谈论的这些公司规模都非常庞大,我们可以向这些团体提供数千台机器人。因此,对我们来说,现在宁愿只与少数几个团体合作,并确保做得非常好,而不是一下子向数百个团体开放市场。不过,在未来几年内,我们会将产品销售给更多的客户。我们计划明年开始我们的生产线,所以我们会从几个客户开始合作。我们的工程团队会与这些客户紧密合作,确保产品运行良好。我们需要修复很多错误,并进行流程改进,以确保这些产品在市场上表现出色。随着产品的成熟度提高,我们将逐步拓展到更多的客户,并会花费越来越多的时间在家用机器人上。

我什么时候可以在家里拥有一台机器人?因为我现在就想下订单。

每六个月,我都会与团队讨论,我们进入家庭市场的时间表正在加快。我们在劳动力市场的成功对我们进入家庭市场非常有帮助,因为它能帮助我们提高系统的可靠性和安全性,降低成本,并增加制造量。这些因素将有助于我们进入家庭市场。你可能会看到,从劳动力市场到家庭市场,价格会大幅下降。要实现这一点,我们需要规模经济,并且需要一个经过安全认证的家庭系统。因此,我们正在通过多种方式利用劳动力市场的经验来实现这一愿景。从绩效角度来看,我认为我们将逐步在家庭中开展早期工作。家庭是一个重要的领域,我预计每六个月就会有显著的进展。

如果要我预测时间,我认为在未来三年内,我们肯定会实现机器人在家庭中的应用。

我愿意尽早参与测试,甚至愿意为此付费。我们可能会从我们设施中的一些模拟家庭开始,逐步解决问题,了解如何让系统架构全面运作。我特别感兴趣的是,看看我们会遇到哪些我们尚未准备好的问题,这些问题可能会限制我们长期居住的能力。

最后一个问题,关于制造和扩展规模。你正在为 Figure 建造一个制造工厂,对吗?

是的,我们实际上计划明年开始生产线的建设。我们打算在加利福尼亚进行这项工作,靠近工程团队,以便更好地解决问题。这将类似于传统的试点生产线或生产线的模式。然后,我们会逐步宣布我们的高速率制造计划将在哪里展开。目前,我们正在设计生产线,计划明年让机器人上线生产。我们会根据预期的产量来调整规模,初期可能会从几百台机器人开始,然后逐步增加到几千台。

对我们来说,比拥有3000、5000或4000台机器人更重要的是,真正掌握如何高效地进行生产,并确保我们生产的机器人运行良好。我们必须避免出现大量机器人运行不良的情况,否则我们将陷入不断修复问题的循环中,这不仅降低了产量,也没有真正的帮助。因此,我们需要在生产的某个阶段确保系统的可靠性达到很高的水平,确保这些机器人的性能能够满足实际用例的需求。

制造数千个机器人并不容易,而制造数十万甚至数百万个机器人则是另一个层次的挑战。然而,制造2000、5000或10000个机器人在当前阶段是可行的。我们可能会从每周制造一个开始,然后逐步增加到每天制造一个,接着在接下来的12个月里,我们会开始每天制造多个机器人。

这条道路看起来相对简单。我们几乎是手工制作手机,每年生产数十亿台。虽然机器人比手机更复杂,但远没有汽车复杂。因此,我认为在短期内制造数千个机器人的目标并不是非常困难。困难的部分在于如何让这些数千美元真正发挥作用,真正变得有用。对我来说,这就是游戏的核心。

我是你的超级粉丝。我非常期待你所建造的一切,尤其是Figure2的推出。我还看到了Figure3,真的非常漂亮,所以我对此也感到非常兴奋。

感谢你所做的所有努力,我确实认为这是提升人类和创造富足时代的一种方式。非常感谢。


机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类展示视频

机器人技术再创新高:10小时学会煮咖啡,端到端学习新突破

在斯坦福机器人炒虾事件后,我们又迎来了一个烹饪界的革新者——一个通过观看人类视频,仅需10小时就能掌握煮咖啡技艺的机器人。 来自Figure公司的这款机器人,其智能程度让人惊艳。

这款神秘机器人的核心亮点在于其端到端的学习能力。 它通过观察人类示范,无需远程操控,就能流畅地完成从打开咖啡机盖、放入咖啡包到按下启动键的一系列动作,最终产出一杯香浓咖啡。 而且,它还具备自主纠错功能,一旦咖啡包放歪,它能自行调整到位,无需人工干预。

对于这一成就,前谷歌DeepMind的研究员,同时也是该机器人的开发者,通过转发和点赞表达了对这一技术突破的认可,强调所有操作,包括纠错,都是在完全自主的状态下完成的。 Figure公司的创始人Brett Adcock称,这标志着机器人技术的一个重要里程碑,也许有人会称其为ChatGPT时代的机器人表现。

尽管10小时的学习速度令人印象深刻,但网友们对于机器人能否达到更高的烹饪水平仍有所期待。 他们期待机器人不仅限于煮咖啡,而是能完成更复杂的任务,如拿起杯子、添加奶油和糖,最后完美呈现到主人面前。 这样的设想不禁让人想起苹果联合创始人Steve Wozniak提出的史蒂夫咖啡测试,这个测试要求机器人在20分钟内完成一系列高难度操作,包括环境识别、工具使用等。

尽管目前的Figure 01展现了快速学习的能力,但能否通过这项测试,还值得我们拭目以待。 据一项调查,89%的人认为在2040年前,这样的机器人会成为现实。 这不仅关乎技术的进步,也反映出我们对人工智能在日常生活中的深度融合的期待。

Figure公司的强大背景也为其研发成果提供了坚实的基础。 这家成立于2022年的公司,专注于通用人形机器人,创始人Brett Adcock的创业经历丰富且多元,从在线人才市场到航天飞机制造,再到现在的机器人领域,每一步都彰显了他对技术前沿的探索精神。

关于Figure 01的更多细节,官方虽然未透露太多,但其背后的神经网络技术,如模仿学习框架VIOLA、HYDRA和AME等,已经在模仿学习领域取得了显著成果。 这些技术的突破,预示着机器人技术的未来将更加智能和自主。

机器人技术的未来充满了无限可能,我们期待着Figure 01和其他创新者在未来史蒂夫咖啡测试中,为我们的生活带来更多的惊喜。 让我们共同见证这一科技飞跃的时刻。

参考资料:[1] Figure机器人官方Twitter账号[2] Figure机器人官方[3] MatthewBarnett的市场预测

16影像提升只有一个按钮 iPhone
什么样的家庭 容易养出内耗的孩子