Skip to main content

机器人,不得不说的硬核与浪漫

发布于2024-04-07

人类对于机器人的逐梦之路从未停歇。而随着人工智能技术的突破以及材料领域的创新,未来这些硅基的机械生物或将有我们想象不到的各种可能。

“机器能思考吗?” ——70多年前“计算机科学之父”图灵提出的著名问题,拉开了人类对机器智能探索的大幕。对于机器能否发展出与人类相同或令人无法区分的智能,也成为日后在机器人的研究中一个绕不开的话题。英伟达(Nvidia)CEO黄仁勋更在近日预测通用人工智能(AGI)将在5年内通过图灵测试。

关于机器人的硬核与浪漫,以及它们可能发展出的智慧甚至情感,成为人类不断探索研究的话题,持续出现在各类科幻小说以及影视作品中。

未来的机器人会是怎样的形态?它们将与人类如何共处?答案或许有很多。它们可以像是电影《阿丽塔:战斗天使》(Alita: Battle Angel)中灵动的机械少女,或是《攻壳别动队》中的机甲战士;它们不见得一定是有着坚硬的金属外表,也可能软体的柔性的机器生物;也可能是帮助人类实现更好身体表现的外骨骼机器人。总之,它们将不再拘泥于某种形态,并且在人工智能等技术的赋能下能够实现更广义的人机融合。

硬核与浪漫:不止于机器替代人力

数十年来,机器人技术一直是工厂车间里制造流程自动化的一个基本组成部分。传统的自动化工厂里,主要有两类的机器人——关节机器人以及自动引导车(AGV)。关节机器人是指拥有旋转关节或“轴”的机器人,其应用范围颇广,焊接、喷漆、致动器、组装以及芯片、电路板和元件等各种制造领域都可以看到他们的身影。AGV 则是一种自主机器人,通常沿着仓库、生产或配送中心周围的轨道行驶。而随着人工成本的不断攀升,各个领域的数字化转型深入推进,对自动化的需求也迈入了新阶段。

为了进一步满足现代工厂对快速生产和无缝供应链的要求,意味着高度自动化和适应性正在成为机器人技术的发展方向。而5G、人工智能 (AI) 和物联网 (IoT) 等技术近年来取得的巨大飞跃,也推动工厂自动化进入新纪元。如今,工厂里的机器人,已远不止于简单的机器替代人力。它们的功能也不再是固定的,可以完成的任务也将不再局限与生产线的一个部分。整体来看,机器人技术已经朝着敏捷制造的方向转变。这意味着机器人不仅要适应生产线的不同任务和部分,还要适应新的工厂配置,并能够作为“协作机器人”,可以和人类安全协同工作。

这也是“钢铁侠”马斯克当年萌生开发人形机器人(Humanoid Robot)想法的初衷。2018年,当时的特斯拉新款电动汽车Model 3销售火爆,但是特斯拉工厂却因为过度自动化而深陷“产能地狱”。

生产一辆汽车,需要经过冲压、焊接、喷漆、总装以及质检等一系列环节。汽车行业在前三个环节已经实现了高度自动化,唯有在总装及直接环节让需要人工操作。当时的特斯拉则试图在后面两个环节也用机器人替代以打造一条全自动生产线。然而现实却狠狠打脸,在总装和质检环节,相比人工操作的灵活性和精确度,机器人的表现却十分糟糕,就连简单的拧紧螺丝的动作,机器人的工作效率也远低于人类。马斯克也因此意识到“特斯拉过度自动化是个错误,人类的作用被低估了。”

正是意识到一条柔性灵活可以实现敏捷制造的生产线对于高阶自动化的重要意义,特斯拉才开始不遗余力地投入到“让机器人像人类一样,在汽车生产线上完成特定任务”的研究开发中。

2023年12月,特斯拉发布了第二代人形机器人擎天柱(Tesla Bot,Optimus Gen 2)。根据其官方视频中介绍,第二代擎天柱搭载了由特斯拉设计的执行器和传感器、2个自由度驱动颈部、响应更快的11个自由度手部、触觉传感器、执行器集成电子和线束、足部力/扭矩传感器、铰接式脚趾等。

图片截自Tesla Youtube官方视频

它可以实现单腿支撑,双臂和另一条腿配合平稳做出瑜伽动作,还可以做出蹲起、跑动等复杂动作。值得注意的是,视频显示,第二代擎天柱可以轻松准确地抓取和放下鸡蛋,整个过程自然平稳,左手转右手的过程也颇为连贯,展示出其双手精巧的操控能力。特斯拉表示,开发擎天柱是为了替代人类去执行不安全或是无聊的工作。在2023年第四季度的财报电话会议上,特斯拉CEO埃隆·马斯克曾表示,公司有望在2025年左右开始向客户交付少量的人形机器人。马斯克此前就曾提到,特斯拉将致力于大规模量产并降低成本,今后擎天柱的产量将达到数百万台,其价格低于特斯拉汽车,预计最终价格不到2万美元。马斯克还认为擎天柱被外界严重低估了,未来需求量可能高达10亿至200亿台。

更加智能、更加自动化、更加敏捷且更具有适应性,是未来的智能工厂中对于机器人的新要求,它们需要足够安全、足够柔性,可以与人类紧密协同工作,避免在工作场所发生危险,并且无需持续监督。

在推动提高机器人自动化程度的过程中,人工智能业已成为一种关键技术,使机器人能够在智能工厂环境中进行自主决策。此外,要使机器人真正实现自动化,就需要带宽更宽,以确保更高的数据传输速率。同样,由于工厂缺乏熟练的劳动力,对易于编程的机器人的需求正在攀升。最后,输出端的一个关键趋势是机器人电机控制的高精度,该功能可使机器人执行各种需要高灵活性和高精度的复杂任务。国际机器人联合会和一些行业观察者认为,这种类似人类的双臂双腿设计使得这些机器人能够在为人类打造的环境中灵活使用,因而也更容易将人形机器人集成到现有基础设施和设施中,如仓库等。

AI大模型加持:机器智能“创新大爆炸”

去年以来,随着大模型与机器人结合的认识逐步清晰,机器人似乎拥有了将原有能力更好地泛化到新场景的机遇。甚至有观点认为“大模型的出现,补全了让机器人产业从1%到10%跃升的技术基础。”

图灵早在1950年就预言了创造出具有真正智能的机器的可能性,并提出著名的图灵测试(Turning Test):如果一台机器能够与人类展开对话(以纯文本形式透过屏幕传输)而不被辨别出其机器身份,那么称这台机器具有智慧。他当时预测,到2000年人类应该可以用10GB的计算机设备,制造出可以在5分钟的问答中骗过30%成年人的人工智能。

尽管比起图灵的预测时间要晚了20多年,但AI大模型在过去几年里的突破让整个产业界再次掀起AI狂热。其中2017年,Google发布的论文“Attention Is All You Need”中提出的Transformer架构具有里程碑意义,这很大程度上启发了以OpenAI为代表的公司通向通用人工智能(AGI,Artificial General Intelligence)发展的可能。英伟达(Nvidia)CEO黄仁勋近日更预测AGI将在5年内通过图灵测试。

在不久前刚刚结束的Nvidia GTC 2024上,该公司发布的一系列重磅AI产品中,就包括人形机器人通用基础模型 Project GR00T,以及一款基于 NVIDIA Thor 系统级芯片(SoC)的新型人形机器人计算机 Jetson Thor,并对 NVIDIA Isaac 机器人平台进行了重大升级,包括生成式 AI 基础模型和仿真工具,以及 AI 工作流基础设施。

这对于推动机器人和具身智能方面的突破有重要意义。所谓具身智能,是指拥有自主感知、交互和行动能力的智能体,能够与环境进行实时互动,从而实现对环境的理解和适应。黄仁勋表示: “开发通用人形机器人基础模型是当今 AI 领域中最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术,致力于在人工通用机器人领域实现突破。”

据了解,Project GR00T 是一种多模态人形机器人通用基础模型,作为机器人的大脑,使它们能够学习技能来解决各种任务。GR00T 驱动的机器人(代表通用机器人 00 技术)将能够理解自然语言,并通过观察人类行为来模仿动作——快速学习协调、灵活性和其它技能,以便导航、适应现实世界并与之互动。

在国际机器人联合会(IFR)列出的其评选的2024年度全球机器人五大趋势中,其中之一就特别提到人工智能和机器学习将助力更多机器人。IFR指出,机器人制造商已经开始开发基于生成式人工智能的界面,这使得用户可以通过自然语言而不是代码更直观地编程系统。这意味着,工人将不再需要专门的编程技能来选择和调整机器人的动作。IFR表示,另一个技术结合的例子是使用预测性人工智能来分析机器人性能数据并预测设备的未来状态。预测性维护可以帮助制造商节省机器停机成本。机器学习算法还可以分析多个执行相同过程的机器人的数据以进行优化。一般来说,机器学习算法获得的数据越多,其表现就越好。

未来机器人形态:碎片化与大一统的平衡

未来的机器人形态将是怎样的?谁将颠覆未知的世界?

最近一两年来,笔者在多个机器人产业相关的专业论坛以及研讨会上听到的答案越来越多倾向于:未来的机器人形态,不会拘泥于某类形式,更将是趋于创新应用端的全面开花,是一种碎片化与大一统的平衡,及专用机器人与通用机器人的平衡发展。

在2023世界机器人大会上发布的《机器人十大前沿热点领域(2023-2024年)》中公布的2023-2024年机器人十大前沿技术中,包括具身智能与垂直大模型、人形与四足仿生机器人、三维感知模型和多模态信息融合等前沿技术,相关的核心技术包括:智能体环境感知与建模、智能体自主决策与规划、人机交互、群控协作、机器学习与强化学习、结构光和立体视觉、三维物体检测和分割、多模态特征提取、融合模型设计等技术。

另外,还有脑机接口、生肌电一体化与微纳机器人,医疗与康复机器人,群体机器人技术以及商业服务机器人和特殊场景服役机器人(军事、消防、农业、核工业、太空等领域)也是未来重要的发展方向。

而在一些核心零部件和系统层面,伴随着MEMS、传感器等技术的快速发展,视觉、力觉传感器、高速/高功率的微小型电机/液压驱动器作为机器人实现智能化、数字化、柔性化的“敲门砖”,逐渐成为新一代机器人重要核心零部件。机器人模块化趋势不断凸显,近些年刚柔耦合的灵巧手、微小执行器、微型伺服电缸、移动模组等不断出现,有望成为新一代机器人的重要核心零部件。此外,还包括机器人操作系统/云平台的进一步发展。其中,机器人操作系统的发展推动机器人标准化、模块化,实现物理空间和数字空间的数字孪生,促进机器人大规模应用。云服务机器人则是指将机器人的核心计算和智能部分部署在云端服务器,借助云计算技术提供更大的计算能力和资源,以实现更强大、更高效的数据处理和应用。“云端大脑+本地机体”或“云端服务”机器人将成为规模化推广与应用的重要模式之一。

结语

“问题比答案更重要。” ——在被誉为“科技圣经”的银河系漫游系列书中,作者道格拉斯·亚当斯表达了这一重要观点。

图灵的著名一问“机器能思考吗?”展开了随后一系列的技术与产业发展的创新故事,并且在持续递进突破中。2024年的全球机器人产业无疑亦是新一轮技术竞赛的开始。

从人形机器人、四足仿生机器人、外骨骼机器人到更多的具身智能以及大模型的加持,未来或将实现更广义的人机交融,人与机器的交互以及操控层面将更简单、更丝滑。甚至机器人也可以是机甲的形态,人可以钻进机甲里“手把手”教会机器做某些特定的任务后,可以实现人机分离,机器能够自主完成特定工作。这有点像是当前自动驾驶汽车的发展路径,汽车在一定条件下可以自主行动,但人类可能随时接管以应对特定情况。

未来,机器人与人类融合的目标,应该更致力于“少人化”的方向,而不是一味地追求“无人化”。因为,人类作为感知化的生物,可以凭“手感”处理多种不确定的离散任务,这是人类不可被忽视的重要价值,过度的自动化就有可能陷入特斯拉曾遭遇的“自动化陷阱”。

关于作者

Carrie Gan (干晔)

拥有14年媒体从业经验,她擅长深度剖析半导体和电子产业链的发展,专注于AI、自动驾驶等新兴技术和应用的报道,曾供职于福布斯中国和IT时代周刊等知名媒体机构。在2022年,加入贸泽电子,负责技术内容的创作和管理工作,致力于创作有趣、新鲜且具有深度的硬核科技内容。