点灯机器人编程一小时在线李飞飞团队再造黑科技！机器人自学家务样样精通，开源代码了解一下？

一只小宸呀 • 2024年12月21日 20:22 • 综合问答 • 阅读 2

...

倒茶、叠衣服、整理书籍、丢垃圾，现在的家务机器人干活真是越来越熟练了。不过，也不是每个家务机器人都能做到像动图里那么流畅的。熟练家务的背后，是李飞飞团队琢磨出来的一种新办法。他们把任务动作拆解后标记出几个关键点，再给到具体规则让机器人知道这些点之间有什么联系，要怎么操作比较好。除此之外，机器人还能自主学习，越练习越厉害。以倒茶这个动作为例，机器人会先用摄像头确定茶杯茶壶等的位置、形状等要素，再识别出关键点，比如茶杯的中心点和把手的中心点，ReKep 会给机器人编写出一系列规则，告诉它要用什么角度、怎么拿怎么倾倒、用多大力气等，机器人只要按照规则行动就能成功倒茶了。不得不说，这么一个简单的动作想让机器人做好是真的是太难了。要是没有 ReKep 技术，想看到机器人熟练地干各种家务活还不知道要等到猴年马月。毕竟今年三月份的时候，李飞飞团队的家务机器人还是这样的，只会擦擦桌子切个水果：而半年后的今天，就已经进化成全能选手了：目前，李飞飞团队关于 ReKep 技术的论文已在 arXiv 公开，代码也已开源。论文标题：ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation 论文地址：https://arxiv.org/pdf/2409.01652 项目网站：https://rekep-robot.github.io/ 项目代码：github.com/huangwl18/ReKep 李飞飞团队旨在解决与机器人操作任务相关的挑战，这些任务涉及多个空间关系和时间依赖阶段，需要对复杂的空间和时间关系进行编码。他们希望开发一个广泛适用的框架，能够适应需要多阶段、野外环境、双手操作和反应行为的任务，通过基础模型的进展在获取约束方面具有可扩展性，并能够实时优化以产生复杂的操作行为。现有的使用刚体变换表示操作任务约束的方法缺乏几何细节，要求预定义的物体模型，并且无法处理可变形物体。在视觉空间中直接学习约束的数据驱动方法也在收集训练数据时面临挑战，因为约束的数量在物体和任务方面呈组合增长。李飞飞团队提出了一种名为关系关键点约束（ReKep）的方法，用于机器人操作。 ReKep 将操作任务编码为约束，连接机器人与其环境，而无需手动标注。该方法利用Python函数将一组语义上有意义的三维关键点映射为数值成本，从而能够表示复杂的空间和时间关系。该框架旨在通过大型视觉模型和视觉-语言模型自动生成约束，实现从自然语言指令和RGB-D观测中高效地指定任务。他们还提出了一种算法实例，可以实时高效地解决优化问题。实验涉及多个任务，包括倒茶、回收罐、整理书籍、打包盒子、折叠衣物、装鞋盒和协作折叠等。这些任务被设计来测试系统在不同方面的性能，如空间和时间依赖性、对环境的适应性、双手协调和与人类的互动。轮式单臂平台和固定式双臂平台的成功率两个机器人平台在外部干扰下的成功率 ReKep 用于折叠不同类别服装的新型双臂策略及其成功率实验结果显示，ReKep在多种任务上的成功率较高，证明了其在自动化操控任务中的潜力。成功率根据任务的不同而有所差异，但总体上表现良好。首先，他们定义了单个ReKep实例，并且假设已经指定了一组 ? 个关键点。每个关键点 ??∈ℝ3 指的是场景表面上的一个 3D 点，其坐标依赖于任务语义和环境（例如，手柄上的抓取点，壶嘴）。本质上来说，一个 ReKep 实例编码了关键点之间的一个期望的空间关系，这些关系可能属于机器人手臂、物体部分或其他代理。然而，一个操作任务通常涉及多个空间关系，并且可能具有多个时间上依赖的阶段，每个阶段都涉及不同的空间关系。为此，他们将任务分解为 ? 个阶段，并为每个阶段 ?∈{1,…,?} 使用 ReKep 来指定两类约束：其中 ?sub-goal (?) 编码阶段 ? 结束时需要达到的关键点关系，而 ?path (?) 编码阶段 ? 内部需要满足的关键点关系。如下图所示的倾倒任务由三个阶段组成：抓取、对齐和倾倒。阶段 1 的子目标约束拉动末端执行器向茶壶手柄靠近。阶段 2 的子目标约束指定壶嘴需要位于杯口上方，阶段 2 的路径约束确保茶壶直立，以避免倾倒时溢出。最后，阶段 3 的子目标约束指定倾倒角度。他们将末端执行器姿态表示为 e∈ SE（3），将操控任务表述为一个优化问题，目标是找到一系列满足ReKep约束的末端执行器（end-effector）姿态，并将控制问题表述如下：对于每个阶段，优化算法需要找到满足子目标约束的末端执行器姿态，以及实现这些子目标的路径。为了实时求解优化问题，他们采用了分解方法，仅优化下一个子目标及其对应的路径。为了使系统能够在给定自由形式任务指令的情况下执行野外任务，他们设计了一个使用大型视觉模型和视觉语言模型进行关键点提议和ReKep生成的管道，并分成了两个部分：关键点提议使用大型视觉模型（LVM），如DINOv2，来提取场景中的特征，并利用这些特征来识别潜在的关键点。这些关键点通常是场景中具有语义意义的3D点，例如物体的边缘、角落或特定物体部分的中心。 ReKep生成结合关键点和任务指令，使用视觉-语言模型（VLM）来生成ReKep，这些约束将用于指导机器人的动作规划和执行。这一步骤利用了视觉模型对场景的理解以及语言模型对指令的解释能力。李飞飞博士是斯坦福大学计算机科学系首任红杉教授，也是斯坦福以人为本的人工智能研究所的联席主任，曾担任担任谷歌副总裁和首席科学家，在多家上市公司或私营公司担任董事会成员或顾问。李飞飞主导的斯坦福AI实验室、斯坦福视觉与学习实验室(SVL)和斯坦福以人为本人工智能研究院涌现出大量优秀人才，包括 OpenAI 联合创始人 Andrej Karpathy、国内内第一个坚探索具身智能的卢策吾、前Google AI中国中心总裁李佳、前阿里自动驾驶掌舵人王刚等。她目前的研究兴趣包括认知启发式人工智能、机器学习、深度学习、计算机视觉、机器人学习和人工智能+医疗，尤其是用于医疗保健的环境智能系统。 Wenlong Huang 是斯坦福大学计算机科学专业的博士生，由李飞飞指导，也是斯坦福视觉与学习实验室（SVL）的成员。他于 2018 年获得加州大学伯克利分校计算机科学学士学位，指导老师是 Deepak Pathak、Igor Mordatch 和 Pieter Abbeel。他的研究目标是赋予机器人广泛的泛化能力，使其能够执行开放世界操控任务，尤其是在家庭环境中。研究兴趣包括：开发能够充分利用互联网规模数据或基于这些数据进行训练的模型的抽象概念开发能够表现出广泛泛化行为的运动技能 Chen Wang是斯坦福计算机科学学院的博士生，导师是李飞飞和 C. Karen Liu。他本科就读于上海交通大学计算机科学专业，是第一批加入卢策吾团队研究机器人具身智能的学生之一。他的研究目标是制造出具有与人类一样的灵活性和处理日常任务能力的机器人，因此专注于机器人学习，以实现灵巧操作、模仿人类动作以及长期规划和控制。 Yunzhu Li现在是哥伦比亚大学计算机科学助理教授，曾是斯坦福视觉与学习实验室 (SVL）的博士后，与李飞飞、Jiajun Wu 一起工作。北京大学本科毕业后，他在麻省理工学院计算机科学与人工智能实验室（CSAIL）获得博士学位，导师是 Antonio Torralba 和 Russ Tedrake。目前他在机器人感知、交互和学习实验室（RoboPIL）进行机器人技术、计算机视觉和机器学习的交叉研究，专注于机器人学习，特别是直观物理学、具身智能、多模式感知三个方向，旨在显著扩展机器人的感知和物理交互能力。 Ruohan Zhang是斯坦福视觉与学习实验室 (SVL)的研究员，和李飞飞、Jiajun Wu、Silvio Savarese 一起工作。他曾在在德克萨斯大学奥斯汀分校获得博士学位，指导教授是 Dana Ballard 和 Mary Hayhoe。他的长期研究兴趣是以人为本的人工智能：理解人类智能以开发受生物启发的人工智能算法，以及使人工智能与人类更加兼容。最近专注于以人为本的机器人技术：通过数据驱动的方法开发可增强人类福祉的机器人解决方案（系统和算法）。雷峰网(公众号：雷峰网)雷峰网雷峰网版权文章，未经授权禁止转载。详情见转载须知。

本文来自作者[一只小宸呀]投稿，不代表娱乐盟立场，如若转载，请注明出处：https://ylmeng.com/zonghewenda/202412-29108.html

2 4

本文作者

一只小宸呀签约作者

0 文章

136990 评论

1 粉丝

我是娱乐盟的签约作者[一只小宸呀],本篇文章《点灯机器人编程一小时在线李飞飞团队再造黑科技！机器人自学家务样样精通，开源代码了解一下？》主要讲述了:...

玩车行家

正版资料免费资料大全十点半(正版资料全年资料大全)--精彩对决解析--V07.51.31

　　1.《正版资料免费资料大全十点半》是一项旨在满足读者多元化需求的创新服务，结合现代信息技术与广泛的内容资源，提供覆盖多个领域的全方位内容支持。这项服务通过精准的数据采集和分析，为用户在每晚十点半准时推送当日最具价值的资讯和资料，成为许多人每日必看的信息来源。　　2.在现代快节奏的生活中，信息

facai369
2024年11月16日
8
每日动态

2024新奥开奖记录,倘使精选解释落实_HD29.21.71

一、2024新奥开奖记录详解：历史数据与未来趋势###2024年新奥开奖记录不仅是数字的简单堆砌，更是对过去与未来趋势的深刻洞察。通过对历史数据的详细分析，我们可以发现一些规律和模式，这些模式不仅有助于理解过去的开奖结果，还能为未来的预测提供有力依据。首先，历史数据显示，某些数字组合出现的频率较高

facai369
2024年11月18日
6
综合问答

2017生肖歇后语全年_一句引发热议_3DM63.95.03

2017生肖歇后语全年在中国传统文化中，生肖是人们生活中不可或缺的一部分，每个生肖都有其独特的象征意义和文化内涵。2017年是中国农历的丁酉年，也就是鸡年。鸡在中国文化中象征着吉祥和勤奋，因此，与鸡年相关的歇后语也充满了智慧和幽默。以下是一些与2017年生肖鸡相关的歇后语，它们不仅体现了人们对鸡

facai369
2024年11月18日
61
综合问答

工地维修电工的必备指南，一本不可或缺的电工书籍电工维修方面的书籍

在繁忙的工地中，维修电工的工作至关重要，他们负责确保电力系统的正常运行，为工地提供稳定可靠的电力支持，为了更好地完成这项工作，一本实用的电工书籍是每个维修电工的必备工具，本文将介绍一本关于工地维修电工的书籍，探讨其重要性、内容特点、适用人群以及推荐理由。书籍概述这本书是一本专门为工地维修电工量身定制

风启觞
2024年12月05日
6
每日动态

经济危机的具体表现

CNZZ数据中心通过对新增电子商务类站点系统供应商的统计分析发现，许多商家看到了此时的商机，纷纷采用了以上游技术进步推动下游应用发展的手段，具体表现为：众多商家在9、10月间推出了多达数十种新版本系统，其中在与CNZZ合作的12个集成系统中，就已累计推出37个新的系统版本，更新速

一只天恩呀
2024年12月08日
247
玩车行家

热衷“投资”的公安局长储志林严重违纪违法案剖析

热衷“投资”的公安局长浙江省杭州市公安局原经济技术开发区分局党委书记、局长储志林严重违纪违法案剖析储志林，1964年出生，1986年参加工作，1991年加入中国共产党。曾任浙江省桐庐县公安局党委委员、副局长，桐庐县安全生产监督管理局党组

一只君之呀
2024年12月09日
237
娱乐体育

民营银行借互联网平台高息揽存，月付利息年化收益最高超7%

在金融科技快速发展之际，借助互联网引流获客成为民营银行突围的利器。不少民营银行推出的存款产品收益最高可达近5%，部分平台为揽客在收益补贴上，有过之而无不及，其补贴的收益率甚至达到了6%，使得平台销售部分产品1个月年化收益率可达7%以上。此外，民营银行加大揽储的同时，传统商业银行线下揽储氛围显得冷清。

facai369
2024年12月10日
5
综合问答

重庆洪崖洞、解放碑住哪里方便？洪崖洞、解放碑住哪里好？洪崖洞、解放碑周边住宿推荐

和周边的餐饮、住宿、娱乐、购物等功能都很完善，第一次去的旅行者几乎都会选择入住这里。周边有、步行街购物中心；周边有、广场等，那么、周边都有哪些酒店值得住呢？国贸格兰维大酒店地址：青年路66号这是一家老五星级酒店，地处

一只妮子呀
2024年12月14日
2
每日动态

银行理财产品托管

银行理财产品托管业务，是指具有证券投资基金托管业务资质的商业银行为银行理财产品提供财产保管、运作监督、资金清算、会计核算、资产估值和信息报告等服务的业务。中国建设银行是国内首批拥有证券投资基金托管业务资质的商业银行，不仅可为本行发行的银行理财产品提供托管服务，也可为其他商业银行发行的理财产品

一只志飞呀
2024年12月15日
2
每日动态

NBA串关连红不止，彩蛋也全收！NBA近20中15，精选2串1信心再出击：302+304，均含让分，大小分推荐

昨天推荐的独行侠让分+森林狼大分的串关收红，而独行侠小分+森林狼让分的彩蛋也是双双拿下，NBA串关连红，且近20场中15胜率75%状态火热，今天继续给大家推荐一个2串1，比赛具体信息如下：3

一只君之呀
2024年12月15日
4

发表回复

本站作者后才能评论

评论列表（4条）

一只小宸呀 2024年12月21日

我是娱乐盟的签约作者“一只小宸呀”！

回复
一只小宸呀 2024年12月21日

希望本篇文章《点灯机器人编程一小时在线李飞飞团队再造黑科技！机器人自学家务样样精通，开源代码了解一下？》能对你有所帮助！

回复
一只小宸呀 2024年12月21日

本站[娱乐盟]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
一只小宸呀 2024年12月21日

本文概览：...

回复

点灯机器人编程一小时在线李飞飞团队再造黑科技！机器人自学家务样样精通，开源代码了解一下？

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们