感动得哭了,机器人终于学会了折叠自己的衣服。

发布日期:2019-02-21

    抓住!抓住!抓住!双12促销项目全年只需4999个招商项目

    如果我们想锻炼人类儿童最基本的体育智力,比如抓举、折叠被子和折叠衣服,几乎不需要指导。

    很多时候,只要把宝宝放在日常生活的场景中,让他与周围的环境和物体进行互动,大部分都能够自动掌握在游戏中判断空间、重力、协调性等的能力。

    相比之下,机器人更“被宠坏了”。

    目前,大多数机器人无法适应复杂环境,无法学习一般的运动能力。

    这导致了一个难题:机器人只能“笨拙地”完成一些程序员首先编程的动作,并且使用单个对象来完成单个技能,这个特定的任务和道具就是它的世界。例如,如果你递过杯子,就不会折叠被子。

    这意味着我们可能需要设计成千上万个机器人来处理特定的任务。太傻了。

    然而,让机器学会独立感知世界,并根据不断变化的环境采取相应的行动,这是一个很大的工程。

    最近,伯克利大学开发了一种新的算法,基于视觉模型的增强学习,使万能机器人成为可能。

    换言之,原本属于人类的元运动智能,也被期望在机器上打开。

    当机器人有能力掌握一般技能并将其内化为“经验”时,它们可以灵活地执行各种类似的任务,而不必每次都重新学习或编程。前景显然令人惊讶。

    那么,这种神奇的事情到底是怎么实现的呢?

    新算法如何指导机器?

    简言之,该算法通过使用标记的感官数据集对墨西哥进行预测,使得机器可以独立地学习大量不同的图像,从而更灵活地预测和判断何时完成任务。通过这种方式,它可以在不同的对象上执行许多不同的任务,而不必重新学习每个对象或任务。

    在伯克利大学的研究人员看来,在单一模式下获得这种通用运动能力的能力是智力的基本表现。

    那么这种方法如何引导机器人完成他们的工作呢?

    首先,研究人员为机器人创建了一个大而多彩的数据集,不限于对象或技能。

    然后,机器人配备有传感器,可以感测图像像素(视觉)、手臂位置(自我感知)和发送发电机指令(动作)。

    这些准备工作完成后,两个机器人就可以同时在存储库中收集数据和独立学习,并实时共享它们。

    因为两个机器人可以共享彼此的感受和数据,这使得它们能够掌握预测下一臂的运动路径的能力,从而使得运动范围具有更大的灵活性,以便完成各种任务来操作不同类型的对象。

    例如,他们让机器完成刚性物体(如苹果)和柔性物体(如折叠衣服)的运动。机器人表现很好。

    此外,即使面对以前从未见过的目标,尽管预测并不像人类所做的那样完美,但它们仍然可以有效地完成指定的任务。

    例如,在下图中,研究人员给出的任务是把苹果放在盘子上,由机器人制定的计划放在中间,然后执行。

    这个算法模型在思想上是绝对独特的。长期以来,根据预期的结果来规划行动路线,并根据不同的步骤和观察结果来实时地迭代和改进计划,是人类所特有的技能。如今,人们还期望机器人学习这种“高智能”游戏,并且它们的应用带来的变化确实令人振奋。

    机械效率坐标系重构:新模型的应用场景

    真实的环境是复杂多样的。为了提高机器人对环境的适应能力,使任务执行更加灵活,该算法为机器人的应用带来了很大的想象空间。

    最大的亮点是机器的功能假设更加现实。通用能力可以容易地迁移到不同的任务,从而大大减少了需要开发和部署以完成特定任务的算法数量。

    目前,新模型似乎至少将彻底改变机器人在以下领域的性能:

    1。客户服务机器人。大多数客户服务机器人不能适应环境,因此程序员需要考虑各种情况,有些甚至在后台直接交互。但是采用通用的模型算法,机器人可以在与人类用户交互中自主学习,学会解决一些开放性问题,变得更加自主和灵活。

    2。医疗机械。目前,医学机器人只能作为医生的手的延伸来协助完成外科任务。为了独立执行高精度手术并帮助减少医生的劳动,医疗机器人必须能够感知手术部位的空间位置,处理更复杂和更复杂的操作,并且新模型清楚地提供更多的可能性。

    三。工业机械。工业机器人具有一定的通用性和适应性,但它们往往需要重新编程,以满足其工作环境变化的需要,或更换不同的操作员来执行不同的任务,这将带来一定的成本。如果应用新算法,工业生产的成本和效率将会降低。

    4。个性化视频生成。该算法除了在真实世界中感知和理解运动预测外,在视频生成领域还有很大的空间。例如,该系统可以独立于大量的无标记视频资源,识别和模拟视频中的字符,使得人工智能能够定制高度个性化的视频。

    仍然有许多机器应用程序掌握了一般技能,它们背后的商业前景非常广阔。毕竟,效率是人类发明机器的初衷。

    在品尝水果之前,我们需要应对哪些挑战?

    说了这么多,我觉得新算法的实现并不困难,而且应用程序端也有足够的支持。能很快实现吗?

    目前,在采摘桃子之前,该算法存在一些特殊的局限性,可能阻碍其实际应用。

    首先,需要大量的培训数据。机器做出实际可执行的操作预测,这完全取决于大量多样化的数据集。

    为了使机器能够根据前一帧的运动分布来想象和模拟下一个像素的运动,研究人员引入了59000组用于大规模自主学习的机器人交互数据集。

    如何在成本控制下获得海量高质量的数据资源,恐怕将成为算法着陆的首要门槛。

    第二,无监督学习带来的一系列问题。例如,由于训练数据完全没有标签和奖励机制,因此在实际中如何确保机器人能够理解和接受所分配的任务,然后进行面向结果的动作存在许多未知数。

    伯克利的解决方案是建立一个自我监控算法,以保持机器对目标感兴趣,保持跟踪和重试直到成功。然而,为了确保稳定的产量,还需要更多的补充研究。

    例如,由无监督机器做出的预测不能用人类的独立经验来解释。它可能不是最优的传输方案,但也可能由于“黑箱”的存在而带来不可预知的风险。

    当我们不理解元智能如何工作时,我们如何确保我们能够很好地控制机器的元智能?

    总之,虽然这个算法令人惊讶,但它并不完美。想象力不错,实用性也不错,但从实验室到商业现场还有很长的路要走。