Rubiks kubus met één (robot)hand opgelost

OpenAI heeft een paar neurale netwerken getraind om de Rubik's Cube op te lossen met een mensachtige robothand. De neurale netwerken zijn volledig getraind in simulatie, met behulp van dezelfde versterkingsleercode als OpenAI Five, gekoppeld aan een nieuwe techniek genaamd Automatic Domain Randomization (ADR). Het systeem kan omgaan met situaties die het nooit tijdens de training heeft gezien, zoals het prikken van een gevulde giraffe. Dit toont aan dat versterkingsleer niet alleen een hulpmiddel is voor virtuele taken, maar dat het ook problemen in de fysieke wereld kan oplossen die een ongekende handigheid vereisen.

Menselijke handen laten ons een grote verscheidenheid aan taken oplossen. In de afgelopen 60 jaar van robotica, hebben de harde taken die mensen met hun vaste handen uitvoeren, het ontwerpen van een aangepaste robot voor elke taak vereist. Als alternatief hebben mensen decennialang geprobeerd om algemene robothardware te gebruiken, maar met beperkt succes vanwege hun hoge mate van vrijheid. Met name de hardware die OpenAI hier gebruikt is niet nieuw - de robothand die ze gebruiken is al vijftien jaar oud - maar de softwareaanpak is dat wel.

Sinds mei 2017 probeert OpenAI een mensachtige robothand te trainen om de Rubik's Cube op te lossen. Het bedrijf heeft zich dit doel gesteld omdat het gelooft dat het succesvol trainen van zo'n robothand om complexe manipulatietaken uit te voeren de basis legt voor algemene robots. In juli 2017 heeft OpenAI de Rubik's Cube in de simulatie opgelost, en nu dus ook in de praktijk.