Mit Helix hat Figure ein generalistisches Vision-Language-Action (VLA) Modell vorgestellt, welches Wahrnehmung, Sprachverständnis und erlernte Kontrolle vereint und so mehrere langjährige Herausforderungen in der Robotik überwindet. Die größte Herausforderung für die Robotik stellt das eigene Zuhause dar. Anders als in kontrollierten Industrieumgebungen wimmelt es in Privathaushalten nur so von zahllosen Objekten wie empfindlichen Glaswaren, zerknitterten Kleidungsstücken, herumliegenden Spielsachen die alle unvorhersehbare Formen, Größen, Farben und Texturen aufweisen.
Damit Roboter im Haushalt nützlich sind, müssen sie in der Lage sein, auf Abruf intelligente neue Verhaltensweisen zu entwickeln, insbesondere für Objekte, die sie noch nie zuvor gesehen haben. Erst vor einem Monat verkündete Figure in Zukunft nicht mehr auf die KI von OpenAI zu setzten und lieber ein eigenes Modell zu entwickeln. Mit dem VLA Helix zeigt das Start-Up nun ihr eigenes VLA-Modell. Das angehängte Video zeigt eindrucksvoll die präzisen Kontrolle des gesamten humanoiden Oberkörpers inklusive Handgelenke, Torso, Kopf und einzelner Finger.
Quelle: Figure