Robotik

Robotern das Planen unter Unsicherheit beibringen

Forschung zu verkörperter KI, die Robotern hilft, wahrzunehmen, zu schlussfolgern und mit sichereren Rückkopplungsschleifen zu handeln.

scopeWahrnehmung · Planung · kontrollierte Übergabe in die reale Welt
HaltungUnsicherheit lebt in der Wahrnehmung, nicht im toten Winkel des Planers
SchleifeSim → Real → Sim, jede Überraschung wird zurückgeführt
Szene von oben · Detektionskonfidenz + geplanter Pfad box · 92% human · 78% unknown · 41% high confidence medium confidence low confidence
Was sich in der verkörperten KI ändert

Unsicherheit gehört zur Wahrnehmung, nicht zum Planer

Roboter, die in der realen Welt handeln, müssen erkennen, wann sie sich irren. Unsere verkörperte Arbeit drängt die Unsicherheit zurück in die Wahrnehmung, sodass Planer auf sie reagieren können, und validiert dann alles gegen sorgfältig kontrollierte reale Umgebungen, bevor die Überraschungen zurück in den Simulator geführt werden.

herkömmliche Aufteilung

Die Wahrnehmung gibt Punktschätzungen aus, und der Planer soll robust gegenüber allem sein, was sie falsch macht.

unsere Aufteilung

Die Wahrnehmung gibt den Zweifel direkt aus — Konfidenzintervalle auf Detektionen, Kovarianz auf Tracks — und der Planer ist darauf ausgelegt, auf diesen Zweifel zu reagieren.

drei Verpflichtungen

Wo die verkörperte Schleife ihre Sicherheit verdient

E1

Wahrnehmung, die Zweifel zulässt

Jede Detektion meldet ein Konfidenzintervall, jeder Track eine Kovarianz. Der Planer sieht den Zweifel direkt.

point + 2σ ellipse
belohnt Planer, die in Echtzeit auf Unsicherheit reagieren bestraft Punktschätzungen, die sicher wirken, bis etwas zu Boden fällt
E2

Sim → Real → Sim

Wir trainieren in der Simulation, validieren in einer sorgfältig kontrollierten realen Umgebung und führen jede Überraschung zurück in den Simulator.

i1 0.62 i2 0.41 i3 0.27 i4 0.16 i5 0.09 reality gap by iteration
belohnt Schleifen, die die Realitätslücke mit jedem Zyklus verkleinern bestraft reine Sim-Metriken, die als Stellvertreter für die reale Welt behandelt werden
E3

eine sicherere Rückkopplungsschleife

Ein Roboter, der nicht weiß, dass er sich irrt, ist der gefährliche. Wir belohnen Systeme, die anhalten, nachfragen und neu planen, wenn die Unsicherheit eine festgeschriebene Schwelle überschreitet.

confident execute uncertain pause · ask unsafe stop
belohnt Regler, die unter Zweifel nachgeben bestraft Regler, die sich durch unsichere Zustände pflügen
Sim → Real → Sim

Die Schleife zieht sich zu, bis die Lücke klein ist

In der Simulation trainieren, in einer kontrollierten realen Umgebung validieren, jede Überraschung zurück in den Simulator führen. Mit jedem Zyklus verkleinert sich die Realitätslücke.

SIM trained policy unit-test surface REAL controlled environment measured surprise SIM′ surprise folded in next training round cycle: each iteration shrinks the reality gap deploy log surprises
Szenen-Policy

Die Detektionstabelle ist die Aktionstabelle

Dieselbe Szene aus dem Hero, aufgeschlüsselt aus der Sicht des Reglers: Detektion, Konfidenz, Entscheidung, Policy-Klasse. Ein Unbekanntes mit geringer Konfidenz wird nicht zu einem ausgeführten Plan.

Detektion Konfidenz Entscheidung Policy-Klasse Dringlichkeit
d1 · box 0.92 pick execute low
d2 · human 0.78 stop & yield override high
d3 · unknown 0.41 pause · ask escalate medium

Wahrnehmung, die Zweifel zulässt

Roboter, die in der realen Welt handeln, müssen erkennen, wann sie sich irren. Unser Wahrnehmungs-Stack meldet die Unsicherheit zusammen mit jeder Detektion, sodass Planer reagieren können.

Erst Sim, dann Real, dann Sim

Wir trainieren in der Simulation, validieren in sorgfältig kontrollierten realen Umgebungen und führen die Überraschungen zurück in den Simulator. Die Schleife zieht sich zu, bis die Lücke klein ist.

Querschnitte

Verkörperte Unsicherheit ist nur Kalibrierung mit einer Frist

Dieselbe Kalibrierungsdisziplin, die in unseren Klimaprognosen und unserer Evaluierungsbibliothek auftaucht, landet hier als Regelgesetz: Ist das Band breit, gibt der Roboter nach.