Robotica

Insegnare ai robot a pianificare con l'incertezza

Ricerca sull'IA incorporata che aiuta i robot a percepire, ragionare e agire con cicli di feedback piu sicuri.

ambitopercezione · pianificazione · passaggio controllato al mondo reale
postural'incertezza vive nella percezione, non nell'angolo cieco del pianificatore
ciclosim → reale → sim, ogni sorpresa reintegrata
scena dall'alto · confidenza della rilevazione + percorso pianificato box · 92% human · 78% unknown · 41% high confidence medium confidence low confidence
Cosa cambia nell'IA incorporata

L'incertezza è parte della percezione, non parte del pianificatore

I robot che agiscono nel mondo reale devono riconoscere quando sono in errore. Il nostro lavoro sull'IA incorporata respinge l'incertezza dentro la percezione, così che i pianificatori possano reagirvi, per poi validare ogni cosa contro ambienti reali accuratamente controllati prima di reintegrare le sorprese nel simulatore.

divisione convenzionale

la percezione emette stime puntuali e il pianificatore dovrebbe essere robusto a qualunque cosa esse sbaglino.

la nostra divisione

la percezione emette il dubbio direttamente — intervalli di confidenza sulle rilevazioni, covarianza sulle tracce — e il pianificatore è cablato per reagire a quel dubbio.

tre impegni

Dove il ciclo incorporato guadagna la sua sicurezza

E1

percezione che ammette il dubbio

Ogni rilevazione riporta un intervallo di confidenza, ogni traccia una covarianza. Il pianificatore vede il dubbio direttamente.

point + 2σ ellipse
premia pianificatori che reagiscono all'incertezza in tempo reale penalizza stime puntuali che sembrano sicure finché qualcosa non finisce a terra
E2

sim → reale → sim

Addestriamo in simulazione, validiamo in un ambiente reale accuratamente controllato e reintegriamo ogni sorpresa nel simulatore.

i1 0.62 i2 0.41 i3 0.27 i4 0.16 i5 0.09 reality gap by iteration
premia cicli che riducono il divario con la realtà a ogni iterazione penalizza metriche solo-simulazione trattate come surrogato del mondo reale
E3

un ciclo di feedback più sicuro

Un robot che non sa di essere in errore è quello pericoloso. Premiamo i sistemi che si fermano, chiedono e ripianificano quando l'incertezza supera una soglia scritta.

confident execute uncertain pause · ask unsafe stop
premia controllori che cedono di fronte al dubbio penalizza controllori che sfondano attraverso stati incerti
sim → reale → sim

Il ciclo si stringe finché il divario è piccolo

Addestra in simulazione, valida in un ambiente reale controllato, reintegra ogni sorpresa nel simulatore. A ogni ciclo il divario con la realtà si riduce.

SIM trained policy unit-test surface REAL controlled environment measured surprise SIM′ surprise folded in next training round cycle: each iteration shrinks the reality gap deploy log surprises
politica di scena

La tabella delle rilevazioni è la tabella delle azioni

La stessa scena dell'hero, scomposta nella vista del controllore: rilevazione, confidenza, decisione, classe di politica. Un'incognita a bassa confidenza non diventa un piano eseguito.

rilevazione confidenza decisione classe di politica urgenza
d1 · box 0.92 pick execute low
d2 · human 0.78 stop & yield override high
d3 · unknown 0.41 pause · ask escalate medium

Percezione che ammette il dubbio

I robot che agiscono nel mondo reale devono riconoscere quando sono in errore. Il nostro stack di percezione riporta l'incertezza insieme a ogni rilevazione, così che i pianificatori possano reagire.

Prima sim, poi reale, poi sim

Addestriamo in simulazione, validiamo in ambienti reali accuratamente controllati e reintegriamo le sorprese nel simulatore. Il ciclo si stringe finché il divario è piccolo.

trasversalità

L'incertezza incorporata è solo calibrazione con una scadenza

La stessa disciplina di calibrazione che emerge nelle nostre previsioni climatiche e nella nostra libreria di valutazione qui atterra come legge di controllo: quando la banda è ampia, il robot cede.