Robótica

Enseñar a los robots a planificar con incertidumbre

Investigación en IA encarnada que ayuda a los robots a percibir, razonar y actuar con bucles de retroalimentación más seguros.

alcancepercepción · planificación · traspaso controlado al mundo real
posturala incertidumbre vive en la percepción, no en el punto ciego del planificador
buclesim → real → sim, cada sorpresa reincorporada
escena cenital · confianza de detección + trayectoria planificada box · 92% human · 78% unknown · 41% high confidence medium confidence low confidence
Lo que cambia en la IA encarnada

La incertidumbre es parte de la percepción, no parte del planificador

Los robots que actúan en el mundo real tienen que reconocer cuándo se equivocan. Nuestro trabajo encarnado empuja la incertidumbre de vuelta a la percepción para que los planificadores puedan reaccionar a ella, y luego valida todo frente a entornos reales cuidadosamente controlados antes de reincorporar las sorpresas al simulador.

división convencional

la percepción emite estimaciones puntuales y se supone que el planificador es robusto ante todo lo que se equivoque.

nuestra división

la percepción emite la duda directamente — intervalos de confianza en las detecciones, covarianza en los seguimientos — y el planificador está cableado para reaccionar a esa duda.

tres compromisos

Donde el bucle encarnado se gana su seguridad

E1

percepción que admite la duda

Cada detección reporta un intervalo de confianza, cada seguimiento una covarianza. El planificador ve la duda directamente.

point + 2σ ellipse
premia planificadores que reaccionan a la incertidumbre en tiempo real castiga estimaciones puntuales que parecen seguras hasta que algo cae al suelo
E2

sim → real → sim

Entrenamos en simulación, validamos en un entorno real cuidadosamente controlado y reincorporamos cada sorpresa al simulador.

i1 0.62 i2 0.41 i3 0.27 i4 0.16 i5 0.09 reality gap by iteration
premia bucles que reducen la brecha con la realidad en cada ciclo castiga métricas exclusivas de simulación tratadas como sustituto del mundo real
E3

un bucle de retroalimentación más seguro

Un robot que no sabe que está equivocado es el peligroso. Premiamos los sistemas que se detienen, preguntan y replanifican cuando la incertidumbre cruza un umbral escrito.

confident execute uncertain pause · ask unsafe stop
premia controladores que ceden ante la duda castiga controladores que arrasan a través de estados inciertos
sim → real → sim

El bucle se estrecha hasta que la brecha es pequeña

Entrena en simulación, valida en un entorno real controlado, reincorpora cada sorpresa al simulador. En cada ciclo la brecha con la realidad se reduce.

SIM trained policy unit-test surface REAL controlled environment measured surprise SIM′ surprise folded in next training round cycle: each iteration shrinks the reality gap deploy log surprises
política de escena

La tabla de detección es la tabla de acción

La misma escena del encabezado, descompuesta en la vista del controlador: detección, confianza, decisión, clase de política. Un desconocido de baja confianza no se convierte en un plan ejecutado.

detección confianza decisión clase de política urgencia
d1 · box 0.92 pick execute low
d2 · human 0.78 stop & yield override high
d3 · unknown 0.41 pause · ask escalate medium

Percepción que admite la duda

Los robots que actúan en el mundo real tienen que reconocer cuándo se equivocan. Nuestro stack de percepción reporta la incertidumbre junto a cada detección para que los planificadores puedan reaccionar.

Sim, luego real, luego sim

Entrenamos en simulación, validamos en entornos reales cuidadosamente controlados y reincorporamos las sorpresas al simulador. El bucle se estrecha hasta que la brecha es pequeña.

transversales

La incertidumbre encarnada es solo calibración con fecha límite

La misma disciplina de calibración que aflora en nuestras previsiones climáticas y en nuestra biblioteca de evaluación aterriza aquí como una ley de control: cuando la banda es amplia, el robot cede.