une perception qui admet le doute
Chaque détection rapporte un intervalle de confiance, chaque piste une covariance. Le planificateur voit le doute directement.
Une architecture sur un axe continu, élevée sur la stack.
Découvrir LoominumEntreprise
Recherche
Science
À propos
Recherche en IA incarnée aidant les robots à percevoir, raisonner et agir avec des boucles de rétroaction plus sûres.
Les robots qui agissent dans le monde réel doivent reconnaître quand ils se trompent. Notre travail sur l’incarnation repousse l’incertitude dans la perception pour que les planificateurs puissent y réagir, puis valide tout dans des environnements réels soigneusement contrôlés avant de réinjecter les surprises dans le simulateur.
la perception émet des estimations ponctuelles, le planificateur est censé être robuste à tout ce qu’elles ratent.
la perception émet directement le doute — intervalles de confiance sur les détections, covariance sur les pistes — et le planificateur est câblé pour réagir à ce doute.
Chaque détection rapporte un intervalle de confiance, chaque piste une covariance. Le planificateur voit le doute directement.
Nous entraînons en simulation, validons dans un environnement réel soigneusement contrôlé, puis réinjectons chaque surprise dans le simulateur.
Un robot qui ne sait pas qu’il a tort est le robot dangereux. Nous récompensons les systèmes qui s’arrêtent, demandent et replanifient quand l’incertitude franchit un seuil écrit.
Entraîner en simulation, valider dans un environnement réel contrôlé, réinjecter chaque surprise dans le simulateur. À chaque cycle, l’écart à la réalité se réduit.
La même scène que dans l’en-tête, décomposée selon la vue du contrôleur : détection, confiance, décision, classe de politique. Un inconnu à faible confiance ne devient pas un plan exécuté.
Les robots qui agissent dans le monde réel doivent reconnaître quand ils se trompent. Notre stack de perception rapporte l’incertitude aux côtés de chaque détection pour que les planificateurs puissent y réagir.
Nous entraînons en simulation, validons dans des environnements réels soigneusement contrôlés, puis réinjectons les surprises dans le simulateur. La boucle se resserre jusqu’à ce que l’écart soit faible.
La même discipline de calibration qui apparaît dans nos prévisions climatiques et notre bibliothèque d’évaluation se traduit ici par une loi de commande : quand la bande est large, le robot cède.