Strumenti di ricerca · replay deterministico · agnostico al dominio

Emmy

Un orchestratore di workspace che esegue pipeline di ricerca riproducibili in diversi domini scientifici.

Un orchestratore di workspace che viaggia con la ricerca. Le pipeline si eseguono, si rieseguono e si verificano in modo identico.

elementi costitutivi sorgente · trasformazione · valutazione · report
replay deterministico per costruzione
domini biologia · materiali · cognizione
Cos'è Emmy

Orchestrazione che viaggia con la ricerca

Emmy è lo strumento di orchestrazione che usiamo per mantenere la ricerca scientifica riproducibile attraverso i domini. Compone i nostri elementi costitutivi di ricerca in pipeline che possono essere eseguite, rieseguite e verificate, con il versionamento dei dati e la gestione delle dipendenze visibili agli scienziati che lo utilizzano. È lo strato che permette a un risultato di passare da un notebook a un artefatto difendibile.

Come è organizzato Emmy

Tre proprietà

E1 Elementi costitutivi componibili

Le pipeline sono composte da componenti versionati e dichiarativi che viaggiano con le proprie dipendenze.

E2 Riproducibile per costruzione

I replay sono deterministici. Rieseguire una pipeline produce gli stessi artefatti a meno che gli input non siano cambiati, e quel cambiamento è visibile.

E3 Agnostico al dominio

Emmy è usato in biologia, materiali e cognizione senza diventare un framework di dominio. È flusso di lavoro, non modellazione.

Log dei replay

Cinque replay. Un solo hash.

La stessa pipeline produce lo stesso artefatto ogni volta che gli input coincidono. Quando gli input cambiano, il cambiamento è visibile a livello di riga.

esecuzione timestamp hash di output corrispondenza
run #1 2026-04-12 09:14 sha256:5c0a…b71e identico
run #2 2026-04-14 22:38 sha256:5c0a…b71e identico
run #3 2026-04-22 11:02 sha256:5c0a…b71e identico
run #4 2026-05-03 16:50 sha256:5c0a…b71e identico
run #5 2026-05-19 07:22 sha256:5c0a…b71e identico
Elementi costitutivi

Quattro tipi, componibili in qualsiasi cosa.

01
sorgente

input versionato — dati, modello o artefatto ancorato tramite hash.

02
trasformazione

trasformazione deterministica dagli input agli output.

03
valutazione

valutata rispetto a una suite fissa, l'output include la traccia.

04
report

artefatto finale ancorato all'esecuzione, rieseguibile end-to-end.

Domini in cui lo usiamo

Un orchestratore, tre scienze.

BIO

biologia

pipeline di sequenze, predizione di strutture, analisi multi-fase con riferimenti versionati.

MAT

materiali

esecuzioni di flussi su silicio, sweep di blocchi analogici, pipeline da layout a LVS mantenute riproducibili tra processi.

COG

cognizione

pipeline di addestramento e valutazione per la ricerca sul substrato cognitivo, incluse esecuzioni multi-seed.

01

Perché l'abbiamo costruito

La velocità della ricerca è limitata dall'infrastruttura di riproducibilità. Emmy è la nostra risposta: un orchestratore di workspace che permette a uno scienziato di passare una pipeline a un collaboratore e ottenere indietro la stessa risposta.

Un flusso di lavoro che permette a una pipeline di viaggiare senza perdere il suo risultato.