Forschungswerkzeuge · deterministische Wiederholung · domänenunabhängig

Emmy

Ein Arbeitsbereichsorchestrierer, der reproduzierbare Forschungspipelines über wissenschaftliche Domänen hinweg ausführt.

Ein Arbeitsbereichsorchestrator, der mit der Forschung reist. Pipelines laufen, werden wiederholt und auditiert – stets identisch.

Bausteine Quelle · Transformation · Evaluierung · Bericht
Wiederholung deterministisch von Grund auf
Domänen Biologie · Materialien · Kognition
Was Emmy ist

Orchestrierung, die mit der Forschung reist

Emmy ist das Orchestrierungswerkzeug, mit dem wir wissenschaftliche Forschung über Domänen hinweg reproduzierbar halten. Es setzt unsere Forschungsbausteine zu Pipelines zusammen, die ausgeführt, wiederholt und auditiert werden können – mit Datenversionierung und Abhängigkeitsverwaltung, die für die nutzenden Wissenschaftlerinnen und Wissenschaftler sichtbar sind. Es ist die Schicht, die ein Ergebnis aus einem Notebook in ein belastbares Artefakt überführt.

Wie Emmy aufgebaut ist

Drei Eigenschaften

E1 Zusammensetzbare Bausteine

Pipelines werden aus versionierten, deklarativen Komponenten zusammengesetzt, die mit ihren Abhängigkeiten reisen.

E2 Reproduzierbar von Grund auf

Wiederholungen sind deterministisch. Die erneute Ausführung einer Pipeline liefert dieselben Artefakte, es sei denn, die Eingaben haben sich geändert – und diese Änderung ist sichtbar.

E3 Domänenunabhängig

Emmy wird in Biologie, Materialien und Kognition eingesetzt, ohne zu einem Domänen-Framework zu werden. Es ist Workflow, nicht Modellierung.

Wiederholungsprotokoll

Fünf Wiederholungen. Ein Hash.

Dieselbe Pipeline erzeugt jedes Mal dasselbe Artefakt, sofern die Eingaben übereinstimmen. Ändern sich die Eingaben, wird die Änderung auf Zeilenebene sichtbar.

Lauf Zeitstempel Ausgabe-Hash Übereinstimmung
run #1 2026-04-12 09:14 sha256:5c0a…b71e identisch
run #2 2026-04-14 22:38 sha256:5c0a…b71e identisch
run #3 2026-04-22 11:02 sha256:5c0a…b71e identisch
run #4 2026-05-03 16:50 sha256:5c0a…b71e identisch
run #5 2026-05-19 07:22 sha256:5c0a…b71e identisch
Bausteine

Vier Arten, zu allem zusammengesetzt.

01
Quelle

versionierte Eingabe – Daten, Modell oder Artefakt, per Hash fixiert.

02
Transformation

deterministische Transformation von Eingaben zu Ausgaben.

03
Evaluierung

bewertet anhand einer festen Suite, die Ausgabe enthält den Trace.

04
Bericht

finales Artefakt, an den Lauf gebunden, durchgängig wiederholbar.

Domänen, in denen wir es einsetzen

Ein Orchestrator, drei Wissenschaften.

BIO

Biologie

Sequenzpipelines, Strukturvorhersage, mehrstufige Analysen mit versionierten Referenzen.

MAT

Materialien

Silizium-Flow-Läufe, Analogblock-Sweeps, Layout-zu-LVS-Pipelines, die über Prozesse hinweg reproduzierbar bleiben.

COG

Kognition

Trainings- und Evaluierungspipelines für die Erforschung kognitiver Substrate, einschließlich Läufen mit mehreren Seeds.

01

Warum wir es gebaut haben

Die Forschungsgeschwindigkeit wird durch die Reproduzierbarkeitsinfrastruktur ausgebremst. Emmy ist unsere Antwort: ein Arbeitsbereichsorchestrator, der es einer Wissenschaftlerin oder einem Wissenschaftler ermöglicht, eine Pipeline an Mitwirkende zu übergeben und dieselbe Antwort zurückzubekommen.

Ein Workflow, der eine Pipeline reisen lässt, ohne ihr Ergebnis zu verlieren.