Les pipelines sont composés de composants déclaratifs et versionnés qui voyagent avec leurs dépendances.
Emmy
Un orchestrateur d'espace de travail qui exécute des pipelines de recherche reproductibles dans des domaines scientifiques variés.
Un orchestrateur d’espace de travail qui voyage avec la recherche. Les pipelines s’exécutent, se rejouent et s’auditent à l’identique.
Une orchestration qui voyage avec la recherche
Emmy est l’outil d’orchestration que nous utilisons pour maintenir la recherche scientifique reproductible à travers les domaines. Il compose nos blocs de construction de recherche en pipelines qui peuvent être exécutés, rejoués et audités, avec le versionnage des données et la gestion des dépendances visibles pour les scientifiques qui l’emploient. C’est la couche qui permet à un résultat de passer d’un carnet de notes à un artefact défendable.
Trois propriétés
Les rejeux sont déterministes. Réexécuter un pipeline produit les mêmes artefacts, sauf si les entrées ont changé — et ce changement est visible.
Emmy est utilisé en biologie, en matériaux et en cognition sans devenir un framework de domaine. C’est du flux de travail, pas de la modélisation.
Cinq rejeux. Un seul hash.
Le même pipeline produit le même artefact à chaque fois que les entrées concordent. Lorsque les entrées changent, le changement est visible au niveau de la ligne.
Quatre types, composés en tout ce que l’on veut.
entrée versionnée — donnée, modèle ou artefact épinglé par hash.
transformation déterministe des entrées vers les sorties.
notée face à une suite fixe, la sortie inclut la trace.
artefact final épinglé à l’exécution, rejouable de bout en bout.
Un seul orchestrateur, trois sciences.
biologie
pipelines de séquences, prédiction de structure, analyses multi-étapes avec références versionnées.
matériaux
exécutions de flux silicium, balayages de blocs analogiques, pipelines layout-vers-LVS maintenus reproductibles à travers les procédés.
cognition
pipelines d’entraînement et d’évaluation pour la recherche sur le substrat cognitif, y compris les exécutions multi-graines.
Pourquoi nous l’avons construit
La vélocité de la recherche est limitée par l’infrastructure de reproductibilité. Emmy est notre réponse : un orchestrateur d’espace de travail qui permet à un scientifique de transmettre un pipeline à un collaborateur et d’obtenir en retour la même réponse.