パイプラインは、バージョン管理された宣言的なコンポーネントから組み立てられ、その依存関係とともに移動します。
Emmy
科学的ドメインを横断して、再現可能な研究パイプラインを実行するワークスペース・オーケストレーターです。
研究とともに移動するワークスペース・オーケストレーター。パイプラインは、実行・リプレイ・監査のいずれにおいても同一の結果を生みます。
研究とともに移動するオーケストレーション
Emmy は、科学研究をドメインを横断して再現可能に保つために私たちが使用するオーケストレーションツールです。研究の構成要素を、実行・リプレイ・監査が可能なパイプラインへと組み立て、データのバージョン管理と依存関係管理を、それを使う科学者に可視化します。これは、結果をノートブックから弁護可能なアーティファクトへと移行させるための層です。
三つの特性
リプレイは決定論的です。パイプラインを再実行すると、入力が変わらない限り同じアーティファクトが得られ、変わった場合はその変化が可視化されます。
Emmy は、ドメインフレームワークになることなく、生物学・材料・認知の各分野で使用されます。これはモデリングではなく、ワークフローです。
5回のリプレイ。一つのハッシュ。
入力が一致する限り、同じパイプラインは毎回同じアーティファクトを生成します。入力が変われば、その変化は行レベルで可視化されます。
4種類を組み合わせ、あらゆるものを構築。
バージョン管理された入力——ハッシュで固定されたデータ、モデル、またはアーティファクト。
入力から出力への決定論的な変換。
固定されたスイートに対して採点され、出力にはトレースが含まれます。
実行に固定された最終アーティファクト。エンドツーエンドでリプレイ可能。
一つのオーケストレーター、三つの科学分野。
生物学
配列パイプライン、構造予測、バージョン管理された参照を備えた多段階分析。
材料
シリコンフローの実行、アナログブロックのスイープ、プロセスを横断して再現性を保つレイアウトからLVSへのパイプライン。
認知
マルチシード実行を含む、認知基盤研究のためのトレーニングおよび評価パイプライン。
私たちが構築した理由
研究のスピードは、再現性のためのインフラがボトルネックになっています。Emmy はその答えです。すなわち、科学者がパイプラインを共同研究者に引き継いでも、同じ答えが返ってくるようにするワークスペース・オーケストレーターです。