E1 可组合的构建模块
流水线由带版本、声明式的组件组合而成,这些组件随其依赖一同迁移。
跨科学领域运行可复现研究流水线的工作区编排工具。
随研究一同迁移的工作区编排器。流水线的运行、重放与审计均完全一致。
Emmy 是我们用来在各领域间保持科学研究可复现的编排工具。它将我们的研究构建模块组合成可运行、可重放、可审计的流水线,并把数据版本管理与依赖管理直接呈现给使用它的科研人员。它正是让一项结果从笔记本迁移为可被辩护之产物的那一层。
流水线由带版本、声明式的组件组合而成,这些组件随其依赖一同迁移。
重放是确定性的。重新运行一条流水线会产出相同的产物,除非输入发生了变化,而该变化是可见的。
Emmy 横跨生物学、材料学与认知科学使用,却不沦为某个领域的框架。它是工作流,而非建模。
只要输入相符,同一条流水线每次都产出相同的产物。一旦输入发生变化,该变化便会在行级别可见。
带版本的输入——以哈希钉定的数据、模型或产物。
从输入到输出的确定性变换。
依据固定测试套件评分,输出包含执行轨迹。
钉定到本次运行的最终产物,端到端可重放。
序列流水线、结构预测,以及基于带版本参考数据的多阶段分析。
硅流程运行、模拟模块扫描、版图到 LVS 的流水线,在不同工艺间保持可复现。
面向认知基底研究的训练与评估流水线,含多随机种子运行。
研究速度的瓶颈在于可复现性基础设施。Emmy 就是我们的答案:一个工作区编排器,让科研人员把流水线交给协作者,并得到同样的结果。