研究工具 · 确定性重放 · 领域无关

Emmy

跨科学领域运行可复现研究流水线的工作区编排工具。

随研究一同迁移的工作区编排器。流水线的运行、重放与审计均完全一致。

构建模块 数据源 · 变换 · 评估 · 报告
重放 构造即确定
领域 生物学 · 材料学 · 认知科学
Emmy 是什么

随研究一同迁移的编排能力

Emmy 是我们用来在各领域间保持科学研究可复现的编排工具。它将我们的研究构建模块组合成可运行、可重放、可审计的流水线,并把数据版本管理与依赖管理直接呈现给使用它的科研人员。它正是让一项结果从笔记本迁移为可被辩护之产物的那一层。

Emmy 的组织方式

三大特性

E1 可组合的构建模块

流水线由带版本、声明式的组件组合而成,这些组件随其依赖一同迁移。

E2 构造即可复现

重放是确定性的。重新运行一条流水线会产出相同的产物,除非输入发生了变化,而该变化是可见的。

E3 领域无关

Emmy 横跨生物学、材料学与认知科学使用,却不沦为某个领域的框架。它是工作流,而非建模。

重放日志

五次重放。同一哈希。

只要输入相符,同一条流水线每次都产出相同的产物。一旦输入发生变化,该变化便会在行级别可见。

运行 时间戳 输出哈希 匹配
run #1 2026-04-12 09:14 sha256:5c0a…b71e 完全一致
run #2 2026-04-14 22:38 sha256:5c0a…b71e 完全一致
run #3 2026-04-22 11:02 sha256:5c0a…b71e 完全一致
run #4 2026-05-03 16:50 sha256:5c0a…b71e 完全一致
run #5 2026-05-19 07:22 sha256:5c0a…b71e 完全一致
构建模块

四种类型,组合成任意流程。

01
数据源

带版本的输入——以哈希钉定的数据、模型或产物。

02
变换

从输入到输出的确定性变换。

03
评估

依据固定测试套件评分,输出包含执行轨迹。

04
报告

钉定到本次运行的最终产物,端到端可重放。

我们的应用领域

一套编排器,三门科学。

BIO

生物学

序列流水线、结构预测,以及基于带版本参考数据的多阶段分析。

MAT

材料学

硅流程运行、模拟模块扫描、版图到 LVS 的流水线,在不同工艺间保持可复现。

COG

认知科学

面向认知基底研究的训练与评估流水线,含多随机种子运行。

01

我们为何构建它

研究速度的瓶颈在于可复现性基础设施。Emmy 就是我们的答案:一个工作区编排器,让科研人员把流水线交给协作者,并得到同样的结果。

让流水线得以迁移而不丢失其结果的工作流。