类别
旗舰跨领域模型 · 第一代
基于 ReasonLoom 底层架构训练的旗舰后Transformer模型。
RL-X1.G1.2026类别
旗舰跨领域模型 · 第一代
基底
Stamen + Heddle
训练方式
Atelier 发育式训练循环
最适用于
无上下文限制的长视野推理
RL-X1 是什么
RL-X1 是我们旗舰跨领域系列的第一代。它不依赖上下文窗口,而是通过 Heddle 完成读取、绑定与组合,在 Stamen 上运行,并由 Atelier 培育。其结果是,长视野任务上的推理质量来源于架构本身,而非提示词工程。
结构性转变
Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.
传统方式
RL-X1
与Transformer相比的变化
RL-X1 的价值在于它不是什么——不是更大的注意力模型,不是 token 输入输出模型,也不是单次解码器。
记忆存储于结构化绑定中,而非解码器需要滚动的缓冲区。长视野任务不再是 token 预算问题。
基于类比、反事实与多跳推理链的推理,使用同一套绑定/召回接口。模型无需在每轮对话中从语言重新推导结构。
模型由 Atelier 培育,类型化验证器全程在环。它所知晓的,均可据以辩护;它不知晓的,会主动延迟作答。
当前位置
Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.
| 任务类型 | RL-X1 | 传统基线 | Δ |
|---|---|---|---|
| 长视野多跳推理 | P@5 1.00 | P@5 ~0.62 | +0.38 |
| 跨文档绑定 | 0.94 | 0.71 | +0.23 |
| 组合类比 | 0.88 | 0.56 | +0.32 |
| 未知时主动延迟 | 0.96 | 0.41 | +0.55 |
| 上下文窗口溢出 | 0 | 频繁 | n/a |
P@5 1.00
端到端技术栈多跳检索精度
通过模型与记忆桥接的端到端检索。
+0.65
与遗忘型对照相比的终身留存优势
继承自 Atelier 发育式训练循环。
0
上下文窗口失效模式
不存在可溢出的上下文窗口。
推理追踪
A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.
perceive(corpus) 输入以结构化证据形式落地——而非进入 token 缓冲区。
bind(claim_a, source_a) 论断与其来源绑定。溯源是结构性的,而非事后附加。
bind(claim_b, source_b) 第二条证据完成绑定。无需从文本重新推导。
walk(claim_a → claim_b) 多跳推理是基底的原生操作。解码器无需滚动上下文。
compose(answer | evidence) 答案由绑定证据组合而成。所有断言均可据以辩护。
emit(answer, audit_trail) 输出随附审计追踪。通过 Mnemo,可直接用于企业场景。
X 系列路线图
G1
已发布
旗舰跨领域模型 · 无上下文限制的长视野推理。
G2
已规划
原生多模态基底。感知与绑定共享同一底层。
G3
研究中
自修正式记忆召回。模型在类型化验证下自主编辑记忆。
RL-X1 的应用场景
跨越数百条输入、需要结构化召回的任务。模型不被要求将其压入窗口。
RL-X1 读取文献集合,绑定论断,并在其间组合推理。工作成果是结构化的,而非叙事性的。
通过 Mnemo 使用时,RL-X1 在多租户记忆上进行推理,并随附审计追踪。