モデル · 第1世代

フラッグシップモデル、
その基盤となるサブストレートとともに。

ReasonLoom基板上でトレーニングされた、フラッグシップのポスト・トランスフォーマー・モデルです。

モデルID
RL-X1.G1.2026
サブストレート
Stamen ランタイム · Heddle メモリ
トレーニング
Atelier 発達ループ · 型付き検証器をループ内に
コンテキスト上限
上限はありません

カテゴリー

フラッグシップ・クロスドメイン · 第1世代

サブストレート

Stamen + Heddle

トレーニング

Atelier 発達ループ

最適用途

コンテキスト制限のない長期推論

RL-X1 とは

サブストレートを基盤に持つモデル

RL-X1 は、フラッグシップ・クロスドメインラインの第1世代です。コンテキストウィンドウの中には存在しません。Heddle を通じて読み取り、バインドし、構成し、Stamen 上で動作し、Atelier によって育てられます。その結果として得られる長期タスクにおける推論品質は、プロンプトエンジニアリングではなく、アーキテクチャから生まれます。

構造的な転換

「より大きなウィンドウ」ではない理由

Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.

従来型

トークンウィンドウ

  • × Memory ceiling = buffer length.
  • × Recall is a scan of attention.
  • × Composition re-derived per turn.
  • × Provenance lives in prose.

RL-X1

構造化サブストレート

  • + No buffer to overflow.
  • + Recall is a substrate primitive.
  • + Composition is bind/walk, not re-read.
  • + Provenance is structural.

トランスフォーマーとの違い

3つの構造的な差異

RL-X1 が注目に値するのは、何でないかという点にあります——より大きなアテンションモデルでも、トークンを入出力するだけのモデルでも、ワンショット型デコーダーでもありません。

X1

コンテキストウィンドウの上限なし

メモリはデコーダーがスクロールするバッファではなく、構造化バインディングの中に存在します。長期タスクはトークン予算の問題ではなくなります。

X2

構成はプリミティブ

アナロジー、反事実的推論、マルチホップチェーンにわたる推論は、同じバインド/リコールのサーフェスを使います。モデルは毎回ターンごとに言語から構造を再導出する必要がありません。

X3

トレーニングによるグラウンディング

モデルは Atelier によって育てられ、ループ内に型付き検証器があります。知っていることは根拠を持って主張でき、知らないことは保留します。

現在地

内部評価

Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.

タスクファミリー RL-X1 従来型ベースライン Δ
長期マルチホップ推論 P@5 1.00 P@5 ~0.62 +0.38
クロスドキュメント・バインディング 0.94 0.71 +0.23
組み合わせ的アナロジー 0.88 0.56 +0.32
不明時の保留判断 0.96 0.41 +0.55
コンテキストウィンドウのオーバーフロー 0 頻発 n/a

P@5 1.00

スタックを通じたマルチホップ検索

モデルとメモリブリッジを通じたエンドツーエンドの検索結果です。

+0.65

健忘コントロールに対する生涯保持優位性

Atelier 発達ループから継承されたものです。

0

コンテキストウィンドウの失敗モード数

オーバーフローするコンテキストウィンドウが存在しません。

推論トレース

マルチホップ質問の処理の流れ

A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.

rl-x1 · trace · multi-hop
  1. 01 READ perceive(corpus)

    入力は構造化されたエビデンスとして受け取られます——トークンバッファではありません。

  2. 02 BIND bind(claim_a, source_a)

    クレームは出典と紐づけられます。プロベナンスは構造的であり、後付けではありません。

  3. 03 BIND bind(claim_b, source_b)

    2つ目のエビデンスがバインドされます。散文からの再導出は不要です。

  4. 04 WALK walk(claim_a → claim_b)

    マルチホップはサブストレートの操作です。デコーダーがスクロールする必要はありません。

  5. 05 COMP compose(answer | evidence)

    回答はバインドされたエビデンスから構成されます。主張できることは、根拠を持って防御できます。

  6. 06 EMIT emit(answer, audit_trail)

    出力は監査証跡とともに提供されます。Mnemo を通じて、エンタープライズ対応済みです。

X-ライン

世代ロードマップにおける RL-X1 の位置づけ

G1

RL-X1

出荷済み

フラッグシップ・クロスドメイン · コンテキスト制限のない長期推論。

G2

RL-X2

計画中

マルチモーダル・サブストレートネイティブ。知覚とバインディングが同一サーフェスを共有。

G3

RL-X3

研究中

自己修正型リコール。モデルが型付き検証のもとで自身のメモリを編集します。

RL-X1 の活用領域

クロスドメイン推論

推論

長期分析

数百の入力にまたがり、すべての入力に対して構造化されたリコールを必要とするタスクです。モデルはそれらをウィンドウに収めるよう求められません。

リサーチ

大規模な科学的読解

RL-X1 はコレクションを読み取り、クレームをバインドし、それらにわたって推論を構成します。成果物は物語ではなく、構造化されたものです。

エンタープライズ

メモリ対応の意思決定支援

Mnemo を通じて使用することで、RL-X1 は監査証跡を付与した状態でマルチテナントメモリ上で推論します。