カテゴリー
フラッグシップ・クロスドメイン · 第1世代
ReasonLoom基板上でトレーニングされた、フラッグシップのポスト・トランスフォーマー・モデルです。
RL-X1.G1.2026カテゴリー
フラッグシップ・クロスドメイン · 第1世代
サブストレート
Stamen + Heddle
トレーニング
Atelier 発達ループ
最適用途
コンテキスト制限のない長期推論
RL-X1 とは
RL-X1 は、フラッグシップ・クロスドメインラインの第1世代です。コンテキストウィンドウの中には存在しません。Heddle を通じて読み取り、バインドし、構成し、Stamen 上で動作し、Atelier によって育てられます。その結果として得られる長期タスクにおける推論品質は、プロンプトエンジニアリングではなく、アーキテクチャから生まれます。
構造的な転換
Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.
従来型
RL-X1
トランスフォーマーとの違い
RL-X1 が注目に値するのは、何でないかという点にあります——より大きなアテンションモデルでも、トークンを入出力するだけのモデルでも、ワンショット型デコーダーでもありません。
メモリはデコーダーがスクロールするバッファではなく、構造化バインディングの中に存在します。長期タスクはトークン予算の問題ではなくなります。
アナロジー、反事実的推論、マルチホップチェーンにわたる推論は、同じバインド/リコールのサーフェスを使います。モデルは毎回ターンごとに言語から構造を再導出する必要がありません。
モデルは Atelier によって育てられ、ループ内に型付き検証器があります。知っていることは根拠を持って主張でき、知らないことは保留します。
現在地
Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.
| タスクファミリー | RL-X1 | 従来型ベースライン | Δ |
|---|---|---|---|
| 長期マルチホップ推論 | P@5 1.00 | P@5 ~0.62 | +0.38 |
| クロスドキュメント・バインディング | 0.94 | 0.71 | +0.23 |
| 組み合わせ的アナロジー | 0.88 | 0.56 | +0.32 |
| 不明時の保留判断 | 0.96 | 0.41 | +0.55 |
| コンテキストウィンドウのオーバーフロー | 0 | 頻発 | n/a |
P@5 1.00
スタックを通じたマルチホップ検索
モデルとメモリブリッジを通じたエンドツーエンドの検索結果です。
+0.65
健忘コントロールに対する生涯保持優位性
Atelier 発達ループから継承されたものです。
0
コンテキストウィンドウの失敗モード数
オーバーフローするコンテキストウィンドウが存在しません。
推論トレース
A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.
perceive(corpus) 入力は構造化されたエビデンスとして受け取られます——トークンバッファではありません。
bind(claim_a, source_a) クレームは出典と紐づけられます。プロベナンスは構造的であり、後付けではありません。
bind(claim_b, source_b) 2つ目のエビデンスがバインドされます。散文からの再導出は不要です。
walk(claim_a → claim_b) マルチホップはサブストレートの操作です。デコーダーがスクロールする必要はありません。
compose(answer | evidence) 回答はバインドされたエビデンスから構成されます。主張できることは、根拠を持って防御できます。
emit(answer, audit_trail) 出力は監査証跡とともに提供されます。Mnemo を通じて、エンタープライズ対応済みです。
X-ライン
G1
出荷済み
フラッグシップ・クロスドメイン · コンテキスト制限のない長期推論。
G2
計画中
マルチモーダル・サブストレートネイティブ。知覚とバインディングが同一サーフェスを共有。
G3
研究中
自己修正型リコール。モデルが型付き検証のもとで自身のメモリを編集します。
RL-X1 の活用領域
数百の入力にまたがり、すべての入力に対して構造化されたリコールを必要とするタスクです。モデルはそれらをウィンドウに収めるよう求められません。
RL-X1 はコレクションを読み取り、クレームをバインドし、それらにわたって推論を構成します。成果物は物語ではなく、構造化されたものです。
Mnemo を通じて使用することで、RL-X1 は監査証跡を付与した状態でマルチテナントメモリ上で推論します。