Modelle · Generation 1

Ein Flaggschiff-Modell
mit dem Substrat darunter.

Flaggschiff-Post-transformer-Modell, trainiert auf dem ReasonLoom-Substrat.

Modell-ID
RL-X1.G1.2026
Substrat
Stamen-Runtime · Heddle-Gedächtnis
Training
Atelier-Entwicklungsloop · typisierter Verifizierer im Loop
Kontextlimit
keines vorhanden

Kategorie

Flaggschiff domänenübergreifend · Generation 1

Substrat

Stamen + Heddle

Trainiert mit

Atelier-Entwicklungsloop

Optimal für

Langfristiges Reasoning ohne Kontextlimits

Was RL-X1 ist

Ein Modell mit dem Substrat darunter

RL-X1 ist die erste Generation unserer Flaggschiff-Linie für domänenübergreifende Aufgaben. Es lebt nicht innerhalb eines Kontextfensters. Es liest, bindet und komponiert über Heddle, läuft auf Stamen und wird von Atelier aufgezogen. Das Ergebnis ist Reasoning-Qualität bei langfristigen Aufgaben, die aus der Architektur stammt – nicht aus Prompt-Engineering.

Der strukturelle Wandel

Warum der Unterschied kein „größeres Fenster“ ist

Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.

Konventionell

Token-Fenster

  • × Memory ceiling = buffer length.
  • × Recall is a scan of attention.
  • × Composition re-derived per turn.
  • × Provenance lives in prose.

RL-X1

Strukturiertes Substrat

  • + No buffer to overflow.
  • + Recall is a substrate primitive.
  • + Composition is bind/walk, not re-read.
  • + Provenance is structural.

Was sich gegenüber einem Transformer verändert

Drei strukturelle Unterschiede

RL-X1 ist interessant durch das, was es nicht ist – kein größeres Attention-Modell, kein reines Tokens-ein-Tokens-aus-Modell, kein One-Shot-Decoder.

X1

Kein Kontextfenster-Limit

Das Gedächtnis lebt in strukturierter Bindung, nicht in einem Puffer, über den der Decoder scrollen muss. Langfristige Aufgaben hören auf, ein Token-Budget-Problem zu sein.

X2

Komposition ist ein Grundelement

Das Reasoning über Analogie, Kontrafaktizität und Multi-Hop-Ketten nutzt dieselbe Bind/Recall-Oberfläche. Das Modell muss die Struktur nicht bei jedem Schritt neu aus Sprache ableiten.

X3

Durch Training verankert

Das Modell wird von Atelier aufgezogen, mit einem typisierten Verifizierer im Loop. Was es weiß, kann es verteidigen; was es nicht weiß, stellt es zurück.

Wo es steht

Interne Evaluation

Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.

Aufgabenfamilie RL-X1 Konventionelle Baseline Δ
Langfristiger Multi-Hop P@5 1.00 P@5 ~0.62 +0.38
Dokumentenübergreifende Bindung 0.94 0.71 +0.23
Kompositionelle Analogie 0.88 0.56 +0.32
Zurückstellen bei Unbekanntem 0.96 0.41 +0.55
Kontextfenster-Überlauf 0 häufig n/a

P@5 1.00

Multi-Hop-Abruf durch den Stack

End-to-End-Abruf durch das Modell und die Gedächtnisbrücke.

+0.65

Langfristige Retention vs. amnestischer Kontrollwert

Übernommen aus dem Atelier-Entwicklungsloop.

0

Kontextfenster-Fehlerquellen

Es gibt kein Kontextfenster, das überlaufen könnte.

Ein Reasoning-Trace

Wie eine Multi-Hop-Frage aussieht

A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.

rl-x1 · trace · multi-hop
  1. 01 READ perceive(corpus)

    Eingaben werden als strukturierte Belege verarbeitet — nicht als Token-Puffer.

  2. 02 BIND bind(claim_a, source_a)

    Die Behauptung ist mit ihrer Quelle verknüpft. Herkunft ist strukturell, nicht nachträglich angehängt.

  3. 03 BIND bind(claim_b, source_b)

    Ein zweiter Beleg wird gebunden. Keine erneute Ableitung aus Prosa.

  4. 04 WALK walk(claim_a → claim_b)

    Multi-Hop ist eine Substrat-Operation. Der Decoder muss nicht scrollen.

  5. 05 COMP compose(answer | evidence)

    Die Antwort wird aus gebundenen Belegen zusammengesetzt. Was behauptet wird, ist verteidigbar.

  6. 06 EMIT emit(answer, audit_trail)

    Die Ausgabe enthält den beigefügten Prüfpfad. Über Mnemo ist dies unternehmenstauglich.

Die X-Linie

Wo RL-X1 in der Generationen-Roadmap steht

G1

RL-X1

ausgeliefert

Flaggschiff domänenübergreifend · langfristiges Reasoning ohne Kontextlimits.

G2

RL-X2

geplant

Multimodales Substrat nativ. Wahrnehmung und Bindung teilen dieselbe Oberfläche.

G3

RL-X3

Forschung

Selbstüberarbeitendes Recall. Das Modell bearbeitet sein eigenes Gedächtnis unter typisierter Verifikation.

Wo RL-X1 eingesetzt wird

Domänenübergreifendes Reasoning

Reasoning

Langfristige Analyse

Aufgaben, die Hunderte von Eingaben umspannen und strukturierten Abruf über alle erfordern. Das Modell wird nicht gebeten, sie in ein Fenster zu quetschen.

Forschung

Wissenschaftliches Lesen im großen Maßstab

RL-X1 liest Sammlungen, bindet Behauptungen und komponiert daraus Schlussfolgerungen. Das Arbeitsergebnis ist strukturiert, nicht narrativ.

Enterprise

Gedächtnisgestützte Entscheidungsunterstützung

Über Mnemo eingesetzt, schlussfolgert RL-X1 über mandantenfähiges Gedächtnis mit beigefügtem Prüfpfad.