Kognition · Aktive Forschung

Ein Trainer, der Kognition aufzieht, statt sie anzupassen.

Ein Entwicklungstrainer für Kognitionssubstrate — Verankerung statt Memorisierung.

„como mi madre“ — zuerst verankern, dann verallgemeinern.

Was Atelier ist

Ein Curriculum, kein Fine-Tuning.

Atelier beruht auf der Überzeugung, dass die richtige Art, ein Substrat zu trainieren, jene ist, wie ein Kind aufgezogen wird: durch Wahrnehmen, Produzieren, Korrigiertwerden, Binden und Konsolidieren, alles nach einem Zeitplan auf zwei Zeitskalen. Es ist der Dirigent, der das Substrat, das strukturierte Gedächtnis, das Fine-Tuning-Framework und das kognitive Gym zu einem einzigen Curriculum verbindet — und die Schicht, in der wir messen, ob dieses Curriculum tatsächlich verankertes Verhalten erzeugt statt einer Nachschlagetabelle.

Der Dirigent verbindet Substrat, strukturiertes Gedächtnis, das Fine-Tuning-Framework und das kognitive Gym zu einer einzigen Aufzucht-Schleife — und der Verifizierer sitzt in der Mitte, sodass Fortschritt niemals vorgetäuscht wird.

Die Schleife

Fünf Schritte, jede Episode.

Die Konstanten sind die Schritte. Was sich ändert, ist die Welt, in der der Lernende aufgezogen wird.

  1. AM1

    Wahrnehmen

    Evidenz kommt aus einer oder mehreren Modalitäten herein — einschließlich eines Live-Ressourcenkanals.

  2. AM2

    Produzieren

    Der Lernende handelt unter einem verankerten Produktionsziel. Keine Abkürzungswege.

  3. AM3

    Korrigieren

    Ein typisierter Entailment-Verifizierer prüft die Produktion. Keine vorgetäuschten Belohnungen.

  4. AM4

    Binden

    Erfolge binden sich in strukturiertes Gedächtnis mit Rollentausch und Multi-Hop-Abruf.

  5. AM5

    Konsolidieren

    Ein CLS-Schritt auf zwei Zeitskalen faltet die Bindung in eine lebenslange Identität.

Meilensteine

Was wir gemessen haben.

  1. Phase 1

    Entscheidendes Head-to-Head gelandet

    Drei Aufzuchtwege isoliert verglichen. Traditionelles verankertes Training funktioniert; eine Distillations-Abkürzung kollabiert zum Nachschlagen; die Entwicklungsschleife verankert die Welt sauber.

    grounded 1.00shortcut 0.00lookup 1.00
  2. Phase 2

    Ehrlicher Verifizierer gebaut

    Ein typisierter Entailment-Verifizierer ohne Fallback-Maskierung. Die Belohnung wird NaN, wenn das Entailment NaN wird. Der Live-arXiv-Pfad ist opt-in und auth-geschützt.

    no faked NLINaN propagationauth-gated
  3. Phase 4

    Lebenslange Identität gemessen

    Konsolidierende Läufe behalten alle vorherigen Welten. Amnestische Kontrollen vergessen katastrophal. Der Abstand hält über Seeds hinweg.

    forgetting +0.00retention 1.00amnesiac forget +1.00
  4. Heute

    Multi-Seed, zwölf Verbesserungen gelandet

    Ein Sechser-Batch an Verbesserungen abgeschlossen mit Multi-Seed-Fehlerbalken. Slot-faktorisiertes relationales Binden gewinnt sauber. Die Behauptung zu architektonischen Prioren wurde ehrlich falsifiziert.

    n=5slot vs byte +0.36arch-priors falsified

Gemessen (Multi-Seed, n=5)

Verankert, nicht auswendig gelernt.

+0.65 ± 0.02

Vorteil bei lebenslanger Retention

Konsolidierende Läufe vs. amnestische Kontrollen, Multi-Seed.

1.90 ± 0.14 ×

CLS-Stichprobeneffizienz

CLS-Zeitplan auf zwei Zeitskalen vs. Baseline auf einer Zeitskala.

+0.36

Slot-faktorisiert vs. Binden auf Byte-Ebene

Held-out relationaler Abruf, Rollentausch zurückgehalten.

Entscheidendes Head-to-Head

Der B-Kollaps, in einem Diagramm.

Drei Aufzuchtwege unter abgeglichenem Compute. Die Distillations-Abkürzung wirkt bei Nachschlageaufgaben attraktiv und verschwindet bei verankerter Produktion.

A — Traditionell verankert

Standard-LM, verankertes Ziel

1.00

B — Distillations-Abkürzung (verankert)

Kollabiert bei Held-out-Produktion

0.00

B — Dasselbe Modell beim Nachschlagen

Die Abkürzung wird zu einer Tabelle

1.00 (lookup)

C — Entwicklungsschleife

Atelier, CLS auf zwei Zeitskalen

1.00 (loss ≈ 0)

Hinweis: C−B-Vorteil bei verankerter Produktion = +0.79 ± 0.18 über Seeds hinweg. C>A ist nicht sauber (±0.24). Der robuste Gewinn liegt in der Aufzuchtmethode, nicht in der Architektur.

Was wir falsifiziert haben

Negativergebnisse, die wir dennoch veröffentlichen.

Weil der Verifizierer niemals ein Signal vortäuscht, ist Atelier auch der Ort, an dem wir veröffentlichen, was nicht funktioniert.

„Wir ziehen Kognition auf. Wir passen sie nicht an.“
Atelier-Designnotiz

Wo das Curriculum läuft

Wofür Atelier da ist.

Modelle

Training der Flaggschiff-Linien

RL-X1 wird innerhalb von Atelier aufgezogen. Die Schleife ist das, was aus dem Substrat plus strukturiertem Gedächtnis ein nutzbares Modell macht — kein Fine-Tuning-Skript.

RL-X1 ansehen →
Kontinuierlich

Lernende, die nicht vergessen

Der CLS-artige Zeitplan auf zwei Zeitskalen ist die Grundlage für die kontinuierliche Linie. Lebenslange Retention wird gemessen, nicht angenommen.

RL-C1 ansehen →
Forschung

Eine Plattform für ehrliche Negativergebnisse

Zwei Falsifikationen von Paradigmengröße sind bereits durchgelaufen. Der Verifizierer ist der Grund, warum die Veröffentlichungslatte hoch bleibt.

Evaluierungen ansehen →

Verfügbar über

Forschung

Alle Technologien →