Kognition · Aktive Forschung

Ein Trainer, der Kognition aufzieht, statt sie anzupassen.

Ein Entwicklungstrainer für Kognitionssubstrate — Verankerung statt Memorisierung.

Die Schleife ansehen Gemessene Ergebnisse

„como mi madre“ — zuerst verankern, dann verallgemeinern.

Was Atelier ist

Ein Curriculum, kein Fine-Tuning.

Atelier beruht auf der Überzeugung, dass die richtige Art, ein Substrat zu trainieren, jene ist, wie ein Kind aufgezogen wird: durch Wahrnehmen, Produzieren, Korrigiertwerden, Binden und Konsolidieren, alles nach einem Zeitplan auf zwei Zeitskalen. Es ist der Dirigent, der das Substrat, das strukturierte Gedächtnis, das Fine-Tuning-Framework und das kognitive Gym zu einem einzigen Curriculum verbindet — und die Schicht, in der wir messen, ob dieses Curriculum tatsächlich verankertes Verhalten erzeugt statt einer Nachschlagetabelle.

Der Dirigent verbindet Substrat, strukturiertes Gedächtnis, das Fine-Tuning-Framework und das kognitive Gym zu einer einzigen Aufzucht-Schleife — und der Verifizierer sitzt in der Mitte, sodass Fortschritt niemals vorgetäuscht wird.

Die Schleife

Fünf Schritte, jede Episode.

Die Konstanten sind die Schritte. Was sich ändert, ist die Welt, in der der Lernende aufgezogen wird.

AM1
Wahrnehmen

Evidenz kommt aus einer oder mehreren Modalitäten herein — einschließlich eines Live-Ressourcenkanals.
AM2
Produzieren

Der Lernende handelt unter einem verankerten Produktionsziel. Keine Abkürzungswege.
AM3
Korrigieren

Ein typisierter Entailment-Verifizierer prüft die Produktion. Keine vorgetäuschten Belohnungen.
AM4
Binden

Erfolge binden sich in strukturiertes Gedächtnis mit Rollentausch und Multi-Hop-Abruf.
AM5
Konsolidieren

Ein CLS-Schritt auf zwei Zeitskalen faltet die Bindung in eine lebenslange Identität.

Meilensteine

Was wir gemessen haben.

Phase 1

Entscheidendes Head-to-Head gelandet

Drei Aufzuchtwege isoliert verglichen. Traditionelles verankertes Training funktioniert; eine Distillations-Abkürzung kollabiert zum Nachschlagen; die Entwicklungsschleife verankert die Welt sauber.

grounded 1.00shortcut 0.00lookup 1.00
Phase 2

Ehrlicher Verifizierer gebaut

Ein typisierter Entailment-Verifizierer ohne Fallback-Maskierung. Die Belohnung wird NaN, wenn das Entailment NaN wird. Der Live-arXiv-Pfad ist opt-in und auth-geschützt.

no faked NLINaN propagationauth-gated
Phase 4

Lebenslange Identität gemessen

Konsolidierende Läufe behalten alle vorherigen Welten. Amnestische Kontrollen vergessen katastrophal. Der Abstand hält über Seeds hinweg.

forgetting +0.00retention 1.00amnesiac forget +1.00
Heute

Multi-Seed, zwölf Verbesserungen gelandet

Ein Sechser-Batch an Verbesserungen abgeschlossen mit Multi-Seed-Fehlerbalken. Slot-faktorisiertes relationales Binden gewinnt sauber. Die Behauptung zu architektonischen Prioren wurde ehrlich falsifiziert.

n=5slot vs byte +0.36arch-priors falsified

Gemessen (Multi-Seed, n=5)

Verankert, nicht auswendig gelernt.

+0.65 ± 0.02

Vorteil bei lebenslanger Retention

Konsolidierende Läufe vs. amnestische Kontrollen, Multi-Seed.

1.90 ± 0.14 ×

CLS-Stichprobeneffizienz

CLS-Zeitplan auf zwei Zeitskalen vs. Baseline auf einer Zeitskala.

+0.36

Slot-faktorisiert vs. Binden auf Byte-Ebene

Held-out relationaler Abruf, Rollentausch zurückgehalten.

Entscheidendes Head-to-Head

Der B-Kollaps, in einem Diagramm.

Drei Aufzuchtwege unter abgeglichenem Compute. Die Distillations-Abkürzung wirkt bei Nachschlageaufgaben attraktiv und verschwindet bei verankerter Produktion.

A — Traditionell verankert

Standard-LM, verankertes Ziel

1.00

B — Distillations-Abkürzung (verankert)

Kollabiert bei Held-out-Produktion

0.00

B — Dasselbe Modell beim Nachschlagen

Die Abkürzung wird zu einer Tabelle

1.00 (lookup)

C — Entwicklungsschleife

Atelier, CLS auf zwei Zeitskalen

1.00 (loss ≈ 0)

Hinweis: C−B-Vorteil bei verankerter Produktion = +0.79 ± 0.18 über Seeds hinweg. C>A ist nicht sauber (±0.24). Der robuste Gewinn liegt in der Aufzuchtmethode, nicht in der Architektur.

Was wir falsifiziert haben

Negativergebnisse, die wir dennoch veröffentlichen.

Weil der Verifizierer niemals ein Signal vortäuscht, ist Atelier auch der Ort, an dem wir veröffentlichen, was nicht funktioniert.

„Post-Transformer-Architektur gewinnt von allein“ — falsifiziert unter denselben Fair-Fight-Bedingungen. Ein externer Vanilla-Transformer erreichte 1.00 beim Benennen unter abgeglichenem Compute. Der robuste Wert lebt im Ziel und im slot-faktorisierten Binden, nicht in der Architektur.
Die Imprevisto-Erholung schrumpfte von romantischen +0.25 auf +0.13 ± 0.09 unter Multi-Seed-Evaluation. Wir veröffentlichen die kleinere Zahl.
Distillations-Abkürzungspfade wirken in frühen Läufen attraktiv und kollabieren unter Held-out-Evaluation zu einer Nachschlagetabelle. Berichtet als Warnung auf Paradigmenebene.

„Wir ziehen Kognition auf. Wir passen sie nicht an.“

Atelier-Designnotiz

Wo das Curriculum läuft

Wofür Atelier da ist.

Modelle

Training der Flaggschiff-Linien

RL-X1 wird innerhalb von Atelier aufgezogen. Die Schleife ist das, was aus dem Substrat plus strukturiertem Gedächtnis ein nutzbares Modell macht — kein Fine-Tuning-Skript.

RL-X1 ansehen →

Kontinuierlich

Lernende, die nicht vergessen

Der CLS-artige Zeitplan auf zwei Zeitskalen ist die Grundlage für die kontinuierliche Linie. Lebenslange Retention wird gemessen, nicht angenommen.

RL-C1 ansehen →

Forschung

Eine Plattform für ehrliche Negativergebnisse

Zwei Falsifikationen von Paradigmengröße sind bereits durchgelaufen. Der Verifizierer ist der Grund, warum die Veröffentlichungslatte hoch bleibt.

Evaluierungen ansehen →

Verfügbar über

Forschung

Alle Technologien →

Loominum^™ 1.0

Produktionsreife Systeme

Die Loominum-Familie

Lösungen

Mehr erfahren

Offene Fragen, denen wir nachgehen

Forschungswerkzeuge

Forschungsbereiche

Mehr erfahren

Die zugrunde liegenden Invarianten aufdecken

Wissenschaftswerkzeuge

Felder

Mehr erfahren

Unsere Mission ist es, überprüfbare Intelligenz zu entwickeln, die die Wissenschaft voranbringt und der Menschheit dient.

Unternehmen

Mehr erfahren

Ein Trainer, der Kognition aufzieht, statt sie anzupassen.

Ein Curriculum, kein Fine-Tuning.

Fünf Schritte, jede Episode.

Wahrnehmen

Produzieren

Korrigieren

Binden

Konsolidieren

Was wir gemessen haben.

Entscheidendes Head-to-Head gelandet

Ehrlicher Verifizierer gebaut

Lebenslange Identität gemessen

Multi-Seed, zwölf Verbesserungen gelandet

Verankert, nicht auswendig gelernt.

Der B-Kollaps, in einem Diagramm.

Negativergebnisse, die wir dennoch veröffentlichen.

Wofür Atelier da ist.

Training der Flaggschiff-Linien

Lernende, die nicht vergessen

Eine Plattform für ehrliche Negativergebnisse

Forschung

Cookie-Einstellungen

Unbedingt erforderlich

Ein Trainer, der Kognition aufzieht, statt sie anzupassen.

Ein Curriculum, kein Fine-Tuning.

Wahrnehmen

Produzieren

Korrigieren

Binden

Konsolidieren

Entscheidendes Head-to-Head gelandet

Ehrlicher Verifizierer gebaut

Lebenslange Identität gemessen

Multi-Seed, zwölf Verbesserungen gelandet

Training der Flaggschiff-Linien

Lernende, die nicht vergessen

Eine Plattform für ehrliche Negativergebnisse

Strukturiertes Gedächtnis

Schlussfolgern unter realen Bedingungen messen

Sicherheitsmethoden für agentische Systeme

Forschung