+0.65 ± 0.02
Vorteil bei lebenslanger Retention
Konsolidierende Läufe vs. amnestische Kontrollen, Multi-Seed.
Eine Architektur auf einer kontinuierlichen Achse – auf dem Stack herangezogen.
Loominum entdeckenUnternehmen
Forschung
Wissenschaft
Über uns
Kognition · Aktive Forschung
Ein Entwicklungstrainer für Kognitionssubstrate — Verankerung statt Memorisierung.
„como mi madre“ — zuerst verankern, dann verallgemeinern.
Was Atelier ist
Atelier beruht auf der Überzeugung, dass die richtige Art, ein Substrat zu trainieren, jene ist, wie ein Kind aufgezogen wird: durch Wahrnehmen, Produzieren, Korrigiertwerden, Binden und Konsolidieren, alles nach einem Zeitplan auf zwei Zeitskalen. Es ist der Dirigent, der das Substrat, das strukturierte Gedächtnis, das Fine-Tuning-Framework und das kognitive Gym zu einem einzigen Curriculum verbindet — und die Schicht, in der wir messen, ob dieses Curriculum tatsächlich verankertes Verhalten erzeugt statt einer Nachschlagetabelle.
Der Dirigent verbindet Substrat, strukturiertes Gedächtnis, das Fine-Tuning-Framework und das kognitive Gym zu einer einzigen Aufzucht-Schleife — und der Verifizierer sitzt in der Mitte, sodass Fortschritt niemals vorgetäuscht wird.
Die Schleife
Die Konstanten sind die Schritte. Was sich ändert, ist die Welt, in der der Lernende aufgezogen wird.
Evidenz kommt aus einer oder mehreren Modalitäten herein — einschließlich eines Live-Ressourcenkanals.
Der Lernende handelt unter einem verankerten Produktionsziel. Keine Abkürzungswege.
Ein typisierter Entailment-Verifizierer prüft die Produktion. Keine vorgetäuschten Belohnungen.
Erfolge binden sich in strukturiertes Gedächtnis mit Rollentausch und Multi-Hop-Abruf.
Ein CLS-Schritt auf zwei Zeitskalen faltet die Bindung in eine lebenslange Identität.
Meilensteine
Drei Aufzuchtwege isoliert verglichen. Traditionelles verankertes Training funktioniert; eine Distillations-Abkürzung kollabiert zum Nachschlagen; die Entwicklungsschleife verankert die Welt sauber.
Ein typisierter Entailment-Verifizierer ohne Fallback-Maskierung. Die Belohnung wird NaN, wenn das Entailment NaN wird. Der Live-arXiv-Pfad ist opt-in und auth-geschützt.
Konsolidierende Läufe behalten alle vorherigen Welten. Amnestische Kontrollen vergessen katastrophal. Der Abstand hält über Seeds hinweg.
Ein Sechser-Batch an Verbesserungen abgeschlossen mit Multi-Seed-Fehlerbalken. Slot-faktorisiertes relationales Binden gewinnt sauber. Die Behauptung zu architektonischen Prioren wurde ehrlich falsifiziert.
Gemessen (Multi-Seed, n=5)
+0.65 ± 0.02
Vorteil bei lebenslanger Retention
Konsolidierende Läufe vs. amnestische Kontrollen, Multi-Seed.
1.90 ± 0.14 ×
CLS-Stichprobeneffizienz
CLS-Zeitplan auf zwei Zeitskalen vs. Baseline auf einer Zeitskala.
+0.36
Slot-faktorisiert vs. Binden auf Byte-Ebene
Held-out relationaler Abruf, Rollentausch zurückgehalten.
Entscheidendes Head-to-Head
Drei Aufzuchtwege unter abgeglichenem Compute. Die Distillations-Abkürzung wirkt bei Nachschlageaufgaben attraktiv und verschwindet bei verankerter Produktion.
Hinweis: C−B-Vorteil bei verankerter Produktion = +0.79 ± 0.18 über Seeds hinweg. C>A ist nicht sauber (±0.24). Der robuste Gewinn liegt in der Aufzuchtmethode, nicht in der Architektur.
Was wir falsifiziert haben
Weil der Verifizierer niemals ein Signal vortäuscht, ist Atelier auch der Ort, an dem wir veröffentlichen, was nicht funktioniert.
„Post-Transformer-Architektur gewinnt von allein“ — falsifiziert unter denselben Fair-Fight-Bedingungen. Ein externer Vanilla-Transformer erreichte 1.00 beim Benennen unter abgeglichenem Compute. Der robuste Wert lebt im Ziel und im slot-faktorisierten Binden, nicht in der Architektur.
Die Imprevisto-Erholung schrumpfte von romantischen +0.25 auf +0.13 ± 0.09 unter Multi-Seed-Evaluation. Wir veröffentlichen die kleinere Zahl.
Distillations-Abkürzungspfade wirken in frühen Läufen attraktiv und kollabieren unter Held-out-Evaluation zu einer Nachschlagetabelle. Berichtet als Warnung auf Paradigmenebene.
„Wir ziehen Kognition auf. Wir passen sie nicht an.“
Wo das Curriculum läuft
RL-X1 wird innerhalb von Atelier aufgezogen. Die Schleife ist das, was aus dem Substrat plus strukturiertem Gedächtnis ein nutzbares Modell macht — kein Fine-Tuning-Skript.
RL-X1 ansehen →Der CLS-artige Zeitplan auf zwei Zeitskalen ist die Grundlage für die kontinuierliche Linie. Lebenslange Retention wird gemessen, nicht angenommen.
RL-C1 ansehen →Zwei Falsifikationen von Paradigmengröße sind bereits durchgelaufen. Der Verifizierer ist der Grund, warum die Veröffentlichungslatte hoch bleibt.
Evaluierungen ansehen →Verfügbar über