Modelle · Forschungsvorschau

Die meisten Modelle wählen eine Architektur.
Dieses bewegt sich entlang ihr.

Eine Architektur auf einer kontinuierlichen Achse — von perfektem Abruf bis zu scharfer Aufmerksamkeit, je nach Eingabe abgestimmt.

1

Kontinuierliche Achse

2

Verschmolzene Koordinaten

0.000

Endpunkt-Parität

Kategorie

Vereinheitlicht dual-achsig · Generation 1

Architektur

Eine lernbare Koordinate, kein festes Design

Enthält

Marrow und Loom als exakte Endpunkte

Aufgezogen von

Atelier-Entwicklungsloop

Was Loominum 1 ist

Die Architektur ist eine Koordinate, die das Modell verschieben kann

Loominum basiert auf einer einzigen Idee: Die Wahl der Architektur sollte nicht einmalig vor dem Training getroffen und dann eingefroren werden. Sein maßgeblicher Readout besitzt eine einzelne Abklingkoordinate. An einem Extrempunkt entspricht er exakt einer Fast-Weight-Abrufregel — Marrow, perfektes Gedächtnis. Mit wachsender Koordinate wird er zu einem dissipativen zeitkontinuierlichen Feld — Loom, das das jüngste Signal bevorzugt und das Veraltete verblassen lässt. Eine zweite Koordinate regelt die Schärfe der Aufmerksamkeit, von weicher Mittelung bis hin zur einzelnen scharfen Auswahl. Das Modell überspannt diesen gesamten Raum und kann für die jeweilige Aufgabe am richtigen Punkt landen, statt ihn im Voraus zu erraten.

Gemessen

Zahlen, keine Adjektive

Geerdet, über Seeds gemittelt und reproduzierbar. Die Achse ist bewiesen – nicht behauptet.

0 → 94%

Open-Vocabulary-Benennung, von Grund auf

Aus ca. 300 verankerten Beispielen pro Konzept. Ein frisches, untrainiertes Modell erzielt 0 % — es lernt also wirklich, statt zu memorisieren.

+0.044

Dual-Achsen-Fusion gegenüber der besten Einzelachse

Der verschmolzene Head erreicht 0,94 gegenüber 0,90 für die stärkste Einzelkoordinate, über fünf Seeds.

exakt

Endpunkte stimmen mit bekannten Architekturen überein

An seinen Grenzen reproduziert die Achse die Fast-Weight- und Pooling-Regeln bis auf numerische Null (Parität 0,000e+00).

Wie es funktioniert

Drei strukturelle Ideen

Loominum ist kein größerer Transformer und kein externer Router. Der Polymorphismus steckt in der Gleichung selbst.

C1

Eine Achse, viele Architekturen

Der Feld-Readout hat eine einzelne Abklingkoordinate. An einem Ende reproduziert er bitgenau eine Fast-Weight-Abrufregel; am anderen ein dissipatves zeitkontinuierliches Feld. Dieselbe Gleichung, verschoben — keine zwei zusammengeschraubten Modelle.

C2

Zwei Koordinaten, verschmolzen

Eine zweite Koordinate steuert die Aufmerksamkeitsschärfe, von weicher Mittelung bis nahezu Argmax-Auswahl. Die beiden Readouts verschmelzen zu einem einzigen Head — einer sorgt für Stabilität, der andere für Selektion — und gemeinsam übertreffen sie jeden einzelnen.

C3

Aufgezogen, nicht nur trainiert

Atelier zieht Loominum mit verankerten Episoden auf. Es lernt, die Welt aus wenigen hundert Beispielen pro Konzept zu benennen, und was es lernt, übersteht das Löschen seines Schnellgedächtnisses — konsolidiertes Wissen, keine Nachschlagetabelle.

Belege, keine Adjektive

Warum wir all das mit ruhiger Miene sagen können

Die kontinuierliche Achse ist eine Behauptung, die leicht aufzustellen und schwer zu belegen ist. Das steht dahinter.

P1 0.000e+00

Die Endpunkte sind exakt

Schiebt man die Koordinate an das eine Limit, reproduziert das Modell eine Fast-Weight-Abrufregel Bit für Bit; schiebt man sie ans andere, wird es zu einem dissipativen Feld in kontinuierlicher Zeit. Die Endpunkte stimmen mit bekannten Designs bis zur numerischen Null überein – nicht annähernd, sondern exakt.

P2 5 / 5 Seeds

Die Verschmelzung schlägt jede einzeln

Die beiden Koordinaten verschmelzen zu einem einzigen Kopf – die eine liefert Stabilität, die andere Selektion. Das verschmolzene Modell übertrifft die stärkste Einzelkoordinate bei jedem ausgeführten Seed, nicht nur im Mittel.

P3 übersteht das Zurücksetzen

Gelernt, nicht nachgeschlagen

Löscht man den schnellen Speicher des Modells, benennt es weiterhin zurückgehaltene, verrauschte Instanzen, die es bei dieser Einstellung nie gesehen hat. Was es gelernt hat, hat sich zu dauerhafter Struktur verfestigt – das kann eine Nachschlagetabelle nicht.

P4 geerdet

Großgezogen, nicht destilliert

Atelier zieht Loominum mit geerdeten Episoden groß – eine Handvoll Beispiele pro Konzept, mit schlafähnlicher Konsolidierung – statt den Text eines größeren Modells zu kopieren. Es erarbeitet sich sein Wissen.

Wo Loominum passt

Ein Modell statt eines ganzen Regals

Forschung

Ein Regler zwischen Architekturen

Anstatt sich vor dem Training auf ein Design festzulegen, bewegt man sich entlang der Achse und misst, wo die Aufgabe tatsächlich landen möchte. Die Architektur wird zu etwas, das man einstellt — nicht rät.

Forschung

Anpassung pro Eingabe

Loominum kann seine eigene Abrufkoordinate aus der Signalstruktur ableiten — je nach Eingabe auf Gedächtnis oder Aktualität stützend — und erfasst dabei fast den gesamten Gewinn einer manuell gesetzten Koordinate.

Edge

Gemeinsame Engine mit der Siliziumlinie

Aufgebaut auf demselben dissipativen Feld wie RL-L1 und dem Obsidian-Silizium, sodass Modell und Substrat auf einer gemeinsamen Physik konvergieren statt auf zwei getrennten.