Modèles · Aperçu de recherche

La plupart des modèles choisissent une architecture.
Celui-ci s'y déplace.

Une architecture sur un axe continu — du rappel parfait à l'attention ciblée, réglée par entrée.

1

Axe continu

2

Coordonnées fusionnées

0.000

Parité aux extrémités

Catégorie

Double axe unifié · génération 1

Architecture

Une coordonnée apprenante, non une conception figée

Contient

Marrow et Loom comme extrémités exactes

Élevé par

Boucle développementale Atelier

Ce qu'est Loominum 1

L'architecture est une coordonnée que le modèle peut déplacer

Loominum repose sur une idée : le choix de l'architecture ne devrait pas être fait une fois avant l'entraînement, puis figé. Sa sortie directrice possède une unique coordonnée de décroissance. À une extrémité, elle reproduit exactement une règle de rappel à poids rapides — Marrow, mémoire parfaite. À mesure que la coordonnée croît, elle devient un champ continu dissipatif — Loom, qui favorise le signal récent et laisse le passé s'estomper. Une seconde coordonnée règle la netteté de l'attention, d'un flou doux à une sélection unique et précise. Le modèle couvre tout cet espace, et l'avantage est de pouvoir se positionner au bon endroit pour la tâche plutôt que de le deviner à l'avance.

Mesuré

Des chiffres, pas des adjectifs

Ancré, moyenné sur plusieurs graines et reproductible. L'axe est prouvé, non affirmé.

0 → 94%

Nomination à vocabulaire ouvert, à partir de zéro

À partir d'environ 300 exemples ancrés par concept. Un modèle neuf et non entraîné score 0 % — c'est donc de l'apprentissage, non de la mémorisation.

+0.044

Fusion double axe sur le meilleur axe unique

La tête fusionnée atteint 0,94 contre 0,90 pour la coordonnée unique la plus forte, sur cinq seeds.

exact

Les extrémités correspondent aux architectures connues

À ses limites, l'axe reproduit les règles à poids rapides et de pooling à zéro numérique près (parité 0,000e+00).

Comment cela fonctionne

Trois idées structurelles

Loominum n'est pas un transformer plus grand, ni un routeur externe. Le polymorphisme réside à l'intérieur de l'équation.

C1

Un axe, de nombreuses architectures

La sortie du champ possède une unique coordonnée de décroissance. À un bout, elle reproduit bit pour bit une règle de rappel à poids rapides ; à l'autre, un champ dissipatif en temps continu. La même équation, déplacée — non deux modèles assemblés.

C2

Deux coordonnées, fusionnées

Une seconde coordonnée contrôle la netteté de l'attention, de la moyenne douce à la sélection quasi-argmax. Les deux sorties fusionnent en une seule tête — l'une apporte la stabilité, l'autre la sélection — et ensemble elles surpassent chacune prise isolément.

C3

Élevé, pas seulement entraîné

Atelier élève Loominum sur des épisodes ancrés dans le réel. Il apprend à nommer le monde à partir de quelques centaines d'exemples par concept, et ce qu'il apprend survit à l'effacement de sa mémoire rapide — connaissance consolidée, non table de correspondance.

Des preuves, pas des adjectifs

Pourquoi nous pouvons affirmer tout cela sans ciller

L'axe continu est une affirmation facile à énoncer et difficile à étayer. Voici ce qui la soutient.

P1 0.000e+00

Les extrémités sont exactes

Faites glisser la coordonnée vers une limite et le modèle reproduit une règle de rappel à poids rapides bit pour bit ; faites-la glisser vers l'autre et il devient un champ dissipatif en temps continu. Les extrémités correspondent à des conceptions connues jusqu'au zéro numérique — non pas approximativement, mais exactement.

P2 5 / 5 graines

La fusion surpasse chacune prise seule

Les deux coordonnées fusionnent en une seule tête — l'une apporte la stabilité, l'autre la sélection. Le modèle fusionné surpasse la coordonnée individuelle la plus forte sur chacune des graines testées, pas seulement en moyenne.

P3 survit à la réinitialisation

Appris, non consulté

Effacez la mémoire rapide du modèle et il nomme encore des instances retenues et bruitées qu'il n'a jamais vues à ce réglage. Ce qu'il a appris s'est consolidé en une structure durable — une table de correspondance ne peut pas faire cela.

P4 ancré

Élevé, non distillé

Atelier élève Loominum sur des épisodes ancrés — une poignée d'exemples par concept, avec une consolidation semblable au sommeil — au lieu de copier le texte d'un modèle plus grand. Il mérite ses connaissances.

Où Loominum s'intègre

Un seul modèle à la place d'une étagère entière

Recherche

Un curseur entre les architectures

Plutôt que de s'engager sur une conception avant l'entraînement, déplacez-vous le long de l'axe et mesurez là où la tâche souhaite réellement se positionner. L'architecture devient quelque chose que vous ajustez, non quelque chose que vous devinez.

Recherche

Adaptation par entrée

Loominum peut inférer sa propre coordonnée de rappel à partir de la forme du signal — s'appuyant sur la mémoire ou sur la récence selon ce que l'entrée demande — capturant presque tout le gain qu'offrirait une coordonnée définie manuellement.

Edge

Moteur partagé avec la ligne silicium

Construit sur le même champ dissipatif que RL-L1 et le silicium Obsidian, de sorte que le modèle et le substrat convergent vers une seule physique plutôt que deux.