Modelos · Pré-visualização de investigação

A maioria dos modelos escolhe uma arquitetura.
Este move-se ao longo dela.

Uma arquitetura num eixo contínuo — desde a evocação perfeita à atenção precisa, ajustada por entrada.

1

Eixo contínuo

2

Coordenadas fundidas

0.000

Paridade nos extremos

Categoria

Eixo duplo unificado · geração 1

Arquitetura

Uma coordenada aprendível, não um design fixo

Contém

Marrow e Loom como extremos exatos

Criado por

Ciclo desenvolvimental Atelier

O que é o Loominum 1

A arquitetura é uma coordenada que o modelo pode mover

O Loominum assenta numa ideia: a escolha de arquitetura não deve ser feita uma única vez, antes do treino, e depois congelada. O seu readout de governação tem uma única coordenada de decaimento. Num extremo é exatamente uma regra de evocação por pesos rápidos — Marrow, memória perfeita. À medida que a coordenada cresce, torna-se um campo dissipativo em tempo contínuo — Loom, que privilegia o sinal recente e deixa o obsoleto desvanecer. Uma segunda coordenada define a nitidez da atenção, desde um desfoque suave até uma seleção única e precisa. O modelo abrange todo esse espaço, e a vantagem está em poder aterrar no ponto certo para a tarefa em vez de o adivinhar à partida.

Medido

Números, não adjetivos

Ancorado no mundo, calculado em média sobre seeds e reproduzível. O eixo está provado, não afirmado.

0 → 94%

Nomeação de vocabulário aberto, de raiz

A partir de ~300 exemplos enraizados por conceito. Um modelo fresco e não treinado obtém 0% — logo, está a aprender, não a memorizar.

+0.044

Fusão de eixo duplo face ao melhor eixo simples

A cabeça fundida atinge 0,94 face a 0,90 para a coordenada simples mais forte, em cinco sementes.

exact

Os extremos correspondem a arquiteturas conhecidas

Nos seus limites, o eixo reproduz as regras de pesos rápidos e de pooling até ao zero numérico (paridade 0.000e+00).

Como funciona

Três ideias estruturais

O Loominum não é um transformer maior nem um router externo. O polimorfismo vive dentro da equação.

C1

Um eixo, muitas arquiteturas

O readout do campo tem uma única coordenada de decaimento. Num extremo reproduz uma regra de evocação por pesos rápidos bit a bit; no outro, um campo dissipativo em tempo contínuo. A mesma equação, deslocada — não dois modelos unidos à força.

C2

Duas coordenadas, fundidas

Uma segunda coordenada controla a nitidez da atenção, desde a média suave até à seleção próxima do argmax. Os dois readouts fundem-se numa única cabeça — um dá estabilidade, o outro dá seleção — e juntos superam qualquer um isolado.

C3

Criado, não apenas treinado

O Atelier cria o Loominum em episódios enraizados. Aprende a nomear o mundo a partir de algumas centenas de exemplos por conceito, e o que aprende sobrevive ao apagamento da sua memória rápida — conhecimento consolidado, não uma tabela de consulta.

Provas, não adjetivos

Porque podemos dizer tudo isto sem pestanejar

O eixo contínuo é uma afirmação fácil de fazer e difícil de sustentar. Eis o que a suporta.

P1 0.000e+00

Os extremos são exatos

Desloque a coordenada até um limite e o modelo reproduz uma regra de recordação de pesos rápidos bit a bit; desloque-a até ao outro e torna-se um campo dissipativo em tempo contínuo. Os extremos coincidem com desenhos conhecidos até ao zero numérico — não de forma aproximada, mas exata.

P2 5 / 5 seeds

A fusão supera qualquer uma isolada

As duas coordenadas fundem-se numa só cabeça — uma dá estabilidade, a outra seleção. O modelo fundido supera a coordenada individual mais forte em cada seed que executámos, não apenas em média.

P3 sobrevive à reposição

Aprendido, não consultado

Limpe a memória rápida do modelo e ele continua a nomear instâncias retidas e ruidosas que nunca viu nessa configuração. O que aprendeu consolidou-se numa estrutura duradoura — uma tabela de consulta não consegue fazer isso.

P4 ancorado

Criado, não destilado

O Atelier cria o Loominum com episódios ancorados no mundo — um punhado de exemplos por conceito, com consolidação semelhante ao sono — em vez de copiar o texto de um modelo maior. Conquista o seu conhecimento.

Onde o Loominum se enquadra

Um modelo em vez de uma prateleira deles

Investigação

Um seletor entre arquiteturas

Em vez de se comprometer com um design antes do treino, desloca-se ao longo do eixo e mede onde a tarefa realmente quer situar-se. A arquitetura torna-se algo que se afina, não algo que se adivinha.

Investigação

Adaptação por entrada

O Loominum pode inferir a sua própria coordenada de evocação a partir da forma do sinal — apoiando-se na memória ou na recência conforme a entrada o exige — capturando quase todo o ganho que uma coordenada definida manualmente daria.

Edge

Motor partilhado com a linha de silício

Construído sobre o mesmo campo dissipativo que o RL-L1 e o silício Obsidian, para que o modelo e o substrato convirjam numa só física em vez de duas.