+0.65 ± 0.02
Vantagem de retenção ao longo da vida
Execuções de consolidação vs. controlos amnésicos, multissemente.
Uma arquitetura num eixo contínuo, criada sobre a stack.
Explorar LoominumEmpresa
Investigação
Ciência
Sobre
Cognição · Investigação ativa
Um treinador desenvolvimental para substratos de cognição — enraizamento, não memorização.
“como mi madre” — primeiro enraizar, depois generalizar.
O que é o Atelier
O Atelier assenta na convicção de que a forma certa de treinar um substrato é a forma como se cria uma criança: percecionando, produzindo, sendo corrigido, vinculando e consolidando, tudo num programa de duas escalas temporais. É o maestro que liga o substrato, a memória estruturada, a framework de ajuste fino e o ginásio cognitivo num único currículo — e a camada onde medimos se esse currículo produz de facto comportamento fundamentado em vez de uma tabela de consulta.
O maestro liga o substrato, a memória estruturada, a framework de ajuste fino e o ginásio cognitivo num único ciclo de criação — e o verificador fica no centro, para que o progresso nunca seja falseado.
O ciclo
As constantes são os passos. O que muda é o mundo em que o aluno é criado.
As evidências chegam a partir de uma ou mais modalidades — incluindo um canal de recursos em direto.
O aluno age sob um objetivo de produção fundamentado. Sem caminhos de atalho.
Um verificador de implicação tipado verifica a produção. Sem recompensas falseadas.
Os sucessos vinculam-se à memória estruturada com troca de papéis e recuperação em múltiplos saltos.
Um passo CLS de duas escalas temporais integra a vinculação numa identidade ao longo da vida.
Marcos
Três percursos de criação comparados isoladamente. O treino fundamentado tradicional funciona; um atalho por destilação colapsa numa consulta; o ciclo desenvolvimental fundamenta o mundo de forma limpa.
Um verificador de implicação tipado sem mascaramento de recurso. A recompensa torna-se NaN quando a implicação se torna NaN. Caminho arXiv em direto opcional e protegido por autenticação.
As execuções de consolidação retêm todos os mundos anteriores. Os controlos amnésicos esquecem catastroficamente. A diferença mantém-se ao longo das sementes.
Um lote de seis melhorias fechado com barras de erro multissemente. A vinculação relacional fatorizada por slots vence de forma limpa. A afirmação dos priores arquiteturais é falsificada honestamente.
Medido (multissemente, n=5)
+0.65 ± 0.02
Vantagem de retenção ao longo da vida
Execuções de consolidação vs. controlos amnésicos, multissemente.
1.90 ± 0.14 ×
Eficiência amostral do CLS
Programa CLS de duas escalas temporais vs. linha de base de escala única.
+0.36
Vinculação fatorizada por slots vs. ao nível do byte
Recuperação relacional retida, troca de papéis retida.
Confronto direto decisivo
Três percursos de criação sob computação equiparada. O atalho por destilação parece atraente em tarefas de consulta e desaparece na produção fundamentada.
Nota: a vantagem C−B na produção fundamentada = +0.79 ± 0.18 ao longo das sementes. C>A não é limpo (±0.24). A vitória robusta é do método de criação, não da arquitetura.
O que falsificámos
Como o verificador nunca falseia um sinal, o Atelier é também o lugar onde publicamos o que não funciona.
“A arquitetura pós-transformer vence por si só” — falsificado nas mesmas condições de luta justa. Um Transformer convencional externo atingiu 1.00 na nomeação sob computação equiparada. O valor robusto vive no objetivo e na vinculação fatorizada por slots, não na arquitetura.
A recuperação de imprevistos encolheu de uns românticos +0.25 para +0.13 ± 0.09 sob avaliação multissemente. Publicamos o número mais pequeno.
Os caminhos de atalho por destilação parecem atraentes nas execuções iniciais e colapsam numa tabela de consulta sob avaliação retida. Reportado como um aviso ao nível do paradigma.
“Criamos a cognição. Não a ajustamos.”
Onde corre o currículo
O RL-X1 é criado dentro do Atelier. O ciclo é o que transforma o substrato e a memória estruturada num modelo utilizável — não um script de ajuste fino.
Ver o RL-X1 →O programa de duas escalas temporais ao estilo CLS é a base da linha contínua. A retenção ao longo da vida é medida, não pressuposta.
Ver o RL-C1 →Duas falsificações à escala de um paradigma já passaram pelo processo. O verificador é a razão pela qual o nível de exigência de publicação se mantém alto.
Ver avaliações →Disponível através de