Modelos · Geração 1

Um modelo de referência
com o substrato por baixo.

Modelo pós-transformer de referência treinado no substrato ReasonLoom.

ID do modelo
RL-X1.G1.2026
Substrato
Stamen runtime · Heddle memory
Treino
Atelier developmental loop · verificador tipado no ciclo
Limite de contexto
não existe

Categoria

Referência multi-domínio · geração 1

Substrato

Stamen + Heddle

Treinado com

Ciclo desenvolvimental Atelier

Ideal para

Raciocínio de longo horizonte sem limites de contexto

O que é o RL-X1

Um modelo com o substrato por baixo

O RL-X1 é a primeira geração da nossa linha de referência multi-domínio. Não vive dentro de uma janela de contexto. Lê, vincula e compõe através do Heddle, corre sobre o Stamen e é criado pelo Atelier. O resultado é qualidade de raciocínio em tarefas de longo horizonte que vem da arquitetura, não de engenharia de prompts.

A mudança estrutural

Por que a diferença não é "uma janela maior"

Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.

Convencional

Janela de tokens

  • × Memory ceiling = buffer length.
  • × Recall is a scan of attention.
  • × Composition re-derived per turn.
  • × Provenance lives in prose.

RL-X1

Substrato estruturado

  • + No buffer to overflow.
  • + Recall is a substrate primitive.
  • + Composition is bind/walk, not re-read.
  • + Provenance is structural.

O que muda face a um transformer

Três diferenças estruturais

O RL-X1 é interessante pelo que não é — não é um modelo de atenção maior, não é um modelo de tokens-para-tokens, não é um descodificador de passo único.

X1

Sem limite de janela de contexto

A memória vive em ligação estruturada, não num buffer que o descodificador tem de percorrer. As tarefas de longo horizonte deixam de ser um problema de orçamento de tokens.

X2

A composição é um primitivo

O raciocínio sobre analogia, contrafactual e cadeias multi-salto usa a mesma superfície de ligação/evocação. O modelo não tem de re-derivar a estrutura a partir da linguagem em cada turno.

X3

Enraizado pelo treino

O modelo é criado pelo Atelier, com um verificador tipado no ciclo. O que sabe, consegue defender; o que não sabe, difere.

Onde se situa

Avaliação interna

Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.

Família de tarefas RL-X1 Referência convencional Δ
Multi-salto de longo horizonte P@5 1.00 P@5 ~0.62 +0.38
Ligação entre documentos 0.94 0.71 +0.23
Analogia composicional 0.88 0.56 +0.32
Diferimento no desconhecido 0.96 0.41 +0.55
Overflow da janela de contexto 0 frequente n/a

P@5 1.00

Recuperação multi-salto através da stack

Recuperação ponta a ponta através do modelo e da ponte de memória.

+0.65

Retenção vitalícia vs controlo amnésico

Herdada do ciclo desenvolvimental Atelier.

0

Modos de falha por janela de contexto

Não existe janela de contexto para saturar.

Um traço de raciocínio

Como é uma pergunta multi-salto

A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.

rl-x1 · trace · multi-hop
  1. 01 READ perceive(corpus)

    Os dados de entrada chegam como evidência estruturada — não como um buffer de tokens.

  2. 02 BIND bind(claim_a, source_a)

    A afirmação está ligada à sua origem. A proveniência é estrutural, não acrescentada.

  3. 03 BIND bind(claim_b, source_b)

    Uma segunda evidência é vinculada. Sem re-derivação a partir de prosa.

  4. 04 WALK walk(claim_a → claim_b)

    O multi-salto é uma operação do substrato. O descodificador não tem de percorrer a janela.

  5. 05 COMP compose(answer | evidence)

    A resposta é composta a partir de evidências vinculadas. O que se afirma é defensável.

  6. 06 EMIT emit(answer, audit_trail)

    O resultado é entregue com o rasto de auditoria em anexo. Através do Mnemo, está pronto para uso empresarial.

A linha X

Onde o RL-X1 se situa no roteiro de gerações

G1

RL-X1

lançado

Referência multi-domínio · raciocínio de longo horizonte sem limites de contexto.

G2

RL-X2

planeado

Substrato multimodal nativo. Perceção e ligação partilham a mesma superfície.

G3

RL-X3

investigação

Evocação auto-revisível. O modelo edita a sua própria memória sob verificação tipada.

Onde o RL-X1 está a ser utilizado

Raciocínio multi-domínio

Raciocínio

Análise de longo horizonte

Tarefas que abrangem centenas de entradas e precisam de evocação estruturada em todas elas. O modelo não é solicitado a encaixá-las numa janela.

Investigação

Leitura científica à escala

O RL-X1 lê coleções, vincula afirmações e compõe inferências entre elas. O produto do trabalho é estruturado, não narrativo.

Empresas

Apoio à decisão com memória

Utilizado através do Mnemo, o RL-X1 raciocina sobre memória multi-inquilino com o rasto de auditoria em anexo.