Modelos · Investigación activa

Un modelo insignia
con el sustrato debajo.

Modelo post-transformer insignia, entrenado sobre el sustrato ReasonLoom.

ID de modelo
RL-X1.G1.2026
Sustrato
Runtime Stamen · memoria Heddle
Entrenamiento
Bucle de desarrollo Atelier · verificador tipado en bucle
Límite de contexto
no existe

Categoría

Insignia transversal · generación 1

Sustrato

Stamen + Heddle

Entrenado con

Bucle de desarrollo Atelier

Ideal para

Razonamiento a largo horizonte sin límites de contexto

Qué es RL-X1

Un modelo con el sustrato debajo

RL-X1 es la primera generación de nuestra línea insignia transversal. No vive dentro de una ventana de contexto. Lee, vincula y compone a través de Heddle, se ejecuta sobre Stamen y es criado por Atelier. El resultado es una calidad de razonamiento en tareas de largo horizonte que proviene de la arquitectura, no de la ingeniería de prompts.

El cambio estructural

Por qué la diferencia no es «una ventana más grande»

Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.

Convencional

Ventana de tokens

  • × Memory ceiling = buffer length.
  • × Recall is a scan of attention.
  • × Composition re-derived per turn.
  • × Provenance lives in prose.

RL-X1

Sustrato estructurado

  • + No buffer to overflow.
  • + Recall is a substrate primitive.
  • + Composition is bind/walk, not re-read.
  • + Provenance is structural.

Qué cambia respecto a un transformer

Tres diferencias estructurales

RL-X1 es interesante por lo que no es — no es un modelo de atención más grande, no es un modelo de tokens-entrada-tokens-salida, no es un decodificador de un solo paso.

X1

Sin techo de ventana de contexto

La memoria vive en binding estructurado, no en un buffer por el que el decodificador tiene que desplazarse. Las tareas de largo horizonte dejan de ser un problema de presupuesto de tokens.

X2

La composición es un primitivo

El razonamiento sobre analogía, contrafáctico y cadenas multi-salto usa la misma superficie de bind/recall. El modelo no tiene que re-derivar la estructura desde el lenguaje en cada turno.

X3

Arraigado por el entrenamiento

El modelo es criado por Atelier, con un verificador tipado en el bucle. Lo que sabe, puede defenderlo; lo que no sabe, lo difiere.

Dónde se sitúa

Evaluación interna

Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.

Familia de tareas RL-X1 Línea base convencional Δ
Multi-salto a largo horizonte P@5 1.00 P@5 ~0.62 +0.38
Binding entre documentos 0.94 0.71 +0.23
Analogía composicional 0.88 0.56 +0.32
Diferir ante lo desconocido 0.96 0.41 +0.55
Desbordamiento de ventana de contexto 0 frecuente n/a

P@5 1.00

Recuperación multi-salto a través del stack

Recuperación de extremo a extremo a través del modelo y el puente de memoria.

+0.65

Retención de por vida frente al control amnésico

Heredado del bucle de desarrollo de Atelier.

0

Modos de fallo por ventana de contexto

No hay ventana de contexto que desbordarse.

Una traza de razonamiento

Cómo es una pregunta multi-salto

A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.

rl-x1 · trace · multi-hop
  1. 01 READ perceive(corpus)

    Las entradas llegan como evidencia estructurada — no como un buffer de tokens.

  2. 02 BIND bind(claim_a, source_a)

    La afirmación queda ligada a su origen. La procedencia es estructural, no añadida.

  3. 03 BIND bind(claim_b, source_b)

    Un segundo fragmento de evidencia queda vinculado. Sin re-derivación desde la prosa.

  4. 04 WALK walk(claim_a → claim_b)

    El multi-salto es una operación del sustrato. El decodificador no tiene que desplazarse.

  5. 05 COMP compose(answer | evidence)

    La respuesta se construye desde evidencia vinculada. Lo que se afirma es defendible.

  6. 06 EMIT emit(answer, audit_trail)

    La salida se entrega con la traza de auditoría adjunta. A través de Mnemo, esto es apto para empresa.

La línea X

Dónde encaja RL-X1 en el plan de generaciones

G1

RL-X1

lanzado

Insignia transversal · razonamiento a largo horizonte sin límites de contexto.

G2

RL-X2

planificado

Sustrato multimodal nativo. Percepción y binding comparten la misma superficie.

G3

RL-X3

investigación

Recuerdo auto-revisable. El modelo edita su propia memoria bajo verificación tipada.

Dónde se usa RL-X1

Razonamiento transversal

Razonamiento

Análisis a largo horizonte

Tareas que abarcan cientos de entradas y necesitan recuerdo estructurado de todas ellas. Al modelo no se le pide que las encaje en una ventana.

Investigación

Lectura científica a escala

RL-X1 lee colecciones, vincula afirmaciones y compone inferencias entre ellas. El producto del trabajo es estructurado, no narrativo.

Empresa

Apoyo a la decisión con memoria

Usado a través de Mnemo, RL-X1 razona sobre memoria multi-tenant con la traza de auditoría adjunta.