Modelli · Generazione 1

Un modello di punta
con il substrato sottostante.

Modello post-transformer di punta addestrato sul substrato ReasonLoom.

ID modello
RL-X1.G1.2026
Substrato
Stamen runtime · Heddle memory
Addestramento
Ciclo evolutivo Atelier · verificatore tipizzato nel loop
Limite di contesto
non esiste

Categoria

Cross-domain di punta · generazione 1

Substrato

Stamen + Heddle

Addestrato con

Ciclo evolutivo Atelier

Ideale per

Ragionamento a lungo orizzonte senza limiti di contesto

Cos'e RL-X1

Un modello con il substrato sottostante

RL-X1 e la prima generazione della nostra linea di punta cross-domain. Non vive dentro una finestra di contesto. Legge, vincola e compone tramite Heddle, gira su Stamen ed e cresciuto da Atelier. Il risultato e una qualita di ragionamento sui task a lungo orizzonte che deriva dall'architettura, non dall'ingegneria del prompt.

Il cambio strutturale

Perche la differenza non e "una finestra piu grande"

Conventional models scale by extending an attention buffer. RL-X1 does not have one to extend. The work that the window used to do is done by the substrate instead.

Convenzionale

Finestra di token

  • × Memory ceiling = buffer length.
  • × Recall is a scan of attention.
  • × Composition re-derived per turn.
  • × Provenance lives in prose.

RL-X1

Substrato strutturato

  • + No buffer to overflow.
  • + Recall is a substrate primitive.
  • + Composition is bind/walk, not re-read.
  • + Provenance is structural.

Cosa cambia rispetto a un transformer

Tre differenze strutturali

RL-X1 e interessante per cio che non e: non un modello di attenzione piu grande, non un modello token-in-token-out, non un decoder one-shot.

X1

Nessun limite di finestra di contesto

La memoria vive nel binding strutturato, non in un buffer che il decoder deve scorrere. I task a lungo orizzonte smettono di essere un problema di budget di token.

X2

La composizione e un primitivo

Il ragionamento su analogie, controfattuali e catene multi-hop usa la stessa superficie bind/recall. Il modello non deve ri-derivare la struttura dal linguaggio ad ogni turno.

X3

Radicato dall'addestramento

Il modello e cresciuto da Atelier, con un verificatore tipizzato nel loop. Cio che sa, puo difenderlo; cio che non sa, lo differisce.

Dove si colloca

Valutazione interna

Numbers are internal — the suites and conditions are documented in the evaluation programme. The pattern, not any single value, is what we report.

Famiglia di task RL-X1 Baseline convenzionale Δ
Multi-hop a lungo orizzonte P@5 1.00 P@5 ~0.62 +0.38
Binding tra documenti 0.94 0.71 +0.23
Analogia composizionale 0.88 0.56 +0.32
Deferimento sugli sconosciuti 0.96 0.41 +0.55
Overflow della finestra di contesto 0 frequente n/a

P@5 1.00

Recupero multi-hop attraverso lo stack

Recupero end-to-end attraverso il modello e il ponte di memoria.

+0.65

Ritenzione a vita vs controllo amnesico

Ereditato dal ciclo evolutivo Atelier.

0

Modi di fallimento della finestra di contesto

Non esiste una finestra di contesto da riempire in eccesso.

Una traccia di ragionamento

Come appare una domanda multi-hop

A question that would force a conventional model to scroll its window becomes a sequence of substrate operations.

rl-x1 · trace · multi-hop
  1. 01 READ perceive(corpus)

    Gli input arrivano come evidenze strutturate, non come buffer di token.

  2. 02 BIND bind(claim_a, source_a)

    Il claim e legato alla sua origine. La provenienza e strutturale, non aggiunta in seguito.

  3. 03 BIND bind(claim_b, source_b)

    Una seconda evidenza viene vincolata. Nessuna ri-derivazione dalla prosa.

  4. 04 WALK walk(claim_a → claim_b)

    Il multi-hop e un'operazione del substrato. Il decoder non deve scorrere.

  5. 05 COMP compose(answer | evidence)

    La risposta e composta da evidenze vincolate. Cio che viene affermato e difendibile.

  6. 06 EMIT emit(answer, audit_trail)

    L'output viene consegnato con la traccia di audit allegata. Tramite Mnemo, questo e pronto per l'impresa.

La linea X

Dove si colloca RL-X1 nella roadmap generazionale

G1

RL-X1

rilasciato

Cross-domain di punta · ragionamento a lungo orizzonte senza limiti di contesto.

G2

RL-X2

pianificato

Substrato nativo multimodale. Percezione e binding condividono la stessa superficie.

G3

RL-X3

ricerca

Richiamo auto-revisionante. Il modello modifica la propria memoria sotto verifica tipizzata.

Dove viene utilizzato RL-X1

Ragionamento cross-domain

Ragionamento

Analisi a lungo orizzonte

Task che attraversano centinaia di input e richiedono richiamo strutturato su tutti. Al modello non viene chiesto di farli stare in una finestra.

Ricerca

Lettura scientifica su larga scala

RL-X1 legge collezioni, vincola affermazioni e compone inferenze tra di esse. Il prodotto del lavoro e strutturato, non narrativo.

Impresa

Supporto decisionale con memoria

Utilizzato tramite Mnemo, RL-X1 ragiona su memoria multi-tenant con la traccia di audit allegata.