场域

认知与记忆

认知地图、结构化绑定，以及大脑的组合方式——应用于人工认知研究。

范畴认知地图 · 绑定 · 终身身份

方法多种子 A/B 测试,并公布负面结果

产出具有区分力的任务,而非排行榜

结构化地图 · 实体被绑定到角色,而非折叠进一个扁平的嵌入空间

为何认知是一项科学项目

作为组合式底层的认知地图

越来越多的神经科学研究表明，认知由结构化地图所支撑——这些地图将实体绑定到角色，并跨领域进行组合。我们的科学项目认真对待这一点：我们构建共享这些组织原则的人工系统，并用专门设计来区分组合与记忆的任务来加以评测。

大多数模型

把实体、角色与世界折叠进单一的嵌入空间,并寄望于更深的网络能再次将它们解开。

我们的押注

认知地图将实体、角色与世界视为彼此独立的结构性对象,而我们用那些一旦折叠便会受到惩罚的任务来加以评测。

三个视角

科学与系统交汇之处

认知地图

作为类比与反事实推理底层的结构化地图，取自神经科学，并以我们自有的记忆库加以检验。

奖励支撑类比与反事实推理的认知结构惩罚看起来像训练集的扁平嵌入

绑定

角色—填充物绑定在角色互换与留出评测下的表现——以及当它失效时会暴露出什么。

奖励在角色互换与留出组合下依然成立的绑定惩罚通过了独立同分布、却在置换下失败的系统

终身身份

长期记忆如何在不覆写早期世界的前提下进行巩固，并以遗忘型对照加以衡量。

奖励在学习新世界的同时巩固早期世界的记忆惩罚被包装成持续学习的近因偏置

置换下的绑定

槽位分解对比字节级,实测对照

留出数据、多种子。同一模型类别在两种绑定机制下接受评测。在系统拥有显式槽位之处,角色互换与留出组合并不构成对抗性挑战。

任务槽位分解字节级备注

compositional 0.96 0.14 held-out role-filler combinations · n=5

relational 0.99 0.63 simple subject-verb-object scenes · n=5

role-swap 1.00 0.60 identical content, roles permuted · n=5

naming 1.00 0.00 name-targeted prefix-LM, held-out · n=5

制胜的是绑定机制,而非架构。我们在两列中评测同一主干家族,从而让对比能够分离出结构性选择本身的影响。

终身身份

巩固,而非覆写

进行巩固的控制器会保留它见过的每一个世界。一个遗忘型控制器——相同数据、相同算力、不做巩固——会在新世界到来时丢失早期的世界。

n=5 种子 · 相同数据、相同算力,巩固规则是唯一变动的维度。

诚实的负面结果

什么没能挺过一次干净的 A/B 测试

挺过来的押注落在目标函数与绑定上。当某个诱人的架构性主张没能挺过时,我们会在本页面如实说明。

负面结果

在连续性上的公平较量是一个负面结果

在两个主干共享同一学习规则的干净 A/B 测试下,发育式底层并未在终身留存上胜过一个强大的 Transformer。我们如实说明。

实测 · retain 0.66 ± 0.25 vs 0.94 ± 0.03

负面结果

命名并不取决于架构

Transformer 在同一套测试框架上达到了完美的命名得分。命名上的制胜在于目标函数与训练方式,而非底层。

实测 · transformer naming = 1.00 held-out

负面结果

C > A 并不干净

在 n=5 种子上,发育式与强基线之间的差距远在误差棒之内。我们在那里并不主张底层取胜。

实测 · gap inside ± 0.24

一项科学押注，以诚实的方式评测

我们公布负面结果。当某个架构先验的主张没能挺过一次干净的 A/B 测试时，我们会如实说明。挺过来的押注落在目标函数与绑定上，而非取决于你在其上贴了哪种底层。

横向贯通

认知是其余一切赖以立足的底层

同一套绑定与巩固原语贯穿我们的各个研究项目——结构化记忆、评测、对齐——并体现在我们交付的每一个长期运行的生产系统中。

结构化记忆 → 评测库 → 全部科学领域 →

Loominum^™ 1.0

生产级系统

Loominum 家族

解决方案

了解更多

我们正在深入探索的开放问题

研究工具

研究方向

了解更多

探寻底层不变规律

科学工具

领域

了解更多

我们的使命是构建可验证的智能，推动科学进步并服务于人类。

公司

了解更多

认知与记忆

作为组合式底层的认知地图

科学与系统交汇之处

认知地图

绑定

终身身份

槽位分解对比字节级,实测对照

巩固,而非覆写

什么没能挺过一次干净的 A/B 测试

在连续性上的公平较量是一个负面结果

命名并不取决于架构

C > A 并不干净

一项科学押注，以诚实的方式评测

认知是其余一切赖以立足的底层

Cookie 偏好设置

严格必要