Komprimieren, nicht auswendig lernen
Wir streben nach kompakten Mechanismen, die wie die Gesetze der Physik aussehen, nicht nach Einbettungen, die wie die Daten aussehen.
Eine Architektur auf einer kontinuierlichen Achse – auf dem Stack herangezogen.
Loominum entdeckenUnternehmen
Forschung
Wissenschaft
Über uns
Komprimierung der physikalischen Gesetze unterhalb der Proteindynamik zu physikalisch invarianten Signalen.
Holobiont ist ein Wissenschaftsprogramm, das um eine bestimmte Idee herum aufgebaut ist: Unterhalb der Proteindynamik liegen physikalisch invariante Signale, die sich besser komprimieren lassen als jede Menge an Auswendiglernen. Wir verfolgen diese Signale, prüfen sie schonungslos gegen Retrieval-Achsen-Leckage und veröffentlichen die Negativergebnisse, wenn sich ein attraktives Merkmal als Messartefakt herausstellt.
fügen Merkmale hinzu, bis sich das Leaderboard bewegt, und liefern das Leaderboard aus, selbst wenn der Zugewinn ein strukturelles Artefakt ist.
verzerrt die Pipeline hin zu Merkmalen, die wie Physik aussehen — kompakt, invariant, prüfbar — und mustert den Rest aus, bevor er in die Produktion gelangt.
Wir streben nach kompakten Mechanismen, die wie die Gesetze der Physik aussehen, nicht nach Einbettungen, die wie die Daten aussehen.
Vorab berechnete Retrieval-Achsen sind notorisch anfällig dafür, Test-Labels durchsickern zu lassen. Standardmäßig setzen wir auf verschachtelte Kreuzvalidierung und melden Leckage-Budgets explizit.
Wo eine Merkmalsklasse die Leistung beeinträchtigt, sobald die Leckage entfernt ist, sagen wir das. Das Produkt ist der Mechanismus, nicht das Leaderboard.
Spaltenstatistiken — Shannon-Entropie und Aminosäurefrequenz — wirken bei geringer Abdeckung attraktiv. Jenseits eines Abdeckungsbudgets etwa in der Mitte des Diagramms beginnen sie, dem besten Schätzer zu schaden. Wir haben sie für den Produktiveinsatz ausgemustert.
Jede Entscheidung ist eine gemessene Aussage, keine Marketing-Aussage. Wo ein Ergebnis geschadet hat, leben das Ergebnis und die Ausmusterung auf der Seite fort.
Ein großer Teil des Zugewinns eines scheinbar starken Merkmals war auf Leckage durch vorab berechnete k-NN-Achsen zurückzuführen. Die Methodik wurde entsprechend verschärft.
Shannon- und Frequenz-Spaltenstatistiken schadeten unserem besten Schätzer jenseits eines bestimmten Abdeckungsbudgets. Wir haben sie für den Produktiveinsatz ausgemustert und die Erkundung von Direct-Coupling-Paaren fortgesetzt.
Die aktuelle Pipeline ist auf Merkmale ausgerichtet, die wie Physik aussehen. Jeder Kandidat verfügt über ein explizites Leckage-Audit und ein explizites Abdeckungsbudget, bevor er ausgeliefert wird.
Die Proteindynamik ist der naheliegende Ort, um die Idee „Komprimieren statt Auswendiglernen“ unter Druck zu setzen. Holobiont ist der Ort, an dem wir diesen Druck ausüben — und an dem wir bereits Merkmale ausgemustert haben, die attraktiv wirkten, das Audit aber nicht überstanden.
Das mechanismus-orientierte Audit reist durch unsere Forschungsprogramme — von der Evaluierungsdisziplin bis hin zur Alignment-Haltung. Wo ein Merkmal hier nicht übersteht, wird es nirgendwo ausgeliefert.