科学ツール

Holobiont

タンパク質ダイナミクスの根底にある法則を、物理的不変シグナルとして圧縮します。

テーゼルックアップテーブルではなく、不変量を見つける
監査入れ子交差検証 · すべての特徴量で報告されるリーケージ予算
実践生き残らないものは引退させる · ネガティブを公表する
上乗せの帰属 · 代表的な特徴量一つ
83%
17%
  • 事前計算された検索軸を通じたリーケージ
  • 入れ子交差検証後の残余メカニズム
Holobiontのテーゼ

ルックアップテーブルではなく、不変量を見つける

Holobiontは、ある特定の考えを中心に構築されたサイエンスプログラムである。すなわち、タンパク質ダイナミクスの根底には、いかなる量の記憶よりもうまく圧縮される物理的不変シグナルが存在する。私たちはそれらのシグナルを追求し、検索軸のリーケージに対して容赦なく監査し、魅力的な特徴量が測定アーティファクトであると判明したときにはネガティブを公表する。

ほとんどのパイプライン

リーダーボードが動くまで特徴量を追加し、上乗せが構造的アーティファクトであっても、そのリーダーボードを出荷する。

holobiont

物理学のように見える特徴量——コンパクトで、不変で、監査可能なもの——へとパイプラインを偏らせ、本番に到達する前に残りを引退させる。

Holobiontの構造

三つのコミットメント

HB1

記憶せず、圧縮する

私たちは、データのように見える埋め込みではなく、物理法則のように見えるコンパクトなメカニズムを目指す。

f(x) compact mechanism lookup table
報いるもの 物理法則のように見えるコンパクトなメカニズム 罰するもの 訓練セットのように見える埋め込み
HB2

検索軸のリーケージを監査する

事前計算された検索軸は、テストラベルをリークさせるのが悪名高いほど容易である。私たちはデフォルトで入れ子交差検証を用い、リーケージ予算を明示的に報告する。

fold 1 fold 2 fold 3 fold 4 fold 5 test PDB never touches the retrieval axes
報いるもの デフォルトとしての入れ子交差検証、報告されるリーケージ予算 罰するもの 監査なしで使われる事前計算された検索軸
HB3

機能しないものを公表する

リーケージを取り除いた後に特徴量クラスが性能を損なう場合、私たちはそう述べる。プロダクトはリーダーボードではなく、メカニズムである。

F1 kept F2 kept F3 retired F4 kept F5 retired F6 kept
報いるもの 監査を生き残らない特徴量クラスを引退させること 罰するもの リーケージ発見後も保持されるリーダーボードの上乗せ
カバレッジの崖

魅力的な特徴量クラスが静かにネガティブへ転じる場所

列統計量——シャノンエントロピーとアミノ酸頻度——は低カバレッジでは魅力的に見える。チャート中央あたりのカバレッジ予算を超えると、それらは最良の推定器を損ない始める。私たちはそれらを本番利用から引退させた。

+ 0.02 + 0.01 0.00 -0.01 -0.02 -0.03 -0.04 0 0% 25% 50% 75% 100% cliff · ~53 % coverage Δ Spearman ρ on held-out PDBs coverage budget →
各点は監査下にある特徴量バリアントである。ゼロ線より下では、その特徴量は推定器を損なっている。私たちはゼロより下では出荷しない。
ネガティブと進捗

Holobiontが決定してきたこと

各決定はマーケティング上の主張ではなく、測定された言明である。結果が損なった場合、その結果と引退はこのページに残る。

  1. D15.1

    検索軸のリーケージを定量化

    見かけ上強力な特徴量の上乗せの大部分は、事前計算されたk-NN軸を通じたリーケージに帰属できた。それに応じて方法論を厳格化した。

    D15.1 83 % の見かけ上の上乗せは検索軸のリーケージだった
  2. D22

    カバレッジにおいて保存特徴量を引退

    シャノンと頻度の列統計量は、一定のカバレッジ予算を超えると最良の推定器を損なった。私たちはそれらを本番利用から引退させ、直接結合ペアの探索を続けた。

    D22 Δρ −0.0382 カバレッジの崖を超えた最良の推定器において
  3. 本日

    メカニズム第一の特徴量パイプライン

    現在のパイプラインは、物理学のように見える特徴量へと偏らせてある。各候補は、出荷前に明示的なリーケージ監査と明示的なカバレッジ予算を持つ。

    today physics-shaped 特徴量のみ、明示的なリーケージ監査付き

なぜこれが独立したプログラムなのか

タンパク質ダイナミクスは、「記憶せず、圧縮する」という考えに圧力をかける明白な場である。Holobiontは私たちがその圧力を加える場であり——そして、魅力的に見えたが監査を生き残らなかった特徴量をすでに引退させてきた場である。

横断テーマ

Holobiontは、圧縮対記憶の考え方がストレステストされる場である

メカニズム第一の監査は、評価規律からアラインメントの姿勢まで、私たちの研究プログラム全体を横断する。ここで特徴量が生き残らなければ、それはどこでも出荷されない。