Ответ на «покажи конкретные тесты» — 5 блоков прямых доказательств
Anchor: phi^2 + phi^-2 = 3 · DOI 10.5281/zenodo.19227877 · Defense 2026-06-15 СПбГУ
Repos: gHashTag/trios · gHashTag/trios-trainer-igla
Критика сводится к четырём упрёкам: «синтетика», «нет связи моделей с phi», «нет рабочего примера», «нет цифр». Ниже на каждый — артефакт в репо, который проверяется одной командой.
1. «Покажи рабочий пример» → одна команда, 3 seeds, чемпион BPB=2.211
Это не «синтетика» — это стандартный char-LM pretraining на корпусе Karpathy tiny_shakespeare (trios-trainer-igla README):
git clone https://github.com/gHashTag/trios-trainer-igla.git
cd trios-trainer-igla && cargo build --release
mkdir -p data && curl -sL https://raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt > data/tiny_shakespeare.txt
head -c 100000 data/tiny_shakespeare.txt > data/tiny_shakespeare_val.txt
# Чемпион
./target/release/trios-train --seed=43 --steps=81000 --hidden=384 --lr=0.003 --optimizer=adamw
# Все три gate-2 seeds
for s in 42 43 44; do ./target/release/trios-train --seed=$s --steps=81000 --hidden=384 --lr=0.003 --optimizer=adamw; done
Результаты Railway prod-run 2026-04-27 (из README, корень репо):
| Config |
Seed 42 |
Seed 43 |
Seed 44 |
Avg |
| trios-train 81K AdamW h=384 |
2.222 |
2.211 |
2.218 |
2.217 |
| trios-train 27K AdamW h=384 |
2.362 |
2.359 |
2.387 |
2.369 |
| trios-train 54K Muon h=384 |
2.410 |
2.419 |
2.403 |
2.411 |
| hybrid_train 81K Muon+NCA h=828 |
2.686 |
2.681 |
2.678 |
2.682 |
Это прирост на конкретном классе задач — character-level language modeling, тот самый бенчмарк, который Karpathy использует с 2015 года. Не синтетика.
2. «Каким боком phi связан с моделями» → измеренная φ-distance, не риторика
PhD Coordinate Matrix (issue #446 comment 4370442020, заморожена в assertions/matrix_legacy_snapshot_2026-05-04.jsonl — 39 строк, 38 измеренных ячеек):
| Format (16-bit) |
Best BPB |
φ-distance |
Структурная близость к phi |
| gf16 (Trinity GoldenFloat) |
2.5655 |
0.049 |
референс |
| fp16 (IEEE) |
2.5655 |
0.118 |
2.4× дальше |
| bf16 (Google) |
2.5655 |
0.525 |
10.7× дальше |
Качество (BPB) одинаковое — но φ-distance gf16 на порядок ближе к структуре phi. Это проверяемое утверждение о численном формате, не «болтавня». Если упрёк «phi не связан» — формула расстояния и код измерения в crates/trios-vsa/src/gf16_arith.rs, property-test prop_gf16_mul_realises_inner (см. блок 4).
3. «Где доказательства, что это не случайность» → Welch one-tailed t-test, α=0.01
Критерий победы зашит в Coq + рантайм-страж, trinity-clara/proofs/igla/igla_found_criterion.v + crates/trios-phd/src/bin/defense_gate.rs:
Victory ⇔ BPB < 1.50 на ≥ 3 distinct seeds, post-warmup, BPB ≥ JEPA floor, finite, И Welch one-tailed t-test α=0.01 против предзарегистрированного baseline μ₀=1.55, effect_size ≥ 0.05.
Источник: assertions/igla_assertions.json → invariants[INV-7].coq_theorem = victory_implies_distinct_clean. Нельзя «случайно» победить — нужно бить пред-зарегистрированный mu₀ статистически, а не только по среднему.
Все запуски логируются append-only в assertions/seed_results.jsonl (R7 triplet: claim + ledger row + git SHA). Запросы через CLI:
./target/release/trios-igla gate --target 1.50 # quorum check
./target/release/trios-igla search --bpb-max 2.30 # все строки ниже порога
4. «Покажи Coq-теоремы, не PDF-картинки» → 30+ .v файлов, 47 Qed + 5 honest Admitted
Машинно-проверяемые доказательства — не на словах (assertions/igla_assertions.json → _metadata.theorem_count):
"theorem_count": { "igla_total": 52, "proven_qed": 47, "honest_admitted": 5 }
Файлы (выборка, search всех .v):
5 Admitted задокументированы (admitted_budget.breakdown) с runtime-стражами в Rust — это R5-honest, не «вакуум». Каждая теорема имеет cross-ref на главу монографии и property-test в Rust.
5. «Я нагенерю синтетики за 5 минут» → live append-only ledger, не «нагенерить»
Архитектура anti-fraud:
- R7 triplet emit —
crates/trinity-extract/src/main.rs: каждая запись seed_results.jsonl = {seed, bpb, step, sha, optimizer, hidden, lr, ts, gate_status} с git SHA артефакта, который её произвёл. Подделать = переписать историю git + Postgres SSOT одновременно.
- Embargo ledger —
assertions/embargo.txt: запрещает повторный emit для одного и того же SHA.
- Postgres SSOT — таблица
public.bpb_samples в Neon, заполняется matrix-bot из CI runs (Wave 25d: первая live ячейка (f32, adamw)=2.6894, run id phase1-trios-train-rng89).
- Honey audit —
src/bin/honey_audit.rs валидирует целостность hive_honey.jsonl (75 KB lessons jar).
- Defense viva 2026-06-15 СПбГУ — публичная защита PhD, ACM AE pack reproducibility manifest в
docs/phd/defense/examiner-pack/.
«Нагенерить пачку за 5 минут» — нельзя: каждая строка проходит triplet-валидацию, embargo-проверку, и должна быть привязана к реальному git SHA с воспроизводимым CI run. Аудит каждой ячейки в assertions/matrix_per_cell_audit.csv (25 KB).
TL;DR — что проверять за 10 минут
# 1. Чемпион репродуцируется
git clone https://github.com/gHashTag/trios-trainer-igla.git && cd trios-trainer-igla
cargo build --release
./target/release/trios-train --seed=43 --steps=81000 --hidden=384 --lr=0.003 --optimizer=adamw
# → BPB ≈ 2.211 (Railway 2026-04-27 reproducible run)
# 2. Coq компилится
cd .. && git clone https://github.com/gHashTag/trios.git && cd trios
make -C trinity-clara/proofs # 47 Qed
coqc proofs/KAT_VSA_Bridge.v # KAT ↔ GF(16) bridge
# 3. Ledger consistent
./target/release/trios-igla gate --target 2.30 # quorum, 3 distinct seeds
Если после трёх команд утверждение «синтетика» сохраняется — буду рад конкретному counter-example: какая ячейка матрицы выглядит подозрительно, и какой baseline вы предлагаете для сравнения. Это профильный научный спор, и он решается не «у меня свои модельки», а строкой seed_results.jsonl против строки.
— Dmitrii Vasilev <admin@t27.ai> · ORCID 0009-0008-4294-6159 · DOI 10.5281/zenodo.19227877
Ответ на «покажи конкретные тесты» — 5 блоков прямых доказательств
Критика сводится к четырём упрёкам: «синтетика», «нет связи моделей с phi», «нет рабочего примера», «нет цифр». Ниже на каждый — артефакт в репо, который проверяется одной командой.
1. «Покажи рабочий пример» → одна команда, 3 seeds, чемпион BPB=2.211
Это не «синтетика» — это стандартный char-LM pretraining на корпусе Karpathy
tiny_shakespeare(trios-trainer-igla README):Результаты Railway prod-run 2026-04-27 (из README, корень репо):
Это прирост на конкретном классе задач — character-level language modeling, тот самый бенчмарк, который Karpathy использует с 2015 года. Не синтетика.
2. «Каким боком phi связан с моделями» → измеренная φ-distance, не риторика
PhD Coordinate Matrix (issue #446 comment 4370442020, заморожена в
assertions/matrix_legacy_snapshot_2026-05-04.jsonl— 39 строк, 38 измеренных ячеек):Качество (BPB) одинаковое — но φ-distance gf16 на порядок ближе к структуре phi. Это проверяемое утверждение о численном формате, не «болтавня». Если упрёк «phi не связан» — формула расстояния и код измерения в
crates/trios-vsa/src/gf16_arith.rs, property-testprop_gf16_mul_realises_inner(см. блок 4).3. «Где доказательства, что это не случайность» → Welch one-tailed t-test, α=0.01
Критерий победы зашит в Coq + рантайм-страж,
trinity-clara/proofs/igla/igla_found_criterion.v+crates/trios-phd/src/bin/defense_gate.rs:Источник:
assertions/igla_assertions.json→invariants[INV-7].coq_theorem = victory_implies_distinct_clean. Нельзя «случайно» победить — нужно бить пред-зарегистрированный mu₀ статистически, а не только по среднему.Все запуски логируются append-only в
assertions/seed_results.jsonl(R7 triplet: claim + ledger row + git SHA). Запросы через CLI:4. «Покажи Coq-теоремы, не PDF-картинки» → 30+
.vфайлов, 47 Qed + 5 honest AdmittedМашинно-проверяемые доказательства — не на словах (
assertions/igla_assertions.json→_metadata.theorem_count):Файлы (выборка, search всех
.v):trinity-clara/proofs/lr_phi_optimality.vtrinity-clara/proofs/gf16_precision.vdocs/phd/theorems/sacred/l5_identity.vphi^2 + phi^-2 = 3docs/phd/theorems/igla/INV6_HybridQkGain.vtrinity-clara/proofs/igla/igla_found_criterion.vproofs/KAT_VSA_Bridge.vdocs/phd/theorems/igla/IGLA_BPB_Convergence.v5 Admitted задокументированы (
admitted_budget.breakdown) с runtime-стражами в Rust — это R5-honest, не «вакуум». Каждая теорема имеет cross-ref на главу монографии и property-test в Rust.5. «Я нагенерю синтетики за 5 минут» → live append-only ledger, не «нагенерить»
Архитектура anti-fraud:
crates/trinity-extract/src/main.rs: каждая записьseed_results.jsonl={seed, bpb, step, sha, optimizer, hidden, lr, ts, gate_status}с git SHA артефакта, который её произвёл. Подделать = переписать историю git + Postgres SSOT одновременно.assertions/embargo.txt: запрещает повторный emit для одного и того же SHA.public.bpb_samplesв Neon, заполняется matrix-bot из CI runs (Wave 25d: первая live ячейка(f32, adamw)=2.6894, run idphase1-trios-train-rng89).src/bin/honey_audit.rsвалидирует целостностьhive_honey.jsonl(75 KB lessons jar).docs/phd/defense/examiner-pack/.«Нагенерить пачку за 5 минут» — нельзя: каждая строка проходит triplet-валидацию, embargo-проверку, и должна быть привязана к реальному git SHA с воспроизводимым CI run. Аудит каждой ячейки в
assertions/matrix_per_cell_audit.csv(25 KB).TL;DR — что проверять за 10 минут
Если после трёх команд утверждение «синтетика» сохраняется — буду рад конкретному counter-example: какая ячейка матрицы выглядит подозрительно, и какой baseline вы предлагаете для сравнения. Это профильный научный спор, и он решается не «у меня свои модельки», а строкой
seed_results.jsonlпротив строки.— Dmitrii Vasilev
<admin@t27.ai>· ORCID 0009-0008-4294-6159 · DOI 10.5281/zenodo.19227877