3 人小团队 · 项目+部门双轴 · 行业资料引用
✅ 复核完成 · v08.1 标 ⚠未复核 的 6 项全 grep 完了(wymegwrz9),真实数字补回:SafeWrite 36%→43%(Claude 编的) · trap 表 3/12→5/12 覆盖 · golden test 缺→实测 31/31(误标)· CI 0 git tag + 只打包不测(更糟) · 四人桌美术→4-max UI 真渲染 4 座但 9-max engine 配齐 seats 4-8 静默跳过 · 38 smoke→在 run_smoke_tests.sh 不在 commit-gate。下面标的全更新成 ✓ 实测。存档 grep-verify-6-suspect.json 17KB。
| 决策 | 为啥要拍 | 推荐 | 截止 |
|---|---|---|---|
| 展会主路径:Godot 桌面 demo vs 网页 arena 直播 | 影响所有美术/UI 工作量,18 天能不能装下取决于这条 | 网页直播(更稳) | 明天 |
| benchmark.json 数据怎么处理 | 线上 72%(旧 prompt)vs 实测 61%(新 prompt)— 评委深问会被拆穿 | 从真跑生成 + 加 provenance | 3 天内 |
| 展会机 GTO_SOLVER_DIR 设不设 | 不设=展示假冒 GTO(诚信塌方),设=必须先装 TexasSolver | 设(本机已装,展会机复制) | 5 天内 |
wk8gcy97q,106 agents · 13 高置信确认 · 10 流行说法被推翻)综合的行业标准 — PRINCE2 Highlight Report + DataCamp funnel + PPP(Progress/Plans/Problems)+ NN/g progressive disclosure。
深挖请点上面 tab: 项目深挖(16 件 P0 详情)/ 部门(11 hat 常设)/ 技术债(post-expo)/ 审计(5 份证据存档)。
#9 GTO golden test(已做)/#10 前端回归接 gate(昨晚就四件了)/#15 verdict 样本量保护(已做)。
Codex 上次预言 "Claude 倾向把 specs/gates 当 implemented behavior" 第 3 次应验。
Documentation/audits/2026-06-19-arena-step2/grep-verify-27items.json。
check_arena_deploy_fresh.py exit 0#9 GTO sidecar 3 golden + 原生 sizing 2 个(gto_sidecar.py self_test 段已有)·
#10 test_arena_bench_bars.js 接 commit-gate(.claude/settings.json 已是四件)·
#15 主面板 verdict 样本量保护(已在 app.js 实做)
status-report · standup · capacity-plan · Stop DoD hookcode-review · 前端条宽回归 hook · system-designdebug · m11/m12 smokedeploy-checklist · runbook · check_arena/ops_deploy_fresh.pypackage-addon.yml 26 行,只打包不测) + git tag -l = 0 tag, 质量门 100% 压本地 commit-gate · 现场 runbook 缺 · gto_sidecar 默认掉启发式testing-strategy · verify · commit-gate 四件run_smoke_tests.sh 走 §11.2 DoD 手动(不在 commit-gate 4 件 Python+JS 闸门) · ✓实测GTO golden 31/31 已远超报口径,真缺:_clamp_and_legalize raise_to 越界 test + test_arena_caliber.py 待接 gate 第五件 · 17 套 gate 套件大多未运行holdem_poker_table.gd:842) · NPC avatar = 占位 Npc1/2/3 · 插件 UI 美化(post-expo)· 九桌美术不做(你 6-19 澄清 ✓)risk-assessment · security-review · compliance-trackinggame_world_editor:253 + game_panel_window:890/1270/1883(后 3 处 CLAUDE §6 未记录)architecture(ADR) · tech-debt · system-designprocess-optimization · incident-response · documentationrun_smoke_tests.sh)· 无覆盖 5/12(EXPAND_FILL / autowrap / 4K字体 / split_offset / 插件未重载)· ADR 台账登到 0018(漏 0019-0024 ✓)· STATUS 腐烂 28 天 ✓ · ADR-0024 流程未立 · SCHEMA drift 多处 ✓Documentation/audits/2026-06-19-arena-step2/dept-taxonomy-research.jsonDocumentation/audits/2026-06-19-arena-step2/claude-7dept.jsonDocumentation/audits/2026-06-19-arena-step2/codex-independent.txt