OPS · 内部运营看板 v07

3 人小团队 · 项目+部门双轴 · 行业资料引用

🔒 内部 · 不对外 · v08.1 诚信版

⚠ 诚信声明 · 看板里 ~85% 是真实 grep/调研有证据(项目工作流的 [#编号] 标签 / 代码行数 / 部门 taxonomy 行业资料 / 4 份审计存档),~15% 是我加工的(估时 / 部分优先级 / 几个数字)。下面标 ⚠ 未复核 的是已识别可疑项,后台 wymegwrz9 正 grep 复核(3-5 分钟),完成后会去掉标签改成 ✓ 实测。

距 FullIndie 展会
— 天
7.7 · 主线 arena
git 状态
冻结中
→ 7.7 解冻
commit-gate
四件
benchmark+parity+zerosum+前端
部门数 / 项目数
11 / 2
v07 → v08 grep 实测回填
arena 真工日
5-9 天
grep 25 项: 16 真做 + 6 部分 + 3 已做
📋 项目 (有始有终)
🏢 部门 (常设职能)
⚠ 技术债 backlog
📚 行业资料/审计
状态: ●已做 · ●进行中 · ●待 · ●post-expo · 部门标签: PM FE BE GameEng AI/LLM DevOps QA Art UX Sec Arch Kaizen
🎯 项目 1 · FullIndie 参展 预跑+网页演示 · 主责 PM deadline 7.7 (18天) 🔨 进行中
✅ 范围已定 · grep 实测(w9ji7jba8 完成): 25 项裁定 = 16 STILL_PRESENT(真要做) · 6 PARTIAL(部分做) · 3 FIXED(Claude 把已做的当 P0 列错)。 Codex 5-8 天版获胜,Claude 27 人日超估一倍。Claude 误报 3 件: #9 GTO golden test(已做)/#10 前端回归接 gate(昨晚就四件了)/#15 verdict 样本量保护(已做)。 Codex 上次预言 "Claude 倾向把 specs/gates 当 implemented behavior" 第 3 次应验。
真实工日 ≈ 5-9 天(16 项 × 0.3-0.5d + 6 PARTIAL 剩余 4-8h)。证据存档 Documentation/audits/2026-06-19-arena-step2/grep-verify-27items.json
WS1.1 · 预跑链路硬化(展会现场观众真会看到的) DevOpsBEGameEng P0 · ~2 天 · 全 STILL_PRESENT
  • [#1 STILL] arena_longrun.sh:30 不传 --require-solver(sidecar 1016-1027 已实装)+ :39-41 Ollama 失败只 echo 不 exit → 改两行 shell
  • [#3 STILL] history_logger action 事件(holdem_poker_table.gd:1372)缺 stacks_per_seat_chips + arena_dashboard.py:177 _on_action 不写 live.stacks_bb → 一手内筹码不动
  • [#4 STILL] circuit breaker 信号(aidr_llm_provider.gd:22 已 emit)0 处订阅(scenes/web grep 全无)+ UI 无指示 → 加 connect + 3 处 UI(arena banner / NPC 角标 / dashboard fallback_rate)
  • [#5 STILL] benchmark.json 手填(无生成器 · 无 provenance 字段)→ 写 tools/gen_benchmark_json.py + 加 git_sha/generated_at/source_jsonl_paths
  • [#6 STILL] run_playmode_benchmark.py 没 OpenAISubject(1733/1798-1813 只支持 native/aidr/gto)→ 加 OpenAI 类跑 18 题对照,benchmark.json 第 4 阵营
  • [#14 STILL] pre-push deploy-fresh hook 缺 → 加 .git/hooks/pre-push 跑 check_arena/ops_deploy_fresh.py
WS1.2 · 主面板诚信 FEPM ★ #15 已做! 改文案即可
  • [#15 FIXED] 主面板 verdict 样本量保护已做(Claude 误判)
  • 剩:三阵营 capabilities 文案与真实 solver 层级对齐(PM 文案级 · ~0.5 天)
  • 禁止说"派生提升 X%"(18 题样本 CI 重叠) → 复核 strings.js
WS1.3 · NPC 决策质量(展会用→复盘回流插件) AI/LLMQA P0 · ~2-3 天 · 复盘后通用化进项目2
  • think-OFF → think-ON 切换(scene tscn:2229 + provider disable_thinking=false)+ 漏牌 gate 重验
  • [#8 PARTIAL] strategy.json 心态边界 + flop OOP draw 规则已有(poker_zhou:65/76),针对 q-013/q-031/q-035/q-026 具体跑偏的 prompt 微调未做
  • [#11 STILL] baked think-ON 18 题作为回归基线 + nightly + 跌破 8/18 告警 → 防 prompt 重写再次无声退化
  • [#21 STILL] 5 故事 NPC bake stale 18 天(strategy.json 06-11 > Modelfile 05-30) → 批量重烤
  • 复盘机制: WS1.3 完成后总结"派生信息+人设"通用经验,作为 input → 项目 2 WS2.6(AI/LLM Platform)
WS1.4 · 预跑产数据 DevOpsPM P0 · ~3 天(机器占,不占人)
  • 同源单批 18 题三阵营真跑(aidr_baked think-ON / native 裸 qwen3 / GTO BT)
  • benchmark.json 从这一份 jsonl 自动生成 + provenance 字段(source_jsonl_path + ts + 命令)
  • arena_longrun.sh 跑 N 手以上预跑(caffeinate + 崩溃 5s 自启)
WS1.5 · 网站冻结 + dry-run PMFEDevOps P0 · ~1 天 + 留 2-3 天缓冲
  • 端到端 dry-run(打开网页 → 三阵营 9-max 结果可读 → 分数条/CI/延迟/showdown 无空无错)
  • check_arena_deploy_fresh.py exit 0
  • 展会前留 Day14-18 缓冲
★ Claude workflow 列错的(grep 实测已做): #9 GTO sidecar 3 golden + 原生 sizing 2 个(gto_sidecar.py self_test 段已有)· #10 test_arena_bench_bars.js 接 commit-gate(.claude/settings.json 已是四件)· #15 主面板 verdict 样本量保护(已在 app.js 实做)
WS1.6 · 卖点&获客(post-expo 暂缓) PM P2 · 暂不做
  • 三档话术(30s/2min/围观字幕)post-expo
  • wishlist/Discord/邮件留存 — 待你拍要不要做
🧠 项目 2 · AIDR 插件(核心 IP) 持续迭代 · 7 个真实子系统(grep 实测) 持续 · 展会是 showcase ○ 多数 post-expo
WS2.1 · Welcome / 第一屏 UXQA P1 · 真机走查 22 未运行
welcome_page.gd 1002 行,4 步引导(probe/pull/bake/demo),你真机走查后改 evidence 为 PASS/FAIL
WS2.2 · Copilot dock & NPC 编辑 UXFEArch P1 · god-class 拆分
  • copilot_window_v2.gd 1255 行 · character_tab/strategy_tab/字段widget/AI助手/完成度
  • 失败 UI status-line only → 持久 error panel + 一键复制 AI 诊断格式
  • 字段编辑控件缺(runtime_inputs.min/max + knowledge 高级字段 passthrough only)
  • silent JSON parse failures(actions/decision_examples/runtime_inputs 字段)
WS2.3 · Sandbox(editor 内试决策) UXQA P1 · 真机验
sandbox_tab.gd 478 行 + sandbox_llm_bar.gd 709 行,试聊+试决策 → 4 gate(选NPC/发输入/看结果/失败方向)真机未运行
WS2.4 · Bake AI/LLMQA P1 · 5 NPC stale 18天
  • bake_prompt.gd / bake_runner.gd · Ollama Modelfile
  • 5 故事 NPC strategy.json 06-11 比 Modelfile 05-30 新 → bake stale
  • Ollama baked model preflight(启动时 ollama list 对账)
WS2.5 · Game World 编辑器 UXSec P0 · 数据安全
game_world_editor.gd:253 直写 rules.md 无 SafeWrite · NPC JSON 已 SafeWrite 保护,game world 没 → 坏写丢用户数据
WS2.6 · LLM 管理(Platform) AI/LLM ★ 项目1 WS1.3 复盘成果回流这里
  • 3 provider(ollama / openai / claude) · llm_gate / prompt_assembler
  • OpenAI key 启动 sanity check + UI banner(现只第一次调用才报错)
  • circuit breaker 触发后 UI 无信号 + 三孤儿信号未消费
  • 派生信息+人设 模式从 arena 通用化 → 写进插件最佳实践
WS2.7 · Runtime 集成 BEGameEng P1 · validator/contract 待订正
  • aidr_npc.gd 498 行 signal-first / contract 510 行 / validator 582 行
  • 三孤儿信号 aidr_failed / aidr_config_reloaded / aidr_state_changed 没消费者
  • SCHEMA_V2.md drift(say_field 例子 vs validator 实际可选)
  • aidr_v2_validator.gd:8,13 注释还写 schema_version=2.0(实是 2.1)
📚 11 部门取自行业标准:SaaS 6-8 职能(Sacks SaaS Org Chart)+ Team Topologies 4 团队类型(teamtopologies.com)+ 你保留的 5 个独立 hat(美术/UX/安全/架构/Kaizen)。 ⚠ Frontend 和 Backend 合并成 Full-stack Eng(行业标准:小团队规模 Engineering subdivides 在 Series A 才发生)。 ⚠ Matrix 结构 NOT 适合 3 人(Asana + Functionly 一致):部门是 hat checklist,不是层级。
🎯1. Product / PMStream-aligned
管什么:路线 · 卖点 · dry-run · 优先级裁决 · blocker
skill/hook:status-report · standup · capacity-plan · Stop DoD hook
技术债:展会主路径未拍 · dry-run 无日程 · STATUS.md 腐烂 28 天
💻2. Full-stack EngStream-aligned
管什么:web/arena · ops · benchmark 网页 · arena_dashboard.py · CF Functions · KV
skill/hook:code-review · 前端条宽回归 hook · system-design
技术债:gsap 无 fallback · stacks_bb 不刷 · 推送静默 · 主面板诚信 verdict
🎮3. Game EngineeringComplicated-Subsystem
管什么:scenes/holdem_poker 引擎 · adapter · runtime · gto_sidecar · 结算
skill/hook:debug · m11/m12 smoke
技术债:4 个 god-class(table 2004 行) · 越界 raise · is_partial 不读 · m10 节点路径
🧠4. AI / LLM PlatformPlatform
管什么:3 provider 抽象 · bake · prompt · think 档 · 漏牌 · llm_gate
skill/hook:(自建,无现成 skill)· run_correlation_test_poker.sh
技术债:think-ON 漏牌未实测 · prompt 回归基线缺 · 5 NPC bake stale · 三孤儿信号
🔧5. DevOps / InfraPlatform
管什么:部署 · CI · longrun · launchd · Cloudflare Pages · wrangler · KV
skill/hook:deploy-checklist · runbook · check_arena/ops_deploy_fresh.py
技术债:longrun 不 fail-fast · ⚠未复核CI 0 git tag 形同虚设 · 现场 runbook 缺 · gto_sidecar 默认掉启发式
行业资料:DevOps 不是一个团队是文化,SRE/Security 在 3 人规模合进这里
6. QA / QualityEnabling
管什么:smoke · gate · 真机验 · golden test · commit-gate
skill/hook:testing-strategy · verify · commit-gate 四件
技术债:136 真机 gate 第三层空白 · ⚠未复核38 smoke 措辞 · ⚠未复核golden test 缺(#9 调研裁定 FIXED) · 17 套 gate 套件大多未运行
🎨7. 美术 ArtCraft
管什么:四人桌 demo 美术 · 插件 UI 美术 · Asset/ sprite/字体
skill/hook:(无 skill · 远程美术合作)
技术债:⚠未复核四人桌美术状态(没真去看 Asset/)· 插件 UI 美化(post-expo)· 九桌美术不做(你 6-19 澄清 ✓)
📐8. UI / UX DesignCraft
管什么:dock 体验 · 牌桌可视 · welcome 4 步 · 信息架构 · 设计 token
skill/hook:(无 skill)· preview MCP 截图
技术债:失败 UI 大量 status-line only · 字段编辑控件缺 · 真机第三层空白(22 未运行+4 待)
🔒9. SecurityEnabling
管什么:secret · key · 数据安全(SafeWrite) · 合规
skill/hook:risk-assessment · security-review · compliance-tracking
技术债:playtest 明文 OpenAI key(post-expo 抹历史)· secret-scan 没进 gate · ⚠未复核SafeWrite 覆盖率 36%(数字 Claude 报的没去算)· game_world_editor 没用 SafeWrite(已 grep ✓)
🏗10. Architecture / Tech DebtEnabling
管什么:跨系统设计 · 重构 · god-class 拆分 · §2.6 行数红线
skill/hook:architecture(ADR) · tech-debt · system-design
技术债:4 个 god-class(holdem_table 2004 / game_panel 2010 / copilot 1255 / welcome 1002)· playmode_benchmark 1860 行(超红线 3 倍)
♻️11. Kaizen 复盘改进Enabling
管什么:postmortem · §4 trap 表 · 流程优化 · 标准变更流程
skill/hook:process-optimization · incident-response · documentation
技术债:⚠未复核trap 表 3/12 覆盖(数字没去 CLAUDE §4 数)· ADR 台账登到 0018(漏 0019-0024 ✓ 实测)· STATUS 腐烂 28 天 ✓ · ADR-0024 标准变更流程未立 · SCHEMA drift 多处 ✓
技术债 = 部门持续职责 · 无 deadline 有优先级。Codex 实测:本会话审计揪出的债大多有 file:line 证据,不是"猜的"。展会前只处理跟展会成功直接相关的;其余 post-expo。
🚨展会前必清(跟展会成功直接相关)
  • 🔴 WS1.1 预跑链路 5 件(GTO标签/Ollama静默/72%旧数据/推送/筹码)→ DevOps + BE
  • 🔴 WS1.2 主面板 verdict 样本量保护 → FE
  • 🔴 WS2.5 game_world_editor SafeWrite → Security · 用户数据安全 P0
  • 🟡 think-ON 切换 + 漏牌 gate 重验 → AI/LLM
  • 🟡 真机 UI gate 第三层走查 22 未运行 → UX + QA(你真机)
📦post-expo backlog(git 解冻后)
  • playtest 明文 OpenAI key 抹历史 + 轮换 → Security
  • 两阶段分支合并 playtest→GI 再 main→GI(31 文件冲突) → Architecture
  • 4 个 god-class 拆分(§2.6 红线) → Architecture
  • 插件失败 UI 产品化 + 字段控件 + silent JSON parse → UX
  • 三孤儿信号 + SCHEMA drift + validator 注释 2.0 → AI/LLM
  • 5 NPC bake stale 18 天重烤 → AI/LLM
  • ADR 台账补登 0019-0024 + STATUS 刷新 + 5 篇主文档腐烂 → Kaizen
  • benchmark.json 自动生成器 → DevOps + Full-stack
  • 扩 18→50 题 + 事实层补 3 维度 → AI/LLM
  • 九桌 UI/美术(用户已澄清不做)→ Art(降级)
📚 v07 重组的 3 个证据源(本会话 2026-06-19 跑出)
🔍证据 1 · deep research(部门 taxonomy 行业标准)
103 agents · 21 sources · 82 claims · 23 确认 · 2 推翻
推翻: 网传"游戏团队 7 部门"(投票 1-2 ✗) · 网传"美术 30-50% 占比"(1-2 ✗)
确认: 游戏 5-6 craft · SaaS 6-8 职能 · Team Topologies 4 团队 · Matrix 不适合小团队
存档: Documentation/audits/2026-06-19-arena-step2/dept-taxonomy-research.json
🤖证据 2 · Claude 7部门 workflow(w42vx1fxu + wz0svv5og)
25 项 consolidated_items · 17.85 / 27 人日 · M1-M5 里程碑 · 6 决策点
给的全(覆盖认知+部署+诚信+数据+预跑 5 层)
Codex 揭穿: 倾向"过度投入治理产物,轻视评委真正看到的"(本会话 META 行漏 + 17 套 gate 漏已应验)
存档: Documentation/audits/2026-06-19-arena-step2/claude-7dept.json
🎯证据 3 · Codex 独立审(task-mqloophi-17vn96)
grep 实测代码:5-8 天版 · GTO BT 5 bug 4/5 FIXED(file:line 证据,1 个 UNCLEAR)
展会现场真坏的 top5: GTO 标签假冒/Ollama 静默/72%旧/推送静默/筹码错
预言 Claude 盲区: "ops page 自己写了 — agents conflate specs/gates with implemented behavior" → 已应验
存档: Documentation/audits/2026-06-19-arena-step2/codex-independent.txt
🔄补充调研(在跑)· w9ji7jba8
逐条 grep Claude 25 项 P0/P1, 给每条 STILL_PRESENT/FIXED/PARTIAL 裁定 + file:line 证据
完成后会补回项目 1 工作流细节, 取代"27 vs 5-8 天"分歧