Skip to content

Latest commit

 

History

History
181 lines (133 loc) · 10.2 KB

File metadata and controls

181 lines (133 loc) · 10.2 KB

Task:Wiki-CTX-AB v1(Harness 上下文消费对照 · P1→P2)

状态done(2026-05-26 验收通过 · WIKI-CTX-AB@2026-05-25)
关联 SPECdocs/spec/governance/SPEC-Governance-Wiki-Harness-Roadmap-v1.md
实验目录docs/harness/experiments/wiki_ctx_ab_v1/
T1b(done)task_coding_wiki_pilot_v1.md · 同 slug harness-p1-docs-consolidation


Harness 元信息

字段
test_strategy not_applicable
test_strategy_note 实验填表 + 结论文;无代码/CI 变更。
freeze_id WIKI-CTX-AB@2026-05-25
gates_before_code ["human_gate"]
semi_auto true
audit_profile post_close
git_branch task/wiki-ctx-ab-p2-v1
task_slug wiki-ctx-ab

人工闸 human_gate

human_gate_id status blocks_hats 说明
HG-AB-SLUG approved gold slug = harness-p1-docs-consolidation
HG-AB-P1-DONE approved P2 执行 P1 已验收 — conclusion_p1_zh.md

帽子顺序(P2 · 计划:22 → 30 → 40 → 50 → 关账

启动 Prompt(子仓)
1 22 R1 docs/harness/invokes/by-task/wiki-ctx-ab/PROMPT_22_startup_wiki-ctx-ab-p2-v1.md
2 30 …/PROMPT_30_startup_wiki-ctx-ab-p2-v1.md
3 40 …/PROMPT_40_startup_wiki-ctx-ab-p2-v1.md
4 50 …/PROMPT_50_startup_wiki-ctx-ab-p2-v1.md
5 关账 …/PROMPT_CLOSE_wiki-ctx-ab-p2-v1.md
说明
10 跳过(task 已存在)
22 P2 开工就绪审(T1b Wiki 同 slug · W 载荷)
30 跑 H-lean vs W · 填 scorecard §P2 · conclusion_p2_zh.md
40 VERIFY 实验产物
50 独立复检 → reinspect_results/
关账 整 task done/ + CLOSE_TRACE

纪律:每帽 新对话 + Open ai-ink-brain-api-python/;见 docs/harness/ACCEPTANCE_LANDING.md

三方跑题(30 内引用):PROMPT_third_party_agent_wiki_ctx_ab_p2.md


背景与目标

用可复现 H-full / H-lean / W 对照,为 Harness 全仓推广Coding Wiki 默认读序 提供证据(见 SPEC §3)。

P1 完成态:物化 H-full/H-lean + scorecard §P1 + conclusion_p1_zh.mdaccepted)。
P2 完成态(T1b done):TEMPLATE-W + W_* 物化 + scorecard §P2 + conclusion_p2_zh.md


范围

  • questions.md 跑 P1(4 题 × 2 臂)。
  • payloads/H-full_harness-p1-docs-consolidation.mdH-lean_*.md 已物化。
  • scorecard.md §P1 · conclusion_p1_zh.md
  • (P2)H-lean vs W(同题集)· conclusion_p2_zh.md · 是否默认 coding_wiki/ 读序。

非范围

  • 不改 docs/harness/prompts/、CI、api/。
  • 不重跑 P1 或修改 P1 已冻结 payload 行(除 22 指出的阻塞修复)。

验收标准

  • P1 scorecard 含每题 × 两臂的 payload_char_count、正确性 pass/fail。
  • conclusion_p1_zh.md 明确:推荐 T3 Harness 推广(已 accepted)。
  • (P2)conclusion_p2_zh.md 明确:是否默认先读 coding_wiki/推荐是)。

实现备忘(由执行 Agent 回填)

类别 路径 / 值
30 执行 2026-05-26 · model composer-2.5 · temp 0
payload_char_count H-lean 9896 · W 2096(降幅 78.8%)
P2 结论 conclusion_p2_zh.md(accepted · 推荐默认 coding_wiki/)
invoke docs/harness/invokes/by-task/wiki-ctx-ab/invoke_20260526_{22,30,40,50}_wiki-ctx-ab-p2-v1.md
22 R1 docs/harness/reviews/by-task/wiki-ctx-ab/task_wiki_ctx_ab_v1_audit_R1_20260526.md
W 物化 python tools/wiki_ctx_ab_materialize_w.pypayloads/W_harness-p1-docs-consolidation.md
50 reinspect_wiki_ctx_ab_p2_20260526_v1.md(建议关账 · 无阻塞)
40 自检 2026-05-26 · VERIFY (1)–(7) 全 pass
下一棒 (50 建议关账 · 2026-05-26;本单已 done/

自检结论(执行者)

结果
40 + 50(P2 自检 + 独立复检 · 2026-05-26)
cwd ai-ink-brain-api-python/ · 分支 task/wiki-ctx-ab-p2-v1
test_strategy not_applicable(纯文档实验;未跑 pytest)

30 产出核对(通读)

检查项 结果
scorecard.md §P2 八行(Q1–Q4 × H-lean/W) pass · 均为 pass
payload_char_count H-lean/W 9896 / 2096 · 降幅 78.8%
conclusion_p2_zh.md SPEC §3.1(T7+T8) pass
默认读序(task 验收 P2) — §3 写明推荐先读 docs/coding_wiki/index.md + syntheses/<slug>.md
30 invoke invoke_20260526_30_wiki-ctx-ab-p2-v1.md

VERIFY 验收表(40 · 子仓根)

# 命令 / 检查 exit pass/fail 要点
1 test -f …/payloads/TEMPLATE-W.md 0 pass 模板存在
2 test -f …/W_harness-p1-docs-consolidation.md 0 pass W 物化实例存在
3 test -f docs/coding_wiki/syntheses/harness-p1-docs-consolidation.md 0 pass T1b ingest 页存在
4 rg '^## P2' scorecard.md + §P2 表 8 行 0 pass L115 主表;Q1–Q4×2 臂均 pass
5 test -f …/conclusion_p2_zh.md 0 pass P2 结论文存在
6 git diff --name-only -- docs/harness/prompts/ | wc -l 0 pass 计数 0(未改 prompts)
7 python tools/wiki_ctx_ab_materialize_w.py --slug …(可选) 0 pass 可再生 · payload_char_count=2096

40 总评pass — P2 实验产物与 task 验收对齐;未改 scorecard 答题原文。

50 复检摘要reinspect_wiki_ctx_ab_p2_20260526_v1.md — 独立抽检 Q2/Q4、W 载荷边界、T7/T8 一致;建议关账、无阻塞关账HANDOFF_CLOSE_TRACE · 归档 docs/tasks/done/(2026-05-26)。


关闭回溯(HANDOFF_CLOSE_TRACE)

结论freeze_id WIKI-CTX-AB@2026-05-25 · Wiki-CTX-AB P1 + P2 帽链 22 → 30 → 40 → 50 已完成;50 书面复检 建议关账、无阻塞;P2 裁决 推荐默认先读 docs/coding_wiki/index.md + syntheses/<slug>.md(W 相对 H-lean 降幅 78.8%、4/4 pass);本 task 归档 docs/tasks/done/(2026-05-26)。

执行路线表

序号 阶段 / 帽子 关键动作 落盘工件(相对 ai-ink-brain-api-python/ commit
0 P1(历史) H-full vs H-lean · scorecard §P1 · conclusion_p1_zh accepted docs/harness/experiments/wiki_ctx_ab_v1/** · 初版 task api-python@f73eb8c
1 预备 P2 帽链启动 · TEMPLATE-W · W 物化脚本 docs/harness/invokes/by-task/wiki-ctx-ab/PROMPT_{22,30,40,50,CLOSE}_* · payloads/TEMPLATE-W.md api-python@bb8496d
2 22 R1 P2 开工就绪审 · 零阻塞 docs/harness/reviews/by-task/wiki-ctx-ab/task_wiki_ctx_ab_v1_audit_R1_20260526.md · …/invoke_20260526_22_wiki-ctx-ab-p2-v1.md api-python@8126ed3
3 30 H-lean vs W · scorecard §P2 · conclusion_p2_zh.md docs/harness/experiments/wiki_ctx_ab_v1/scorecard.md · conclusion_p2_zh.md · …/invoke_20260526_30_wiki-ctx-ab-p2-v1.md api-python@91045eb
4 40 VERIFY (1)–(7) · §自检结论 …/invoke_20260526_40_wiki-ctx-ab-p2-v1.md · 本 task ### 自检结论 api-python@669debc
5 50 独立复检 + 全局验收(T2 / 读序) docs/tasks/reinspect_results/reinspect_wiki_ctx_ab_p2_20260526_v1.md · …/invoke_20260526_50_wiki-ctx-ab-p2-v1.md api-python@c0e8cfb
6 关账 git mv task · 排期/_views · SPEC §3.1 · 本回溯节 docs/tasks/done/task_wiki_ctx_ab_v1.md api-python@0dcd394

分仓 Commit 索引(api-python · 从新到旧)

### api-python(ai-ink-brain-api-python · branch task/wiki-ctx-ab-p2-v1)
- 0dcd394 docs(task): Wiki-CTX-AB v1 关账 · WIKI-CTX-AB@2026-05-25
- c0e8cfb docs(harness): 完成 Wiki-CTX-AB P2 的 50 复检落盘
- 669debc docs(harness): WIKI-CTX-AB P2 40 自检 VERIFY 全 pass
- 91045eb feat(wiki-ctx-ab): P2 H-lean vs W 对照落盘与结论文
- 8126ed3 docs(harness): 22 audit for wiki-ctx-ab P2 R1
- bb8496d docs(harness): Wiki-CTX-AB P2 帽链启动稿与 W 臂物化预备 (#58)
- f73eb8c docs: Coding Wiki pilot 关账 (T1b) + …(含 P1 scorecard / conclusion_p1)

关联工件freeze_id WIKI-CTX-AB@2026-05-25 · task_slug wiki-ctx-ab · gold slug harness-p1-docs-consolidation · 治理 SPEC docs/spec/governance/SPEC-Governance-Wiki-Harness-Roadmap-v1.md T2

下一 Epic(非本 task):全仓 P1-4 Harness parity(ai-ink-brain)· 远期。


修订记录

日期 摘要
2026-05-25 初稿 draft
2026-05-26 P2 帽链启动稿 22→50→CLOSE;T1b done;TEMPLATE-W + W 物化预备
2026-05-26 done:P2 22→30→40→50 完成;git mvdone/HANDOFF_CLOSE_TRACE 关账