chore(ultraplan-local): Spor 0 — foundation for v3.1.0 kvalitetsprogram
- package.json med node:test runner og scripts (test, simulate), zero deps - settings.json: fjern vestigial exploration- og agentTeam-blokker (verifisert leset av ingen kode via grep) - docs/: commit subagent-delegation-audit.md og ultraexecute-v2-observations-from-config-audit-v4.md (begge real arkitektur-notater) - docs/: arkiver ultra-suite-brief_2.md som _archive- (var paste fra annet plugin-arbeid, irrelevant her) - tests/helpers/hook-helper.mjs kopiert fra llm-security m/ provenance-kommentar Forberedelse for Spor 1 (lib/-moduler), Spor 2 (HANDOVER-CONTRACTS + PreCompact-hook), Spor 3 (bug-fixes + CC-features). Plan: ~/.claude/plans/det-neste-vi-gj-r-eventual-adleman.md Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
This commit is contained in:
parent
ab504bdf8c
commit
1016914fc1
6 changed files with 487 additions and 39 deletions
118
plugins/ultraplan-local/docs/_archive-ultra-suite-brief_2.md
Normal file
118
plugins/ultraplan-local/docs/_archive-ultra-suite-brief_2.md
Normal file
|
|
@ -0,0 +1,118 @@
|
|||
Kontekst: Harness-plugin (../harness/) er nettopp oppgradert til v13.0.0 (commit
|
||||
8a444f5 på main). Kiur (v5.4.0) er søster-plugin — harness orkestrerer hvilke
|
||||
features som bygges, Kiur håndhever kvalitet via TDD + multi-agent review. Kiur
|
||||
dispatches fra harness for L1/L2 features (kiur:tdd + kiur:done), så konvensjonene
|
||||
må holdes i sync.
|
||||
|
||||
Oppgave: Moderniser Kiur til å matche:
|
||||
1. Harness v13.0.0 konvensjoner
|
||||
2. Opus 4.7 (ny modell — claude-opus-4-7, extended reasoning)
|
||||
3. Nyere Claude Code features (2.1.x+)
|
||||
|
||||
Viktig: IKKE implementer ennå. Les kontekst, foreslå en plan med prioritert
|
||||
oppgaveliste + begrunnelse, vent på min godkjenning.
|
||||
|
||||
### Fase 1 — Les kontekst (obligatorisk før planlegging)
|
||||
|
||||
Les disse filene i sin helhet:
|
||||
- ../harness/CLAUDE.md (v13.0 konvensjoner, spesielt model.strategy, review gates, 3
|
||||
nye hooks)
|
||||
- ../harness/README.md (seksjonene "Review Gates", "Review Triad (v13.0)", "Version
|
||||
History v13.0.0")
|
||||
- ../harness/lib/config.mjs (se model.strategy og enforce-mønsteret)
|
||||
- ../harness/agents/plan-critic-agent.md (adversarial review-pattern)
|
||||
- ../harness/agents/scope-guardian-agent.md (coverage matrix-pattern)
|
||||
- ../harness/hooks/scripts/subagent-stop-validate.mjs (verification_manifest gate)
|
||||
- ../harness/hooks/scripts/pre-compact-snapshot.mjs (state preservation)
|
||||
- ../harness/hooks/hooks.json (SessionEnd/SubagentStop/PreCompact wiring)
|
||||
|
||||
Fra Kiur selv:
|
||||
- CLAUDE.md, README.md, CHANGELOG.md
|
||||
- .claude-plugin/plugin.json (nåværende versjon, manglende
|
||||
compatibleClaudeCodeVersions)
|
||||
- Alle 6 agent-filer (agents/*.md) — noter modeller i frontmatter
|
||||
- Alle 8 commands (commands/*.md) — spesielt tdd.md, review.md, done.md
|
||||
- Alle 4 hook-scripter (hooks/scripts/*.mjs)
|
||||
|
||||
### Fase 2 — Dimensjoner å vurdere
|
||||
|
||||
A) **Opus 4.7-tilpasning**
|
||||
- Hvilke agenter ville ha nytte av ny extended reasoning? (Default: dype
|
||||
planleggings-/review-agenter → opus, implementerings-/formatterings-agenter →
|
||||
sonnet)
|
||||
- Konkret: red-team-agent, security-auditor-agent, accessibility-auditor-agent,
|
||||
spec-reviewer-agent er plausible opus-kandidater. implementer-agent,
|
||||
tdd-test-first-agent er plausible sonnet-kandidater. Vurder per agent.
|
||||
- Sjekk om frontmatter bruker korrekt modellidentifikator (sonnet/opus som alias,
|
||||
ikke hardkodet "claude-3.5-sonnet" eller lignende utdaterte navn).
|
||||
|
||||
B) **Harness v13 paritet**
|
||||
- **Centralized model strategy:** Innfør `model.strategy` i Kiur-config med
|
||||
per-role defaults (tdd_implementer, tdd_test_first, reviewer_default, red_team,
|
||||
security, accessibility, spec_reviewer). Dette lar harness override Kiur-dispatch
|
||||
uten å redigere agent-filer.
|
||||
- **Compatibility declaration:** Legg til `compatibleClaudeCodeVersions: {
|
||||
minimum: "2.1.0" }` i plugin.json.
|
||||
- **SubagentStop validation:** Kiur dispatcher mange subagenter (Agent Teams for
|
||||
L2). Vurder en analog subagent-stop-validate.mjs som sjekker at review-agenter
|
||||
produserte strukturert output (f.eks. JSON-verdict) før Stop-event propageres.
|
||||
- **PreCompact snapshot:** Kiurs WORKFLOW_STATE.json kan tape progresjon ved
|
||||
context compaction midt i RED/GREEN/REFACTOR. Vurder en pre-compact-snapshot.mjs som
|
||||
lagrer TDD-fase + failing test count.
|
||||
- **SessionEnd archive:** Kiur skriver ikke event-log på samme måte som harness,
|
||||
men vurder om review-db (hvis den finnes) eller andre JSONL-stater trenger
|
||||
gzip-arkivering.
|
||||
|
||||
C) **Claude Code 2.1.x changelog-relevante features**
|
||||
- **Agent isolation: "worktree"** — Agent-tool støtter nå worktree-isolering.
|
||||
Relevant for red-team-agent som gjør eksperimentelle endringer.
|
||||
- **Dynamic /loop og ScheduleWakeup** — Ikke direkte relevant for Kiur (harness
|
||||
eier loop), men Kiur kan eksponere hooks/events som /loop-integrasjoner kan lytte
|
||||
på.
|
||||
- **TaskCreate/TaskUpdate med blocks/blockedBy** — Mulig bruk i kiur:done for å
|
||||
eksponere Definition of Done-sjekkpunkter som tracked tasks.
|
||||
- **Monitor tool** — For å streame output fra langvarige test-kjøringer uten å
|
||||
blokkere. Vurder i tdd-pipelinen ved store test-suites.
|
||||
- **SendMessage mellom agenter** — Kan forenkle feedback-loop mellom
|
||||
tdd-test-first-agent og implementer-agent i Agent Teams-mode.
|
||||
- **PreCompact / SessionEnd / SubagentStop hook-events** — Allerede dekket i del
|
||||
B.
|
||||
- **Skill tool vs direct invocation** — Hvis Kiur har skills, sjekk at de følger
|
||||
progressive disclosure-mønsteret (kompakt SKILL.md + references/).
|
||||
|
||||
D) **Kiur-spesifikke forbedringer inspirert av harness**
|
||||
- **Adversarial pattern:** Harness' plan-critic-agent er en NO-PLACEHOLDER-streng
|
||||
adversarial reviewer. Vurder analog for Kiur: en "test-critic-agent" som motbeviser
|
||||
at tester faktisk tester noe meningsfullt (f.eks. sjekker for tautologiske asserts,
|
||||
mocks som ikke verifiserer noe, manglende edge cases). Dette forsterker Iron Law.
|
||||
- **Enforce-gating:** Innfør `red_team.enforce`, `security.enforce`,
|
||||
`accessibility.enforce` i config — default warn, kan settes til block for kritiske
|
||||
prosjekter.
|
||||
|
||||
### Fase 3 — Leveranse
|
||||
|
||||
Gi meg tilbake:
|
||||
1. **Oppgaveliste** — nummerert, prioritert (P0/P1/P2), med konkret acceptance
|
||||
criteria per oppgave.
|
||||
2. **Scope-fence** — hva som IKKE gjøres i denne omgangen (f.eks. full rewrite av
|
||||
Agent Teams-orkestrering).
|
||||
3. **Versjonsforslag** — v5.5.0 (minor) vs v6.0.0 (major). Begrunn basert på
|
||||
breaking changes.
|
||||
4. **Risikovurdering** — hva kan gå galt når harness v13 dispatcher til Kiur vN
|
||||
etter disse endringene?
|
||||
5. **Testforslag** — hvilke nye unit/integration-tester trengs for å verifisere
|
||||
paritet med harness-konvensjoner?
|
||||
6. **Rekkefølge** — hvilken av A/B/C/D bør gjøres først? (Min intuisjon: B før A før
|
||||
D før C, men overbevis meg.)
|
||||
|
||||
### Constraints
|
||||
|
||||
- Arbeid KUN i ../kiur/. Ikke rør harness, andre plugins, eller marketplace.json.
|
||||
- Alle hooks skal være .mjs (cross-platform, ingen bash-avhengigheter utover det som
|
||||
allerede finnes).
|
||||
- Følg plugin-konvensjonen i ../CLAUDE.md (plugins/ktg-privat CLAUDE.md).
|
||||
- Bash 3.2-kompatibilitet for eventuelle shell-templates.
|
||||
- Aldri bruk `claude-3.5-sonnet` eller `claude-3-opus` i frontmatter — bruk alias
|
||||
`sonnet` / `opus` / `haiku` som plugin-arkitekturen forstår.
|
||||
|
||||
Start med Fase 1 (les kontekst). Rapporter når klar for Fase 3.
|
||||
Loading…
Add table
Add a link
Reference in a new issue