ktg-plugin-marketplace/plugins/ultraplan-local/docs/_archive-ultra-suite-brief_2.md
Kjell Tore Guttormsen 1016914fc1 chore(ultraplan-local): Spor 0 — foundation for v3.1.0 kvalitetsprogram
- package.json med node:test runner og scripts (test, simulate), zero deps
- settings.json: fjern vestigial exploration- og agentTeam-blokker (verifisert leset av ingen kode via grep)
- docs/: commit subagent-delegation-audit.md og ultraexecute-v2-observations-from-config-audit-v4.md (begge real arkitektur-notater)
- docs/: arkiver ultra-suite-brief_2.md som _archive- (var paste fra annet plugin-arbeid, irrelevant her)
- tests/helpers/hook-helper.mjs kopiert fra llm-security m/ provenance-kommentar

Forberedelse for Spor 1 (lib/-moduler), Spor 2 (HANDOVER-CONTRACTS + PreCompact-hook), Spor 3 (bug-fixes + CC-features).

Plan: ~/.claude/plans/det-neste-vi-gj-r-eventual-adleman.md

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-01 05:27:44 +02:00

6.3 KiB

Kontekst: Harness-plugin (../harness/) er nettopp oppgradert til v13.0.0 (commit 8a444f5 på main). Kiur (v5.4.0) er søster-plugin — harness orkestrerer hvilke features som bygges, Kiur håndhever kvalitet via TDD + multi-agent review. Kiur dispatches fra harness for L1/L2 features (kiur:tdd + kiur:done), så konvensjonene må holdes i sync.

Oppgave: Moderniser Kiur til å matche:

  1. Harness v13.0.0 konvensjoner
  2. Opus 4.7 (ny modell — claude-opus-4-7, extended reasoning)
  3. Nyere Claude Code features (2.1.x+)

Viktig: IKKE implementer ennå. Les kontekst, foreslå en plan med prioritert oppgaveliste + begrunnelse, vent på min godkjenning.

Fase 1 — Les kontekst (obligatorisk før planlegging)

Les disse filene i sin helhet:

  • ../harness/CLAUDE.md (v13.0 konvensjoner, spesielt model.strategy, review gates, 3 nye hooks)
  • ../harness/README.md (seksjonene "Review Gates", "Review Triad (v13.0)", "Version History v13.0.0")
  • ../harness/lib/config.mjs (se model.strategy og enforce-mønsteret)
  • ../harness/agents/plan-critic-agent.md (adversarial review-pattern)
  • ../harness/agents/scope-guardian-agent.md (coverage matrix-pattern)
  • ../harness/hooks/scripts/subagent-stop-validate.mjs (verification_manifest gate)
  • ../harness/hooks/scripts/pre-compact-snapshot.mjs (state preservation)
  • ../harness/hooks/hooks.json (SessionEnd/SubagentStop/PreCompact wiring)

Fra Kiur selv:

  • CLAUDE.md, README.md, CHANGELOG.md
  • .claude-plugin/plugin.json (nåværende versjon, manglende compatibleClaudeCodeVersions)
  • Alle 6 agent-filer (agents/*.md) — noter modeller i frontmatter
  • Alle 8 commands (commands/*.md) — spesielt tdd.md, review.md, done.md
  • Alle 4 hook-scripter (hooks/scripts/*.mjs)

Fase 2 — Dimensjoner å vurdere

A) Opus 4.7-tilpasning - Hvilke agenter ville ha nytte av ny extended reasoning? (Default: dype planleggings-/review-agenter → opus, implementerings-/formatterings-agenter → sonnet) - Konkret: red-team-agent, security-auditor-agent, accessibility-auditor-agent, spec-reviewer-agent er plausible opus-kandidater. implementer-agent, tdd-test-first-agent er plausible sonnet-kandidater. Vurder per agent. - Sjekk om frontmatter bruker korrekt modellidentifikator (sonnet/opus som alias, ikke hardkodet "claude-3.5-sonnet" eller lignende utdaterte navn).

B) Harness v13 paritet - Centralized model strategy: Innfør model.strategy i Kiur-config med per-role defaults (tdd_implementer, tdd_test_first, reviewer_default, red_team, security, accessibility, spec_reviewer). Dette lar harness override Kiur-dispatch uten å redigere agent-filer. - Compatibility declaration: Legg til compatibleClaudeCodeVersions: { minimum: "2.1.0" } i plugin.json. - SubagentStop validation: Kiur dispatcher mange subagenter (Agent Teams for L2). Vurder en analog subagent-stop-validate.mjs som sjekker at review-agenter produserte strukturert output (f.eks. JSON-verdict) før Stop-event propageres. - PreCompact snapshot: Kiurs WORKFLOW_STATE.json kan tape progresjon ved context compaction midt i RED/GREEN/REFACTOR. Vurder en pre-compact-snapshot.mjs som lagrer TDD-fase + failing test count. - SessionEnd archive: Kiur skriver ikke event-log på samme måte som harness, men vurder om review-db (hvis den finnes) eller andre JSONL-stater trenger gzip-arkivering.

C) Claude Code 2.1.x changelog-relevante features - Agent isolation: "worktree" — Agent-tool støtter nå worktree-isolering. Relevant for red-team-agent som gjør eksperimentelle endringer. - Dynamic /loop og ScheduleWakeup — Ikke direkte relevant for Kiur (harness eier loop), men Kiur kan eksponere hooks/events som /loop-integrasjoner kan lytte på. - TaskCreate/TaskUpdate med blocks/blockedBy — Mulig bruk i kiur:done for å eksponere Definition of Done-sjekkpunkter som tracked tasks. - Monitor tool — For å streame output fra langvarige test-kjøringer uten å blokkere. Vurder i tdd-pipelinen ved store test-suites. - SendMessage mellom agenter — Kan forenkle feedback-loop mellom tdd-test-first-agent og implementer-agent i Agent Teams-mode. - PreCompact / SessionEnd / SubagentStop hook-events — Allerede dekket i del B. - Skill tool vs direct invocation — Hvis Kiur har skills, sjekk at de følger progressive disclosure-mønsteret (kompakt SKILL.md + references/).

D) Kiur-spesifikke forbedringer inspirert av harness - Adversarial pattern: Harness' plan-critic-agent er en NO-PLACEHOLDER-streng adversarial reviewer. Vurder analog for Kiur: en "test-critic-agent" som motbeviser at tester faktisk tester noe meningsfullt (f.eks. sjekker for tautologiske asserts, mocks som ikke verifiserer noe, manglende edge cases). Dette forsterker Iron Law. - Enforce-gating: Innfør red_team.enforce, security.enforce, accessibility.enforce i config — default warn, kan settes til block for kritiske prosjekter.

Fase 3 — Leveranse

Gi meg tilbake:

  1. Oppgaveliste — nummerert, prioritert (P0/P1/P2), med konkret acceptance criteria per oppgave.
  2. Scope-fence — hva som IKKE gjøres i denne omgangen (f.eks. full rewrite av Agent Teams-orkestrering).
  3. Versjonsforslag — v5.5.0 (minor) vs v6.0.0 (major). Begrunn basert på breaking changes.
  4. Risikovurdering — hva kan gå galt når harness v13 dispatcher til Kiur vN etter disse endringene?
  5. Testforslag — hvilke nye unit/integration-tester trengs for å verifisere paritet med harness-konvensjoner?
  6. Rekkefølge — hvilken av A/B/C/D bør gjøres først? (Min intuisjon: B før A før D før C, men overbevis meg.)

Constraints

  • Arbeid KUN i ../kiur/. Ikke rør harness, andre plugins, eller marketplace.json.
  • Alle hooks skal være .mjs (cross-platform, ingen bash-avhengigheter utover det som allerede finnes).
  • Følg plugin-konvensjonen i ../CLAUDE.md (plugins/ktg-privat CLAUDE.md).
  • Bash 3.2-kompatibilitet for eventuelle shell-templates.
  • Aldri bruk claude-3.5-sonnet eller claude-3-opus i frontmatter — bruk alias sonnet / opus / haiku som plugin-arkitekturen forstår.

Start med Fase 1 (les kontekst). Rapporter når klar for Fase 3.