ktg-plugin-marketplace/plugins/ms-ai-architect/playground/test-fixtures/poc.md
Kjell Tore Guttormsen 7ffaa82207 feat(ms-ai-architect): release v1.11.0 — design-system 100%-adoption + visual upgrade
Sesjon 3 av 3 — leverer Fase 7-9 av v1.11.0-planen.

Fase 7 (Acme-rename på demo-state):
- Rename "Acme AS" → "Acme Kommune" og "Demosystem" → "Acme Kunde-chatbot"
  konsistent på tvers av alle 17 fixtures.
- build-demo-state.mjs: organization.name → "Acme Kommune", projects[0] →
  id "acme-kunde-chatbot" / name "Acme: Kunde-chatbot".
- Re-bygd demo-state-v1-blokk i playground HTML.

Fase 8 (Screenshots-regenerering):
- 24 nye PNG-er under playground/screenshots/v1.11.0/ (12 surfaces × 2 tema,
  retina, fullPage). v1.10.0-mappen beholdt som historisk referanse.
- tests/screenshot/run.mjs: OUT_DIR + kommentarer bumpet til v1.11.0.

Fase 9 (Release: docs + versjonsbump):
- plugin.json 1.10.1 → 1.11.0.
- README.md (plugin): version-badge + Version History + screenshot-gallery refs +
  demo-data refs oppdatert.
- CLAUDE.md (plugin): Playground-overskrift v3/v1.10.0 → v3/v1.11.0,
  Demo system-seksjon v1.10.1 → v1.11.0, screenshot-refs v1.10.0 → v1.11.0,
  "Inline CSS-kandidater" konvertert til "Design-system 100%-adoption" status.
- Root README.md: ms-ai-architect-versjon 1.10.1 → 1.11.0, demo-tekst og
  Playground-tekst regenerert for v1.11.0, "271 PASS combined" → "278 PASS".

Verifisering:
- bash tests/run-e2e.sh --playground → 271/271 PASS (static + parsers).
- bash tests/test-playground-migrations.sh → 7/7 PASS.
- Total: 278/278 PASS, 0 FAIL.

Refs: NEXT-SESSION-PROMPT.local.md (Sesjon 3 av 3, plan
.claude/plans/jeg-skal-pr-ve-effervescent-token.md).

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-04 17:41:36 +02:00

2.6 KiB

POC-plan — Acme Kunde-chatbot

System: Acme Kunde-chatbot (Acme Kommune) POC-mål: Validere at Azure AI Foundry kan dekke OCR + forklaring + audit innen tids- og kostbudsjett

Faser

Fase 1 — Foundation (uker 1-2)

Varighet: 2 uker Status: done

Milepæler:

  • Foundry hub + project i West Europe
  • Identity og networking konfigurert
  • Sample-data uploadet (10k anonymiserte objekt-ID)

Suksesskriterier:

  • Inferens-endpoint nåbart fra dev-Vnet via Private Endpoint
  • Audit-logg fanger første test-inferens
  • Cost-monitor viser daglig forbruk i Azure portal

Fase 2 — OCR-modell (uker 3-5)

Varighet: 3 uker Status: active

Milepæler:

  • Pre-trent Azure AI Vision OCR pilotert
  • Custom fine-tune på 10k objekt-ID
  • Sammenligning av accuracy/latency mellom de to

Suksesskriterier:

  • F1 ≥ 92% på pilot-sett (lavere mål enn produksjon, akseptabelt for POC)
  • Latency P95 < 200ms
  • Inference-cost ≤ NOK 0.04 per kall

Fase 3 — Forklarings-loop (uker 6-7)

Varighet: 2 uker Status: planned

Milepæler:

  • GPT-4 Turbo via Foundry integrert
  • Prompt-template for forklaring av flagged sak
  • saksbehandler-mock UI (en enkel webside) prøvd ut med 3 brukere

Suksesskriterier:

  • Forklaring referer til konfidens og kontekst korrekt i 95% av tilfellene
  • saksbehandler-feedback kvalitativt positiv ("forståelig, men trenger justering")
  • Prompt-tokens under 250 i snitt per sak

Fase 4 — Compliance-pre-check (uke 8)

Varighet: 1 uke Status: planned

Milepæler:

  • Audit-logg mot EU AI Act Art. 12-krav
  • Customer-managed keys verifisert
  • Pre-DPIA-sjekk gjort med Datatilsynet

Suksesskriterier:

  • Audit-logg dekker 100% av inferences med tidsstempel + bruker
  • Personvernombud signer pre-DPIA-utkast
  • Ingen åpenbare GDPR-blokkere

Risiko

Risiko Sannsynlighet Konsekvens Tiltak
Custom OCR-modell underyter pre-trent medium medium Aksepter pre-trent for POC; planlegg custom for full prod
Foundry-quota i West Europe utilstrekkelig low medium Reserver kapasitet før POC starter
saksbehandler-recruitment forsinker fase 3 medium low Bruk interne ressurser i AI-teamet som mock
Audit-logg-format ikke kompatibelt med Sentinel low medium Test integrasjon i fase 1

POC-Verdict: BETINGET

Pilot-fase 1 fullført med F1=0.94 og inference-cost 0.038 NOK/kall (under budsjett). Fase 2 pågår — sammenligning av custom fine-tune mot pre-trent OCR i progress. Forklarings-loop og compliance-pre-check planlagt for siste halvdel.

Total varighet

8 uker. Beslutningskriterium for full prosjektgodkjenning: alle 4 fasers suksesskriterier møtt.