ktg-plugin-marketplace/plugins/ms-ai-architect/playground/test-fixtures/poc.md
Kjell Tore Guttormsen 7ffaa82207 feat(ms-ai-architect): release v1.11.0 — design-system 100%-adoption + visual upgrade
Sesjon 3 av 3 — leverer Fase 7-9 av v1.11.0-planen.

Fase 7 (Acme-rename på demo-state):
- Rename "Acme AS" → "Acme Kommune" og "Demosystem" → "Acme Kunde-chatbot"
  konsistent på tvers av alle 17 fixtures.
- build-demo-state.mjs: organization.name → "Acme Kommune", projects[0] →
  id "acme-kunde-chatbot" / name "Acme: Kunde-chatbot".
- Re-bygd demo-state-v1-blokk i playground HTML.

Fase 8 (Screenshots-regenerering):
- 24 nye PNG-er under playground/screenshots/v1.11.0/ (12 surfaces × 2 tema,
  retina, fullPage). v1.10.0-mappen beholdt som historisk referanse.
- tests/screenshot/run.mjs: OUT_DIR + kommentarer bumpet til v1.11.0.

Fase 9 (Release: docs + versjonsbump):
- plugin.json 1.10.1 → 1.11.0.
- README.md (plugin): version-badge + Version History + screenshot-gallery refs +
  demo-data refs oppdatert.
- CLAUDE.md (plugin): Playground-overskrift v3/v1.10.0 → v3/v1.11.0,
  Demo system-seksjon v1.10.1 → v1.11.0, screenshot-refs v1.10.0 → v1.11.0,
  "Inline CSS-kandidater" konvertert til "Design-system 100%-adoption" status.
- Root README.md: ms-ai-architect-versjon 1.10.1 → 1.11.0, demo-tekst og
  Playground-tekst regenerert for v1.11.0, "271 PASS combined" → "278 PASS".

Verifisering:
- bash tests/run-e2e.sh --playground → 271/271 PASS (static + parsers).
- bash tests/test-playground-migrations.sh → 7/7 PASS.
- Total: 278/278 PASS, 0 FAIL.

Refs: NEXT-SESSION-PROMPT.local.md (Sesjon 3 av 3, plan
.claude/plans/jeg-skal-pr-ve-effervescent-token.md).

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-04 17:41:36 +02:00

83 lines
2.6 KiB
Markdown

# POC-plan — Acme Kunde-chatbot
System: Acme Kunde-chatbot (Acme Kommune)
POC-mål: Validere at Azure AI Foundry kan dekke OCR + forklaring + audit innen tids- og kostbudsjett
## Faser
### Fase 1 — Foundation (uker 1-2)
Varighet: 2 uker
Status: done
Milepæler:
- Foundry hub + project i West Europe
- Identity og networking konfigurert
- Sample-data uploadet (10k anonymiserte objekt-ID)
Suksesskriterier:
- Inferens-endpoint nåbart fra dev-Vnet via Private Endpoint
- Audit-logg fanger første test-inferens
- Cost-monitor viser daglig forbruk i Azure portal
### Fase 2 — OCR-modell (uker 3-5)
Varighet: 3 uker
Status: active
Milepæler:
- Pre-trent Azure AI Vision OCR pilotert
- Custom fine-tune på 10k objekt-ID
- Sammenligning av accuracy/latency mellom de to
Suksesskriterier:
- F1 ≥ 92% på pilot-sett (lavere mål enn produksjon, akseptabelt for POC)
- Latency P95 < 200ms
- Inference-cost ≤ NOK 0.04 per kall
### Fase 3 — Forklarings-loop (uker 6-7)
Varighet: 2 uker
Status: planned
Milepæler:
- GPT-4 Turbo via Foundry integrert
- Prompt-template for forklaring av flagged sak
- saksbehandler-mock UI (en enkel webside) prøvd ut med 3 brukere
Suksesskriterier:
- Forklaring referer til konfidens og kontekst korrekt i 95% av tilfellene
- saksbehandler-feedback kvalitativt positiv ("forståelig, men trenger justering")
- Prompt-tokens under 250 i snitt per sak
### Fase 4 — Compliance-pre-check (uke 8)
Varighet: 1 uke
Status: planned
Milepæler:
- Audit-logg mot EU AI Act Art. 12-krav
- Customer-managed keys verifisert
- Pre-DPIA-sjekk gjort med Datatilsynet
Suksesskriterier:
- Audit-logg dekker 100% av inferences med tidsstempel + bruker
- Personvernombud signer pre-DPIA-utkast
- Ingen åpenbare GDPR-blokkere
## Risiko
| Risiko | Sannsynlighet | Konsekvens | Tiltak |
|--------|---------------|------------|--------|
| Custom OCR-modell underyter pre-trent | medium | medium | Aksepter pre-trent for POC; planlegg custom for full prod |
| Foundry-quota i West Europe utilstrekkelig | low | medium | Reserver kapasitet før POC starter |
| saksbehandler-recruitment forsinker fase 3 | medium | low | Bruk interne ressurser i AI-teamet som mock |
| Audit-logg-format ikke kompatibelt med Sentinel | low | medium | Test integrasjon i fase 1 |
## POC-Verdict: BETINGET
Pilot-fase 1 fullført med F1=0.94 og inference-cost 0.038 NOK/kall (under budsjett). Fase 2 pågår — sammenligning av custom fine-tune mot pre-trent OCR i progress. Forklarings-loop og compliance-pre-check planlagt for siste halvdel.
## Total varighet
8 uker. Beslutningskriterium for full prosjektgodkjenning: alle 4 fasers suksesskriterier møtt.