Sesjon 3 av 3 — leverer Fase 7-9 av v1.11.0-planen. Fase 7 (Acme-rename på demo-state): - Rename "Acme AS" → "Acme Kommune" og "Demosystem" → "Acme Kunde-chatbot" konsistent på tvers av alle 17 fixtures. - build-demo-state.mjs: organization.name → "Acme Kommune", projects[0] → id "acme-kunde-chatbot" / name "Acme: Kunde-chatbot". - Re-bygd demo-state-v1-blokk i playground HTML. Fase 8 (Screenshots-regenerering): - 24 nye PNG-er under playground/screenshots/v1.11.0/ (12 surfaces × 2 tema, retina, fullPage). v1.10.0-mappen beholdt som historisk referanse. - tests/screenshot/run.mjs: OUT_DIR + kommentarer bumpet til v1.11.0. Fase 9 (Release: docs + versjonsbump): - plugin.json 1.10.1 → 1.11.0. - README.md (plugin): version-badge + Version History + screenshot-gallery refs + demo-data refs oppdatert. - CLAUDE.md (plugin): Playground-overskrift v3/v1.10.0 → v3/v1.11.0, Demo system-seksjon v1.10.1 → v1.11.0, screenshot-refs v1.10.0 → v1.11.0, "Inline CSS-kandidater" konvertert til "Design-system 100%-adoption" status. - Root README.md: ms-ai-architect-versjon 1.10.1 → 1.11.0, demo-tekst og Playground-tekst regenerert for v1.11.0, "271 PASS combined" → "278 PASS". Verifisering: - bash tests/run-e2e.sh --playground → 271/271 PASS (static + parsers). - bash tests/test-playground-migrations.sh → 7/7 PASS. - Total: 278/278 PASS, 0 FAIL. Refs: NEXT-SESSION-PROMPT.local.md (Sesjon 3 av 3, plan .claude/plans/jeg-skal-pr-ve-effervescent-token.md). Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
83 lines
2.6 KiB
Markdown
83 lines
2.6 KiB
Markdown
# POC-plan — Acme Kunde-chatbot
|
|
|
|
System: Acme Kunde-chatbot (Acme Kommune)
|
|
POC-mål: Validere at Azure AI Foundry kan dekke OCR + forklaring + audit innen tids- og kostbudsjett
|
|
|
|
## Faser
|
|
|
|
### Fase 1 — Foundation (uker 1-2)
|
|
|
|
Varighet: 2 uker
|
|
Status: done
|
|
|
|
Milepæler:
|
|
- Foundry hub + project i West Europe
|
|
- Identity og networking konfigurert
|
|
- Sample-data uploadet (10k anonymiserte objekt-ID)
|
|
|
|
Suksesskriterier:
|
|
- Inferens-endpoint nåbart fra dev-Vnet via Private Endpoint
|
|
- Audit-logg fanger første test-inferens
|
|
- Cost-monitor viser daglig forbruk i Azure portal
|
|
|
|
### Fase 2 — OCR-modell (uker 3-5)
|
|
|
|
Varighet: 3 uker
|
|
Status: active
|
|
|
|
Milepæler:
|
|
- Pre-trent Azure AI Vision OCR pilotert
|
|
- Custom fine-tune på 10k objekt-ID
|
|
- Sammenligning av accuracy/latency mellom de to
|
|
|
|
Suksesskriterier:
|
|
- F1 ≥ 92% på pilot-sett (lavere mål enn produksjon, akseptabelt for POC)
|
|
- Latency P95 < 200ms
|
|
- Inference-cost ≤ NOK 0.04 per kall
|
|
|
|
### Fase 3 — Forklarings-loop (uker 6-7)
|
|
|
|
Varighet: 2 uker
|
|
Status: planned
|
|
|
|
Milepæler:
|
|
- GPT-4 Turbo via Foundry integrert
|
|
- Prompt-template for forklaring av flagged sak
|
|
- saksbehandler-mock UI (en enkel webside) prøvd ut med 3 brukere
|
|
|
|
Suksesskriterier:
|
|
- Forklaring referer til konfidens og kontekst korrekt i 95% av tilfellene
|
|
- saksbehandler-feedback kvalitativt positiv ("forståelig, men trenger justering")
|
|
- Prompt-tokens under 250 i snitt per sak
|
|
|
|
### Fase 4 — Compliance-pre-check (uke 8)
|
|
|
|
Varighet: 1 uke
|
|
Status: planned
|
|
|
|
Milepæler:
|
|
- Audit-logg mot EU AI Act Art. 12-krav
|
|
- Customer-managed keys verifisert
|
|
- Pre-DPIA-sjekk gjort med Datatilsynet
|
|
|
|
Suksesskriterier:
|
|
- Audit-logg dekker 100% av inferences med tidsstempel + bruker
|
|
- Personvernombud signer pre-DPIA-utkast
|
|
- Ingen åpenbare GDPR-blokkere
|
|
|
|
## Risiko
|
|
|
|
| Risiko | Sannsynlighet | Konsekvens | Tiltak |
|
|
|--------|---------------|------------|--------|
|
|
| Custom OCR-modell underyter pre-trent | medium | medium | Aksepter pre-trent for POC; planlegg custom for full prod |
|
|
| Foundry-quota i West Europe utilstrekkelig | low | medium | Reserver kapasitet før POC starter |
|
|
| saksbehandler-recruitment forsinker fase 3 | medium | low | Bruk interne ressurser i AI-teamet som mock |
|
|
| Audit-logg-format ikke kompatibelt med Sentinel | low | medium | Test integrasjon i fase 1 |
|
|
|
|
## POC-Verdict: BETINGET
|
|
|
|
Pilot-fase 1 fullført med F1=0.94 og inference-cost 0.038 NOK/kall (under budsjett). Fase 2 pågår — sammenligning av custom fine-tune mot pre-trent OCR i progress. Forklarings-loop og compliance-pre-check planlagt for siste halvdel.
|
|
|
|
## Total varighet
|
|
|
|
8 uker. Beslutningskriterium for full prosjektgodkjenning: alle 4 fasers suksesskriterier møtt.
|