ktg-plugin-marketplace/plugins/ms-ai-architect/playground/test-fixtures/migrate.md
Kjell Tore Guttormsen e57dee5a03 chore(ms-ai-architect): scrub identifying references from fixtures + remove screenshots
Removes:
- All 6 PNG screenshots (playground/screenshots/) and the capture script
  (scripts/screenshots/capture-playground.py).
- "Screenshots" section from plugin README.
- "Screenshot-suite" section from plugin CLAUDE.md.
- Screenshots bullet from marketplace root README's ms-ai-architect listing.

Scrubs the 17 synthetic fixtures + CHANGELOG/CLAUDE/README of identifying
references: organization names, government-agency names, agency-specific
terminology, sector-specific use cases. Replaced with generic placeholder
data ("Acme AS" / "Demosystem") that exercises the same parser archetypes.

Plugin's domain-target wording (Datatilsynet, offentlig sektor, offentlig
myndighet, rettshåndhevelse, NS 5814, Utredningsinstruksen, EU AI Act
Annex III categories) is intact — those describe the plugin's intended
audience, not any specific entity.

This is a cleanup commit. Earlier git history still contains the prior
references; force-push or rebase is required if scrubbing the history is
desired. That decision is out of scope here — please run it separately
if needed.

Verified post-scrub:
- bash tests/validate-plugin.sh -> 215/215 PASS
- bash tests/run-e2e.sh --playground -> 240/240 PASS (170 + 70)
2026-05-03 20:53:49 +02:00

2.5 KiB

Migrasjonsplan — Demosystem

System: Demosystem (Acme AS) Fra: On-prem OCR + manuell klassifisering Til: Azure AI Foundry + saksbehandler-co-pilot

Faser

Fase 1 — Foundry-fundament (uker 1-6)

Varighet: 6 uker

Milepæler:

  • Hub + projects opprettet i West Europe
  • Network isolation: Private Endpoints + Vnet integration
  • Identity: Entra ID-integrasjon med PIM
  • Logging: OpenTelemetry → Sentinel pipeline

Suksesskriterier:

  • Pilot OCR-modell deployert med <100ms latency P95
  • Audit-logg fanger 100% av inferences
  • Sikkerhetsarkitekt godkjenner foundation-design

Fase 2 — Modell-trening og baseline (uker 7-14)

Varighet: 8 uker

Milepæler:

  • Treningsdata kuratert (200k norske objekt-ID, stratifisert)
  • Custom modell trent på Azure ML
  • Baseline-nøyaktighet etablert (mål: ≥96% F1)
  • Bias-evaluering på utenlandske registre fullført

Suksesskriterier:

  • F1 ≥ 96% overall, ≥ 92% per objekter-segment
  • Drift-deteksjon kalibrert med terskel
  • ROS-revisjon godkjent

Fase 3 — saksbehandler-co-pilot (uker 15-22)

Varighet: 8 uker

Milepæler:

  • Forklaringsmodell (GPT-4 Turbo) integrert via Foundry
  • saksbehandler-UI bygget (Copilot Studio + Power Platform)
  • Workflow: AI flagger → saksbehandler reviewer → klar for sanksjon
  • Brukertest med 12 saksbehandler fra ulike regioner

Suksesskriterier:

  • Saksbehandlingstid -40% vs baseline
  • saksbehandler-tillit >7/10 i post-pilot survey
  • Ingen kritiske UX-feil

Fase 4 — Compliance og produksjonssetting (uker 23-28)

Varighet: 6 uker

Milepæler:

  • FRIA gjennomført og godkjent
  • Conformity assessment ferdigstilt per Annex VI
  • DPIA oppdatert med nye operasjonelle data
  • Produksjonssetting til 3 piloter (Oslo, Bergen, Trondheim)

Suksesskriterier:

  • Personvernombud signerer DPIA
  • Ingen open critical-funn fra arkitekturgjennomgang
  • Stabil 99.9% uptime i 30 dager pilot

Risiko

Risiko Sannsynlighet Konsekvens Tiltak
Custom modell underyter mot 96% mål medium high Backup-strategi: bruk Azure AI Vision OCR som fallback
saksbehandler-motstand mot AI medium medium Tidlig involvering; transparent forklaring; opt-out på enkelt-saker
FRIA blokkerer fase 4 low high Pre-FRIA-kjøring i fase 2 for tidlig varsling
Cost-overrun ved skalering medium medium Reserved capacity-binding etter fase 3

Total varighet

28 uker (~7 måneder). Avhengighet: Foundry-fundament må være ferdig før modell-trening starter.