test(ms-ai-architect): playground v3 markdown fixtures (17 commands) [skip-docs]
Synthetic markdown fixtures for the 17 report-producing commands per the canonical archetype-routing-tabell. Each fixture uses the consistent ANPR-trafikkanalyse system from brief example to produce parser-input that exercises every archetype path (aiact, requirements-list, text-document, fria, conformity-checklist, matrix-risk 5x5, matrix-risk-6x5, findings, cost-distribution, capability, phased-plan, markdown, verdict, comparison). Real /architect:<command> capture deferred to incremental work; synthetic fixtures suffice as parser test input for Steps 11-12.
This commit is contained in:
parent
3750bee48b
commit
b4a5ff0c75
17 changed files with 744 additions and 0 deletions
80
plugins/ms-ai-architect/playground/test-fixtures/migrate.md
Normal file
80
plugins/ms-ai-architect/playground/test-fixtures/migrate.md
Normal file
|
|
@ -0,0 +1,80 @@
|
|||
# Migrasjonsplan — ANPR-trafikkanalyse
|
||||
|
||||
System: ANPR-trafikkanalyse (Statens vegvesen)
|
||||
Fra: On-prem OCR + manuell klassifisering
|
||||
Til: Azure AI Foundry + saksbehandler-co-pilot
|
||||
|
||||
## Faser
|
||||
|
||||
### Fase 1 — Foundry-fundament (uker 1-6)
|
||||
|
||||
Varighet: 6 uker
|
||||
|
||||
Milepæler:
|
||||
- Hub + projects opprettet i West Europe
|
||||
- Network isolation: Private Endpoints + Vnet integration
|
||||
- Identity: Entra ID-integrasjon med PIM
|
||||
- Logging: OpenTelemetry → Sentinel pipeline
|
||||
|
||||
Suksesskriterier:
|
||||
- Pilot OCR-modell deployert med <100ms latency P95
|
||||
- Audit-logg fanger 100% av inferences
|
||||
- Sikkerhetsarkitekt godkjenner foundation-design
|
||||
|
||||
### Fase 2 — Modell-trening og baseline (uker 7-14)
|
||||
|
||||
Varighet: 8 uker
|
||||
|
||||
Milepæler:
|
||||
- Treningsdata kuratert (200k norske kjennemerker, stratifisert)
|
||||
- Custom modell trent på Azure ML
|
||||
- Baseline-nøyaktighet etablert (mål: ≥96% F1)
|
||||
- Bias-evaluering på utenlandske registre fullført
|
||||
|
||||
Suksesskriterier:
|
||||
- F1 ≥ 96% overall, ≥ 92% per kjøretøy-segment
|
||||
- Drift-deteksjon kalibrert med terskel
|
||||
- ROS-revisjon godkjent
|
||||
|
||||
### Fase 3 — Saksbehandler-co-pilot (uker 15-22)
|
||||
|
||||
Varighet: 8 uker
|
||||
|
||||
Milepæler:
|
||||
- Forklaringsmodell (GPT-4 Turbo) integrert via Foundry
|
||||
- Saksbehandler-UI bygget (Copilot Studio + Power Platform)
|
||||
- Workflow: AI flagger → saksbehandler reviewer → klar for sanksjon
|
||||
- Brukertest med 12 saksbehandlere fra ulike regioner
|
||||
|
||||
Suksesskriterier:
|
||||
- Saksbehandlingstid -40% vs baseline
|
||||
- Saksbehandler-tillit >7/10 i post-pilot survey
|
||||
- Ingen kritiske UX-feil
|
||||
|
||||
### Fase 4 — Compliance og produksjonssetting (uker 23-28)
|
||||
|
||||
Varighet: 6 uker
|
||||
|
||||
Milepæler:
|
||||
- FRIA gjennomført og godkjent
|
||||
- Conformity assessment ferdigstilt per Annex VI
|
||||
- DPIA oppdatert med nye operasjonelle data
|
||||
- Produksjonssetting til 3 piloter (Oslo, Bergen, Trondheim)
|
||||
|
||||
Suksesskriterier:
|
||||
- Personvernombud signerer DPIA
|
||||
- Ingen open critical-funn fra arkitekturgjennomgang
|
||||
- Stabil 99.9% uptime i 30 dager pilot
|
||||
|
||||
## Risiko
|
||||
|
||||
| Risiko | Sannsynlighet | Konsekvens | Tiltak |
|
||||
|--------|---------------|------------|--------|
|
||||
| Custom modell underyter mot 96% mål | medium | high | Backup-strategi: bruk Azure AI Vision OCR som fallback |
|
||||
| Saksbehandler-motstand mot AI | medium | medium | Tidlig involvering; transparent forklaring; opt-out på enkelt-saker |
|
||||
| FRIA blokkerer fase 4 | low | high | Pre-FRIA-kjøring i fase 2 for tidlig varsling |
|
||||
| Cost-overrun ved skalering | medium | medium | Reserved capacity-binding etter fase 3 |
|
||||
|
||||
## Total varighet
|
||||
|
||||
28 uker (~7 måneder). Avhengighet: Foundry-fundament må være ferdig før modell-trening starter.
|
||||
Loading…
Add table
Add a link
Reference in a new issue