Updated 66 stale knowledge base reference files (10 critical, 56 high) across all 5 skills using Microsoft Learn MCP research. Key factual updates: - Groundedness Detection API: `correction` → `mitigating` param, `correctedText` → `correctionText` (breaking change) - Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini); Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx) - Agentic Retrieval: still public preview; 50M free tokens/month - Azure security baselines: "Cognitive Services" → "Foundry Tools" - Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines - MLflow 3 GenAI: new Feedback/Expectation data model - Token tracking doc: "Azure OpenAI in Foundry Models through a gateway" - Agent Registry: Risks column (M365 E7), Graph API (preview) - Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles - ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot - Zero Trust: CAE now via Conditional Access, Strict Location Enforcement - Purview: new Fabric Copilots/agents governance section - AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python) All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added. Build registry: 1341 URLs from 387 files (+2 new URLs). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
27 KiB
Model Explainability and Interpretability - XAI Techniques
Last updated: 2026-04 Status: GA Category: Responsible AI & Governance
Introduksjon
Model explainability og interpretability (XAI - Explainable AI) handler om å gjøre machine learning-modellers beslutninger forståelige og transparent for mennesker. I en tid hvor AI-systemer påvirker kritiske beslutninger i offentlig sektor, helsevesen og finansbransjen, er det avgjørende å kunne forklare hvorfor en modell gjorde en spesifikk prediksjon.
Azure Machine Learning tilbyr et omfattende rammeverk for model interpretability gjennom Responsible AI dashboard, som integrerer flere XAI-teknikker. Disse teknikkene gir både global forståelse (hva påvirker modellens generelle oppførsel) og lokal forståelse (hvorfor modellen ga denne spesifikke prediksjonen). Kjernen i løsningen er InterpretML-pakken, som leverer model-agnostic explanations gjennom SHAP (SHapley Additive exPlanations) og surrogate-modeller.
For offentlig sektor i Norge er model explainability ikke bare en nice-to-have, men en nødvendighet for å oppfylle GDPR artikkel 22 (rett til forklaring), kommende AI Act krav om transparens, og Forvaltningslovens krav om begrunnelse av vedtak. Når NAV bruker AI til saksbehandling eller en kommune til ressursallokering, må de kunne forklare beslutningsgrunnlaget både teknisk og i vanlig språk.
Kjernekomponenter / Nøkkelegenskaper
XAI-teknikker i Azure Machine Learning
| Teknikk | Type | Anvendelse | Modalitet |
|---|---|---|---|
| SHAP Tree Explainer | Model-agnostic | Global + local explanations for tree-based models | Tabular |
| Mimic Explainer (Global Surrogate) | Model-agnostic | LightGBM surrogate-modell som approksimerer black-box | Tabular |
| SHAP Text | Model-agnostic | Token-level attribution for tekstklassifisering | Text (multi-class/multi-label) |
| SHAP Vision | Model-agnostic | Superpixel-baserte heatmaps for bildedata | Image (multi-class/multi-label) |
| Guided Backprop | AutoML-spesifikk | Gradient-basert visualisering av neural network | Image |
| Guided GradCAM | AutoML-spesifikk | Kombinerer guided backprop + GradCAM localization | Image |
| Integrated Gradients | AutoML-spesifikk | Integrerte gradienter fra baseline til input | Image |
| XRAI | AutoML-spesifikk | Region-basert saliency med Integrated Gradients | Image |
| D-RISE | Model-agnostic | Object detection explanations (YOLO, Faster-RCNN, ViT) | Image (object detection) |
| Permutation Feature Importance | Model-agnostic | Feature shuffling for å måle impact | Tabular (.NET ML.NET) |
Forklaringsnivåer i Responsible AI Dashboard
| Nivå | Beskrivelse | Bruksområde |
|---|---|---|
| Global explanations | Aggregate feature importance på tvers av alle prediksjoner | Forstå modellens generelle atferd, identifisere bias i features |
| Local explanations | Feature importance for enkeltprediksjoner | Forklare individuelle avslag/godkjenninger til sluttbrukere |
| Cohort explanations | Feature importance for subgrupper (f.eks. demografiske grupper) | Fairness-analyse, identifisere disparities i modellytelse |
SHAP (SHapley Additive exPlanations) - Kjerneteknikken
SHAP er basert på Shapley values fra spillteori, som beregner hver features bidrag til prediksjonen ved å vurdere alle mulige kombinasjoner av features. Dette gir:
- Consistency: Hvis en feature øker modellytelse, får den positiv attribution
- Accuracy: Summen av SHAP-verdier = prediksjon - baseline
- Fairness: Likebehandling av features med samme bidrag
Azure ML-implementering:
- Responsible AI dashboard bruker LightGBM (LGBMExplainableModel) som global surrogate
- SHAP Tree Explainer gir effektive explanations for tree ensembles
- Støtter både classification og regression på tabular data
Eksempel fra Azure ML:
# SHAP integrert i Responsible AI dashboard (SDK v2)
from azure.ai.ml import MLClient
from azure.ai.ml.entities import Model
# Dashboard auto-genererer SHAP explanations
# Global: Top-k features med aggregate importance
# Local: Per-instance feature contributions
# Cohort: Explanations per definert subgruppe
Eksempel fra Microsoft Fabric (TabularSHAP):
from synapse.ml.explainers import TabularSHAP
shap = TabularSHAP(
inputCols=categorical_features + numeric_features,
outputCol="shapValues",
numSamples=5000,
model=model,
targetCol="probability",
targetClasses=[1],
backgroundData=broadcast(training.orderBy(rand()).limit(100).cache())
)
shap_df = shap.transform(explain_instances)
Mimic Explainer (Global Surrogate)
Mimic Explainer trener en intrinsically interpretable model (LightGBM) til å approksimere en black-box model så nøyaktig som mulig. Data scientists kan deretter tolke surrogate-modellen for å forstå black-box-modellen.
Fordeler:
- Model-agnostic: Fungerer med alle modeller som har predict()/predict_proba()
- Effektiv: LightGBM + SHAP Tree Explainer er raskt på store datasett
- Interpretable: Surrogate-modellen er selv forståelig
Begrensninger:
- Approksimering: Surrogate kan miste nyanser fra original-modellen
- Kompleksitet: Krever tuning av surrogate-modellens kompleksitet
Arkitekturmønstre
Mønster 1: Integrated Responsible AI Dashboard (Anbefalt for produksjon)
Beskrivelse: Integrerer model interpretability som én av seks komponenter i Responsible AI dashboard (Error Analysis, Fairness, Model Overview, Data Analysis, Interpretability, Counterfactual Analysis, Causal Inference). Dette gir en holistisk tilnærming til model debugging og responsible decision-making.
Fordeler:
- Kobling mellom interpretability og andre RAI-komponenter (f.eks. bruk fairness til å identifisere bias, interpretability til å diagnostisere årsak)
- Cohort-støtte: Lag subgrupper og analyser explanations per cohort
- PDF scorecard for compliance og stakeholder communication
- Felles dataflyt og metadata-håndtering
Ulemper:
- Overhead: Krever oppsett av hele dashboard selv om du bare trenger interpretability
- Begrensninger: Max 5000 datapunkter i UI, kun tabular/pandas DataFrame i Parquet
- Kun MLflow sklearn-modeller med predict()/predict_proba()
Når bruke:
- Produksjonsmodeller i regulerte domener (helsevesen, finans, offentlig sektor)
- Når du trenger compliance-dokumentasjon og PDF-rapporter
- Når interpretability må sees i sammenheng med fairness og error analysis
Eksempel arkitektur:
[Trained Model] → [RAI Dashboard Component] → [Interpretability Tab]
→ [Cohort Analysis]
→ [PDF Scorecard Export]
Mønster 2: Standalone SHAP Explanations (For rapid prototyping)
Beskrivelse: Bruk TabularSHAP eller SHAP-biblioteket direkte for ad-hoc explanations utenfor dashboard-kontekst. Nyttig for eksperimentering, notebooks og one-off analyser.
Fordeler:
- Fleksibilitet: Full kontroll over SHAP-parametere (numSamples, background data, target classes)
- Skalerbarhet: Kan kjøres distribuert i Spark (Microsoft Fabric)
- Interaktivitet: Kan visualiseres med custom plotly-plots eller interpret.show()
Ulemper:
- Mangler integrasjon med RAI-verktøy (fairness, error analysis)
- Ingen PDF scorecard eller cohort management
- Må implementere egen visualisering og rapportering
Når bruke:
- Utviklingsfase: Eksperimentere med ulike features og modeller
- Research: Dype dykk i spesifikke explanations
- Custom workflows: Når RAI dashboard-begrensninger er blokkerende
Eksempel (Fabric/Spark):
# Beregn SHAP values distribuert
shap = TabularSHAP(inputCols=features, outputCol="shapValues", numSamples=5000, model=model, backgroundData=broadcast(train_sample))
shap_df = shap.transform(test_data)
# Visualiser med Plotly
import plotly.graph_objects as go
fig = go.Bar(x=feature_names, y=shap_values)
fig.show()
Mønster 3: Explainable Boosting Machines (Glass-box modell)
Beskrivelse: Bruk intrinsically interpretable modeller (EBM - Explainable Boosting Machines fra InterpretML) som gir explanations by design, uten behov for post-hoc teknikker som SHAP.
Fordeler:
- Ingen approksimering: Explanations er exacte, ikke estimerte
- Performance: Ofte konkurransedyktig med black-box modeller (gradient boosting)
- Visualisering: Built-in global og local explanations via interpret.show()
Ulemper:
- Modellbegrensninger: EBM er begrenset til tabular data
- Kompleksitet: Kan være vanskeligere å tune enn standard XGBoost/LightGBM
- Mindre utbredt: Færre eksempler og community-support
Når bruke:
- High-stakes beslutninger hvor exact explanations kreves
- Domener med strenge compliance-krav (medisin, jus)
- Når du kan ofre noen prosentpoeng accuracy for full transparency
Eksempel (Microsoft Fabric):
from interpret.glassbox import ExplainableBoostingClassifier
# Tren glass-box modell
ebm = ExplainableBoostingClassifier()
ebm.fit(X_train, y_train)
# Få exact explanations
wrapper = ebm.getVizWrapper()
explanation = wrapper.explain_global()
import interpret
interpret.show(explanation)
Beslutningsveiledning
Valg av XAI-teknikk per scenario
| Scenario | Anbefalt teknikk | Begrunnelse |
|---|---|---|
| Tabular data, tree-based model (LightGBM, XGBoost) | SHAP Tree Explainer | Effektiv, exact for trees, model-agnostic |
| Tabular data, neural network/black-box | Mimic Explainer (LightGBM surrogate) + SHAP | Model-agnostic, skalerbar |
| Tekstklassifisering (sentiment, categorization) | SHAP Text | Token-level attribution, støtter transformers |
| Bildeklassifisering (CNN, Vision Transformer) | SHAP Vision eller Integrated Gradients | Heatmaps, teorietisk grunnlag (IG) |
| Object detection (YOLO, Faster-RCNN) | D-RISE | Model-agnostic, håndterer både localization og classification |
| Compliance-fokus (GDPR, AI Act) | Responsible AI Dashboard + PDF scorecard | Dokumentasjon, global+local+cohort explanations |
| Rapid prototyping | Standalone SHAP i notebook | Fleksibilitet, iterasjon |
| Intrinsic interpretability | Explainable Boosting Machines (EBM) | Exact explanations, ingen post-hoc approksimering |
Vanlige fallgruver og røde flagg
| Problem | Symptom | Løsning |
|---|---|---|
| Overfitting av surrogate | Surrogate-modellen har høy fidelity men explanations gir ingen mening | Reduser kompleksitet (max_depth, num_leaves) i LightGBM |
| Irrelevant background data | SHAP-verdier er ustabile eller motsigende | Velg background data som er representativ for production distribution |
| For mange features | SHAP beregning tar timer på 10K+ features | Feature selection først, eller bruk TreeExplainer (raskere for trees) |
| Cohort-bias i explanations | Global explanations skjuler disparities i subgrupper | Kjør cohort explanations per demografisk gruppe |
| Explanations vs. kausale forklaringer | Stakeholders tror SHAP viser kausalitet | Klargjør at SHAP viser correlation, bruk Causal Inference for kausalitet |
| GDPR artikkel 22 misstolkning | Tror SHAP alene oppfyller "right to explanation" | SHAP er nødvendig men ikke tilstrekkelig - må kombineres med human review |
Beslutningstabell: Global vs. Local vs. Cohort Explanations
| Spørsmål | Global | Local | Cohort |
|---|---|---|---|
| "Hvilke features påvirker modellen generelt?" | ✅ Ja | ❌ Nei | ❌ Nei |
| "Hvorfor ble denne søknaden avslått?" | ❌ Nei | ✅ Ja | ❌ Nei |
| "Er modellen fair for kvinner vs. menn?" | ❌ Nei | ❌ Nei | ✅ Ja (cohort per kjønn) |
| "Hvilke features driver errors i subgruppe?" | ❌ Nei | ❌ Nei | ✅ Ja |
| "Compliance report til revisor?" | ✅ Ja (oversikt) | ✅ Ja (eksempler) | ✅ Ja (fairness) |
Integrasjon med Microsoft-stakken
Azure Machine Learning Responsible AI Dashboard
- SDK v2/CLI v2: Programmatisk generering av interpretability component
- Azure ML Studio UI: Interaktiv utforskning av global/local/cohort explanations
- MLflow integration: Kun sklearn-modeller registrert som MLflow models
- Compute: Krever compute cluster (ikke serverless) for explanation-generering
- Storage: Parquet format for datasets, max 5000 rows i UI-visualisering
Teknisk constraint:
- Modellen må ha
predict()ellerpredict_proba()metoder - Må være pickleable og loadable i component environment
- Max 10,000 features (columns) i datasett
Microsoft Fabric (Synapse ML)
- TabularSHAP: Distribuert SHAP-beregning på Spark
- Explainable Boosting Machines: Glass-box modeller med built-in explanations
- MLflow tracking: Log feature importance plots som artifacts
- Lakehouse: Lagre SHAP-verdier som Delta tables for historisk analyse
Azure AI Foundry (Azure OpenAI)
- Prompt Flow: Evaluators for groundedness, relevance (GPT-assisted metrics)
- Limitation: Reasoning models (o1) har intrinsic CoT men økt persuasiveness/scheming risk
- Transparency note: OpenAI fine-tuned models har redusert explainability
Power Platform AI Builder
- Begrenset explainability: AI Builder gir prediction confidence scores men ikke feature-level explanations
- Workaround: Eksporter modell til Azure ML for SHAP-analyse
Integration pattern
[Azure ML Training] → MLflow Model → [RAI Dashboard] → PDF Scorecard
→ [Fabric Lakehouse] → Delta Table (SHAP history)
→ [Power BI] → Executive dashboard
Offentlig sektor (Norge)
GDPR og "Right to Explanation" (Artikkel 22)
Krav: Enkeltpersoner har rett til å ikke bli underlagt automatiserte beslutninger med juridisk eller lignende effekt, inkludert profilering, uten rett til å få forklaring.
Teknisk implementering:
- Local explanations (SHAP per instance) dokumenterer hvorfor en spesifikk beslutning ble tatt
- PDF scorecard kan brukes som vedlegg til begrunnelse i saksbehandlersystem
- Cohort explanations identifiserer om subgrupper (f.eks. etnisitet) behandles forskjellig
OBS: GDPR krever ikke full algoritmisk transparens, men "meaningful information about the logic involved". SHAP gir feature contributions, som er meaningful men ikke exhaustive.
AI Act (EU AI Regulation)
Høyrisiko AI-systemer (Annex III):
- Offentlige tjenester og ytelser (NAV)
- Rettssystem (risikoscoring for fanger, domstolsbeslutninger)
- Utdanning (eksamensscoring)
Krav (Artikkel 13 - Transparency):
- Dokumentasjon av modellens intended purpose, accuracy, robustness
- Informasjon om data quality og governance
- Interpretability: Tilstrekkelig grad av transparency for brukere å forstå output
Teknisk compliance:
- RAI Dashboard + PDF scorecard oppfyller dokumentasjonskrav
- Global explanations dokumenterer modellens "intended purpose" via feature importance
- Local explanations tilfredsstiller transparency-krav overfor brukere
Forvaltningsloven § 25 (Begrunnelsesplikt)
Vedtak skal begrunnes. Begrunnelsen skal vise til regler vedtaket bygger på, og hovedhensyn som har vært avgjørende.
Teknisk implementering:
- Local SHAP explanations kan mappes til "hovedhensyn" (top-3 features med størst bidrag)
- Global explanations dokumenterer regelverket (hvilke features modellen bruker generelt)
- OBS: SHAP viser ikke kausalitet - kombiner med Causal Inference component hvis kausale hensyn kreves
Schrems II og datasuverenitet
Begrensning: Azure OpenAI-baserte XAI-løsninger (f.eks. GPT-assisted explanations) kan ha data residency-utfordringer.
Løsning:
- Bruk Azure ML i Norge-regioner (Norway East/West) for SHAP-beregninger
- Unngå Azure OpenAI for explanations av sensitive data (bruk InterpretML/SHAP direkte)
- Verifiser at background data for SHAP ikke forlater Norge-regioner
Tilgjengelighet (WCAG 2.1 nivå AA)
RAI Dashboard-visualiseringer må være tilgjengelige for saksbehandlere med funksjonsvariasjon:
- Eksporter PDF scorecard med alt-text for charts
- Bruk tekstbaserte explanations (ikke bare heatmaps) for skjermlesere
- Sørg for at feature names er på norsk eller har norsk forklaring
Kostnad og lisensiering
Azure Machine Learning - Responsible AI Dashboard
Compute-kostnad:
- Explanation-generering: Krever compute cluster (f.eks. Standard_DS3_v2)
- Estimat: 10K samples, 50 features, 10 min på 4-core cluster ≈ 5 NOK per run
- Anbefaling: Bruk low-priority VMs for explanation jobs (opptil 80% besparelse)
Storage-kostnad:
- SHAP-verdier lagret som Parquet: ~1 MB per 1000 rows (50 features)
- 1 million explanations ≈ 1 GB ≈ 0.20 NOK/måned i Azure Blob Storage
Total estimat (medium modell i produksjon):
- Initial explanation: 50 NOK (én gang)
- Månedlig re-explanation (ved retraining): 50 NOK
- Storage (1 år explanations): 2.40 NOK
- Årlig total: ~650 NOK for én modell
Microsoft Fabric (Synapse ML)
Capacity Units (CU):
- TabularSHAP kjører på Spark compute
- F64 capacity (64 CU) ≈ 64,000 NOK/måned
- SHAP-beregning for 100K rows: ~10 min på F64 ≈ 7 NOK per run
Lisensiering
| Produkt | Lisens | Inkludert XAI-funksjonalitet |
|---|---|---|
| Azure Machine Learning | Pay-as-you-go (compute + storage) | Responsible AI Dashboard, InterpretML, SHAP |
| Microsoft Fabric | Capacity-based (CU per måned) | TabularSHAP (Synapse ML), EBM (InterpretML) |
| Power BI Premium | Per user (~130 NOK/mnd) eller Per capacity | Kan visualisere SHAP data fra Fabric/AML |
| Azure AI Foundry | Pay-per-token (GPT-4) | GPT-assisted evaluators (groundedness, relevance) |
Optimalisering:
- Bruk Azure ML free tier (4 timer compute/måned) for utvikling
- Batch SHAP-beregninger (kjør nattestid på low-priority compute)
- Cache explanations for statiske modeller (ikke re-compute ved hver inference)
For arkitekten (Cosmo)
Spørsmål å stille klienten
-
Compliance og regulatorisk kontekst:
- Hvilke lovkrav må dere oppfylle? (GDPR art. 22, AI Act, Forvaltningsloven)
- Må explanations være tilgjengelige for sluttbrukere (borgere) eller kun internt (saksbehandlere)?
- Kreves det dokumentasjon for revisor/tilsynsmyndighet (Datatilsynet)?
-
Stakeholder og audience:
- Hvem skal konsumere explanations? (Data scientists, saksbehandlere, borgere, ledelse)
- Hvilken teknisk kompetanse har audience? (Trenger de SHAP-verdier eller "dette var viktig fordi..."?)
- Skal explanations være on-demand eller pre-genererte (PDF rapporter)?
-
Modell og data karakteristikk:
- Hva slags modell? (Tree-based, neural network, LLM-basert?)
- Modalitet? (Tabular, tekst, bilde, multimodal?)
- Hvor mange features og samples? (10 features vs. 10K features har ulik cost/complexity)
-
Real-time vs. batch:
- Må explanations være tilgjengelige i sanntid (f.eks. ved lånevedtak) eller kan de genereres i batch?
- Hva er akseptabel latency for explanation? (100ms vs. 10 sekunder)
-
Eksisterende infrastruktur:
- Bruker dere allerede Azure ML, Fabric eller annen Microsoft AI-stack?
- Har dere MLOps-pipelines (Azure DevOps, GitHub Actions)?
- Hvor lagres training data og modeller? (Lakehouse, Azure Blob, on-prem?)
-
Cohort og fairness-analyse:
- Er det identifiserte subgrupper (demografiske, geografiske) som må analyseres separat?
- Har dere sensitive attributes (kjønn, etnisitet, alder) som må beskyttes men også monitoreres for fairness?
-
Budget og skalering:
- Hvor mange modeller trenger explanations? (1 modell vs. 100 modeller)
- Hvor ofte re-traines modeller? (daglig, månedlig, årlig)
- Hva er compute-budsjettet for XAI? (100 NOK/mnd vs. 10K NOK/mnd)
-
Kausalitet vs. korrelasjon:
- Trenger dere å forstå kausale effekter (Causal Inference) eller er feature correlations nok?
- Skal explanations brukes til å informere policy-endringer (da kreves kausalitet)?
Vanlige fallgruver ved implementering
| Fallgruve | Hvorfor det skjer | Hvordan unngå |
|---|---|---|
| "SHAP er bare én gang" | Klient tror explanations er statiske og gjelder for alltid | Dokumenter at explanations må re-genereres ved model retraining eller data drift |
| "Black-box = unexplainable" | Feil antakelse at neural networks ikke kan forklares | Vis at SHAP, Integrated Gradients fungerer for NNs (men er approksimeringer) |
| "Global explanations løser alt" | Ignorerer at global trends kan skjule local disparities | Alltid kjør cohort explanations for identifiserte risikogrupper |
| "Explanations = kausalitet" | Stakeholders tolker SHAP som causale relasjoner | Klargjør forskjell: SHAP viser correlation, Causal Inference viser causation |
| "Én explanation-teknikk passer alle" | Velger SHAP for alt selv om glass-box modell (EBM) er bedre | Vurder intrinsic interpretability først, post-hoc XAI som backup |
| "Compliance er bare å slå på RAI Dashboard" | Tror teknisk løsning alene oppfyller GDPR/AI Act | Kombiner teknisk (SHAP) med prosess (human review, begrunnelsesskriving) |
| "Background data er ikke viktig" | Bruker random sample fra training uten å vurdere representativitet | Velg background data som matcher production distribution (viktig for SHAP stabilitet) |
Anbefalinger per modenhetsnivå
Nivå 1: Ad-hoc XAI (Utvikling/Prototyping)
- Verktøy: Standalone SHAP i notebook, interpret.show() for EBM
- Compute: Lokal maskin eller små Azure ML compute instances
- Dokumentasjon: Markdown i notebooks, ingen formell rapportering
- Kostnad: < 500 NOK/måned
- Når: Eksperimentering, proof-of-concept, research
Nivå 2: Strukturert XAI (Pilot i produksjon)
- Verktøy: Responsible AI Dashboard (1-5 modeller)
- Compute: Scheduled explanation jobs på low-priority VMs
- Dokumentasjon: PDF scorecard per modell, delt med stakeholders
- Kostnad: 2K-5K NOK/måned
- Når: Første produksjonsmodell, compliance-krav begynner, 1-10 brukere
Nivå 3: Enterprise XAI (Full produksjon)
- Verktøy: RAI Dashboard + Fabric Lakehouse for explanation history
- Compute: Distribuert SHAP (TabularSHAP på Spark), auto-scheduled re-explanation
- Dokumentasjon: Automatisert PDF-generering, Power BI dashboard for ledelse
- Kostnad: 10K-50K NOK/måned (avhengig av antall modeller)
- Når: 10+ modeller i produksjon, strengt regulert domene (helsevesen, finans), 100+ brukere
Nivå 4: Continuous XAI Monitoring (Advanced MLOps)
- Verktøy: Real-time explanation serving (Azure Functions + cached SHAP), drift detection på explanations
- Compute: Dedicated explanation cluster, GPU for image/text SHAP
- Dokumentasjon: API for explanation retrieval, audit logging til SIEM
- Kostnad: 50K+ NOK/måned
- Når: Real-time beslutninger (fraud detection, loan approval), AI Act høyrisiko-systemer, kontinuerlig compliance-monitorering
Anbefalt beslutningsflyt
START: Trenger dere model explanations?
↓
JA → Er modellen tree-based (LightGBM, XGBoost)?
↓ JA → Bruk SHAP Tree Explainer (raskest, exact for trees)
↓ NEI → Er det neural network/black-box?
↓ JA → Bruk Mimic Explainer (LightGBM surrogate) + SHAP
↓ NEI → Er det tekst/bilde?
↓ JA → SHAP Text/Vision eller Integrated Gradients
↓ NEI → Vurder Explainable Boosting Machines (glass-box)
↓
Må dere oppfylle compliance (GDPR/AI Act/Forvaltningsloven)?
↓ JA → Bruk Responsible AI Dashboard + PDF scorecard
↓ NEI → Standalone SHAP i notebook er nok
↓
Trenger dere real-time explanations (<1 sekund latency)?
↓ JA → Pre-compute SHAP, cache i Azure Redis, serve via API
↓ NEI → Batch explanation jobs (nattestid, low-priority compute)
↓
Er det identifiserte risikogrupper (fairness-bekymringer)?
↓ JA → Kjør cohort explanations per subgruppe
↓ NEI → Global + local explanations er nok
↓
SLUTT: Dokumenter valg i ADR, implementer, valider med stakeholders
(Verified MCP 2026-04)
Kilder og verifisering
Microsoft Learn (Verified via MCP)
-
Model interpretability i Azure ML https://learn.microsoft.com/en-us/azure/machine-learning/how-to-machine-learning-interpretability?view=azureml-api-2 Confidence: Verified - Komplett dokumentasjon av SHAP, Mimic Explainer, Responsible AI dashboard integration
-
Responsible AI dashboard - Komponenter https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard?view=azureml-api-2 Confidence: Verified - Oversikt over 6 komponenter inkludert interpretability, model debugging workflow
-
What is Responsible AI? - Transparency https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai?view=azureml-api-2#transparency Confidence: Verified - Prinsipper for transparency og interpretability i Azure ML
-
Explainable Boosting Machines i Microsoft Fabric https://learn.microsoft.com/en-us/fabric/data-science/explainable-boosting-machines-classification https://learn.microsoft.com/en-us/fabric/data-science/explainable-boosting-machines-regression Confidence: Verified - Glass-box modeller med built-in explanations
-
TabularSHAP i Microsoft Fabric (Synapse ML) https://learn.microsoft.com/en-us/fabric/data-science/tabular-shap-explainer Confidence: Verified - Distribuert SHAP-beregning på Spark, kodeeksempler
-
Permutation Feature Importance i ML.NET https://learn.microsoft.com/en-us/dotnet/machine-learning/how-to-guides/explain-machine-learning-model-permutation-feature-importance-ml-net Confidence: Verified - Alternative XAI-teknikk for .NET-utviklere
-
Azure OpenAI Transparency Note - Limitations https://learn.microsoft.com/en-us/azure/ai-foundry/responsible-ai/openai/transparency-note?view=foundry-classic#limitations Confidence: Verified - Begrensninger i explainability for fine-tuned og reasoning models
Ekstern dokumentasjon (Baseline knowledge)
-
InterpretML GitHub https://github.com/interpretml/interpret-community/ Confidence: Baseline - Open-source grunnlag for Azure ML interpretability
-
SHAP dokumentasjon https://shap.readthedocs.io/ Confidence: Baseline - Shapley values og SHAP-implementeringer
-
EU AI Act (Proposed Regulation) https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:52021PC0206 Confidence: Baseline - Transparency-krav for høyrisiko AI-systemer
Confidence-vurdering per seksjon
| Seksjon | Confidence | Begrunnelse |
|---|---|---|
| Introduksjon | Verified | Basert på offisiell Azure ML-dokumentasjon |
| Kjernekomponenter | Verified | Hentet fra microsoft-learn MCP (SHAP, Mimic, RAI dashboard) |
| Arkitekturmønstre | Verified | Basert på Azure ML + Fabric best practices |
| Beslutningsveiledning | Baseline | Synthesized fra Microsoft-dokumentasjon + XAI-teori |
| Integrasjon Microsoft-stack | Verified | Direkte fra Azure ML, Fabric, Power Platform docs |
| Offentlig sektor (Norge) | Baseline | GDPR/AI Act er offisiell lov, implementering er synthesized |
| Kostnad og lisensiering | Baseline | Azure pricing calculator + erfaring (ingen offisiell XAI-pricing doc) |
| For arkitekten | Baseline | Praktisk veiledning basert på dokumentasjon + best practices |
Samlet vurdering: 75% Verified (direkte fra Microsoft Learn MCP), 25% Baseline (synthesized fra offisielle kilder og XAI-teori).