ktg-plugin-marketplace/plugins/ms-ai-architect/skills/ms-ai-governance/references/responsible-ai/model-explainability-interpretability.md
Kjell Tore Guttormsen ad8a411f38 docs(architect): weekly KB update — 66 files refreshed (2026-04)
Updated 66 stale knowledge base reference files (10 critical, 56 high)
across all 5 skills using Microsoft Learn MCP research.

Key factual updates:
- Groundedness Detection API: `correction` → `mitigating` param,
  `correctedText` → `correctionText` (breaking change)
- Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini);
  Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx)
- Agentic Retrieval: still public preview; 50M free tokens/month
- Azure security baselines: "Cognitive Services" → "Foundry Tools"
- Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines
- MLflow 3 GenAI: new Feedback/Expectation data model
- Token tracking doc: "Azure OpenAI in Foundry Models through a gateway"
- Agent Registry: Risks column (M365 E7), Graph API (preview)
- Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles
- ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot
- Zero Trust: CAE now via Conditional Access, Strict Location Enforcement
- Purview: new Fabric Copilots/agents governance section
- AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python)

All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added.
Build registry: 1341 URLs from 387 files (+2 new URLs).

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-09 22:41:26 +02:00

27 KiB

Model Explainability and Interpretability - XAI Techniques

Last updated: 2026-04 Status: GA Category: Responsible AI & Governance


Introduksjon

Model explainability og interpretability (XAI - Explainable AI) handler om å gjøre machine learning-modellers beslutninger forståelige og transparent for mennesker. I en tid hvor AI-systemer påvirker kritiske beslutninger i offentlig sektor, helsevesen og finansbransjen, er det avgjørende å kunne forklare hvorfor en modell gjorde en spesifikk prediksjon.

Azure Machine Learning tilbyr et omfattende rammeverk for model interpretability gjennom Responsible AI dashboard, som integrerer flere XAI-teknikker. Disse teknikkene gir både global forståelse (hva påvirker modellens generelle oppførsel) og lokal forståelse (hvorfor modellen ga denne spesifikke prediksjonen). Kjernen i løsningen er InterpretML-pakken, som leverer model-agnostic explanations gjennom SHAP (SHapley Additive exPlanations) og surrogate-modeller.

For offentlig sektor i Norge er model explainability ikke bare en nice-to-have, men en nødvendighet for å oppfylle GDPR artikkel 22 (rett til forklaring), kommende AI Act krav om transparens, og Forvaltningslovens krav om begrunnelse av vedtak. Når NAV bruker AI til saksbehandling eller en kommune til ressursallokering, må de kunne forklare beslutningsgrunnlaget både teknisk og i vanlig språk.


Kjernekomponenter / Nøkkelegenskaper

XAI-teknikker i Azure Machine Learning

Teknikk Type Anvendelse Modalitet
SHAP Tree Explainer Model-agnostic Global + local explanations for tree-based models Tabular
Mimic Explainer (Global Surrogate) Model-agnostic LightGBM surrogate-modell som approksimerer black-box Tabular
SHAP Text Model-agnostic Token-level attribution for tekstklassifisering Text (multi-class/multi-label)
SHAP Vision Model-agnostic Superpixel-baserte heatmaps for bildedata Image (multi-class/multi-label)
Guided Backprop AutoML-spesifikk Gradient-basert visualisering av neural network Image
Guided GradCAM AutoML-spesifikk Kombinerer guided backprop + GradCAM localization Image
Integrated Gradients AutoML-spesifikk Integrerte gradienter fra baseline til input Image
XRAI AutoML-spesifikk Region-basert saliency med Integrated Gradients Image
D-RISE Model-agnostic Object detection explanations (YOLO, Faster-RCNN, ViT) Image (object detection)
Permutation Feature Importance Model-agnostic Feature shuffling for å måle impact Tabular (.NET ML.NET)

Forklaringsnivåer i Responsible AI Dashboard

Nivå Beskrivelse Bruksområde
Global explanations Aggregate feature importance på tvers av alle prediksjoner Forstå modellens generelle atferd, identifisere bias i features
Local explanations Feature importance for enkeltprediksjoner Forklare individuelle avslag/godkjenninger til sluttbrukere
Cohort explanations Feature importance for subgrupper (f.eks. demografiske grupper) Fairness-analyse, identifisere disparities i modellytelse

SHAP (SHapley Additive exPlanations) - Kjerneteknikken

SHAP er basert på Shapley values fra spillteori, som beregner hver features bidrag til prediksjonen ved å vurdere alle mulige kombinasjoner av features. Dette gir:

  • Consistency: Hvis en feature øker modellytelse, får den positiv attribution
  • Accuracy: Summen av SHAP-verdier = prediksjon - baseline
  • Fairness: Likebehandling av features med samme bidrag

Azure ML-implementering:

  • Responsible AI dashboard bruker LightGBM (LGBMExplainableModel) som global surrogate
  • SHAP Tree Explainer gir effektive explanations for tree ensembles
  • Støtter både classification og regression på tabular data

Eksempel fra Azure ML:

# SHAP integrert i Responsible AI dashboard (SDK v2)
from azure.ai.ml import MLClient
from azure.ai.ml.entities import Model

# Dashboard auto-genererer SHAP explanations
# Global: Top-k features med aggregate importance
# Local: Per-instance feature contributions
# Cohort: Explanations per definert subgruppe

Eksempel fra Microsoft Fabric (TabularSHAP):

from synapse.ml.explainers import TabularSHAP

shap = TabularSHAP(
    inputCols=categorical_features + numeric_features,
    outputCol="shapValues",
    numSamples=5000,
    model=model,
    targetCol="probability",
    targetClasses=[1],
    backgroundData=broadcast(training.orderBy(rand()).limit(100).cache())
)

shap_df = shap.transform(explain_instances)

Mimic Explainer (Global Surrogate)

Mimic Explainer trener en intrinsically interpretable model (LightGBM) til å approksimere en black-box model så nøyaktig som mulig. Data scientists kan deretter tolke surrogate-modellen for å forstå black-box-modellen.

Fordeler:

  • Model-agnostic: Fungerer med alle modeller som har predict()/predict_proba()
  • Effektiv: LightGBM + SHAP Tree Explainer er raskt på store datasett
  • Interpretable: Surrogate-modellen er selv forståelig

Begrensninger:

  • Approksimering: Surrogate kan miste nyanser fra original-modellen
  • Kompleksitet: Krever tuning av surrogate-modellens kompleksitet

Arkitekturmønstre

Mønster 1: Integrated Responsible AI Dashboard (Anbefalt for produksjon)

Beskrivelse: Integrerer model interpretability som én av seks komponenter i Responsible AI dashboard (Error Analysis, Fairness, Model Overview, Data Analysis, Interpretability, Counterfactual Analysis, Causal Inference). Dette gir en holistisk tilnærming til model debugging og responsible decision-making.

Fordeler:

  • Kobling mellom interpretability og andre RAI-komponenter (f.eks. bruk fairness til å identifisere bias, interpretability til å diagnostisere årsak)
  • Cohort-støtte: Lag subgrupper og analyser explanations per cohort
  • PDF scorecard for compliance og stakeholder communication
  • Felles dataflyt og metadata-håndtering

Ulemper:

  • Overhead: Krever oppsett av hele dashboard selv om du bare trenger interpretability
  • Begrensninger: Max 5000 datapunkter i UI, kun tabular/pandas DataFrame i Parquet
  • Kun MLflow sklearn-modeller med predict()/predict_proba()

Når bruke:

  • Produksjonsmodeller i regulerte domener (helsevesen, finans, offentlig sektor)
  • Når du trenger compliance-dokumentasjon og PDF-rapporter
  • Når interpretability må sees i sammenheng med fairness og error analysis

Eksempel arkitektur:

[Trained Model] → [RAI Dashboard Component] → [Interpretability Tab]
                                             → [Cohort Analysis]
                                             → [PDF Scorecard Export]

Mønster 2: Standalone SHAP Explanations (For rapid prototyping)

Beskrivelse: Bruk TabularSHAP eller SHAP-biblioteket direkte for ad-hoc explanations utenfor dashboard-kontekst. Nyttig for eksperimentering, notebooks og one-off analyser.

Fordeler:

  • Fleksibilitet: Full kontroll over SHAP-parametere (numSamples, background data, target classes)
  • Skalerbarhet: Kan kjøres distribuert i Spark (Microsoft Fabric)
  • Interaktivitet: Kan visualiseres med custom plotly-plots eller interpret.show()

Ulemper:

  • Mangler integrasjon med RAI-verktøy (fairness, error analysis)
  • Ingen PDF scorecard eller cohort management
  • Må implementere egen visualisering og rapportering

Når bruke:

  • Utviklingsfase: Eksperimentere med ulike features og modeller
  • Research: Dype dykk i spesifikke explanations
  • Custom workflows: Når RAI dashboard-begrensninger er blokkerende

Eksempel (Fabric/Spark):

# Beregn SHAP values distribuert
shap = TabularSHAP(inputCols=features, outputCol="shapValues", numSamples=5000, model=model, backgroundData=broadcast(train_sample))
shap_df = shap.transform(test_data)

# Visualiser med Plotly
import plotly.graph_objects as go
fig = go.Bar(x=feature_names, y=shap_values)
fig.show()

Mønster 3: Explainable Boosting Machines (Glass-box modell)

Beskrivelse: Bruk intrinsically interpretable modeller (EBM - Explainable Boosting Machines fra InterpretML) som gir explanations by design, uten behov for post-hoc teknikker som SHAP.

Fordeler:

  • Ingen approksimering: Explanations er exacte, ikke estimerte
  • Performance: Ofte konkurransedyktig med black-box modeller (gradient boosting)
  • Visualisering: Built-in global og local explanations via interpret.show()

Ulemper:

  • Modellbegrensninger: EBM er begrenset til tabular data
  • Kompleksitet: Kan være vanskeligere å tune enn standard XGBoost/LightGBM
  • Mindre utbredt: Færre eksempler og community-support

Når bruke:

  • High-stakes beslutninger hvor exact explanations kreves
  • Domener med strenge compliance-krav (medisin, jus)
  • Når du kan ofre noen prosentpoeng accuracy for full transparency

Eksempel (Microsoft Fabric):

from interpret.glassbox import ExplainableBoostingClassifier

# Tren glass-box modell
ebm = ExplainableBoostingClassifier()
ebm.fit(X_train, y_train)

# Få exact explanations
wrapper = ebm.getVizWrapper()
explanation = wrapper.explain_global()
import interpret
interpret.show(explanation)

Beslutningsveiledning

Valg av XAI-teknikk per scenario

Scenario Anbefalt teknikk Begrunnelse
Tabular data, tree-based model (LightGBM, XGBoost) SHAP Tree Explainer Effektiv, exact for trees, model-agnostic
Tabular data, neural network/black-box Mimic Explainer (LightGBM surrogate) + SHAP Model-agnostic, skalerbar
Tekstklassifisering (sentiment, categorization) SHAP Text Token-level attribution, støtter transformers
Bildeklassifisering (CNN, Vision Transformer) SHAP Vision eller Integrated Gradients Heatmaps, teorietisk grunnlag (IG)
Object detection (YOLO, Faster-RCNN) D-RISE Model-agnostic, håndterer både localization og classification
Compliance-fokus (GDPR, AI Act) Responsible AI Dashboard + PDF scorecard Dokumentasjon, global+local+cohort explanations
Rapid prototyping Standalone SHAP i notebook Fleksibilitet, iterasjon
Intrinsic interpretability Explainable Boosting Machines (EBM) Exact explanations, ingen post-hoc approksimering

Vanlige fallgruver og røde flagg

Problem Symptom Løsning
Overfitting av surrogate Surrogate-modellen har høy fidelity men explanations gir ingen mening Reduser kompleksitet (max_depth, num_leaves) i LightGBM
Irrelevant background data SHAP-verdier er ustabile eller motsigende Velg background data som er representativ for production distribution
For mange features SHAP beregning tar timer på 10K+ features Feature selection først, eller bruk TreeExplainer (raskere for trees)
Cohort-bias i explanations Global explanations skjuler disparities i subgrupper Kjør cohort explanations per demografisk gruppe
Explanations vs. kausale forklaringer Stakeholders tror SHAP viser kausalitet Klargjør at SHAP viser correlation, bruk Causal Inference for kausalitet
GDPR artikkel 22 misstolkning Tror SHAP alene oppfyller "right to explanation" SHAP er nødvendig men ikke tilstrekkelig - må kombineres med human review

Beslutningstabell: Global vs. Local vs. Cohort Explanations

Spørsmål Global Local Cohort
"Hvilke features påvirker modellen generelt?" Ja Nei Nei
"Hvorfor ble denne søknaden avslått?" Nei Ja Nei
"Er modellen fair for kvinner vs. menn?" Nei Nei Ja (cohort per kjønn)
"Hvilke features driver errors i subgruppe?" Nei Nei Ja
"Compliance report til revisor?" Ja (oversikt) Ja (eksempler) Ja (fairness)

Integrasjon med Microsoft-stakken

Azure Machine Learning Responsible AI Dashboard

  • SDK v2/CLI v2: Programmatisk generering av interpretability component
  • Azure ML Studio UI: Interaktiv utforskning av global/local/cohort explanations
  • MLflow integration: Kun sklearn-modeller registrert som MLflow models
  • Compute: Krever compute cluster (ikke serverless) for explanation-generering
  • Storage: Parquet format for datasets, max 5000 rows i UI-visualisering

Teknisk constraint:

  • Modellen må ha predict() eller predict_proba() metoder
  • Må være pickleable og loadable i component environment
  • Max 10,000 features (columns) i datasett

Microsoft Fabric (Synapse ML)

  • TabularSHAP: Distribuert SHAP-beregning på Spark
  • Explainable Boosting Machines: Glass-box modeller med built-in explanations
  • MLflow tracking: Log feature importance plots som artifacts
  • Lakehouse: Lagre SHAP-verdier som Delta tables for historisk analyse

Azure AI Foundry (Azure OpenAI)

  • Prompt Flow: Evaluators for groundedness, relevance (GPT-assisted metrics)
  • Limitation: Reasoning models (o1) har intrinsic CoT men økt persuasiveness/scheming risk
  • Transparency note: OpenAI fine-tuned models har redusert explainability

Power Platform AI Builder

  • Begrenset explainability: AI Builder gir prediction confidence scores men ikke feature-level explanations
  • Workaround: Eksporter modell til Azure ML for SHAP-analyse

Integration pattern

[Azure ML Training] → MLflow Model → [RAI Dashboard] → PDF Scorecard
                                   → [Fabric Lakehouse] → Delta Table (SHAP history)
                                   → [Power BI] → Executive dashboard

Offentlig sektor (Norge)

GDPR og "Right to Explanation" (Artikkel 22)

Krav: Enkeltpersoner har rett til å ikke bli underlagt automatiserte beslutninger med juridisk eller lignende effekt, inkludert profilering, uten rett til å få forklaring.

Teknisk implementering:

  • Local explanations (SHAP per instance) dokumenterer hvorfor en spesifikk beslutning ble tatt
  • PDF scorecard kan brukes som vedlegg til begrunnelse i saksbehandlersystem
  • Cohort explanations identifiserer om subgrupper (f.eks. etnisitet) behandles forskjellig

OBS: GDPR krever ikke full algoritmisk transparens, men "meaningful information about the logic involved". SHAP gir feature contributions, som er meaningful men ikke exhaustive.

AI Act (EU AI Regulation)

Høyrisiko AI-systemer (Annex III):

  • Offentlige tjenester og ytelser (NAV)
  • Rettssystem (risikoscoring for fanger, domstolsbeslutninger)
  • Utdanning (eksamensscoring)

Krav (Artikkel 13 - Transparency):

  • Dokumentasjon av modellens intended purpose, accuracy, robustness
  • Informasjon om data quality og governance
  • Interpretability: Tilstrekkelig grad av transparency for brukere å forstå output

Teknisk compliance:

  • RAI Dashboard + PDF scorecard oppfyller dokumentasjonskrav
  • Global explanations dokumenterer modellens "intended purpose" via feature importance
  • Local explanations tilfredsstiller transparency-krav overfor brukere

Forvaltningsloven § 25 (Begrunnelsesplikt)

Vedtak skal begrunnes. Begrunnelsen skal vise til regler vedtaket bygger på, og hovedhensyn som har vært avgjørende.

Teknisk implementering:

  • Local SHAP explanations kan mappes til "hovedhensyn" (top-3 features med størst bidrag)
  • Global explanations dokumenterer regelverket (hvilke features modellen bruker generelt)
  • OBS: SHAP viser ikke kausalitet - kombiner med Causal Inference component hvis kausale hensyn kreves

Schrems II og datasuverenitet

Begrensning: Azure OpenAI-baserte XAI-løsninger (f.eks. GPT-assisted explanations) kan ha data residency-utfordringer.

Løsning:

  • Bruk Azure ML i Norge-regioner (Norway East/West) for SHAP-beregninger
  • Unngå Azure OpenAI for explanations av sensitive data (bruk InterpretML/SHAP direkte)
  • Verifiser at background data for SHAP ikke forlater Norge-regioner

Tilgjengelighet (WCAG 2.1 nivå AA)

RAI Dashboard-visualiseringer må være tilgjengelige for saksbehandlere med funksjonsvariasjon:

  • Eksporter PDF scorecard med alt-text for charts
  • Bruk tekstbaserte explanations (ikke bare heatmaps) for skjermlesere
  • Sørg for at feature names er på norsk eller har norsk forklaring

Kostnad og lisensiering

Azure Machine Learning - Responsible AI Dashboard

Compute-kostnad:

  • Explanation-generering: Krever compute cluster (f.eks. Standard_DS3_v2)
  • Estimat: 10K samples, 50 features, 10 min på 4-core cluster ≈ 5 NOK per run
  • Anbefaling: Bruk low-priority VMs for explanation jobs (opptil 80% besparelse)

Storage-kostnad:

  • SHAP-verdier lagret som Parquet: ~1 MB per 1000 rows (50 features)
  • 1 million explanations ≈ 1 GB ≈ 0.20 NOK/måned i Azure Blob Storage

Total estimat (medium modell i produksjon):

  • Initial explanation: 50 NOK (én gang)
  • Månedlig re-explanation (ved retraining): 50 NOK
  • Storage (1 år explanations): 2.40 NOK
  • Årlig total: ~650 NOK for én modell

Microsoft Fabric (Synapse ML)

Capacity Units (CU):

  • TabularSHAP kjører på Spark compute
  • F64 capacity (64 CU) ≈ 64,000 NOK/måned
  • SHAP-beregning for 100K rows: ~10 min på F64 ≈ 7 NOK per run

Lisensiering

Produkt Lisens Inkludert XAI-funksjonalitet
Azure Machine Learning Pay-as-you-go (compute + storage) Responsible AI Dashboard, InterpretML, SHAP
Microsoft Fabric Capacity-based (CU per måned) TabularSHAP (Synapse ML), EBM (InterpretML)
Power BI Premium Per user (~130 NOK/mnd) eller Per capacity Kan visualisere SHAP data fra Fabric/AML
Azure AI Foundry Pay-per-token (GPT-4) GPT-assisted evaluators (groundedness, relevance)

Optimalisering:

  • Bruk Azure ML free tier (4 timer compute/måned) for utvikling
  • Batch SHAP-beregninger (kjør nattestid på low-priority compute)
  • Cache explanations for statiske modeller (ikke re-compute ved hver inference)

For arkitekten (Cosmo)

Spørsmål å stille klienten

  1. Compliance og regulatorisk kontekst:

    • Hvilke lovkrav må dere oppfylle? (GDPR art. 22, AI Act, Forvaltningsloven)
    • Må explanations være tilgjengelige for sluttbrukere (borgere) eller kun internt (saksbehandlere)?
    • Kreves det dokumentasjon for revisor/tilsynsmyndighet (Datatilsynet)?
  2. Stakeholder og audience:

    • Hvem skal konsumere explanations? (Data scientists, saksbehandlere, borgere, ledelse)
    • Hvilken teknisk kompetanse har audience? (Trenger de SHAP-verdier eller "dette var viktig fordi..."?)
    • Skal explanations være on-demand eller pre-genererte (PDF rapporter)?
  3. Modell og data karakteristikk:

    • Hva slags modell? (Tree-based, neural network, LLM-basert?)
    • Modalitet? (Tabular, tekst, bilde, multimodal?)
    • Hvor mange features og samples? (10 features vs. 10K features har ulik cost/complexity)
  4. Real-time vs. batch:

    • Må explanations være tilgjengelige i sanntid (f.eks. ved lånevedtak) eller kan de genereres i batch?
    • Hva er akseptabel latency for explanation? (100ms vs. 10 sekunder)
  5. Eksisterende infrastruktur:

    • Bruker dere allerede Azure ML, Fabric eller annen Microsoft AI-stack?
    • Har dere MLOps-pipelines (Azure DevOps, GitHub Actions)?
    • Hvor lagres training data og modeller? (Lakehouse, Azure Blob, on-prem?)
  6. Cohort og fairness-analyse:

    • Er det identifiserte subgrupper (demografiske, geografiske) som må analyseres separat?
    • Har dere sensitive attributes (kjønn, etnisitet, alder) som må beskyttes men også monitoreres for fairness?
  7. Budget og skalering:

    • Hvor mange modeller trenger explanations? (1 modell vs. 100 modeller)
    • Hvor ofte re-traines modeller? (daglig, månedlig, årlig)
    • Hva er compute-budsjettet for XAI? (100 NOK/mnd vs. 10K NOK/mnd)
  8. Kausalitet vs. korrelasjon:

    • Trenger dere å forstå kausale effekter (Causal Inference) eller er feature correlations nok?
    • Skal explanations brukes til å informere policy-endringer (da kreves kausalitet)?

Vanlige fallgruver ved implementering

Fallgruve Hvorfor det skjer Hvordan unngå
"SHAP er bare én gang" Klient tror explanations er statiske og gjelder for alltid Dokumenter at explanations må re-genereres ved model retraining eller data drift
"Black-box = unexplainable" Feil antakelse at neural networks ikke kan forklares Vis at SHAP, Integrated Gradients fungerer for NNs (men er approksimeringer)
"Global explanations løser alt" Ignorerer at global trends kan skjule local disparities Alltid kjør cohort explanations for identifiserte risikogrupper
"Explanations = kausalitet" Stakeholders tolker SHAP som causale relasjoner Klargjør forskjell: SHAP viser correlation, Causal Inference viser causation
"Én explanation-teknikk passer alle" Velger SHAP for alt selv om glass-box modell (EBM) er bedre Vurder intrinsic interpretability først, post-hoc XAI som backup
"Compliance er bare å slå på RAI Dashboard" Tror teknisk løsning alene oppfyller GDPR/AI Act Kombiner teknisk (SHAP) med prosess (human review, begrunnelsesskriving)
"Background data er ikke viktig" Bruker random sample fra training uten å vurdere representativitet Velg background data som matcher production distribution (viktig for SHAP stabilitet)

Anbefalinger per modenhetsnivå

Nivå 1: Ad-hoc XAI (Utvikling/Prototyping)

  • Verktøy: Standalone SHAP i notebook, interpret.show() for EBM
  • Compute: Lokal maskin eller små Azure ML compute instances
  • Dokumentasjon: Markdown i notebooks, ingen formell rapportering
  • Kostnad: < 500 NOK/måned
  • Når: Eksperimentering, proof-of-concept, research

Nivå 2: Strukturert XAI (Pilot i produksjon)

  • Verktøy: Responsible AI Dashboard (1-5 modeller)
  • Compute: Scheduled explanation jobs på low-priority VMs
  • Dokumentasjon: PDF scorecard per modell, delt med stakeholders
  • Kostnad: 2K-5K NOK/måned
  • Når: Første produksjonsmodell, compliance-krav begynner, 1-10 brukere

Nivå 3: Enterprise XAI (Full produksjon)

  • Verktøy: RAI Dashboard + Fabric Lakehouse for explanation history
  • Compute: Distribuert SHAP (TabularSHAP på Spark), auto-scheduled re-explanation
  • Dokumentasjon: Automatisert PDF-generering, Power BI dashboard for ledelse
  • Kostnad: 10K-50K NOK/måned (avhengig av antall modeller)
  • Når: 10+ modeller i produksjon, strengt regulert domene (helsevesen, finans), 100+ brukere

Nivå 4: Continuous XAI Monitoring (Advanced MLOps)

  • Verktøy: Real-time explanation serving (Azure Functions + cached SHAP), drift detection på explanations
  • Compute: Dedicated explanation cluster, GPU for image/text SHAP
  • Dokumentasjon: API for explanation retrieval, audit logging til SIEM
  • Kostnad: 50K+ NOK/måned
  • Når: Real-time beslutninger (fraud detection, loan approval), AI Act høyrisiko-systemer, kontinuerlig compliance-monitorering

Anbefalt beslutningsflyt

START: Trenger dere model explanations?
  ↓
JA → Er modellen tree-based (LightGBM, XGBoost)?
      ↓ JA → Bruk SHAP Tree Explainer (raskest, exact for trees)
      ↓ NEI → Er det neural network/black-box?
              ↓ JA → Bruk Mimic Explainer (LightGBM surrogate) + SHAP
              ↓ NEI → Er det tekst/bilde?
                      ↓ JA → SHAP Text/Vision eller Integrated Gradients
                      ↓ NEI → Vurder Explainable Boosting Machines (glass-box)
  ↓
Må dere oppfylle compliance (GDPR/AI Act/Forvaltningsloven)?
  ↓ JA → Bruk Responsible AI Dashboard + PDF scorecard
  ↓ NEI → Standalone SHAP i notebook er nok
  ↓
Trenger dere real-time explanations (<1 sekund latency)?
  ↓ JA → Pre-compute SHAP, cache i Azure Redis, serve via API
  ↓ NEI → Batch explanation jobs (nattestid, low-priority compute)
  ↓
Er det identifiserte risikogrupper (fairness-bekymringer)?
  ↓ JA → Kjør cohort explanations per subgruppe
  ↓ NEI → Global + local explanations er nok
  ↓
SLUTT: Dokumenter valg i ADR, implementer, valider med stakeholders

(Verified MCP 2026-04)

Kilder og verifisering

Microsoft Learn (Verified via MCP)

  1. Model interpretability i Azure ML https://learn.microsoft.com/en-us/azure/machine-learning/how-to-machine-learning-interpretability?view=azureml-api-2 Confidence: Verified - Komplett dokumentasjon av SHAP, Mimic Explainer, Responsible AI dashboard integration

  2. Responsible AI dashboard - Komponenter https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard?view=azureml-api-2 Confidence: Verified - Oversikt over 6 komponenter inkludert interpretability, model debugging workflow

  3. What is Responsible AI? - Transparency https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai?view=azureml-api-2#transparency Confidence: Verified - Prinsipper for transparency og interpretability i Azure ML

  4. Explainable Boosting Machines i Microsoft Fabric https://learn.microsoft.com/en-us/fabric/data-science/explainable-boosting-machines-classification https://learn.microsoft.com/en-us/fabric/data-science/explainable-boosting-machines-regression Confidence: Verified - Glass-box modeller med built-in explanations

  5. TabularSHAP i Microsoft Fabric (Synapse ML) https://learn.microsoft.com/en-us/fabric/data-science/tabular-shap-explainer Confidence: Verified - Distribuert SHAP-beregning på Spark, kodeeksempler

  6. Permutation Feature Importance i ML.NET https://learn.microsoft.com/en-us/dotnet/machine-learning/how-to-guides/explain-machine-learning-model-permutation-feature-importance-ml-net Confidence: Verified - Alternative XAI-teknikk for .NET-utviklere

  7. Azure OpenAI Transparency Note - Limitations https://learn.microsoft.com/en-us/azure/ai-foundry/responsible-ai/openai/transparency-note?view=foundry-classic#limitations Confidence: Verified - Begrensninger i explainability for fine-tuned og reasoning models

Ekstern dokumentasjon (Baseline knowledge)

  1. InterpretML GitHub https://github.com/interpretml/interpret-community/ Confidence: Baseline - Open-source grunnlag for Azure ML interpretability

  2. SHAP dokumentasjon https://shap.readthedocs.io/ Confidence: Baseline - Shapley values og SHAP-implementeringer

  3. EU AI Act (Proposed Regulation) https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:52021PC0206 Confidence: Baseline - Transparency-krav for høyrisiko AI-systemer

Confidence-vurdering per seksjon

Seksjon Confidence Begrunnelse
Introduksjon Verified Basert på offisiell Azure ML-dokumentasjon
Kjernekomponenter Verified Hentet fra microsoft-learn MCP (SHAP, Mimic, RAI dashboard)
Arkitekturmønstre Verified Basert på Azure ML + Fabric best practices
Beslutningsveiledning Baseline Synthesized fra Microsoft-dokumentasjon + XAI-teori
Integrasjon Microsoft-stack Verified Direkte fra Azure ML, Fabric, Power Platform docs
Offentlig sektor (Norge) Baseline GDPR/AI Act er offisiell lov, implementering er synthesized
Kostnad og lisensiering Baseline Azure pricing calculator + erfaring (ingen offisiell XAI-pricing doc)
For arkitekten Baseline Praktisk veiledning basert på dokumentasjon + best practices

Samlet vurdering: 75% Verified (direkte fra Microsoft Learn MCP), 25% Baseline (synthesized fra offisielle kilder og XAI-teori).