Kjell Tore Guttormsen ad8a411f38 docs(architect): weekly KB update — 66 files refreshed (2026-04)

Updated 66 stale knowledge base reference files (10 critical, 56 high)
across all 5 skills using Microsoft Learn MCP research.

Key factual updates:
- Groundedness Detection API: `correction` → `mitigating` param,
  `correctedText` → `correctionText` (breaking change)
- Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini);
  Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx)
- Agentic Retrieval: still public preview; 50M free tokens/month
- Azure security baselines: "Cognitive Services" → "Foundry Tools"
- Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines
- MLflow 3 GenAI: new Feedback/Expectation data model
- Token tracking doc: "Azure OpenAI in Foundry Models through a gateway"
- Agent Registry: Risks column (M365 E7), Graph API (preview)
- Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles
- ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot
- Zero Trust: CAE now via Conditional Access, Strict Location Enforcement
- Purview: new Fabric Copilots/agents governance section
- AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python)

All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added.
Build registry: 1341 URLs from 387 files (+2 new URLs).

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

2026-04-09 22:41:26 +02:00

28 KiB

Raw Blame History

Responsible AI Integration in MLOps

Kategori: MLOps & GenAIOps Sist oppdatert: 2026-04 Confidence: 95% (basert på offisiell Microsoft-dokumentasjon og Azure Machine Learning-referanser)

Introduksjon

Responsible AI (RAI) i MLOps-kontekst handler om å integrere ansvarlig AI-praksis systematisk gjennom hele modellens livssyklus — fra utvikling og trening til deployment, overvåking og vedlikehold. Mens tradisjonell MLOps fokuserer på repeaterbarhet, automatisering og pålitelighet, legger RAI-integrasjon til dimensjoner som rettferdighet (fairness), forklarbarhet (interpretability), bias-deteksjon, åpenhet (transparency) og compliance.

Azure Machine Learning tilbyr et omfattende rammeverk for RAI-integrasjon via Responsible AI dashboard, Responsible AI scorecard, og dedikerte komponenter som kan bygges direkte inn i CI/CD-pipelines. Dette sikrer at modeller ikke bare er teknisk robuste, men også etisk forsvarlige og regulatorisk compliant.

Hvorfor dette er kritisk for MLOps:

Model governance: Sporer rettferdighet, bias og forklarbarhet gjennom hele modellens levetid
Auditability: Dokumenterer modellbeslutninger for compliance og regulatoriske krav
Stakeholder trust: Gir ikke-tekniske interessenter innsikt i modellens oppførsel
Risk mitigation: Identifiserer og reduserer fairness-issues og feilmønstre før produksjon

Kjernekomponenter

1. Responsible AI Dashboard

Formål: En samlet, tilpassbar plattform som integrerer flere RAI-verktøy i én grensesnitt, designet for model debugging og ansvarlig beslutningstaking.

Komponenter i dashbordet:

Komponent	Funksjon	Bruksområde
Error Analysis	Identifiserer hvordan feil er distribuert i datasettet	Oppdage systematiske feil i spesifikke subgrupper
Model Fairness	Vurderer modellens ytelse på tvers av sensitive grupper	Sjekke om modellen behandler ulike grupper likt
Model Interpretability	Forklarer hvordan modellen tar beslutninger (global/lokal)	Forstå hvilke features som driver prediksjoner
Data Analysis	Utforsker datasettet for skjevheter og representasjon	Identifisere over-/underrepresentasjon i treningsdata
Counterfactual What-If	Viser minimale endringer som gir annen prediksjon	Hjelpe brukere forstå hva som må endres for annet utfall
Causal Inference	Estimerer kausale effekter av treatment-features	Skille korrelasjon fra kausalitet i beslutninger

Integrasjon i MLOps: Dashbordet genereres som del av en Azure ML pipeline job ved hjelp av komponentene fra Azure ML-registeret. Dette gjør RAI-vurdering til en automatisert del av CI/CD-flyten.

Confidence note: 🟢 Høy (basert på microsoft_azureml_rai_tabular_insight_constructor og relaterte komponenter)

2. Responsible AI Scorecard (Public Preview)

(Verified MCP 2026-04) — RAI Scorecard er i public preview. Bruker Azure SDK v2 og CLI v2.

Formål: Et PDF-dokument som oppsummerer RAI-innsikter fra dashbordet, designet for å dele med ikke-tekniske stakeholders, compliance-team og auditører.

Innhold:

Model summary med performance metrics og target values
Data characteristics (distribusjon, representasjon)
Fairness assessment på tvers av sensitive grupper
Top important features (global interpretability)
Error cohort analysis (hvor modellen feiler)
Causal insights (hvis relevant)

Bruk i governance-workflow:

Data scientist genererer scorecard etter modelltrening
Product manager/risk officer vurderer om modellen møter rettferdighets- og ytelseskrav
Scorecard arkiveres som del av model registry for audit trail
Godkjenning fra stakeholders før deployment til produksjon

Confidence note: 🟢 Høy (basert på Azure ML Responsible AI Scorecard-dokumentasjon)

3. RAI Components for Pipelines

Azure Machine Learning tilbyr RAI-komponenter som kan kjøres i pipeline jobs for automatisert RAI-vurdering:

Komponent	Komponent-navn	Funksjon
Constructor	`microsoft_azureml_rai_tabular_insight_constructor`	Oppretter RAI dashboard-objektet
Explanation	`microsoft_azureml_rai_tabular_explanation`	Genererer model interpretability insights
Error Analysis	`microsoft_azureml_rai_tabular_erroranalysis`	Analyserer feilmønstre i kohorter
Causal Analysis	`microsoft_azureml_rai_tabular_causal`	Utfører kausal inferens på treatment features
Counterfactual	`microsoft_azureml_rai_tabular_counterfactual`	Genererer counterfactual examples
Gather	`microsoft_azureml_rai_tabular_insight_gather`	Samler alle insights til dashboard

Pipeline-eksempel (Python SDK):

from azure.ai.ml import MLClient, Input
from azure.ai.ml.entities import Pipeline
from azure.identity import DefaultAzureCredential

ml_client_registry = MLClient(
    credential=DefaultAzureCredential(),
    registry_name="azureml"
)

# Last komponenter
rai_constructor = ml_client_registry.components.get(
    name="microsoft_azureml_rai_tabular_insight_constructor",
    label="latest"
)
rai_explanation = ml_client_registry.components.get(
    name="microsoft_azureml_rai_tabular_explanation",
    label="latest"
)
rai_erroranalysis = ml_client_registry.components.get(
    name="microsoft_azureml_rai_tabular_erroranalysis",
    label="latest"
)
rai_gather = ml_client_registry.components.get(
    name="microsoft_azureml_rai_tabular_insight_gather",
    label="latest"
)

# Definer pipeline
@pipeline
def rai_pipeline(train_data, test_data, model_input, target_column):
    # Opprett RAI dashboard
    create_rai_job = rai_constructor(
        title="Production Model RAI Assessment",
        task_type="classification",
        model_input=model_input,
        train_dataset=train_data,
        test_dataset=test_data,
        target_column_name=target_column,
        categorical_column_names='["gender", "ethnicity", "income_bracket"]',
        maximum_rows_for_test_dataset=5000
    )

    # Generer explanations
    explain_job = rai_explanation(
        rai_insights_dashboard=create_rai_job.outputs.rai_insights_dashboard
    )

    # Kjør error analysis
    error_job = rai_erroranalysis(
        rai_insights_dashboard=create_rai_job.outputs.rai_insights_dashboard,
        filter_features='["gender", "income_bracket"]'
    )

    # Samle insights
    gather_job = rai_gather(
        constructor=create_rai_job.outputs.rai_insights_dashboard,
        insight_1=explain_job.outputs.explanation,
        insight_2=error_job.outputs.error_analysis
    )

    return {
        "dashboard": gather_job.outputs.dashboard,
        "scorecard": gather_job.outputs.scorecard
    }

Confidence note: 🟢 Høy (basert på kodeeksempler fra Microsoft Learn)

Arkitekturmønstre

1. RAI-Augmented MLOps Pipeline

Pattern: Integrere RAI-vurdering som kvalitetsgate i CI/CD-pipeline.

Workflow:

┌─────────────────────────────────────────────────────────────────┐
│  1. Data Preparation (DataOps)                                  │
│     └─ Data quality checks + bias detection i input data        │
└────────────────┬────────────────────────────────────────────────┘
                 │
┌────────────────▼────────────────────────────────────────────────┐
│  2. Model Training (MLOps)                                      │
│     └─ MLflow tracking + model registry                         │
└────────────────┬────────────────────────────────────────────────┘
                 │
┌────────────────▼────────────────────────────────────────────────┐
│  3. RAI Dashboard Generation (Automated)                        │
│     ├─ Error analysis                                           │
│     ├─ Fairness assessment                                      │
│     ├─ Interpretability                                         │
│     └─ Scorecard generering                                     │
└────────────────┬────────────────────────────────────────────────┘
                 │
┌────────────────▼────────────────────────────────────────────────┐
│  4. Quality Gate Check                                          │
│     └─ Sjekk om fairness/performance thresholds er møtt         │
│        (automatisk eller human-in-the-loop approval)            │
└────────────────┬────────────────────────────────────────────────┘
                 │
          ┌──────┴──────┐
          │             │
    [PASS]│             │[FAIL]
          ▼             ▼
   ┌──────────┐   ┌──────────────┐
   │ Deploy   │   │ Reject +     │
   │ to Prod  │   │ Retrain      │
   └──────────┘   └──────────────┘

Implementering i Azure DevOps/GitHub Actions:

# Azure Pipelines eksempel
stages:
  - stage: Train
    jobs:
      - job: TrainModel
        steps:
          - script: python train.py
          - task: AzureCLI@2
            inputs:
              scriptType: bash
              scriptLocation: inlineScript
              inlineScript: |
                az ml job create -f training-pipeline.yml

  - stage: RAI_Assessment
    dependsOn: Train
    jobs:
      - job: GenerateRAIDashboard
        steps:
          - task: AzureCLI@2
            inputs:
              scriptType: bash
              scriptLocation: inlineScript
              inlineScript: |
                az ml job create -f rai-pipeline.yml
          - script: python validate_rai_metrics.py
            displayName: "Check RAI Quality Gates"

  - stage: Deploy
    dependsOn: RAI_Assessment
    condition: succeeded()
    jobs:
      - job: DeployToProduction
        steps:
          - script: python deploy.py

Confidence note: 🟡 Moderat-høy (basert på generell MLOps-praksis + Azure ML RAI-komponenter)

2. Continuous RAI Monitoring i Produksjon

Pattern: Overvåke fairness og model drift i produksjon med Azure ML Data Collection.

Komponenter:

Azure ML Data Collector: Samler inn inference-data fra deployed endpoints
Model Monitoring: Tracker data drift, prediction drift, og feature attribution drift
Fairness Metrics Tracking: Kontinuerlig evaluering av fairness-metrics på live data

Workflow:

Production Model Endpoint
    │
    ├─> Data Collection (via Azure ML Data Collector)
    │       └─> Lagres i Azure ML Dataset
    │
    ├─> Scheduled RAI Pipeline (daglig/ukentlig)
    │       ├─> Error analysis på nye data
    │       ├─> Fairness drift detection
    │       └─> Interpretability refresh
    │
    └─> Alerting & Actions
            ├─> Alert hvis fairness threshold brytes
            ├─> Trigger retraining pipeline
            └─> Notify stakeholders via Azure Event Grid

Implementering:

# Deploy model med data collection
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    DataCollector
)

deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name="credit-model-endpoint",
    model=model,
    data_collector=DataCollector(
        collections={
            "model_inputs": {"enabled": True},
            "model_outputs": {"enabled": True}
        },
        sampling_rate=1.0
    )
)

# Schedule RAI monitoring pipeline
from azure.ai.ml.entities import JobSchedule, RecurrenceTrigger

schedule = JobSchedule(
    name="rai-monitoring-schedule",
    trigger=RecurrenceTrigger(frequency="week", interval=1),
    create_job=rai_monitoring_pipeline
)

ml_client.schedules.begin_create_or_update(schedule)

Confidence note: 🟢 Høy (basert på Azure ML monitoring-dokumentasjon)

3. Human-in-the-Loop RAI Approval

Pattern: Bruke Responsible AI Scorecard som beslutningsunderlag for deployment-godkjenning.

Workflow:

Automated RAI Assessment: Pipeline genererer dashboard + scorecard
Scorecard Distribution: PDF sendes til product manager/risk officer
Stakeholder Review: Ikke-tekniske stakeholders vurderer:
- Møter modellen fairness-krav?
- Er error rates akseptable?
- Er sensitive grupper behandlet rettferdig?
Approval Gate: Manuell godkjenning i Azure DevOps/GitHub før deployment
Audit Trail: Scorecard arkiveres sammen med modell i registry

Azure DevOps eksempel:

- stage: Approval
  dependsOn: RAI_Assessment
  jobs:
    - deployment: ApprovalJob
      environment: 'production-approval'  # Krever manuell approval
      strategy:
        runOnce:
          deploy:
            steps:
              - download: current
                artifact: rai-scorecard
              - script: echo "Scorecard downloaded for review"

Confidence note: 🟢 Høy (standard DevOps approval pattern)

Beslutningsveiledning

Når bør RAI integreres i MLOps?

Scenario	RAI-kritiskhet	Anbefalte komponenter
Høy-risiko beslutninger (kreditt, rekruttering, helse)	🔴 Kritisk	Full RAI dashboard + scorecard + human approval
Regulerte sektorer (finans, helse, offentlig sektor)	🔴 Kritisk	Error analysis + fairness + causal inference
Customer-facing AI (anbefalingssystemer, chatbots)	🟡 Viktig	Interpretability + counterfactual + data analysis
Interne optimaliseringsmodeller (supply chain, ops)	🟢 Moderat	Error analysis + basic interpretability
Eksperimentelle/forskningsmodeller	🟢 Lavt	Valgfritt, kan utsettes til produksjon

Beslutningstre: Hvilke RAI-komponenter trengs?

Påvirker modellen menneskers liv direkte?
│
├─ JA → Bruker den sensitive attributes (kjønn, etnisitet, etc.)?
│       │
│       ├─ JA → FULLT RAI-dashboard
│       │       ├─ Error analysis
│       │       ├─ Fairness assessment
│       │       ├─ Interpretability
│       │       ├─ Counterfactual what-if
│       │       └─ Scorecard for approval
│       │
│       └─ NEI → Interpretability + Error analysis
│
└─ NEI → Er modellen i produksjon med mange brukere?
         │
         ├─ JA → Error analysis + Interpretability (monitoring)
         │
         └─ NEI → Valgfritt RAI-dashboard (best practice)

Quality Gates: Eksempel på fairness thresholds

# validate_rai_metrics.py
import json

def validate_rai_scorecard(scorecard_path: str) -> bool:
    """
    Validerer at modellen møter RAI-krav før deployment.
    """
    with open(scorecard_path, 'r') as f:
        metrics = json.load(f)

    # Fairness thresholds
    fairness_checks = {
        "accuracy_disparity": metrics["fairness"]["accuracy_disparity"] < 0.05,
        "precision_disparity": metrics["fairness"]["precision_disparity"] < 0.05,
        "false_positive_rate_disparity": metrics["fairness"]["fpr_disparity"] < 0.10
    }

    # Performance thresholds
    performance_checks = {
        "overall_accuracy": metrics["performance"]["accuracy"] > 0.85,
        "f1_score": metrics["performance"]["f1_score"] > 0.80
    }

    # Error distribution checks
    error_checks = {
        "max_cohort_error_rate": max(metrics["error_analysis"]["cohort_error_rates"]) < 0.25
    }

    all_checks = {**fairness_checks, **performance_checks, **error_checks}

    if all(all_checks.values()):
        print("✅ All RAI quality gates passed")
        return True
    else:
        print("❌ RAI quality gate failures:")
        for check, passed in all_checks.items():
            if not passed:
                print(f"  - {check}: FAILED")
        return False

if __name__ == "__main__":
    import sys
    success = validate_rai_scorecard("rai_scorecard.json")
    sys.exit(0 if success else 1)

Confidence note: 🟡 Moderat (eksempel-kode, må tilpasses faktiske metric-strukturer)

Integrasjon med Microsoft-stakken

Azure Machine Learning

Feature	RAI-funksjonalitet
Model Registry	Lagrer RAI dashboard + scorecard sammen med modell
MLflow Integration	Logger RAI metrics som MLflow metrics for versjonskontroll
Azure ML Pipelines	Kjører RAI-komponenter som del av training/evaluation pipeline
Managed Endpoints	Data collection for kontinuerlig RAI-monitoring
Event Grid	Trigger alerts ved RAI metric drift

Azure DevOps / GitHub Actions

Integration points:

Build Validation: Kjør RAI pipeline som del av PR-validering
Release Gates: Automatisk quality gate basert på RAI metrics
Approval Workflows: Distribuer scorecard til approvers via artifacts
Audit Logging: Lagre RAI scorecards i Azure Artifacts for compliance

GitHub Actions eksempel:

name: MLOps with RAI

on:
  push:
    branches: [main]

jobs:
  train-and-assess:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v3

      - name: Train Model
        run: |
          az ml job create -f training-pipeline.yml

      - name: Generate RAI Dashboard
        run: |
          az ml job create -f rai-pipeline.yml

      - name: Download RAI Scorecard
        run: |
          az ml job download --name $RAI_JOB_NAME --output-name scorecard

      - name: Upload Scorecard as Artifact
        uses: actions/upload-artifact@v3
        with:
          name: rai-scorecard
          path: scorecard.pdf

      - name: Validate RAI Metrics
        run: python validate_rai_metrics.py

  deploy:
    needs: train-and-assess
    runs-on: ubuntu-latest
    environment: production  # Krever approval
    steps:
      - name: Deploy to Production
        run: python deploy.py

Azure AI Foundry / Copilot Studio

Scenario: RAI for generative AI-modeller (GenAIOps).

Utfordringer:

Responsible AI dashboard støtter kun tabular structured data (regression/classification)
Generative AI krever andre RAI-tilnærminger

Løsninger:

Content Safety: Bruk Azure AI Content Safety for toxicity/bias detection
Prompt Flow Evaluation: Evaluere generative models med custom metrics
Manual Review: Human-in-the-loop review av generated outputs

Confidence note: 🟡 Moderat (RAI for GenAI er et fremvoksende felt, mindre standardisert enn for discriminative models)

Offentlig sektor (Norge)

Regulatoriske krav

Regulering	RAI-relevans
EU AI Act	Krever transparens og forklarbarhet for høy-risiko AI-systemer
GDPR Art. 22	Rett til forklaring ved automatiserte beslutninger
Digitaliseringsdirektoratet: Etisk retningslinjer for AI	Krav om rettferdighet og ikke-diskriminering
Utredningsinstruksen	Krav om konsekvensutredning (inkl. RAI-vurdering)

RAI Scorecard i utredningsprosessen

Pattern: Bruke Responsible AI Scorecard som del av AI-konsekvensutredning.

Workflow:

Innledende vurdering: Vurdere om AI-systemet faller under høy-risiko kategori
RAI-integrasjon i utvikling: Bygg RAI-vurdering inn i MLOps fra dag 1
Scorecard-generering: Generer scorecard ved milestone-punkter
Utredningsdokumentasjon: Inkluder scorecard i utredningsrapporten
Offentlig høring: Del scorecard med berørte parter
Vedtak og deployment: Arkiver scorecard som del av beslutningsgrunnlag

DPIA (Data Protection Impact Assessment) + RAI

Integration pattern: Kombinere DPIA og RAI-vurdering.

DPIA-element	RAI-komponent	Dokumentasjon
Formål og proporsjonalitet	Model overview + performance	Vis at modellen oppfyller formålet uten overskudd av nøyaktighet
Nødvendighet og dataminimering	Data analysis	Dokumenter hvilke features som faktisk brukes
Individers rettigheter	Counterfactual what-if	Gi brukere innsikt i hva som påvirker beslutningen
Risiko for diskriminering	Fairness assessment	Kvantifiser disparities på sensitive grupper
Åpenhet og informasjon	Interpretability + scorecard	Forklar modellens beslutninger i ikke-tekniske termer

Confidence note: 🟢 Høy (basert på GDPR + Digdir-retningslinjer)

Kostnad og lisensiering

Azure Machine Learning Pricing for RAI

Ressurs	Kostnadsfaktor	Estimat (NOK/måned)
Compute for RAI pipeline	VM-tid (CPU/GPU)	5 000 - 20 000 (avhengig av dataset-størrelse)
Storage (RAI dashboards)	Blob storage	100 - 500
Model Registry	Inkludert i AML workspace	Ingen ekstrakostnad
Event Grid (alerts)	Per event	50 - 200
Data Collection (monitoring)	Ingress/egress	500 - 2 000

Total estimat: 6 000 - 23 000 NOK/måned for full RAI-integrasjon.

Kostnad-optimalisering:

Kjør RAI-pipelines på lavere-kostnads compute (CPU istedenfor GPU)
Begrens test dataset til 5000 rader (maks for RAI dashboard UI)
Bruk scheduled pipelines (ukentlig) istedenfor real-time monitoring
Arkiver gamle RAI dashboards til cool/archive storage

Lisensiering

Tool	Lisensmodell	Inkludert i
Responsible AI Dashboard	Open-source (basert på InterpretML, Fairlearn, ErrorAnalysis, DiCE)	Azure ML workspace
Azure ML Pipelines	PaaS-modell	Azure ML workspace (betaler for compute)
Azure DevOps	Per-user (Basic Plan: gratis for 5 brukere)	Separat fra Azure ML
GitHub Actions	Gratis for public repos, betalt for private	Separat fra Azure ML

Confidence note: 🟢 Høy (basert på Azure pricing + open-source lisensiering)

For arkitekten (Cosmo)

Når skal RAI integreres i MLOps?

Cosmo's rule of thumb:

"Hvis modellen tar beslutninger som kan påvirke enkeltpersoners liv, økonomi eller rettigheter — integrer RAI fra dag 1. Hvis modellen optimaliserer interne prosesser uten direkte menneskelig påvirkning, kan RAI utsettes til produksjon, men bør uansett implementeres før go-live."

Typiske arkitekturvalg

Scenario	Anbefalt arkitektur
Kredittscoring for bank	Full RAI dashboard + human approval gate + DPIA-integrasjon
Rekruttering AI i offentlig sektor	RAI pipeline + scorecard + fairness monitoring i produksjon
Anbefalingssystem for e-handel	Error analysis + interpretability + A/B testing med fairness metrics
Prediktivt vedlikehold (industri)	Interpretability for trust + error analysis for modellkvalitet

Vanlige fallgruver

"Vi legger til RAI etter deployment" ❌ Problem: Vanskelig å fikse bias/unfairness i produksjonsmodell ✅ Løsning: Bygg RAI-vurdering inn i training pipeline fra start
"RAI dashboard er for komplisert for stakeholders" ❌ Problem: Stakeholders får ikke innsikt i modellens oppførsel ✅ Løsning: Bruk Responsible AI Scorecard (PDF) for ikke-tekniske stakeholders
"Vi kan ikke kjøre RAI-pipeline på produksjonsdata pga. GDPR" ❌ Problem: Manglende monitoring av fairness i produksjon ✅ Løsning: Anonymiser data eller kjør RAI på syntetiske data som matcher produksjonsdistribusjon
"RAI-komponenter tar for lang tid å kjøre" ❌ Problem: Forsinker CI/CD-pipeline ✅ Løsning: Kjør RAI-vurdering parallelt eller som scheduled job (ikke blocking)

Spørsmål å stille klienten

Regulatorisk kontekst:
- "Faller denne modellen under EU AI Act høy-risiko kategori?"
- "Krever deres sektor spesifikke compliance-krav (finans, helse, offentlig)?"
Stakeholder-forventninger:
- "Hvem trenger innsikt i modellens beslutninger? (risk officers, auditors, sluttbrukere?)"
- "Hva er akseptabel fairness disparity for dere? (f.eks. <5% accuracy gap mellom grupper)"
Datasettet:
- "Inneholder datasettet sensitive attributes (kjønn, etnisitet, alder)?"
- "Er det kjente skjevheter i historisk data?"
Deployment-strategi:
- "Skal RAI-vurdering være blocking for deployment, eller advisory?"
- "Hvem godkjenner modell-deployment basert på RAI scorecard?"

Anbefalte ressurser for videre dybdelæring

Microsoft Responsible AI Standard: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE5cmFl
Azure ML RAI Dashboard docs: https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard
Fairlearn (open-source): https://fairlearn.org/
InterpretML: https://interpret.ml/
EU AI Act compliance guide: https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai

Kilder og verifisering

Microsoft Learn (offisiell dokumentasjon):

Responsible AI Dashboard concept: https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard?view=azureml-api-2
MLOps and GenAIOps for AI workloads: https://learn.microsoft.com/en-us/azure/well-architected/ai/mlops-genaiops
Responsible AI Scorecard: https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-scorecard?view=azureml-api-2
Generate RAI insights with YAML and Python: https://learn.microsoft.com/en-us/azure/machine-learning/how-to-responsible-ai-insights-sdk-cli?view=azureml-api-2
Model monitoring and data collection: https://learn.microsoft.com/en-us/azure/machine-learning/concept-data-collection https://learn.microsoft.com/en-us/azure/machine-learning/concept-model-monitoring
Fairness in ML (Azure ML): https://learn.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml?view=azureml-api-2
Azure DevOps for ML: https://learn.microsoft.com/en-us/azure/machine-learning/how-to-devops-machine-learning?view=azureml-api-2

Open-source tools (referert i Azure ML RAI):

Fairlearn: https://fairlearn.org/
InterpretML: https://interpret.ml/
Error Analysis: https://erroranalysis.ai/
DiCE (Counterfactuals): https://github.com/interpretml/DiCE
EconML (Causal Inference): https://github.com/microsoft/EconML

Regulatory references:

EU AI Act: https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
GDPR Article 22: https://gdpr-info.eu/art-22-gdpr/
Digdir AI-retningslinjer: https://www.digdir.no/

MCP-calls brukt: 6 (microsoft_docs_search x 3, microsoft_docs_fetch x 2, microsoft_code_sample_search x 1) Kilder totalt: 15 Confidence: 95% (høy tillit til Microsoft-dokumentasjon, moderat for implementeringseksempler)

For Cosmo Skyberg:

Dette dokumentet gir deg en komplett arkitekturoversikt over RAI-integrasjon i MLOps. Nøkkelpunktene for deg som arkitekt er:

RAI er ikke "nice-to-have", det er governance-kritisk for modeller som påvirker mennesker
Azure ML tilbyr production-ready komponenter — du trenger ikke bygge egne RAI-verktøy
Integrer RAI-vurdering i CI/CD-pipeline som quality gate, ikke som etterpåklapp
Responsible AI Scorecard er din kommunikasjonskanal til ikke-tekniske stakeholders
Norsk offentlig sektor har spesifikke krav (DPIA + utredningsinstruksen) som RAI støtter direkte

Bruk dette dokumentet som referanse når du designer MLOps-arkitekturer hvor compliance og etikk er kritisk.

28 KiB Raw Blame History

Responsible AI Integration in MLOps

Introduksjon

Kjernekomponenter

1. Responsible AI Dashboard

2. Responsible AI Scorecard (Public Preview)

3. RAI Components for Pipelines

Arkitekturmønstre

1. RAI-Augmented MLOps Pipeline

2. Continuous RAI Monitoring i Produksjon

3. Human-in-the-Loop RAI Approval

Beslutningsveiledning

Når bør RAI integreres i MLOps?

Beslutningstre: Hvilke RAI-komponenter trengs?

Quality Gates: Eksempel på fairness thresholds

Integrasjon med Microsoft-stakken

Azure Machine Learning

Azure DevOps / GitHub Actions

Azure AI Foundry / Copilot Studio

Offentlig sektor (Norge)

Regulatoriske krav

RAI Scorecard i utredningsprosessen

DPIA (Data Protection Impact Assessment) + RAI

Kostnad og lisensiering

Azure Machine Learning Pricing for RAI

Lisensiering

For arkitekten (Cosmo)

Når skal RAI integreres i MLOps?

Typiske arkitekturvalg

Vanlige fallgruver

Spørsmål å stille klienten

Anbefalte ressurser for videre dybdelæring

Kilder og verifisering

28 KiB

Raw Blame History