Initial addition of ms-ai-architect plugin to the open-source marketplace. Private content excluded: orchestrator/ (Linear tooling), docs/utredning/ (client investigation), generated test reports and PDF export script. skill-gen tooling moved from orchestrator/ to scripts/skill-gen/. Security scan: WARNING (risk 20/100) — no secrets, no injection found. False positive fixed: added gitleaks:allow to Python variable reference in output-validation-grounding-verification.md line 109. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
19 KiB
AI Risk Taxonomy - Classification and Risk Levels
Last updated: 2026-02 Status: GA Category: Responsible AI & Governance
Introduksjon
AI Risk Taxonomy er et strukturert rammeverk for å identifisere, klassifisere og prioritere risikoer i AI-systemer. Microsoft har utviklet en omfattende tilnærming som kombinerer teknisk sikkerhet, ansvarlig AI-praksis og regulatorisk compliance (spesielt EU AI Act). Taxonomien dekker hele AI-livssyklusen fra datainnsamling til produksjonsdrift.
Denne kunnskapsbasen beskriver Microsofts tilnærming til risikokategorisering, severitetsgradering og taksonomisk klassifikasjon av AI-risikoer. Den integrerer:
- AI Security Risk Assessment Framework – teknisk risikokartlegging
- Responsible AI Standard – etiske og regulatoriske krav
- EU AI Act alignment – risikokategorier (unacceptable, high, limited, minimal)
- MITRE ATLAS – adversarial ML threat matrix
Verified (microsoft_docs_search, 2026-02)
Kjernekomponenter
1. Risikokategorier (EU AI Act-inspirert)
Microsoft har tilpasset sin risikotaksonomi til EU AI Acts fire hovedkategorier:
| Risikokategori | Beskrivelse | Krav | Eksempler |
|---|---|---|---|
| Unacceptable Risk | Forbudte bruksområder som krenker grunnleggende rettigheter | Totalt forbud | Social scoring, real-time facial recognition (law enforcement), subliminal manipulation, exploitation av sårbare grupper |
| High Risk | Betydelig påvirkning på individers rettigheter eller sikkerhet | Strict compliance, human oversight, impact assessment | Critical infrastructure, employment decisions, credit scoring, healthcare diagnosis, biometric identification |
| Limited Risk | Transparenskrav for brukere | Disclosure requirements | Chatbots, AI-generated content, deepfakes |
| Minimal Risk | Fri bruk med best practice | Voluntary compliance | Spam filters, AI-enabled video games, recommendation systems |
Verified (Microsoft Enterprise AI Services Code of Conduct, 2026-02)
2. Severitetsgradering (Microsoft Security Framework)
Microsoft bruker en 5-nivå severitetsmodell for å prioritere sikkerhetsrisikoer:
| Severity Level | Kriterier | Impact | Eksempler |
|---|---|---|---|
| Critical | AI modell behandler sensitive persondata (PCI, HIPAA, GDPR) Business-critical system Fysisk skade/død mulig Kritisk infrastruktur |
Stor negativ innvirkning på business operations | Healthcare AI, autonomous vehicles, financial fraud detection |
| High | Sensitive persondata eller konfidensielt IP Stor men avgrenset business impact Business-critical applications |
Betydelig men avgrenset skade | Customer-facing AI, HR recruitment systems |
| Medium | Subset av treningsdata inneholder sensitive data Ikke-kritisk men business-facing Påvirker production models indirekte |
Begrenset business impact | Non-production models with production data access |
| Low | Treningsdata ikke brukt i production Ingen production deployment Ingen produksjonsrelevans |
Minimal business impact | Research models, sandbox environments |
| Informational | Uklassifiserte data fra vetted sources Ingen production-bruk |
Ingen business impact | Academic research, public datasets |
Verified (AI Risk Assessment for ML Engineers, 2026-02)
3. Attack Type Risk Matrix
Microsoft har utviklet en spesialisert risikomatrise for adversarial ML attacks basert på likelihood, impact og exploitability:
| Attack Type | Likelihood | Impact | Exploitability | Beskrivelse |
|---|---|---|---|---|
| Extraction | High | Low | High | Model stealing via API queries |
| Evasion | High | Medium | High | Adversarial inputs som forårsaker feile prediksjoner |
| Inference | Medium | Medium | Medium | Rekonstruksjon av treningsdata via modell-spørring |
| Inversion | Medium | High | Medium | Recovery av sensitive attributter fra modelloutput |
| Poisoning | Low | High | Low | Manipulering av treningsdata for å påvirke modelloppførsel |
Verified (AI Risk Assessment for ML Engineers, 2026-02)
4. Content Safety Risk Categories
Azure AI Content Safety og Microsoft Responsible AI Standard definerer seks primære innholdsrisiko-kategorier:
| Risk Category | Severity Levels | Beskrivelse | Default Threshold |
|---|---|---|---|
| Hate and Fairness | Safe (0) → High (6) | Hatefullt innhold, diskriminering basert på beskyttede attributter | Medium (block 4+) |
| Sexual Content | Safe (0) → High (6) | Erotisk, pornografisk eller seksuelt eksplisitt innhold | Medium (block 4+) |
| Violence | Safe (0) → High (6) | Grafisk vold, gore, våpen, trusler | Medium (block 4+) |
| Self-Harm | Safe (0) → High (6) | Selvskading, suicidal ideation | Medium (block 4+) |
| Protected Material | Detected / Not Detected | Opphavsrettsbeskyttet materiale (text, code) | Block all detected |
| Jailbreak (User Prompt Injection) | Detected / Not Detected | Forsøk på å omgå sikkerhetskontroller | Block all detected |
Verified (Default Guidelines & controls policies, 2026-02)
Arkitekturmønstre
Risk Assessment Workflow
1. IDENTIFY
├─ Impact Assessment (Responsible AI Impact Assessment template)
├─ Red Team Testing (PYRIT, AI Red Teaming Agent)
├─ Stress Testing
└─ Prioritized Harm List
2. ASSESS
├─ Severity Classification (Critical → Informational)
├─ Likelihood Evaluation (High → Low)
├─ Impact Analysis (Quantitative + Qualitative)
└─ Risk Score Calculation
3. MITIGATE
├─ Platform Security (AI-1 to AI-5 controls)
├─ Content Safety Filters
├─ Human-in-the-Loop (HITL)
└─ Access Controls & Monitoring
4. MONITOR
├─ Azure Monitor Logs (AADUserRiskEvents)
├─ Security Dashboard for AI
├─ Continuous Red Teaming
└─ Incident Response
Three-Pillar Security Model
Microsoft organiserer AI-sikkerhet i tre pillarer:
Pillar 1: AI Platform Security
- Model approval process (AI-1)
- Network segmentation & VPN (NS-2)
- Identity management (IM-3)
- Logging & monitoring (LT-3)
Pillar 2: AI Application Security
- Content Safety inspection (Azure AI Content Safety)
- Prompt injection detection
- Output validation & filtering
- RAG grounding verification
Pillar 3: AI Usage Security
- Human-in-the-Loop (AI-5)
- User authentication & authorization
- Acceptable Use Policies
- Audit trails & compliance reporting
Verified (Artificial Intelligence Security - MCSB, 2026-02)
Beslutningsveiledning
Når skal hvilken risikokategori brukes?
Bruk denne beslutningstreet:
START
│
├─ Omfattes bruksområdet av forbudte use cases? → JA → UNACCEPTABLE RISK (avslå)
│ → NEI → fortsett
│
├─ Påvirker systemet juridiske rettigheter, økonomisk stilling,
│ ansettelse, eller kan det forårsake fysisk/psykisk skade? → JA → HIGH RISK
│ → NEI → fortsett
│
├─ Genererer systemet syntetisk innhold (tekst, tale, bilde, video)
│ som interagerer med eksterne brukere? → JA → LIMITED RISK (disclosure required)
│ → NEI → fortsett
│
└─ Alle andre tilfeller → MINIMAL RISK (best practice)
Severity Assessment Checklist
For hvert AI-system, evaluer:
Kritiske faktorer (Critical hvis JA):
- Behandler sensitive persondata (GDPR Art. 9, HIPAA, PCI-DSS)
- Fysisk skade eller død er mulig outcome
- Kritisk infrastruktur (helse, energi, transport, vann)
- Business-critical med stor operational impact
Høye faktorer (High hvis JA):
- Konfidensielle data eller bedriftshemmeligheter
- Betydelig men avgrenset business impact
- Customer-facing production system
Medium faktorer (Medium hvis JA):
- Subset av treningsdata er sensitive
- Non-production men business-relevant
- Indirekte påvirkning på production models
Human Oversight Requirements (AI-5)
High-risk actions krever Human-in-the-Loop (HITL) ved:
| Scenario | HITL-krav | Implementering |
|---|---|---|
| External data transfer | Mandatory approval | Azure Logic Apps / Power Automate approval workflow |
| Financial transactions > threshold | Mandatory approval | Secure dashboard with Azure Key Vault auth |
| Healthcare diagnosis/treatment | Mandatory review | Clinical decision support with physician override |
| Employment decisions | Mandatory review | HR dashboard with documented decision rationale |
| Legal/compliance decisions | Mandatory approval | Audit trail with Azure Monitor |
Verified (AI-5: Ensure human-in-the-loop, MCSB, 2026-02)
Integrasjon med Microsoft-stakken
Azure AI Foundry
| Komponent | Risk Assessment Feature |
|---|---|
| AI Red Teaming Agent | Automated adversarial testing (4 risk categories: Violence, Hate, Sexual, Self-Harm) |
| Safety Evaluators | Pre-deployment risk scoring for content safety |
| Prompt Shields | Real-time jailbreak detection |
| Groundedness Detection | Hallucination & ungrounded inference detection |
Azure AI Content Safety
{
"riskCategories": {
"Hate": { "enabled": true, "threshold": "Medium" },
"Sexual": { "enabled": true, "threshold": "Medium" },
"Violence": { "enabled": true, "threshold": "Medium" },
"SelfHarm": { "enabled": true, "threshold": "Medium" }
},
"blocklists": ["custom-terms-list"],
"promptShield": { "enabled": true }
}
Security Dashboard for AI (Preview)
Sentralisert risikokartlegging på tvers av:
- Microsoft Entra – Identity & access risk
- Microsoft Defender – Threat protection & cloud security posture
- Microsoft Purview – Data classification & DLP
- Security Copilot – AI-powered risk exploration
Query example (Log Analytics):
// Recent high-risk user events
AADUserRiskEvents
| where DetectedDateTime > ago(30d)
| where RiskState == "atRisk"
| where RiskLevel == "high"
| summarize count() by RiskEventType
Verified (Security Dashboard for AI, 2026-02)
Responsible AI Dashboard (Azure Machine Learning)
Integrert risikoevaluering med:
- Error Analysis – Identifiser cohorts med høy feilrate
- Fairness Assessment – Bias detection across sensitive groups
- Model Explainability – Feature importance for transparency
- Causal Inference – Skille correlation fra causation
Offentlig sektor (Norge)
GDPR & Personopplysningsloven
Risk taxonomy må tilpasses norsk regulering:
| Datakategori | GDPR Art. | Risk Level | Tiltak |
|---|---|---|---|
| Særlige kategorier (Art. 9) | 9(1) | Critical | Explicit consent, DPIA, encryption at rest/transit |
| Personopplysninger | 4(1) | High | Lawful basis (Art. 6), data minimization |
| Anonymiserte data | Recital 26 | Low | Best practice, no legal basis required |
Sektorspesifikke krav
Helsesektoren:
- Norm for informasjonssikkerhet (Helsedirektoratet)
- Pasientjournalloven § 22 (tilgangskontroll)
- Helseregisterloven (forskning & kvalitet)
Justissektoren:
- Politiregisterloven (behandling av straffesakdata)
- Straffeprosessloven kap. 16a (DNA-register)
Anbefalt tilnærming for offentlig sektor
- Alltid start med DPIA (GDPR Art. 35) for high-risk AI
- Dokumenter lawful basis (GDPR Art. 6 eller Art. 9)
- Implementer Privacy by Design (GDPR Art. 25)
- Etabler Data Protection Officer (DPO) oversight
- Bruk Norwegian data residency (Azure Norway East/West)
Kostnad og lisensiering
Azure AI Services Pricing (Risk-relevante tjenester)
| Tjeneste | Pris (ca. NOK) | Risk Mitigation Capability |
|---|---|---|
| Azure AI Content Safety | 11 NOK / 1000 transactions | Content filtering (4 risk categories) |
| Azure OpenAI (GPT-4o) | 0.03 NOK / 1K input tokens | Built-in content filters (default: Medium threshold) |
| Azure AI Foundry (Red Teaming) | Inkludert i AI Foundry | Automated adversarial testing |
| Microsoft Defender for Cloud | 190 NOK / server / måned | AI security posture management |
| Microsoft Purview (Compliance) | Fra 2500 NOK / måned | Data classification & DLP for AI |
Lisenskrav for Security Dashboard for AI
Security Dashboard for AI krever ingen egen lisens, men er avhengig av:
| Produkt | Lisens | Rolle i Risk Management |
|---|---|---|
| Microsoft Entra ID P2 | ~75 NOK / bruker / måned | Identity risk detection (low/medium/high) |
| Microsoft Defender for Cloud (P2) | ~380 NOK / ressurs / måned | AI workload threat protection |
| Microsoft Purview (Compliance) | ~340 NOK / bruker / måned | AI-accessible data classification |
| Security Copilot | ~4500 NOK / capacity unit / måned | AI risk exploration via prompts |
Baseline confidence (modellkunnskap, januar 2025 – verifiser priser)
For arkitekten (Cosmo)
Når dette temaet er relevant
Bruk denne kunnskapsbasen når kunden:
- Spør om "risk levels", "severity", "high risk AI"
- Trenger å klassifisere AI-systemet sitt iht. regulering (EU AI Act, GDPR)
- Skal gjøre en Responsible AI Impact Assessment
- Trenger å dokumentere risk assessment for compliance
- Planlegger offentlig sektor-deployment med sensitive data
Cosmo-tilnærming
Fase 2 (Kontekst) – Still disse spørsmålene:
- "Hvilke datakategorier behandler systemet? (personopplysninger, helseopplysninger, etc.)"
- "Kan systemet påvirke individers juridiske rettigheter, økonomiske stilling eller sikkerhet?"
- "Er dette et autonomt system, eller har dere human oversight?"
- "Hvilke compliance-krav gjelder for dere? (GDPR, helsesektorlover, etc.)"
Fase 5 (Kunnskapsintegrasjon) – Kombiner med:
responsible-ai-framework.md– overordnede prinsippersecurity-governance-model.md– tekniske kontrollerpublic-sector-requirements-norway.md– sektorspesifikke kravlicensing-guide-ai-capabilities.md– Security Dashboard krav
Fase 6 (Arkitekturforslag) – Lever:
-
Risk Classification Report:
- EU AI Act category (unacceptable/high/limited/minimal)
- Microsoft severity level (critical → informational)
- Attack type risk matrix (extraction, evasion, etc.)
-
Mitigation Architecture:
- Content Safety filters (med threshold-anbefaling)
- HITL workflows (Logic Apps / Power Automate)
- Monitoring setup (Log Analytics queries)
-
Compliance Checklist:
- GDPR Art. 35 DPIA template
- Lawful basis dokumentasjon
- Data residency confirmation (Azure Norway)
Røde flagg (Unacceptable Risk)
Hvis kunden beskriver noen av disse, stopp og advare:
- Social scoring eller predictive profiling som fører til diskriminering
- Real-time facial recognition for law enforcement (unntatt spesifikke lovlige bruksområder)
- Manipulation via subliminal techniques
- Exploitation av sårbare grupper (alder, funksjonshemming, sosioøkonomisk status)
- Criminality risk assessment basert kun på profiling
Disse er forbudt iht. Microsoft Enterprise AI Services Code of Conduct.
Typiske misvær
Misforståelse: "Vi bruker bare Azure OpenAI, så vi har ingen high-risk AI." Cosmo-svar: "Azure OpenAI selv er ikke high-risk, men bruken kan være det. Hvis systemet deres tar beslutninger om ansettelse, kreditt, eller helsediagnoser, er det high-risk uavhengig av underliggende teknologi."
Misforståelse: "Vi trenger ikke HITL fordi modellen er veldig nøyaktig." Cosmo-svar: "HITL handler ikke bare om nøyaktighet – det handler om accountability og compliance. EU AI Act krever human oversight for high-risk systems uavhengig av modellprestasjon."
Praktisk verktøy-stack for risk assessment
Anbefal denne kombinasjonen:
-
Pre-deployment:
- AI Red Teaming Agent (Azure AI Foundry)
- Responsible AI Dashboard (Azure ML)
- PYRIT (open source red teaming)
-
Runtime:
- Azure AI Content Safety (API integration)
- Prompt Shields (Azure OpenAI)
- Azure Monitor + Log Analytics
-
Governance:
- Security Dashboard for AI (cross-product view)
- Microsoft Purview (data classification)
- Defender for Cloud (CSPM for AI)
Kilder og verifisering
Primærkilder (Verified via MCP)
-
AI Risk Assessment for ML Engineers
- URL: https://learn.microsoft.com/en-us/security/ai-red-team/ai-risk-assessment
- Hentet: 2026-02-04
- Innhold: Severity matrix, likelihood/impact assessment, control framework
-
Microsoft Enterprise AI Services Code of Conduct
- URL: https://learn.microsoft.com/en-us/legal/ai-code-of-conduct
- Hentet: 2026-02-04
- Innhold: Unacceptable risk categories, usage restrictions, content requirements
-
Artificial Intelligence Security (MCSB v2)
- URL: https://learn.microsoft.com/en-us/security/benchmark/azure/mcsb-v2-artificial-intelligence-security
- Hentet: 2026-02-04
- Innhold: AI-1 to AI-5 security controls, three-pillar model
-
Security Dashboard for AI (Preview)
- URL: https://learn.microsoft.com/en-us/security/security-for-ai/security-dashboard-for-ai
- Hentet: 2026-02-04
- Innhold: Cross-product risk monitoring, AI inventory
-
Default Guidelines & controls policies (Azure AI Foundry)
- URL: https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/default-safety-policies
- Hentet: 2026-02-04
- Innhold: Content filtering categories, severity levels, default thresholds
-
What is Responsible AI? (Azure Machine Learning)
- URL: https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai
- Hentet: 2026-02-04
- Innhold: Six principles, fairness assessment, Responsible AI dashboard
Sekundærkilder (Baseline confidence)
- ISO 27001:2013 standard (kontroller og policies)
- MITRE ATLAS (adversarial ML threat matrix)
- EU AI Act (risikokategorier – ikke offisiell Microsoft-dokumentasjon)
- Microsoft Responsible AI Standard v2 (PDF, juni 2022)
MCP Calls Summary
- microsoft_docs_search: 3 calls (AI risk classification, AI Act levels, Azure framework)
- microsoft_docs_fetch: 2 calls (AI Risk Assessment, Code of Conduct)
- microsoft_code_sample_search: 1 call (AI risk assessment code examples)
- Totalt unike URLer: 6 verified Microsoft Learn articles
Sist verifisert
- Dato: 2026-02-04
- Metode: MCP microsoft-learn server
- Confidence: High (alle kjernekomponenter fra Microsoft Learn)
Dette dokumentet er en kunnskapsreferanse for Cosmo Skyberg (ms-ai-governance skill). Sist oppdatert: 2026-02. Status: General Availability (GA). For spørsmål om denne referansen, kontakt plugin-utvikler.