Updated 66 stale knowledge base reference files (10 critical, 56 high) across all 5 skills using Microsoft Learn MCP research. Key factual updates: - Groundedness Detection API: `correction` → `mitigating` param, `correctedText` → `correctionText` (breaking change) - Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini); Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx) - Agentic Retrieval: still public preview; 50M free tokens/month - Azure security baselines: "Cognitive Services" → "Foundry Tools" - Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines - MLflow 3 GenAI: new Feedback/Expectation data model - Token tracking doc: "Azure OpenAI in Foundry Models through a gateway" - Agent Registry: Risks column (M365 E7), Graph API (preview) - Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles - ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot - Zero Trust: CAE now via Conditional Access, Strict Location Enforcement - Purview: new Fabric Copilots/agents governance section - AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python) All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added. Build registry: 1341 URLs from 387 files (+2 new URLs). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
24 KiB
Fairness Testing and Measurement - Quantifying Equity
Last updated: 2026-04 Status: GA Category: Responsible AI & Governance
Introduksjon
Fairness testing og measurement er kritiske disipliner for å kvantifisere og redusere bias i AI-systemer. Når AI-modeller tar beslutninger som påvirker mennesker — fra låneinnvilgelser til sykdomsdiagnostikk — må vi kunne måle om disse systemene behandler alle grupper rettferdig.
Microsoft sin tilnærming til fairness testing bygger på prinsippet om group fairness, som identifiserer hvilke grupper av individer som står i fare for å oppleve skade fra AI-systemet. Dette operasjonaliseres gjennom:
- Identifikasjon av sensitive features — attributter som kjønn, alder, etnisitet, geografi
- Disparity metrics — kvantitative mål på forskjeller i modellprestasjon mellom grupper
- Parity constraints — krav til at modellen skal oppføre seg sammenlignbart på tvers av grupper
- Mitigation algorithms — teknikker for å redusere oppdagede forskjeller
Verified (Microsoft Learn, 2026-02): Azure Machine Learning Responsible AI dashboard tilbyr fairness assessment som en kjernekomponent i model lifecycle management.
To hovedtyper av AI-skapt skade
| Skadetype | Definisjon | Eksempel |
|---|---|---|
| Allocation harm | Systemet gir eller nekter muligheter, ressurser eller informasjon til visse grupper | Lånemodell som er bedre til å velge gode kandidater fra én etnisk gruppe enn en annen |
| Quality-of-service harm | Systemet fungerer dårligere for én gruppe enn en annen | Voice recognition som feiler oftere for kvinner enn menn |
Kjernekomponenter
Fairlearn Open-Source Package
Verified (Microsoft Learn, fairlearn.org): Fairlearn er Microsoft sitt primære open-source bibliotek for fairness assessment og mitigation. Det er integrert i Azure Machine Learning Responsible AI dashboard.
| Komponent | Funksjon |
|---|---|
| Disparity metrics | Sammenligner modellprestasjon mellom grupper |
| Mitigation algorithms | Reduction og post-processing teknikker |
| Dashboard integration | Visualisering i Azure ML Studio |
| Parity constraints | Demographic parity, equalized odds, equal opportunity, bounded group loss |
Disparity Metrics — Kvantifisering av Ulikhet
To hovedklasser av disparity metrics:
1. Disparity i Model Performance
Måler forskjellen i ytelsesmetrikker på tvers av subgrupper:
| Metrikk | Definisjon | Modelltype |
|---|---|---|
| Disparity in accuracy | Forskjell i nøyaktighet mellom grupper | Classification |
| Disparity in error rate | Forskjell i feilrate mellom grupper | Classification |
| Disparity in precision | Forskjell i presisjon mellom grupper | Classification |
| Disparity in recall | Forskjell i recall mellom grupper | Classification |
| Disparity in MAE | Forskjell i mean absolute error mellom grupper | Regression |
Målemåter: Kan uttrykkes som ratio (max/min) eller difference (max - min).
2. Disparity i Selection Rate
Selection rate = andelen datapunkter klassifisert som 1 (i binary classification) eller distribusjon av prediksjoner (i regression).
Eksempel: Disparity i loan approval rate — forskjell i godkjenningsrate mellom demografiske grupper.
Fairness Metrics for Responsible AI Scorecard
Verified (Azure ML SDK/CLI documentation, 2026-02): Ved generering av Responsible AI scorecard kan du konfigurere fairness assessment med disse metrikkene:
| Metric | fairness_evaluation_kind | Definition | Model type |
|---|---|---|---|
accuracy_score |
difference | Maksimal forskjell i accuracy mellom to grupper | Classification |
accuracy_score |
ratio | Minimum ratio i accuracy mellom to grupper | Classification |
precision_score |
difference | Maksimal forskjell i precision mellom to grupper | Classification |
precision_score |
ratio | Maksimal ratio i precision mellom to grupper | Classification |
recall_score |
difference | Maksimal forskjell i recall mellom to grupper | Classification |
recall_score |
ratio | Maksimal ratio i recall mellom to grupper | Classification |
f1_score |
difference | Maksimal forskjell i F1 mellom to grupper | Classification |
f1_score |
ratio | Maksimal ratio i F1 mellom to grupper | Classification |
error_rate |
difference | Maksimal forskjell i error rate mellom to grupper | Classification |
error_rate |
ratio | Maksimal ratio i error rate mellom to grupper | Classification |
selection_rate |
difference | Maksimal forskjell i selection rate mellom to grupper | Classification |
selection_rate |
ratio | Maksimal ratio i selection rate mellom to grupper | Classification |
mean_absolute_error |
difference | Maksimal forskjell i MAE mellom to grupper | Regression |
mean_absolute_error |
ratio | Maksimal ratio i MAE mellom to grupper | Regression |
mean_squared_error |
difference | Maksimal forskjell i MSE mellom to grupper | Regression |
mean_squared_error |
ratio | Maksimal ratio i MSE mellom to grupper | Regression |
Viktig: Valg av difference vs. ratio påvirker skalaen av target-verdien. Ved setting av thresholds:
- Difference: Typisk målsetning ≤ 0.05 (5% forskjell)
- Ratio: Typisk målsetning ≥ 0.80 (80% ratio)
Databricks Data Quality Monitoring — Fairness Metrics
Verified (Databricks documentation, 2026-02): For classification models i Databricks kan du overvåke fairness med disse metrikkene:
| Metrikk | Definisjon | Referanse |
|---|---|---|
predictive_parity |
Sammenligner modellens precision mellom grupper | Fairness Definitions Explained, Verma & Rubin 2018 |
predictive_equality |
Sammenligner false positive rates mellom grupper | Wikipedia: Fairness (machine learning) |
equal_opportunity |
Måler om en label blir predikert like godt for begge grupper | Equality of Opportunity in Supervised Learning |
statistical_parity |
Måler forskjell i predikerte outcomes mellom grupper | Fairness literature |
Oppsett:
slicing_exprs = ["age < 25"] # Protected group = True, unprotected = False
Arkitekturmønstre
Pattern 1: Responsible AI Dashboard — Model Overview Component
Verified (Azure ML, GA): Model Overview-komponenten i Responsible AI dashboard genererer performance metrics for hele datasettet og identifiserte kohorter, med breakdown på sensitive features.
Workflow:
- Opprett dashboard constructor — last inn model, training dataset, test dataset
- Spesifiser sensitive features — f.eks.
categorical_column_names: '["gender", "age_group", "ethnicity"]' - Konfigurer fairness assessment — velg metrics og target thresholds
- Generer fairness heat map — visualiser disparity across cohorts
- Eksporter Responsible AI scorecard — PDF med fairness insights for stakeholders
YAML eksempel:
create_rai_job:
type: command
component: azureml://registries/azureml/components/microsoft_azureml_rai_tabular_insight_constructor/versions/<version>
inputs:
title: "Fairness Assessment - Loan Approval Model"
task_type: classification
model_input:
type: mlflow_model
path: azureml:loan_model:1
train_dataset: ${{parent.inputs.train_data}}
test_dataset: ${{parent.inputs.test_data}}
target_column_name: "approved"
categorical_column_names: '["gender", "ethnicity", "age_group"]'
Scorecard configuration (JSON):
{
"Model": {
"ModelName": "Loan Approval Classifier",
"ModelType": "Classification"
},
"Fairness": {
"metric": ["accuracy_score", "selection_rate"],
"sensitive_features": ["gender", "ethnicity"],
"fairness_evaluation_kind": "difference",
"threshold": "<=0.05"
}
}
Pattern 2: Fairness Mitigation med Parity Constraints
Verified (Fairlearn documentation, Azure ML): Etter å ha identifisert fairness issues, bruk mitigation algorithms.
Parity Constraints
| Constraint | Formål | ML Task | Algoritme |
|---|---|---|---|
| Demographic parity | Mitigere allocation harms | Binary classification, regression | ExponentiatedGradient, GridSearch |
| Equalized odds | Diagnostisere allocation og quality-of-service harms | Binary classification | ExponentiatedGradient, GridSearch, ThresholdOptimizer |
| Equal opportunity | Diagnostisere allocation og quality-of-service harms | Binary classification | ThresholdOptimizer |
| Bounded group loss | Mitigere quality-of-service harms | Regression | GridSearch |
Mitigation Algorithms
| Algoritme | Type | Beskrivelse | Sensitive Features | Parity Constraints |
|---|---|---|---|---|
ExponentiatedGradient |
Reduction | Black-box approach — retrainer modellen med reweighted datasets | Categorical | Demographic parity, equalized odds |
GridSearch |
Reduction | Grid-search over reweighted models | Binary | Demographic parity, equalized odds, bounded group loss |
ThresholdOptimizer |
Post-processing | Justerer decision thresholds for å enforces fairness | Categorical | Demographic parity, equalized odds |
Python eksempel (Fairlearn mitigation):
from fairlearn.reductions import ExponentiatedGradient, DemographicParity
from sklearn.linear_model import LogisticRegression
# Define constraint
constraint = DemographicParity()
# Mitigate unfairness
mitigator = ExponentiatedGradient(
estimator=LogisticRegression(),
constraints=constraint
)
mitigator.fit(X_train, y_train, sensitive_features=A_train)
y_pred_mitigated = mitigator.predict(X_test)
Pattern 3: MLflow GenAI Evaluation med Custom Fairness Scorers
Verified (Databricks MLflow documentation): For generative AI kan du definere custom fairness scorers.
Python eksempel:
from mlflow.genai.scorers import scorer
from mlflow.entities import Feedback, AssessmentSource
@scorer
def fairness_scorer(inputs, outputs, context):
# Custom logic to assess fairness in LLM outputs
protected_group_mentions = check_demographic_representation(outputs)
score = calculate_fairness_score(protected_group_mentions)
return Feedback(
value=score,
rationale=f"Protected group representation: {protected_group_mentions}",
source=AssessmentSource(
source_type="CODE",
source_id="fairness_checker_v1"
)
)
Pattern 4: Azure AI Foundry — Hate and Unfairness Evaluator
Verified (Azure AI Evaluation SDK, 2026-02): For Azure OpenAI og generative modeller.
Python eksempel:
from azure.identity import DefaultAzureCredential
from azure.ai.evaluation import HateUnfairnessEvaluator
azure_ai_project = {
"subscription_id": os.environ.get("AZURE_SUBSCRIPTION_ID"),
"resource_group_name": os.environ.get("AZURE_RESOURCE_GROUP_NAME"),
"project_name": os.environ.get("AZURE_PROJECT_NAME"),
}
credential = DefaultAzureCredential()
hate_unfairness_eval = HateUnfairnessEvaluator(
azure_ai_project=azure_ai_project,
credential=credential,
threshold=1
)
result = hate_unfairness_eval(
query="What is the capital of France?",
response="Paris",
)
Beslutningsveiledning
Når bruke hvilken metrikk?
| Scenario | Anbefalt metrikk | Begrunnelse |
|---|---|---|
| Låneinnvilgelser, ansettelser | Selection rate (difference) | Direkte måler allocation harm — forskjell i positive outcomes |
| Diagnosemodeller | Equalized odds (recall, precision) | Kritisk at både sensitivity og specificity er like på tvers av grupper |
| Prisestimering | MAE/MSE (difference) | Viktig at gjennomsnittlig feil er lik for alle grupper |
| Risk scoring | Predictive parity | Sikrer at precision er lik — positive predictions er like pålitelige |
Velg mellom Difference og Ratio
| Evaluation Kind | Når bruke | Eksempel threshold |
|---|---|---|
| Difference (max - min) | Når absolutte gap er viktig | ≤ 0.05 (5% forskjell) |
| Ratio (min/max) | Når relativ forskjell er viktig | ≥ 0.80 (80% ratio) |
Baseline: Difference er ofte enklere å tolke for stakeholders.
Fairness vs. Performance Trade-off
Viktig: Mange fairness metrics kan ikke tilfredsstilles samtidig. Du må gjøre trade-offs basert på:
- Business domain — hva er konsekvensene av false positives vs. false negatives?
- Legal requirements — diskrimineringslover i Norge/EU (GDPR, AI Act)
- Stakeholder input — kvalitativ analyse med domeneeksperter
- Performance tolerance — hvor mye accuracy tap aksepterer du for å oppnå fairness?
Decision tree:
Er dette en high-stakes decision? (lån, jobb, helse)
├── Ja → Bruk strenge fairness thresholds (difference ≤ 0.03)
│ → Vurder post-processing (ThresholdOptimizer)
│ → Dokumenter i ADR
└── Nei → Bruk moderate thresholds (difference ≤ 0.05)
→ Vurder reduction methods (ExponentiatedGradient)
Integrasjon med Microsoft-stakken
Azure Machine Learning
| Komponent | Fairness Capability | Status |
|---|---|---|
| Responsible AI dashboard | Model overview med fairness metrics | GA |
| Fairlearn integration | Disparity metrics og mitigation | GA |
| Scorecard PDF export | Fairness insights for stakeholders | Preview |
| MLflow model registry | Logg fairness metrics som model metadata | GA |
Workflow:
- Tren modell → registrer i MLflow format med sklearn flavor
- Opprett RAI dashboard → konfigurer sensitive features og metrics
- Analyser results → identifiser cohorts med høyest disparity
- Appliser mitigation → retrain med Fairlearn algorithms
- Generer scorecard → eksporter PDF med fairness target values
- Deployment gate → beslutning basert på fairness thresholds
Azure AI Foundry
Verified (Azure AI Foundry documentation, 2026-02):
| Capability | Beskrivelse | Status |
|---|---|---|
HateUnfairnessEvaluator |
Content safety evaluator for generative models | GA |
| Responsible AI dashboard integration | Lenke RAI insights til model endpoints | GA |
| Content filtering | Pre-trained filters for hate, fairness, violence | GA |
Bruk sammen med Azure OpenAI:
- Evaluate generated content for bias before deployment
- Monitor production traffic for fairness degradation
- Implement human-in-the-loop review for high-risk scenarios
Power Platform AI Builder
Baseline: AI Builder bruker samme Responsible AI prinsipper, men fairness testing er mer begrenset:
- Pre-built models: Fairness testing utført av Microsoft
- Custom models: Ingen innebygd fairness assessment UI (per 2026-02)
- Workaround: Eksporter predictions til Azure ML for fairness analysis
Offentlig sektor (Norge)
Juridiske rammeverk
| Regelverk | Relevans for Fairness | Krav |
|---|---|---|
| EU AI Act | Høy-risiko AI-systemer må undergå fairness testing | Dokumentert bias testing, adverse impact analysis |
| GDPR | Automatiserte beslutninger må kunne forklares | Fairness som del av "meaningful information" |
| Likestillingsloven | Forbud mot indirekte diskriminering | Disparity metrics for kjønn |
| Diskrimineringsloven | Forbud mot etnisitet-, alders-, funksjonsnedsettelsesdiskriminering | Fairness testing for alle beskyttede grupper |
Anbefalte praksis for norsk offentlig sektor
- Identifiser sensitive features tidlig — dokumenter i PVK (personvernkonsekvensutredning)
- Sett fairness thresholds — strengere enn privat sektor (≤ 0.03 difference)
- Dokumenter trade-offs — bruk ADR for fairness vs. performance decisions
- Etabler governance — fairness review som deployment gate
- Kontinuerlig overvåking — fairness metrics i production dashboards
Eksempel: NAV AI-system
- Sensitive features: Kjønn, alder, innvandrerbakgrunn, funksjonsnedsettelse
- Metrics: Selection rate (difference), predictive parity
- Threshold: ≤ 0.02 (2% forskjell)
- Mitigation: ThresholdOptimizer med manual review layer
Datatilgang og representativitet
Utfordring: Norske datasett kan være for små til å oppdage disparity i minoritetsgrupper.
Løsninger:
- Oversampling — bruk synthetic data generation (men dokumenter bias risk)
- Intersectional analysis — test ikke bare enkeltdimensjoner (kjønn), men kombinasjoner (kjønn + alder + geografi)
- External validation — test på EU-datasett hvis norske data mangler
Kostnad og lisensiering
Azure Machine Learning Responsible AI Dashboard
Verified (Azure pricing, 2026-02):
| Komponent | Kostnad | Lisens |
|---|---|---|
| Fairlearn (open-source) | Gratis | MIT License |
| RAI dashboard compute | Standard Azure ML compute pricing | Betales per compute time |
| Scorecard generation | Inkludert i RAI pipeline | Ingen ekstra kostnad |
Estimat for fairness testing pipeline:
- Compute: Standard_DS3_v2 (4 cores, 14 GB RAM)
- Runtime: 15-30 min per model
- Kostnad: ~10-20 NOK per run
Total TCO for årlig fairness monitoring (12 models, monthly testing):
- Compute: ~2000-3000 NOK/år
- Storage (dashboard artifacts): ~100 NOK/år
Azure AI Foundry — Content Safety Evaluators
| Evaluator | Pricing Model | Estimat |
|---|---|---|
HateUnfairnessEvaluator |
Per 1000 transactions | ~5 NOK per 1000 eval calls |
| Content filtering (Azure OpenAI) | Inkludert i token pricing | Ingen ekstra kostnad |
Databricks — Data Quality Monitoring
Baseline: Fairness metrics i Databricks er del av Lakehouse monitoring feature.
- Requires: Databricks Premium eller Enterprise tier
- Kostnad: Inkludert i tier pricing (ingen per-metric charge)
For arkitekten (Cosmo)
1. Fairness er ikke kun teknisk — det er sosio-teknisk
Viktig: Kvantitative fairness metrics fanger ikke aspekter som rettferdighet, due process, og kontekstuell hensiktsmessighet. Du må alltid kombinere metrics med kvalitativ analyse.
Anbefalinger til kunden:
- "Fairness assessment krever domeneekspertise. Hvilke grupper er i risiko for skade i deres brukstilfelle?"
- "Fairlearn kan identifisere disparity, men ikke fortelle om det er 'rettferdig'. Vi må involvere stakeholders."
2. Trade-offs er uunngåelige
Du kan ikke tilfredsstille alle fairness metrics samtidig (mathematical impossibility results, Kleinberg et al. 2016).
Spørsmål å stille kunden:
- "Hva er viktigst: lik accuracy på tvers av grupper, eller lik false positive rate?"
- "Er det verre å feilaktig nekte noen (false negative) eller feilaktig godkjenne (false positive)?"
- "Hva er lovkravene i deres domene? (EU AI Act, diskrimineringsloven)"
Dokumenter i ADR:
- Hvilke fairness metrics som ble valgt
- Hvilke ble nedprioritert, og hvorfor
- Performance vs. fairness trade-off
3. Velg riktig mitigation strategi
| Scenario | Anbefalt strategi | Begrunnelse |
|---|---|---|
| Må re-deploy modellen hyppig | Post-processing (ThresholdOptimizer) |
Rask, ingen retraining, fleksibel |
| Har tid til retraining | Reduction (ExponentiatedGradient) |
Bedre performance, men tregere |
| Multi-class problem | One-vs-Rest + post-processing | Fairlearn støtter primært binary classification |
| High-stakes decision | Hybrid approach — reduction + human review | Kombinerer automatisering med oversikt |
4. Fairness i produksjon — overvåking er kritisk
Fairness degradation kan skje over tid (data drift, population shift).
Implementer:
- Fairness metrics i monitoring dashboard — track disparity over time
- Alerting — trigger hvis disparity overskrider threshold
- Retraining triggers — automatisk re-evaluate når data distribution endres
Azure ML løsning:
- Bruk Azure ML model monitoring med custom metrics
- Logg fairness metrics til Application Insights
- Sett opp Azure Monitor alerts for fairness thresholds
5. Generative AI fairness — nye utfordringer
Baseline: Tradisjonelle fairness metrics (demographic parity, equalized odds) er designet for discriminative models. For generative AI:
Nye metrics:
- Representation fairness — er alle grupper representert i generated content?
- Stereotyping detection — genererer modellen stereotype outputs?
- Toxicity disparity — er hate speech mer vanlig for visse grupper?
Verktøy:
HateUnfairnessEvaluator(Azure AI Evaluation)- Custom MLflow scorers med LLM-as-a-judge
- Human-in-the-loop review (obligatorisk for high-stakes)
6. Offentlig sektor — strengere krav
For norske offentlige myndigheter:
Obligatoriske tiltak:
- PVK (personvernkonsekvensutredning) — fairness testing som del av prosessen
- Diskrimineringsanalyse — dokumenter testing for alle beskyttede grupper
- Transparensrapport — publiser fairness metrics (i tråd med AI Act)
- Klageadgang — mekanisme for å utfordre automated decisions
Arkitektur-implikasjoner:
- Lag audit trail for alle fairness tests
- Eksporter Responsible AI scorecards som PDF for juridisk dokumentasjon
- Implementer "right to explanation" — link model predictions til fairness analysis
7. Skill mellom fairness testing (development) og fairness monitoring (production)
| Fase | Mål | Verktøy | Frekvens |
|---|---|---|---|
| Development | Identifiser og mitiger bias før deployment | Responsible AI dashboard, Fairlearn mitigation | Per model version |
| Production | Detect fairness degradation over tid | Azure ML monitoring, custom metrics | Continuous (weekly/monthly) |
(Verified MCP 2026-04)
Kilder og verifisering
Microsoft Learn Documentation (Verified)
-
Model performance and fairness — Azure Machine Learning https://learn.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml?view=azureml-api-2 Status: GA | Verifisert: 2026-02
-
Generate Responsible AI insights with YAML and Python https://learn.microsoft.com/en-us/azure/machine-learning/how-to-responsible-ai-insights-sdk-cli?view=azureml-api-2 Status: GA | Verifisert: 2026-02
-
Monitor fairness and bias for classification models — Databricks https://learn.microsoft.com/en-us/azure/databricks/data-quality-monitoring/data-profiling/fairness-bias Status: GA | Verifisert: 2026-02
-
Responsible AI dashboard — Azure Machine Learning https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard?view=azureml-api-2 Status: GA | Verifisert: 2026-02
-
Azure AI Evaluation SDK — HateUnfairnessEvaluator https://learn.microsoft.com/en-us/python/api/azure-ai-evaluation/azure.ai.evaluation.hateunfairnessevaluator?view=azure-python Status: GA | Verifisert: 2026-02
Akademiske kilder (Baseline)
-
Fairness Definitions Explained — Verma & Rubin (2018) http://fairware.cs.umass.edu/papers/Verma.pdf Kilde: Databricks documentation reference
-
Equality of Opportunity in Supervised Learning — Hardt, Price & Srebro (2016) https://arxiv.org/abs/1610.02413 Kilde: Fairlearn mitigation algorithms
-
A Reductions Approach to Fair Classification — Agarwal et al. (2018) https://arxiv.org/abs/1803.02453 Kilde: Fairlearn ExponentiatedGradient algorithm
Open-Source (Verified)
- Fairlearn — Microsoft open-source fairness toolkit https://fairlearn.org/ License: MIT | Verifisert: 2026-02
Code Samples (Verified)
- Azure AI Evaluation Python SDK examples https://learn.microsoft.com/en-us/python/api/azure-ai-evaluation/ Language: Python | Verifisert: 2026-02
Confidence level: High (95%)
- Fairness metrics, Fairlearn integration, RAI dashboard: Verified via Microsoft Learn
- Mitigation algorithms: Verified via Fairlearn documentation og Azure ML examples
- Generative AI evaluators: Verified via Azure AI Evaluation SDK documentation
- Databricks metrics: Verified via Databricks documentation
Sist verifisert: 2026-02-04