Updated 66 stale knowledge base reference files (10 critical, 56 high) across all 5 skills using Microsoft Learn MCP research. Key factual updates: - Groundedness Detection API: `correction` → `mitigating` param, `correctedText` → `correctionText` (breaking change) - Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini); Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx) - Agentic Retrieval: still public preview; 50M free tokens/month - Azure security baselines: "Cognitive Services" → "Foundry Tools" - Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines - MLflow 3 GenAI: new Feedback/Expectation data model - Token tracking doc: "Azure OpenAI in Foundry Models through a gateway" - Agent Registry: Risks column (M365 E7), Graph API (preview) - Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles - ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot - Zero Trust: CAE now via Conditional Access, Strict Location Enforcement - Purview: new Fabric Copilots/agents governance section - AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python) All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added. Build registry: 1341 URLs from 387 files (+2 new URLs). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
27 KiB
Reserved Capacity and Commitment Discounts
Last updated: 2026-04 Status: GA Category: Cost Optimization & FinOps for AI
Introduksjon
Reserved capacity og commitment tier pricing er Azures to primære mekanismer for kostnadsoptimalisering av AI-tjenester gjennom term-baserte rabatter. Disse mekanismene lar organisasjoner oppnå betydelige kostnadsbesparelser (opptil 40-60% for reservasjoner) i bytte mot å binde seg til en bestemt kapasitet over tid.
Nøkkelforskjeller:
| Aspekt | Azure Reservations (PTU) | Commitment Tier Pricing |
|---|---|---|
| Gjelder for | Azure OpenAI Provisioned Throughput (PTU) | Cognitive Services (Speech, Language, Vision, Document Intelligence) |
| Bindingstid | 1 måned eller 1 år | 1 måned (web/connected) eller 1 år (disconnected containers) |
| Scope flexibility | Høy (subscription, resource group, management group, billing account) | Lav (kun Azure OpenAI resource) |
| Kjøpsmekanisme | Azure Reservations portal | Resource-level i Azure portal |
| Deployment types | Regional, Data Zone, Global Provisioned | Web API, Connected containers, Disconnected containers |
| Overage håndtering | Hourly rate for excess PTUs | Overage rate per commitment tier |
💡 Confidence: HIGH — Basert på offisiell Microsoft dokumentasjon oppdatert april 2026. Verified (MCP 2026-04).
Kjernekomponenter / Nøkkelegenskaper
Azure Reservations for Provisioned Throughput Units (PTU)
Provisioned Throughput Units (PTU) er generiske enheter av modellprosesseringskapasitet som måler throughput for Azure OpenAI og Foundry Models (DeepSeek, Llama, etc.).
Deployment Types og Reservations
| Deployment Type | Quota Name | Minimum PTUs | Scale Increment | Use Case |
|---|---|---|---|---|
| Regional Provisioned | Regional Provisioned Throughput Unit | 50 (25 for mini/nano) | 50 (25 for mini/nano) | Data residency-krav, compliance |
| Data Zone Provisioned | Data Zone Provisioned Throughput Unit | 15 | 5 | Balanse mellom fleksibilitet og data residency |
| Global Provisioned | Global Provisioned Throughput Unit | 15 | 5 | Global load balancing, høyest tilgjengelighet |
Viktig: Reservations for Regional, Data Zone og Global er ikke utskiftbare — du må kjøpe separate reservasjoner for hver deployment type.
Reservation Scopes
| Scope | Beskrivelse | Bruksområde |
|---|---|---|
| Single resource group | Gjelder kun ressurser i én resource group | Isolerte prosjekter, dev/test miljøer |
| Single subscription | Gjelder alle ressurser i én subscription | Avdelingsbasert struktur |
| Management group | Gjelder subscriptions i en management group | Organisasjonsbrede AI-satsninger |
| Shared (billing account) | Gjelder alle subscriptions i billing account | Enterprise Agreement, maksimal fleksibilitet |
Best practice: Start med shared scope for maksimal fleksibilitet. Scope kan endres uten straff.
Reservation Discount Application
Rabattene anvendes time-for-time basert på deployed PTUs:
Deployed PTUs ≤ Reserved PTUs → Full reservation discount
Deployed PTUs > Reserved PTUs → Excess charged at hourly rate
Eksempel — Underutnyttelse:
- Reservation: 300 PTUs
- Deployed: 200 PTUs
- Resultat: 200 PTUs dekket av reservasjon, 100 PTUs ubrukt (går tapt, ingen rollover)
Eksempel — Overforbruk:
- Reservation: 200 PTUs
- Deployed: 250 PTUs
- Resultat: 200 PTUs dekket av reservasjon, 50 PTUs faktureres hourly rate
Eksempel — Partial-hour deployments:
- 100 PTU deployment i 15 minutter av timen = 25 PTU (1/4 av time)
Shared PTU Reservations på tvers av Foundry Models
Fra mai 2025 støtter PTU-reservasjoner automatisk cross-model sharing:
- Én reservasjon kan dekke Azure OpenAI og Foundry Models (DeepSeek, Llama, etc.)
- Reservasjonen anvendes først til Azure OpenAI, deretter Foundry Models
- Excess utover reservasjon faktureres per modellens hourly rate
Eksempel:
- Reservation: 500 PTUs
- Azure OpenAI deployment: 300 PTUs → dekket av reservasjon
- DeepSeek-R1 deployment: 200 PTUs → dekket av reservasjon (totalt 500)
- Ekstra DeepSeek: 100 PTUs → faktureres DeepSeek hourly rate
Commitment Tier Pricing (Cognitive Services)
Commitment tier pricing gjelder for single-service resources (ikke multi-service eller Foundry multi-service):
Støttede tjenester
| Tjeneste | Commitment Type | Bruksområde |
|---|---|---|
| Speech to Text (Standard) | Web, Connected, Disconnected | Transkripsjon, voice analytics |
| Text to Speech (Neural) | Web, Connected, Disconnected | Voice assistants, accessibility |
| Text Translation (Standard) | Web, Connected | Flerspråklig innhold |
| Language Understanding (LUIS) | Web | Intent detection, chatbots |
| Azure Language (Sentiment, Key Phrase, NER, Language Detection) | Web | Text analytics |
| Vision OCR | Web, Connected | Dokumentprosessering |
| Document Intelligence (Custom/Invoice) | Web | Faktura-/skjemabehandling |
Commitment Types
| Type | Beskrivelse | Bindingstid | Faktureringscyklus |
|---|---|---|---|
| Web | Cloud-basert API-tilgang | 1 måned | Månedlig (første måned pro-rated) |
| Connected container | On-premises med Azure-tilkobling for metering | 1 måned | Månedlig (første måned pro-rated) |
| Disconnected container | Fullstendig offline, ingen Azure-tilkobling | 1 år | Årlig (fullt beløp ved kjøp) |
Viktig: Commitment tier kan ikke refunderes etter kjøp. Test kapasitetsbehov før binding.
Overage Pricing
- Forbruk utover commitment quota faktureres til overage rate (spesifisert per tier)
- Overage rates er høyere enn commitment rate, men lavere enn standard pay-as-you-go
- Ekstra quota for disconnected containers: Kjøp via slider i Azure portal (pro-rated)
Arkitekturmønstre
Mønster 1: Hybrid Hourly + Reservation (Azure OpenAI PTU)
Scenario: Produksjon med varierende trafikk + ad-hoc eksperimentering.
┌─────────────────────────────────────────────────┐
│ Production Workload (stabil trafikk) │
│ ├─ Base capacity: 200 PTUs │
│ └─ Payment: 1-year Regional Reservation │
│ → 40-60% discount │
└─────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────┐
│ Burst/Experimentation (varierende trafikk) │
│ ├─ Additional capacity: 0-100 PTUs │
│ └─ Payment: Hourly (no reservation) │
│ → Full flexibility, no commitment │
└─────────────────────────────────────────────────┘
Fordeler:
- Kostnadskontroll på base load
- Fleksibilitet for nye modeller/tester
- Ingen risiko for over-provisioning av reservasjon
Offentlig sektor: Egnet for virksomheter med stabile kjernebehov + innovasjonsprosjekter.
Mønster 2: Multi-Scope Reservation Strategy
Scenario: Enterprise med mange subscriptions og AI-prosjekter.
┌─────────────────────────────────────────────────┐
│ Shared Scope Reservation (Billing Account) │
│ ├─ Covers: All subscriptions │
│ ├─ PTUs: 1000 (mix of Regional + Global) │
│ └─ Auto-applies to any matching deployment │
└─────────────────────────────────────────────────┘
│
┌─────────┴─────────┬─────────┐
▼ ▼ ▼
┌─────────┐ ┌─────────┐ ┌─────────┐
│ Sub A │ │ Sub B │ │ Sub C │
│ 300 PTU │ │ 400 PTU │ │ 300 PTU │
└─────────┘ └─────────┘ └─────────┘
Fordeler:
- Maksimal fleksibilitet ved restrukturering
- Ingen administrative overhead ved subscription-endringer
- Naturlig load balancing mellom prosjekter
Offentlig sektor: Egnet for statlige virksomheter med kompleks organisasjonsstruktur.
Mønster 3: Commitment Tier for Edge Scenarios
Scenario: On-premises Speech/Language-tjenester i nettverk med begrenset tilgang.
┌─────────────────────────────────────────────────┐
│ Azure Portal: Commitment Tier Purchase │
│ ├─ Service: Speech to Text (Neural) │
│ ├─ Type: Disconnected Container │
│ ├─ Term: 1 year │
│ └─ Quota: 1M transactions/year │
└─────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────┐
│ On-Premises Deployment │
│ ├─ Docker container (no internet) │
│ ├─ Usage tracking via volume mount │
│ └─ Annual usage report submitted to Azure │
└─────────────────────────────────────────────────┘
Fordeler:
- Data forlater ikke lokalt nettverk
- Forutsigbar årlig kostnad
- Ingen runtime-avhengigheter til Azure
Offentlig sektor: Kritisk for Klassifisert/Beskyttet data (politi, forsvar, PST).
Mønster 4: Migration from Commitment to Reservation (Legacy Azure OpenAI)
Scenario: Kunder med gamle commitments (før august 2024) migrerer til ny modell.
┌─────────────────────────────────────────────────┐
│ OLD: Resource-bound Commitment (legacy) │
│ ├─ Binding: Tied to specific Azure OpenAI res. │
│ ├─ Models: Limited (gpt-4o, gpt-4o-mini only) │
│ └─ New enrollments: STOPPED Aug 1, 2024 │
└─────────────────────────────────────────────────┘
│
▼ Migration Path
┌─────────────────────────────────────────────────┐
│ NEW: Hourly + Azure Reservation │
│ ├─ Binding: Flexible scope (sub/RG/MG) │
│ ├─ Models: All models (incl. gpt-5, o-series) │
│ └─ Overage: Can be covered by reservation │
└─────────────────────────────────────────────────┘
Migrasjonstips:
- Ikke kanseller gamle commitments før modell-retirement (fortsatt gyldig)
- Opprett nye deployments på hourly først
- Kjøp reservation for nye deployments
- Overage fra gamle commitments kan dekkes av nye reservasjoner
Beslutningsveiledning
Beslutningstre: Reservation vs. Commitment vs. Hourly
Er tjenesten Azure OpenAI/Foundry Models?
│
├─ JA → Bruk Azure Reservations (PTU)
│ │
│ ├─ Stabil trafikk i >3 måneder? → 1-year reservation
│ ├─ Stabil trafikk i >1 måned? → 1-month reservation
│ └─ Ad-hoc/testing? → Hourly (no reservation)
│
└─ NEI → Er det Cognitive Services (Speech/Language/Vision)?
│
├─ JA → Bruk Commitment Tier
│ │
│ ├─ On-premises uten internett? → Disconnected container (1 år)
│ ├─ On-premises med internett? → Connected container (1 måned)
│ └─ Cloud-based? → Web commitment (1 måned)
│
└─ NEI → Sjekk tjeneste-spesifikke reservasjonsmodeller
Når IKKE bruke reservations/commitments
| Scenario | Hvorfor unngå | Alternativ |
|---|---|---|
| Proof of Concept (< 1 måned) | Usikker kapasitet, risiko for over-purchase | Hourly PTU, pay-as-you-go |
| Eksperimentering med nye modeller | Ikke sikker på modellvalg/throughput-behov | Hourly PTU, test først |
| Sporadisk bruk (< 50% av måneden) | Underutnyttelse → tapt investering | Hourly PTU, pay-as-you-go |
| Kapasitet ikke verifisert | Risiko: Kjøper reservasjon, men ingen capacity | Deploy først, kjøp reservasjon etterpå |
| Serverless workloads (Azure SQL Serverless, Cosmos DB Serverless) | Reservasjoner støttes IKKE for serverless SKUs | Pay-as-you-go kun |
💡 Best Practice: ALLTID deploy først, kjøp reservasjon etterpå. Quota ≠ capacity.
Autorenew er nå ON som standard for alle nye reservasjoner (gjelder reservasjoner opprettet etter 2025-Q4). Sjekk innstillingen ved kjøp og deaktiver manuelt hvis ønskelig. Verified (MCP 2026-04).
Sizing og kapasitetsplanlegging
PTU Capacity Calculator (innebygd i Azure AI Foundry)
Tilgjengelig i deployment workflow:
Input:
- Input TPM (Tokens Per Minute)
- Output TPM
- Peak calls per minute
- Tokens per prompt
- Tokens per response
Output:
- Recommended PTUs (avrundet til scale increment)
- Raw PTUs (eksakt estimat)
Eksempel (gpt-5):
- Input TPM: 100K
- Output TPM: 25K (output tokens teller 8x input, jf. pricing ratio)
- Resultat: ~150 PTUs regional (avrundet til 150, min 50)
💡 Tip: For workloads med stor variance i call shapes, benchmark på faktisk trafikk i 1-2 uker før sizing.
Integrasjon med Microsoft-stakken
Cost Management + Billing
| Feature | Bruksområde | Link |
|---|---|---|
| Reservation utilization | Monitorere utnyttelsesgrad (target: >80%) | Azure Monitor, Reservations blade |
| Amortized cost view | Fordele reservasjonskostnad over term | Cost Management → Amortized view |
| Chargeback | Allokere kostnad til avdelinger/prosjekter | Cost Management → Cost allocation rules |
| Budget alerts | Varsle ved overage (hourly charges) | Cost Management → Budgets |
FinOps Recommendations
| Metric | Target | Action if below target |
|---|---|---|
| Reservation utilization | ≥ 80% | Reduser deployment size eller exchange reservation |
| Hourly overage % | < 10% av total | Øk reservation size eller optimaliser traffic |
| Amortized cost/PTU | Benchmark per region | Vurder migration til billigere region/deployment type |
Offentlig sektor: Integrer med Difi/Digdir FinOps frameworks for statsbudsjettrapportering.
Multi-Cloud & Hybrid Scenarios
| Scenario | Azure Mekanisme | Integrasjon |
|---|---|---|
| Hybrid (on-prem + cloud) | Connected container commitment | ExpressRoute/VPN for metering |
| Air-gapped (FSA/PST) | Disconnected container commitment | Annual usage report via secure channel |
| Multi-cloud (AWS/GCP + Azure) | Ingen direct integration | Separat capacity planning per cloud |
Offentlig sektor (Norge)
Compliance og juridiske krav
| Krav | Reservation Impact | Commitment Impact |
|---|---|---|
| Schrems II (EU data residency) | ✅ Regional Provisioned PTU → garanterer region | ✅ Commitment tier + regional resources |
| Personvernforordningen (GDPR) | ✅ Data Zone Provisioned → EU Data Boundary | ✅ Connected containers on-prem |
| Sikkerhetsloven (FSA/PST) | ⚠️ Vurder Global Provisioned (data kan forlate EU) | ✅ Disconnected containers (full kontroll) |
| Offentleglova (transparency) | ✅ Reservation costs transparent i Cost Management | ✅ Fixed monthly/yearly budget |
Budsjettmessige hensyn
| Budsjettmodell | Anbefaling | Begrunnelse |
|---|---|---|
| Årlig (statlige virksomheter) | 1-year reservation | Forutsigbar kostnad, aligner med budsjettår |
| Måned-til-måned (kommuner) | 1-month reservation eller commitment tier | Fleksibilitet for kommunale budsjettjusteringer |
| Prosjektbasert (IT-prosjekter) | Hourly PTU | Ingen binding utover prosjektperiode |
💡 Tip: For statlige virksomheter med vedtatt årlig AI-budsjett → kjøp 1-year reservation ved budsjettstart (januar) for maksimal rabatt.
Innkjøpsprosess og anskaffelse
| Fase | Handling | Ansvarlig rolle |
|---|---|---|
| 1. Behovsanalyse | Estimer TPM/PTU-behov via capacity calculator | AI Architect / DevOps |
| 2. Kapasitetsverifisering | Deploy test deployment i target region | DevOps / Cloud Engineer |
| 3. Budsjettgodkjenning | Innhent godkjenning for term commitment | Økonomi / IT-leder |
| 4. Reservasjonskjøp | Kjøp via Azure Reservations portal | IT-admin (EA Admin for Enterprise) |
| 5. Monitorering | Sett opp Cost Management alerts | FinOps / Cloud Governance |
Rolebasert tilgangskontroll (RBAC):
- Reservation Purchaser role → Kjøpe reservasjoner
- Owner på subscription → Administrere reservations scope
- Billing Account Admin (EA) → Enable "Reserved Instances" policy
Kostnad og lisensiering
Prisingeksempler (estimert, verifiser via Azure Pricing Calculator)
Merk: Priser varierer per region og oppdateres hyppig. Bruk Azure Pricing Calculator for nøyaktig estimat.
Azure OpenAI Provisioned Throughput (Regional, Norway East)
| PTUs | Hourly Rate | 1-month Reservation | 1-year Reservation | Savings (1-year) |
|---|---|---|---|---|
| 100 | ~$300/time | ~$220/time (~27% off) | ~$150/time (~50% off) | ~$108K/år |
| 300 | ~$900/time | ~$660/time (~27% off) | ~$450/time (~50% off) | ~$324K/år |
| 1000 | ~$3000/time | ~$2200/time (~27% off) | ~$1500/time (~50% off) | ~$1.08M/år |
💡 Confidence: MEDIUM — Eksakte priser per januar 2026 ikke offentlig tilgjengelig for alle regioner.
Commitment Tier Pricing (Speech to Text, Web)
| Tier | Transactions/month | Monthly Cost | Pay-as-you-go Equivalent | Savings |
|---|---|---|---|---|
| C1 | 100K | ~$500 | ~$750 | ~33% |
| C2 | 500K | ~$2000 | ~$3500 | ~43% |
| C3 | 2M | ~$7000 | ~$13000 | ~46% |
Lisensieringskrav
| Tjeneste | Lisensiering | Reservations/Commitments |
|---|---|---|
| Azure OpenAI | None (consumption-based) | Reservations apply automatically based on scope |
| Cognitive Services | None (consumption-based) | Commitment tier purchased per resource |
| M365 Copilot | M365 E3/E5 + Copilot license | N/A (capacity inkludert i lisens) |
Viktig: M365 Copilot har ikke PTU-modell eller reservasjoner — kapasitet inkludert i per-user licensing.
Total Cost of Ownership (TCO) Calculation
Scenario: 300 PTU Regional Provisioned, 1 år drift
| Cost Component | Hourly (No Reservation) | 1-year Reservation | Delta |
|---|---|---|---|
| Compute (300 PTU) | ~$7.9M/år | ~$3.9M/år | -$4M |
| Storage (1TB hot) | ~$0.2K/år | ~$0.2K/år | $0 |
| Networking (1TB egress) | ~$87/år | ~$87/år | $0 |
| Support (Standard) | ~$100K/år | ~$100K/år | $0 |
| TOTAL | ~$8.0M/år | ~$4.0M/år | -$4M/år (-50%) |
💡 Tip: Bruk Azure TCO Calculator for komplekse multi-service scenarios.
For arkitekten (Cosmo)
Når anbefale reservations/commitments
| Signal fra kunde | Anbefaling | Rationale |
|---|---|---|
| "Vi har stabil trafikk i produksjon" | 1-year reservation | ROI oppnås etter ~2 måneder |
| "Vi er i pilot-fase, men planlegger produksjon om 3 mnd" | Hourly → 1-month reservation ved prod-start | Unngå early commitment før traffic patterns er kjent |
| "Vi trenger Speech-tjenester on-prem" | Commitment tier (Connected/Disconnected) | Eneste alternativ for on-prem deployment |
| "Vi har mange subscriptions og prosjekter" | Shared scope reservation | Administrativ forenkling |
| "Vi har strenge data residency-krav" | Regional Provisioned + 1-year reservation | Compliance + cost optimization |
Røde flagg (når advare mot commitments)
| Scenario | Risk | Mitigation |
|---|---|---|
| Ukjent traffic pattern | Over-provisioning → tapt investering | Start med hourly, monitorer 1-2 måneder |
| Ny modellgeneration snart (f.eks. gpt-6) | Gammel modell blir obsolete | Vent med 1-year reservation til etter modellrelease |
| Kapasitet ikke verifisert | Kjøp reservation, men ingen deployment capacity | Deploy først, verifiser capacity, kjøp deretter |
| Multi-region strategy usikkert | Reservation i feil region | Evaluer latency/compliance-krav før region lock-in |
| Budget uncertainty | Binding på kostnad uten sikker finansiering | Sikre budsjettgodkjenning før purchase |
Diskusjonsspørsmål til kunde
-
Traffic pattern: "Har dere historiske data på API-kall per time/dag/uke?" → Benytt til sizing via capacity calculator
-
Vekstforventning: "Forventer dere 2x, 5x, 10x økning i trafikk neste 12 måneder?" → Påvirker om 1-year reservation er trygt
-
Budget cycle: "Er AI-budsjettet årlig eller kan det justeres innen året?" → Aligner reservation term med budsjettcyklus
-
Data residency: "Har dere krav om at data ikke forlater Norge/EU?" → Regional Provisioned + Norway East/West Europe
-
Compliance requirements: "Er dette et Klassifisert/Beskyttet system?" → Vurder disconnected containers (commitment tier)
Arkitekturbeslutning: Reservation Sizing Worksheet
Bruk dette i ADR-prosessen:
1. Baseline Capacity (stabil trafikk):
- Avg PTUs/hour: ___________
- Peak PTUs/hour: ___________
- Recommendation: Reserve at ___% of peak (typisk 80%)
2. Growth Buffer:
- Expected growth (6 months): ___________%
- Recommendation: Add ___% buffer
3. Reservation Size:
- Base: ___________
- Growth buffer: ___________
- TOTAL PTUs: ___________
4. Financial Commitment:
- Hourly cost (no reservation): ___________
- 1-month reservation cost: ___________
- 1-year reservation cost: ___________
- Break-even period: ___________ (typisk 2-3 måneder)
5. Risk Assessment:
[ ] Capacity verified in target region
[ ] Budget approved for term length
[ ] Traffic pattern stable (>1 month data)
[ ] Compliance requirements met
[ ] Scope configured (subscription/RG/MG)
Integrasjon med ADR-prosess
Når dokumentere reservation decisions:
- Context: Hvorfor vurderes reservation? (Cost optimization, stable workload, budget predictability)
- Decision: Hvilken reservation type/term? (1-month vs. 1-year, Regional vs. Global, scope)
- Alternatives considered:
- Hourly (no reservation)
- Commitment tier (hvis Cognitive Services)
- Different scope/term lengths
- Consequences:
- Positive: Cost savings (X% reduction), budget predictability
- Negative: Reduced flexibility, risk of underutilization if traffic drops
- Neutral: Administrative overhead for monitoring utilization
Bruk /architect:adr command for å generere ADR basert på denne vurderingen.
Kilder og verifisering
MCP Calls: 3 Unique Sources: 9
| Kilde | Type | Last Verified |
|---|---|---|
| Save costs with Microsoft Foundry Provisioned Throughput Reservations | Offisiell docs | 2026-01 |
| Understanding costs associated with provisioned throughput units (PTU) | Offisiell docs | 2026-01 |
| Azure OpenAI provisioned Managed offering updates | Offisiell docs | 2025-08 |
| Purchase commitment tier pricing | Offisiell docs | 2026-01 |
| What is provisioned throughput? | Offisiell docs | 2026-01 |
| Azure OpenAI Provisioned Managed Offering in Azure Government | Offisiell docs | 2025-05 |
| View Azure reservation utilization | Cost Management | 2025-12 |
| How reservation discounts are applied | Cost Management | 2025-12 |
| Azure Pricing Calculator | Pricing tool | Live |
Confidence markers:
- ✅ HIGH — Direkte fra offisiell Microsoft Learn dokumentasjon (januar 2026)
- ⚠️ MEDIUM — Estimerte priser (verifiser via Pricing Calculator for nøyaktig region/dato)
- 💡 BEST PRACTICE — Basert på kombinasjon av docs + FinOps Framework principles
For Cosmo:
Denne kunnskapen er kritisk for cost optimization discussions med kunder. Viktigste takeaways:
- Deploy først, kjøp reservasjon etterpå — aldri motsatt vei
- Scope matters — Shared scope gir maksimal fleksibilitet for enterprise-kunder
- Reservations ≠ Commitments — Azure OpenAI bruker reservations, Cognitive Services bruker commitment tier
- Underutilization = tapt kostnad — Excess reserved PTUs går tapt (ingen rollover)
- Offentlig sektor — 1-year reservations aligner med statsbudsjettet (januar-start)
Bruk capacity calculator aktivt i kundedialog for å unngå over-/under-sizing.