# Reserved Capacity and Commitment Discounts **Last updated:** 2026-04 **Status:** GA **Category:** Cost Optimization & FinOps for AI --- ## Introduksjon Reserved capacity og commitment tier pricing er Azures to primære mekanismer for kostnadsoptimalisering av AI-tjenester gjennom term-baserte rabatter. Disse mekanismene lar organisasjoner oppnå betydelige kostnadsbesparelser (opptil 40-60% for reservasjoner) i bytte mot å binde seg til en bestemt kapasitet over tid. **Nøkkelforskjeller:** | Aspekt | Azure Reservations (PTU) | Commitment Tier Pricing | |--------|-------------------------|------------------------| | **Gjelder for** | Azure OpenAI Provisioned Throughput (PTU) | Cognitive Services (Speech, Language, Vision, Document Intelligence) | | **Bindingstid** | 1 måned eller 1 år | 1 måned (web/connected) eller 1 år (disconnected containers) | | **Scope flexibility** | Høy (subscription, resource group, management group, billing account) | Lav (kun Azure OpenAI resource) | | **Kjøpsmekanisme** | Azure Reservations portal | Resource-level i Azure portal | | **Deployment types** | Regional, Data Zone, Global Provisioned | Web API, Connected containers, Disconnected containers | | **Overage håndtering** | Hourly rate for excess PTUs | Overage rate per commitment tier | **💡 Confidence: HIGH** — Basert på offisiell Microsoft dokumentasjon oppdatert april 2026. Verified (MCP 2026-04). --- ## Kjernekomponenter / Nøkkelegenskaper ### Azure Reservations for Provisioned Throughput Units (PTU) **Provisioned Throughput Units (PTU)** er generiske enheter av modellprosesseringskapasitet som måler throughput for Azure OpenAI og Foundry Models (DeepSeek, Llama, etc.). #### Deployment Types og Reservations | Deployment Type | Quota Name | Minimum PTUs | Scale Increment | Use Case | |-----------------|------------|--------------|-----------------|----------| | **Regional Provisioned** | Regional Provisioned Throughput Unit | 50 (25 for mini/nano) | 50 (25 for mini/nano) | Data residency-krav, compliance | | **Data Zone Provisioned** | Data Zone Provisioned Throughput Unit | 15 | 5 | Balanse mellom fleksibilitet og data residency | | **Global Provisioned** | Global Provisioned Throughput Unit | 15 | 5 | Global load balancing, høyest tilgjengelighet | **Viktig:** Reservations for Regional, Data Zone og Global er **ikke utskiftbare** — du må kjøpe separate reservasjoner for hver deployment type. #### Reservation Scopes | Scope | Beskrivelse | Bruksområde | |-------|-------------|-------------| | **Single resource group** | Gjelder kun ressurser i én resource group | Isolerte prosjekter, dev/test miljøer | | **Single subscription** | Gjelder alle ressurser i én subscription | Avdelingsbasert struktur | | **Management group** | Gjelder subscriptions i en management group | Organisasjonsbrede AI-satsninger | | **Shared (billing account)** | Gjelder alle subscriptions i billing account | Enterprise Agreement, maksimal fleksibilitet | **Best practice:** Start med shared scope for maksimal fleksibilitet. Scope kan endres uten straff. #### Reservation Discount Application Rabattene anvendes time-for-time basert på deployed PTUs: ``` Deployed PTUs ≤ Reserved PTUs → Full reservation discount Deployed PTUs > Reserved PTUs → Excess charged at hourly rate ``` **Eksempel — Underutnyttelse:** - Reservation: 300 PTUs - Deployed: 200 PTUs - Resultat: 200 PTUs dekket av reservasjon, 100 PTUs ubrukt (går tapt, ingen rollover) **Eksempel — Overforbruk:** - Reservation: 200 PTUs - Deployed: 250 PTUs - Resultat: 200 PTUs dekket av reservasjon, 50 PTUs faktureres hourly rate **Eksempel — Partial-hour deployments:** - 100 PTU deployment i 15 minutter av timen = 25 PTU (1/4 av time) #### Shared PTU Reservations på tvers av Foundry Models Fra mai 2025 støtter PTU-reservasjoner automatisk **cross-model sharing**: - Én reservasjon kan dekke Azure OpenAI **og** Foundry Models (DeepSeek, Llama, etc.) - Reservasjonen anvendes først til Azure OpenAI, deretter Foundry Models - Excess utover reservasjon faktureres per modellens hourly rate **Eksempel:** 1. Reservation: 500 PTUs 2. Azure OpenAI deployment: 300 PTUs → dekket av reservasjon 3. DeepSeek-R1 deployment: 200 PTUs → dekket av reservasjon (totalt 500) 4. Ekstra DeepSeek: 100 PTUs → faktureres DeepSeek hourly rate ### Commitment Tier Pricing (Cognitive Services) Commitment tier pricing gjelder for **single-service resources** (ikke multi-service eller Foundry multi-service): #### Støttede tjenester | Tjeneste | Commitment Type | Bruksområde | |----------|----------------|-------------| | **Speech to Text (Standard)** | Web, Connected, Disconnected | Transkripsjon, voice analytics | | **Text to Speech (Neural)** | Web, Connected, Disconnected | Voice assistants, accessibility | | **Text Translation (Standard)** | Web, Connected | Flerspråklig innhold | | **Language Understanding (LUIS)** | Web | Intent detection, chatbots | | **Azure Language** (Sentiment, Key Phrase, NER, Language Detection) | Web | Text analytics | | **Vision OCR** | Web, Connected | Dokumentprosessering | | **Document Intelligence** (Custom/Invoice) | Web | Faktura-/skjemabehandling | #### Commitment Types | Type | Beskrivelse | Bindingstid | Faktureringscyklus | |------|-------------|-------------|-------------------| | **Web** | Cloud-basert API-tilgang | 1 måned | Månedlig (første måned pro-rated) | | **Connected container** | On-premises med Azure-tilkobling for metering | 1 måned | Månedlig (første måned pro-rated) | | **Disconnected container** | Fullstendig offline, ingen Azure-tilkobling | 1 år | Årlig (fullt beløp ved kjøp) | **Viktig:** Commitment tier kan **ikke refunderes** etter kjøp. Test kapasitetsbehov før binding. #### Overage Pricing - Forbruk utover commitment quota faktureres til **overage rate** (spesifisert per tier) - Overage rates er høyere enn commitment rate, men lavere enn standard pay-as-you-go - Ekstra quota for disconnected containers: Kjøp via slider i Azure portal (pro-rated) --- ## Arkitekturmønstre ### Mønster 1: Hybrid Hourly + Reservation (Azure OpenAI PTU) **Scenario:** Produksjon med varierende trafikk + ad-hoc eksperimentering. ``` ┌─────────────────────────────────────────────────┐ │ Production Workload (stabil trafikk) │ │ ├─ Base capacity: 200 PTUs │ │ └─ Payment: 1-year Regional Reservation │ │ → 40-60% discount │ └─────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────┐ │ Burst/Experimentation (varierende trafikk) │ │ ├─ Additional capacity: 0-100 PTUs │ │ └─ Payment: Hourly (no reservation) │ │ → Full flexibility, no commitment │ └─────────────────────────────────────────────────┘ ``` **Fordeler:** - Kostnadskontroll på base load - Fleksibilitet for nye modeller/tester - Ingen risiko for over-provisioning av reservasjon **Offentlig sektor:** Egnet for virksomheter med **stabile kjernebehov** + innovasjonsprosjekter. --- ### Mønster 2: Multi-Scope Reservation Strategy **Scenario:** Enterprise med mange subscriptions og AI-prosjekter. ``` ┌─────────────────────────────────────────────────┐ │ Shared Scope Reservation (Billing Account) │ │ ├─ Covers: All subscriptions │ │ ├─ PTUs: 1000 (mix of Regional + Global) │ │ └─ Auto-applies to any matching deployment │ └─────────────────────────────────────────────────┘ │ ┌─────────┴─────────┬─────────┐ ▼ ▼ ▼ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ Sub A │ │ Sub B │ │ Sub C │ │ 300 PTU │ │ 400 PTU │ │ 300 PTU │ └─────────┘ └─────────┘ └─────────┘ ``` **Fordeler:** - Maksimal fleksibilitet ved restrukturering - Ingen administrative overhead ved subscription-endringer - Naturlig load balancing mellom prosjekter **Offentlig sektor:** Egnet for **statlige virksomheter** med kompleks organisasjonsstruktur. --- ### Mønster 3: Commitment Tier for Edge Scenarios **Scenario:** On-premises Speech/Language-tjenester i nettverk med begrenset tilgang. ``` ┌─────────────────────────────────────────────────┐ │ Azure Portal: Commitment Tier Purchase │ │ ├─ Service: Speech to Text (Neural) │ │ ├─ Type: Disconnected Container │ │ ├─ Term: 1 year │ │ └─ Quota: 1M transactions/year │ └─────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────┐ │ On-Premises Deployment │ │ ├─ Docker container (no internet) │ │ ├─ Usage tracking via volume mount │ │ └─ Annual usage report submitted to Azure │ └─────────────────────────────────────────────────┘ ``` **Fordeler:** - Data forlater ikke lokalt nettverk - Forutsigbar årlig kostnad - Ingen runtime-avhengigheter til Azure **Offentlig sektor:** Kritisk for **Klassifisert/Beskyttet** data (politi, forsvar, PST). --- ### Mønster 4: Migration from Commitment to Reservation (Legacy Azure OpenAI) **Scenario:** Kunder med gamle commitments (før august 2024) migrerer til ny modell. ``` ┌─────────────────────────────────────────────────┐ │ OLD: Resource-bound Commitment (legacy) │ │ ├─ Binding: Tied to specific Azure OpenAI res. │ │ ├─ Models: Limited (gpt-4o, gpt-4o-mini only) │ │ └─ New enrollments: STOPPED Aug 1, 2024 │ └─────────────────────────────────────────────────┘ │ ▼ Migration Path ┌─────────────────────────────────────────────────┐ │ NEW: Hourly + Azure Reservation │ │ ├─ Binding: Flexible scope (sub/RG/MG) │ │ ├─ Models: All models (incl. gpt-5, o-series) │ │ └─ Overage: Can be covered by reservation │ └─────────────────────────────────────────────────┘ ``` **Migrasjonstips:** 1. **Ikke kanseller gamle commitments** før modell-retirement (fortsatt gyldig) 2. **Opprett nye deployments** på hourly først 3. **Kjøp reservation** for nye deployments 4. **Overage fra gamle commitments** kan dekkes av nye reservasjoner --- ## Beslutningsveiledning ### Beslutningstre: Reservation vs. Commitment vs. Hourly ``` Er tjenesten Azure OpenAI/Foundry Models? │ ├─ JA → Bruk Azure Reservations (PTU) │ │ │ ├─ Stabil trafikk i >3 måneder? → 1-year reservation │ ├─ Stabil trafikk i >1 måned? → 1-month reservation │ └─ Ad-hoc/testing? → Hourly (no reservation) │ └─ NEI → Er det Cognitive Services (Speech/Language/Vision)? │ ├─ JA → Bruk Commitment Tier │ │ │ ├─ On-premises uten internett? → Disconnected container (1 år) │ ├─ On-premises med internett? → Connected container (1 måned) │ └─ Cloud-based? → Web commitment (1 måned) │ └─ NEI → Sjekk tjeneste-spesifikke reservasjonsmodeller ``` ### Når IKKE bruke reservations/commitments | Scenario | Hvorfor unngå | Alternativ | |----------|---------------|------------| | **Proof of Concept (< 1 måned)** | Usikker kapasitet, risiko for over-purchase | Hourly PTU, pay-as-you-go | | **Eksperimentering med nye modeller** | Ikke sikker på modellvalg/throughput-behov | Hourly PTU, test først | | **Sporadisk bruk (< 50% av måneden)** | Underutnyttelse → tapt investering | Hourly PTU, pay-as-you-go | | **Kapasitet ikke verifisert** | Risiko: Kjøper reservasjon, men ingen capacity | Deploy først, kjøp reservasjon etterpå | | **Serverless workloads (Azure SQL Serverless, Cosmos DB Serverless)** | Reservasjoner støttes IKKE for serverless SKUs | Pay-as-you-go kun | **💡 Best Practice:** **ALLTID deploy først, kjøp reservasjon etterpå.** Quota ≠ capacity. **Autorenew er nå ON som standard for alle nye reservasjoner** (gjelder reservasjoner opprettet etter 2025-Q4). Sjekk innstillingen ved kjøp og deaktiver manuelt hvis ønskelig. Verified (MCP 2026-04). --- ### Sizing og kapasitetsplanlegging #### PTU Capacity Calculator (innebygd i Azure AI Foundry) Tilgjengelig i deployment workflow: **Input:** - **Input TPM** (Tokens Per Minute) - **Output TPM** - **Peak calls per minute** - **Tokens per prompt** - **Tokens per response** **Output:** - **Recommended PTUs** (avrundet til scale increment) - **Raw PTUs** (eksakt estimat) **Eksempel (gpt-5):** - Input TPM: 100K - Output TPM: 25K (output tokens teller 8x input, jf. pricing ratio) - Resultat: ~150 PTUs regional (avrundet til 150, min 50) **💡 Tip:** For workloads med **stor variance** i call shapes, benchmark på faktisk trafikk i 1-2 uker før sizing. --- ## Integrasjon med Microsoft-stakken ### Cost Management + Billing | Feature | Bruksområde | Link | |---------|-------------|------| | **Reservation utilization** | Monitorere utnyttelsesgrad (target: >80%) | Azure Monitor, Reservations blade | | **Amortized cost view** | Fordele reservasjonskostnad over term | Cost Management → Amortized view | | **Chargeback** | Allokere kostnad til avdelinger/prosjekter | Cost Management → Cost allocation rules | | **Budget alerts** | Varsle ved overage (hourly charges) | Cost Management → Budgets | ### FinOps Recommendations | Metric | Target | Action if below target | |--------|--------|------------------------| | **Reservation utilization** | ≥ 80% | Reduser deployment size eller exchange reservation | | **Hourly overage %** | < 10% av total | Øk reservation size eller optimaliser traffic | | **Amortized cost/PTU** | Benchmark per region | Vurder migration til billigere region/deployment type | **Offentlig sektor:** Integrer med **Difi/Digdir FinOps frameworks** for statsbudsjettrapportering. --- ### Multi-Cloud & Hybrid Scenarios | Scenario | Azure Mekanisme | Integrasjon | |----------|----------------|-------------| | **Hybrid (on-prem + cloud)** | Connected container commitment | ExpressRoute/VPN for metering | | **Air-gapped (FSA/PST)** | Disconnected container commitment | Annual usage report via secure channel | | **Multi-cloud (AWS/GCP + Azure)** | Ingen direct integration | Separat capacity planning per cloud | --- ## Offentlig sektor (Norge) ### Compliance og juridiske krav | Krav | Reservation Impact | Commitment Impact | |------|-------------------|------------------| | **Schrems II (EU data residency)** | ✅ Regional Provisioned PTU → garanterer region | ✅ Commitment tier + regional resources | | **Personvernforordningen (GDPR)** | ✅ Data Zone Provisioned → EU Data Boundary | ✅ Connected containers on-prem | | **Sikkerhetsloven (FSA/PST)** | ⚠️ Vurder Global Provisioned (data kan forlate EU) | ✅ Disconnected containers (full kontroll) | | **Offentleglova (transparency)** | ✅ Reservation costs transparent i Cost Management | ✅ Fixed monthly/yearly budget | ### Budsjettmessige hensyn | Budsjettmodell | Anbefaling | Begrunnelse | |----------------|-----------|--------------| | **Årlig (statlige virksomheter)** | 1-year reservation | Forutsigbar kostnad, aligner med budsjettår | | **Måned-til-måned (kommuner)** | 1-month reservation eller commitment tier | Fleksibilitet for kommunale budsjettjusteringer | | **Prosjektbasert (IT-prosjekter)** | Hourly PTU | Ingen binding utover prosjektperiode | **💡 Tip:** For **statlige virksomheter** med vedtatt årlig AI-budsjett → kjøp 1-year reservation ved budsjettstart (januar) for maksimal rabatt. --- ### Innkjøpsprosess og anskaffelse | Fase | Handling | Ansvarlig rolle | |------|---------|----------------| | **1. Behovsanalyse** | Estimer TPM/PTU-behov via capacity calculator | AI Architect / DevOps | | **2. Kapasitetsverifisering** | Deploy test deployment i target region | DevOps / Cloud Engineer | | **3. Budsjettgodkjenning** | Innhent godkjenning for term commitment | Økonomi / IT-leder | | **4. Reservasjonskjøp** | Kjøp via Azure Reservations portal | IT-admin (EA Admin for Enterprise) | | **5. Monitorering** | Sett opp Cost Management alerts | FinOps / Cloud Governance | **Rolebasert tilgangskontroll (RBAC):** - **Reservation Purchaser** role → Kjøpe reservasjoner - **Owner** på subscription → Administrere reservations scope - **Billing Account Admin** (EA) → Enable "Reserved Instances" policy --- ## Kostnad og lisensiering ### Prisingeksempler (estimert, verifiser via Azure Pricing Calculator) **Merk:** Priser varierer per region og oppdateres hyppig. Bruk [Azure Pricing Calculator](https://azure.microsoft.com/pricing/calculator/) for nøyaktig estimat. #### Azure OpenAI Provisioned Throughput (Regional, Norway East) | PTUs | Hourly Rate | 1-month Reservation | 1-year Reservation | Savings (1-year) | |------|-------------|---------------------|-------------------|------------------| | 100 | ~$300/time | ~$220/time (~27% off) | ~$150/time (~50% off) | ~$108K/år | | 300 | ~$900/time | ~$660/time (~27% off) | ~$450/time (~50% off) | ~$324K/år | | 1000 | ~$3000/time | ~$2200/time (~27% off) | ~$1500/time (~50% off) | ~$1.08M/år | **💡 Confidence: MEDIUM** — Eksakte priser per januar 2026 ikke offentlig tilgjengelig for alle regioner. #### Commitment Tier Pricing (Speech to Text, Web) | Tier | Transactions/month | Monthly Cost | Pay-as-you-go Equivalent | Savings | |------|-------------------|--------------|-------------------------|---------| | C1 | 100K | ~$500 | ~$750 | ~33% | | C2 | 500K | ~$2000 | ~$3500 | ~43% | | C3 | 2M | ~$7000 | ~$13000 | ~46% | --- ### Lisensieringskrav | Tjeneste | Lisensiering | Reservations/Commitments | |----------|-------------|------------------------| | **Azure OpenAI** | None (consumption-based) | Reservations apply automatically based on scope | | **Cognitive Services** | None (consumption-based) | Commitment tier purchased per resource | | **M365 Copilot** | M365 E3/E5 + Copilot license | N/A (capacity inkludert i lisens) | **Viktig:** M365 Copilot har **ikke** PTU-modell eller reservasjoner — kapasitet inkludert i per-user licensing. --- ### Total Cost of Ownership (TCO) Calculation **Scenario:** 300 PTU Regional Provisioned, 1 år drift | Cost Component | Hourly (No Reservation) | 1-year Reservation | Delta | |----------------|------------------------|--------------------|-------| | **Compute (300 PTU)** | ~$7.9M/år | ~$3.9M/år | -$4M | | **Storage (1TB hot)** | ~$0.2K/år | ~$0.2K/år | $0 | | **Networking (1TB egress)** | ~$87/år | ~$87/år | $0 | | **Support (Standard)** | ~$100K/år | ~$100K/år | $0 | | **TOTAL** | ~$8.0M/år | ~$4.0M/år | **-$4M/år (-50%)** | **💡 Tip:** Bruk Azure TCO Calculator for komplekse multi-service scenarios. --- ## For arkitekten (Cosmo) ### Når anbefale reservations/commitments | Signal fra kunde | Anbefaling | Rationale | |------------------|-----------|-----------| | **"Vi har stabil trafikk i produksjon"** | 1-year reservation | ROI oppnås etter ~2 måneder | | **"Vi er i pilot-fase, men planlegger produksjon om 3 mnd"** | Hourly → 1-month reservation ved prod-start | Unngå early commitment før traffic patterns er kjent | | **"Vi trenger Speech-tjenester on-prem"** | Commitment tier (Connected/Disconnected) | Eneste alternativ for on-prem deployment | | **"Vi har mange subscriptions og prosjekter"** | Shared scope reservation | Administrativ forenkling | | **"Vi har strenge data residency-krav"** | Regional Provisioned + 1-year reservation | Compliance + cost optimization | --- ### Røde flagg (når advare mot commitments) | Scenario | Risk | Mitigation | |----------|------|------------| | **Ukjent traffic pattern** | Over-provisioning → tapt investering | Start med hourly, monitorer 1-2 måneder | | **Ny modellgeneration snart** (f.eks. gpt-6) | Gammel modell blir obsolete | Vent med 1-year reservation til etter modellrelease | | **Kapasitet ikke verifisert** | Kjøp reservation, men ingen deployment capacity | Deploy først, verifiser capacity, kjøp deretter | | **Multi-region strategy usikkert** | Reservation i feil region | Evaluer latency/compliance-krav før region lock-in | | **Budget uncertainty** | Binding på kostnad uten sikker finansiering | Sikre budsjettgodkjenning før purchase | --- ### Diskusjonsspørsmål til kunde 1. **Traffic pattern:** "Har dere historiske data på API-kall per time/dag/uke?" → Benytt til sizing via capacity calculator 2. **Vekstforventning:** "Forventer dere 2x, 5x, 10x økning i trafikk neste 12 måneder?" → Påvirker om 1-year reservation er trygt 3. **Budget cycle:** "Er AI-budsjettet årlig eller kan det justeres innen året?" → Aligner reservation term med budsjettcyklus 4. **Data residency:** "Har dere krav om at data ikke forlater Norge/EU?" → Regional Provisioned + Norway East/West Europe 5. **Compliance requirements:** "Er dette et Klassifisert/Beskyttet system?" → Vurder disconnected containers (commitment tier) --- ### Arkitekturbeslutning: Reservation Sizing Worksheet **Bruk dette i ADR-prosessen:** ``` 1. Baseline Capacity (stabil trafikk): - Avg PTUs/hour: ___________ - Peak PTUs/hour: ___________ - Recommendation: Reserve at ___% of peak (typisk 80%) 2. Growth Buffer: - Expected growth (6 months): ___________% - Recommendation: Add ___% buffer 3. Reservation Size: - Base: ___________ - Growth buffer: ___________ - TOTAL PTUs: ___________ 4. Financial Commitment: - Hourly cost (no reservation): ___________ - 1-month reservation cost: ___________ - 1-year reservation cost: ___________ - Break-even period: ___________ (typisk 2-3 måneder) 5. Risk Assessment: [ ] Capacity verified in target region [ ] Budget approved for term length [ ] Traffic pattern stable (>1 month data) [ ] Compliance requirements met [ ] Scope configured (subscription/RG/MG) ``` --- ### Integrasjon med ADR-prosess **Når dokumentere reservation decisions:** 1. **Context:** Hvorfor vurderes reservation? (Cost optimization, stable workload, budget predictability) 2. **Decision:** Hvilken reservation type/term? (1-month vs. 1-year, Regional vs. Global, scope) 3. **Alternatives considered:** - Hourly (no reservation) - Commitment tier (hvis Cognitive Services) - Different scope/term lengths 4. **Consequences:** - **Positive:** Cost savings (X% reduction), budget predictability - **Negative:** Reduced flexibility, risk of underutilization if traffic drops - **Neutral:** Administrative overhead for monitoring utilization **Bruk `/architect:adr` command** for å generere ADR basert på denne vurderingen. --- ## Kilder og verifisering **MCP Calls:** 3 **Unique Sources:** 9 | Kilde | Type | Last Verified | |-------|------|---------------| | [Save costs with Microsoft Foundry Provisioned Throughput Reservations](https://learn.microsoft.com/en-us/azure/cost-management-billing/reservations/azure-openai) | Offisiell docs | 2026-01 | | [Understanding costs associated with provisioned throughput units (PTU)](https://learn.microsoft.com/en-us/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding) | Offisiell docs | 2026-01 | | [Azure OpenAI provisioned Managed offering updates](https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/provisioned-migration) | Offisiell docs | 2025-08 | | [Purchase commitment tier pricing](https://learn.microsoft.com/en-us/azure/ai-services/commitment-tier) | Offisiell docs | 2026-01 | | [What is provisioned throughput?](https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/provisioned-throughput) | Offisiell docs | 2026-01 | | [Azure OpenAI Provisioned Managed Offering in Azure Government](https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/gov-provisioned) | Offisiell docs | 2025-05 | | [View Azure reservation utilization](https://learn.microsoft.com/en-us/azure/cost-management-billing/reservations/reservation-utilization) | Cost Management | 2025-12 | | [How reservation discounts are applied](https://learn.microsoft.com/en-us/azure/cost-management-billing/reservations/reservation-discount-application) | Cost Management | 2025-12 | | [Azure Pricing Calculator](https://azure.microsoft.com/pricing/calculator/) | Pricing tool | Live | **Confidence markers:** - ✅ **HIGH** — Direkte fra offisiell Microsoft Learn dokumentasjon (januar 2026) - ⚠️ **MEDIUM** — Estimerte priser (verifiser via Pricing Calculator for nøyaktig region/dato) - 💡 **BEST PRACTICE** — Basert på kombinasjon av docs + FinOps Framework principles --- **For Cosmo:** Denne kunnskapen er kritisk for **cost optimization discussions** med kunder. Viktigste takeaways: 1. **Deploy først, kjøp reservasjon etterpå** — aldri motsatt vei 2. **Scope matters** — Shared scope gir maksimal fleksibilitet for enterprise-kunder 3. **Reservations ≠ Commitments** — Azure OpenAI bruker reservations, Cognitive Services bruker commitment tier 4. **Underutilization = tapt kostnad** — Excess reserved PTUs går tapt (ingen rollover) 5. **Offentlig sektor** — 1-year reservations aligner med statsbudsjettet (januar-start) Bruk **capacity calculator** aktivt i kundedialog for å unngå over-/under-sizing.