ktg-plugin-marketplace/plugins/ms-ai-architect/skills/ms-ai-security/references/cost-optimization/reserved-capacity-planning.md
Kjell Tore Guttormsen ad8a411f38 docs(architect): weekly KB update — 66 files refreshed (2026-04)
Updated 66 stale knowledge base reference files (10 critical, 56 high)
across all 5 skills using Microsoft Learn MCP research.

Key factual updates:
- Groundedness Detection API: `correction` → `mitigating` param,
  `correctedText` → `correctionText` (breaking change)
- Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini);
  Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx)
- Agentic Retrieval: still public preview; 50M free tokens/month
- Azure security baselines: "Cognitive Services" → "Foundry Tools"
- Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines
- MLflow 3 GenAI: new Feedback/Expectation data model
- Token tracking doc: "Azure OpenAI in Foundry Models through a gateway"
- Agent Registry: Risks column (M365 E7), Graph API (preview)
- Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles
- ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot
- Zero Trust: CAE now via Conditional Access, Strict Location Enforcement
- Purview: new Fabric Copilots/agents governance section
- AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python)

All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added.
Build registry: 1341 URLs from 387 files (+2 new URLs).

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-09 22:41:26 +02:00

27 KiB

Reserved Capacity and Commitment Discounts

Last updated: 2026-04 Status: GA Category: Cost Optimization & FinOps for AI


Introduksjon

Reserved capacity og commitment tier pricing er Azures to primære mekanismer for kostnadsoptimalisering av AI-tjenester gjennom term-baserte rabatter. Disse mekanismene lar organisasjoner oppnå betydelige kostnadsbesparelser (opptil 40-60% for reservasjoner) i bytte mot å binde seg til en bestemt kapasitet over tid.

Nøkkelforskjeller:

Aspekt Azure Reservations (PTU) Commitment Tier Pricing
Gjelder for Azure OpenAI Provisioned Throughput (PTU) Cognitive Services (Speech, Language, Vision, Document Intelligence)
Bindingstid 1 måned eller 1 år 1 måned (web/connected) eller 1 år (disconnected containers)
Scope flexibility Høy (subscription, resource group, management group, billing account) Lav (kun Azure OpenAI resource)
Kjøpsmekanisme Azure Reservations portal Resource-level i Azure portal
Deployment types Regional, Data Zone, Global Provisioned Web API, Connected containers, Disconnected containers
Overage håndtering Hourly rate for excess PTUs Overage rate per commitment tier

💡 Confidence: HIGH — Basert på offisiell Microsoft dokumentasjon oppdatert april 2026. Verified (MCP 2026-04).


Kjernekomponenter / Nøkkelegenskaper

Azure Reservations for Provisioned Throughput Units (PTU)

Provisioned Throughput Units (PTU) er generiske enheter av modellprosesseringskapasitet som måler throughput for Azure OpenAI og Foundry Models (DeepSeek, Llama, etc.).

Deployment Types og Reservations

Deployment Type Quota Name Minimum PTUs Scale Increment Use Case
Regional Provisioned Regional Provisioned Throughput Unit 50 (25 for mini/nano) 50 (25 for mini/nano) Data residency-krav, compliance
Data Zone Provisioned Data Zone Provisioned Throughput Unit 15 5 Balanse mellom fleksibilitet og data residency
Global Provisioned Global Provisioned Throughput Unit 15 5 Global load balancing, høyest tilgjengelighet

Viktig: Reservations for Regional, Data Zone og Global er ikke utskiftbare — du må kjøpe separate reservasjoner for hver deployment type.

Reservation Scopes

Scope Beskrivelse Bruksområde
Single resource group Gjelder kun ressurser i én resource group Isolerte prosjekter, dev/test miljøer
Single subscription Gjelder alle ressurser i én subscription Avdelingsbasert struktur
Management group Gjelder subscriptions i en management group Organisasjonsbrede AI-satsninger
Shared (billing account) Gjelder alle subscriptions i billing account Enterprise Agreement, maksimal fleksibilitet

Best practice: Start med shared scope for maksimal fleksibilitet. Scope kan endres uten straff.

Reservation Discount Application

Rabattene anvendes time-for-time basert på deployed PTUs:

Deployed PTUs ≤ Reserved PTUs → Full reservation discount
Deployed PTUs > Reserved PTUs → Excess charged at hourly rate

Eksempel — Underutnyttelse:

  • Reservation: 300 PTUs
  • Deployed: 200 PTUs
  • Resultat: 200 PTUs dekket av reservasjon, 100 PTUs ubrukt (går tapt, ingen rollover)

Eksempel — Overforbruk:

  • Reservation: 200 PTUs
  • Deployed: 250 PTUs
  • Resultat: 200 PTUs dekket av reservasjon, 50 PTUs faktureres hourly rate

Eksempel — Partial-hour deployments:

  • 100 PTU deployment i 15 minutter av timen = 25 PTU (1/4 av time)

Shared PTU Reservations på tvers av Foundry Models

Fra mai 2025 støtter PTU-reservasjoner automatisk cross-model sharing:

  • Én reservasjon kan dekke Azure OpenAI og Foundry Models (DeepSeek, Llama, etc.)
  • Reservasjonen anvendes først til Azure OpenAI, deretter Foundry Models
  • Excess utover reservasjon faktureres per modellens hourly rate

Eksempel:

  1. Reservation: 500 PTUs
  2. Azure OpenAI deployment: 300 PTUs → dekket av reservasjon
  3. DeepSeek-R1 deployment: 200 PTUs → dekket av reservasjon (totalt 500)
  4. Ekstra DeepSeek: 100 PTUs → faktureres DeepSeek hourly rate

Commitment Tier Pricing (Cognitive Services)

Commitment tier pricing gjelder for single-service resources (ikke multi-service eller Foundry multi-service):

Støttede tjenester

Tjeneste Commitment Type Bruksområde
Speech to Text (Standard) Web, Connected, Disconnected Transkripsjon, voice analytics
Text to Speech (Neural) Web, Connected, Disconnected Voice assistants, accessibility
Text Translation (Standard) Web, Connected Flerspråklig innhold
Language Understanding (LUIS) Web Intent detection, chatbots
Azure Language (Sentiment, Key Phrase, NER, Language Detection) Web Text analytics
Vision OCR Web, Connected Dokumentprosessering
Document Intelligence (Custom/Invoice) Web Faktura-/skjemabehandling

Commitment Types

Type Beskrivelse Bindingstid Faktureringscyklus
Web Cloud-basert API-tilgang 1 måned Månedlig (første måned pro-rated)
Connected container On-premises med Azure-tilkobling for metering 1 måned Månedlig (første måned pro-rated)
Disconnected container Fullstendig offline, ingen Azure-tilkobling 1 år Årlig (fullt beløp ved kjøp)

Viktig: Commitment tier kan ikke refunderes etter kjøp. Test kapasitetsbehov før binding.

Overage Pricing

  • Forbruk utover commitment quota faktureres til overage rate (spesifisert per tier)
  • Overage rates er høyere enn commitment rate, men lavere enn standard pay-as-you-go
  • Ekstra quota for disconnected containers: Kjøp via slider i Azure portal (pro-rated)

Arkitekturmønstre

Mønster 1: Hybrid Hourly + Reservation (Azure OpenAI PTU)

Scenario: Produksjon med varierende trafikk + ad-hoc eksperimentering.

┌─────────────────────────────────────────────────┐
│  Production Workload (stabil trafikk)           │
│  ├─ Base capacity: 200 PTUs                     │
│  └─ Payment: 1-year Regional Reservation        │
│      → 40-60% discount                           │
└─────────────────────────────────────────────────┘
              │
              ▼
┌─────────────────────────────────────────────────┐
│  Burst/Experimentation (varierende trafikk)     │
│  ├─ Additional capacity: 0-100 PTUs             │
│  └─ Payment: Hourly (no reservation)            │
│      → Full flexibility, no commitment           │
└─────────────────────────────────────────────────┘

Fordeler:

  • Kostnadskontroll på base load
  • Fleksibilitet for nye modeller/tester
  • Ingen risiko for over-provisioning av reservasjon

Offentlig sektor: Egnet for virksomheter med stabile kjernebehov + innovasjonsprosjekter.


Mønster 2: Multi-Scope Reservation Strategy

Scenario: Enterprise med mange subscriptions og AI-prosjekter.

┌─────────────────────────────────────────────────┐
│  Shared Scope Reservation (Billing Account)     │
│  ├─ Covers: All subscriptions                   │
│  ├─ PTUs: 1000 (mix of Regional + Global)       │
│  └─ Auto-applies to any matching deployment      │
└─────────────────────────────────────────────────┘
              │
    ┌─────────┴─────────┬─────────┐
    ▼                   ▼         ▼
┌─────────┐      ┌─────────┐   ┌─────────┐
│ Sub A   │      │ Sub B   │   │ Sub C   │
│ 300 PTU │      │ 400 PTU │   │ 300 PTU │
└─────────┘      └─────────┘   └─────────┘

Fordeler:

  • Maksimal fleksibilitet ved restrukturering
  • Ingen administrative overhead ved subscription-endringer
  • Naturlig load balancing mellom prosjekter

Offentlig sektor: Egnet for statlige virksomheter med kompleks organisasjonsstruktur.


Mønster 3: Commitment Tier for Edge Scenarios

Scenario: On-premises Speech/Language-tjenester i nettverk med begrenset tilgang.

┌─────────────────────────────────────────────────┐
│  Azure Portal: Commitment Tier Purchase          │
│  ├─ Service: Speech to Text (Neural)            │
│  ├─ Type: Disconnected Container                │
│  ├─ Term: 1 year                                │
│  └─ Quota: 1M transactions/year                 │
└─────────────────────────────────────────────────┘
              │
              ▼
┌─────────────────────────────────────────────────┐
│  On-Premises Deployment                         │
│  ├─ Docker container (no internet)              │
│  ├─ Usage tracking via volume mount             │
│  └─ Annual usage report submitted to Azure      │
└─────────────────────────────────────────────────┘

Fordeler:

  • Data forlater ikke lokalt nettverk
  • Forutsigbar årlig kostnad
  • Ingen runtime-avhengigheter til Azure

Offentlig sektor: Kritisk for Klassifisert/Beskyttet data (politi, forsvar, PST).


Mønster 4: Migration from Commitment to Reservation (Legacy Azure OpenAI)

Scenario: Kunder med gamle commitments (før august 2024) migrerer til ny modell.

┌─────────────────────────────────────────────────┐
│  OLD: Resource-bound Commitment (legacy)         │
│  ├─ Binding: Tied to specific Azure OpenAI res. │
│  ├─ Models: Limited (gpt-4o, gpt-4o-mini only)  │
│  └─ New enrollments: STOPPED Aug 1, 2024        │
└─────────────────────────────────────────────────┘
              │
              ▼ Migration Path
┌─────────────────────────────────────────────────┐
│  NEW: Hourly + Azure Reservation                │
│  ├─ Binding: Flexible scope (sub/RG/MG)         │
│  ├─ Models: All models (incl. gpt-5, o-series)  │
│  └─ Overage: Can be covered by reservation      │
└─────────────────────────────────────────────────┘

Migrasjonstips:

  1. Ikke kanseller gamle commitments før modell-retirement (fortsatt gyldig)
  2. Opprett nye deployments på hourly først
  3. Kjøp reservation for nye deployments
  4. Overage fra gamle commitments kan dekkes av nye reservasjoner

Beslutningsveiledning

Beslutningstre: Reservation vs. Commitment vs. Hourly

Er tjenesten Azure OpenAI/Foundry Models?
│
├─ JA → Bruk Azure Reservations (PTU)
│   │
│   ├─ Stabil trafikk i >3 måneder? → 1-year reservation
│   ├─ Stabil trafikk i >1 måned? → 1-month reservation
│   └─ Ad-hoc/testing? → Hourly (no reservation)
│
└─ NEI → Er det Cognitive Services (Speech/Language/Vision)?
    │
    ├─ JA → Bruk Commitment Tier
    │   │
    │   ├─ On-premises uten internett? → Disconnected container (1 år)
    │   ├─ On-premises med internett? → Connected container (1 måned)
    │   └─ Cloud-based? → Web commitment (1 måned)
    │
    └─ NEI → Sjekk tjeneste-spesifikke reservasjonsmodeller

Når IKKE bruke reservations/commitments

Scenario Hvorfor unngå Alternativ
Proof of Concept (< 1 måned) Usikker kapasitet, risiko for over-purchase Hourly PTU, pay-as-you-go
Eksperimentering med nye modeller Ikke sikker på modellvalg/throughput-behov Hourly PTU, test først
Sporadisk bruk (< 50% av måneden) Underutnyttelse → tapt investering Hourly PTU, pay-as-you-go
Kapasitet ikke verifisert Risiko: Kjøper reservasjon, men ingen capacity Deploy først, kjøp reservasjon etterpå
Serverless workloads (Azure SQL Serverless, Cosmos DB Serverless) Reservasjoner støttes IKKE for serverless SKUs Pay-as-you-go kun

💡 Best Practice: ALLTID deploy først, kjøp reservasjon etterpå. Quota ≠ capacity.

Autorenew er nå ON som standard for alle nye reservasjoner (gjelder reservasjoner opprettet etter 2025-Q4). Sjekk innstillingen ved kjøp og deaktiver manuelt hvis ønskelig. Verified (MCP 2026-04).


Sizing og kapasitetsplanlegging

PTU Capacity Calculator (innebygd i Azure AI Foundry)

Tilgjengelig i deployment workflow:

Input:

  • Input TPM (Tokens Per Minute)
  • Output TPM
  • Peak calls per minute
  • Tokens per prompt
  • Tokens per response

Output:

  • Recommended PTUs (avrundet til scale increment)
  • Raw PTUs (eksakt estimat)

Eksempel (gpt-5):

  • Input TPM: 100K
  • Output TPM: 25K (output tokens teller 8x input, jf. pricing ratio)
  • Resultat: ~150 PTUs regional (avrundet til 150, min 50)

💡 Tip: For workloads med stor variance i call shapes, benchmark på faktisk trafikk i 1-2 uker før sizing.


Integrasjon med Microsoft-stakken

Cost Management + Billing

Feature Bruksområde Link
Reservation utilization Monitorere utnyttelsesgrad (target: >80%) Azure Monitor, Reservations blade
Amortized cost view Fordele reservasjonskostnad over term Cost Management → Amortized view
Chargeback Allokere kostnad til avdelinger/prosjekter Cost Management → Cost allocation rules
Budget alerts Varsle ved overage (hourly charges) Cost Management → Budgets

FinOps Recommendations

Metric Target Action if below target
Reservation utilization ≥ 80% Reduser deployment size eller exchange reservation
Hourly overage % < 10% av total Øk reservation size eller optimaliser traffic
Amortized cost/PTU Benchmark per region Vurder migration til billigere region/deployment type

Offentlig sektor: Integrer med Difi/Digdir FinOps frameworks for statsbudsjettrapportering.


Multi-Cloud & Hybrid Scenarios

Scenario Azure Mekanisme Integrasjon
Hybrid (on-prem + cloud) Connected container commitment ExpressRoute/VPN for metering
Air-gapped (FSA/PST) Disconnected container commitment Annual usage report via secure channel
Multi-cloud (AWS/GCP + Azure) Ingen direct integration Separat capacity planning per cloud

Offentlig sektor (Norge)

Compliance og juridiske krav

Krav Reservation Impact Commitment Impact
Schrems II (EU data residency) Regional Provisioned PTU → garanterer region Commitment tier + regional resources
Personvernforordningen (GDPR) Data Zone Provisioned → EU Data Boundary Connected containers on-prem
Sikkerhetsloven (FSA/PST) ⚠️ Vurder Global Provisioned (data kan forlate EU) Disconnected containers (full kontroll)
Offentleglova (transparency) Reservation costs transparent i Cost Management Fixed monthly/yearly budget

Budsjettmessige hensyn

Budsjettmodell Anbefaling Begrunnelse
Årlig (statlige virksomheter) 1-year reservation Forutsigbar kostnad, aligner med budsjettår
Måned-til-måned (kommuner) 1-month reservation eller commitment tier Fleksibilitet for kommunale budsjettjusteringer
Prosjektbasert (IT-prosjekter) Hourly PTU Ingen binding utover prosjektperiode

💡 Tip: For statlige virksomheter med vedtatt årlig AI-budsjett → kjøp 1-year reservation ved budsjettstart (januar) for maksimal rabatt.


Innkjøpsprosess og anskaffelse

Fase Handling Ansvarlig rolle
1. Behovsanalyse Estimer TPM/PTU-behov via capacity calculator AI Architect / DevOps
2. Kapasitetsverifisering Deploy test deployment i target region DevOps / Cloud Engineer
3. Budsjettgodkjenning Innhent godkjenning for term commitment Økonomi / IT-leder
4. Reservasjonskjøp Kjøp via Azure Reservations portal IT-admin (EA Admin for Enterprise)
5. Monitorering Sett opp Cost Management alerts FinOps / Cloud Governance

Rolebasert tilgangskontroll (RBAC):

  • Reservation Purchaser role → Kjøpe reservasjoner
  • Owner på subscription → Administrere reservations scope
  • Billing Account Admin (EA) → Enable "Reserved Instances" policy

Kostnad og lisensiering

Prisingeksempler (estimert, verifiser via Azure Pricing Calculator)

Merk: Priser varierer per region og oppdateres hyppig. Bruk Azure Pricing Calculator for nøyaktig estimat.

Azure OpenAI Provisioned Throughput (Regional, Norway East)

PTUs Hourly Rate 1-month Reservation 1-year Reservation Savings (1-year)
100 ~$300/time ~$220/time (~27% off) ~$150/time (~50% off) ~$108K/år
300 ~$900/time ~$660/time (~27% off) ~$450/time (~50% off) ~$324K/år
1000 ~$3000/time ~$2200/time (~27% off) ~$1500/time (~50% off) ~$1.08M/år

💡 Confidence: MEDIUM — Eksakte priser per januar 2026 ikke offentlig tilgjengelig for alle regioner.

Commitment Tier Pricing (Speech to Text, Web)

Tier Transactions/month Monthly Cost Pay-as-you-go Equivalent Savings
C1 100K ~$500 ~$750 ~33%
C2 500K ~$2000 ~$3500 ~43%
C3 2M ~$7000 ~$13000 ~46%

Lisensieringskrav

Tjeneste Lisensiering Reservations/Commitments
Azure OpenAI None (consumption-based) Reservations apply automatically based on scope
Cognitive Services None (consumption-based) Commitment tier purchased per resource
M365 Copilot M365 E3/E5 + Copilot license N/A (capacity inkludert i lisens)

Viktig: M365 Copilot har ikke PTU-modell eller reservasjoner — kapasitet inkludert i per-user licensing.


Total Cost of Ownership (TCO) Calculation

Scenario: 300 PTU Regional Provisioned, 1 år drift

Cost Component Hourly (No Reservation) 1-year Reservation Delta
Compute (300 PTU) ~$7.9M/år ~$3.9M/år -$4M
Storage (1TB hot) ~$0.2K/år ~$0.2K/år $0
Networking (1TB egress) ~$87/år ~$87/år $0
Support (Standard) ~$100K/år ~$100K/år $0
TOTAL ~$8.0M/år ~$4.0M/år -$4M/år (-50%)

💡 Tip: Bruk Azure TCO Calculator for komplekse multi-service scenarios.


For arkitekten (Cosmo)

Når anbefale reservations/commitments

Signal fra kunde Anbefaling Rationale
"Vi har stabil trafikk i produksjon" 1-year reservation ROI oppnås etter ~2 måneder
"Vi er i pilot-fase, men planlegger produksjon om 3 mnd" Hourly → 1-month reservation ved prod-start Unngå early commitment før traffic patterns er kjent
"Vi trenger Speech-tjenester on-prem" Commitment tier (Connected/Disconnected) Eneste alternativ for on-prem deployment
"Vi har mange subscriptions og prosjekter" Shared scope reservation Administrativ forenkling
"Vi har strenge data residency-krav" Regional Provisioned + 1-year reservation Compliance + cost optimization

Røde flagg (når advare mot commitments)

Scenario Risk Mitigation
Ukjent traffic pattern Over-provisioning → tapt investering Start med hourly, monitorer 1-2 måneder
Ny modellgeneration snart (f.eks. gpt-6) Gammel modell blir obsolete Vent med 1-year reservation til etter modellrelease
Kapasitet ikke verifisert Kjøp reservation, men ingen deployment capacity Deploy først, verifiser capacity, kjøp deretter
Multi-region strategy usikkert Reservation i feil region Evaluer latency/compliance-krav før region lock-in
Budget uncertainty Binding på kostnad uten sikker finansiering Sikre budsjettgodkjenning før purchase

Diskusjonsspørsmål til kunde

  1. Traffic pattern: "Har dere historiske data på API-kall per time/dag/uke?" → Benytt til sizing via capacity calculator

  2. Vekstforventning: "Forventer dere 2x, 5x, 10x økning i trafikk neste 12 måneder?" → Påvirker om 1-year reservation er trygt

  3. Budget cycle: "Er AI-budsjettet årlig eller kan det justeres innen året?" → Aligner reservation term med budsjettcyklus

  4. Data residency: "Har dere krav om at data ikke forlater Norge/EU?" → Regional Provisioned + Norway East/West Europe

  5. Compliance requirements: "Er dette et Klassifisert/Beskyttet system?" → Vurder disconnected containers (commitment tier)


Arkitekturbeslutning: Reservation Sizing Worksheet

Bruk dette i ADR-prosessen:

1. Baseline Capacity (stabil trafikk):
   - Avg PTUs/hour: ___________
   - Peak PTUs/hour: ___________
   - Recommendation: Reserve at ___% of peak (typisk 80%)

2. Growth Buffer:
   - Expected growth (6 months): ___________%
   - Recommendation: Add ___% buffer

3. Reservation Size:
   - Base: ___________
   - Growth buffer: ___________
   - TOTAL PTUs: ___________

4. Financial Commitment:
   - Hourly cost (no reservation): ___________
   - 1-month reservation cost: ___________
   - 1-year reservation cost: ___________
   - Break-even period: ___________ (typisk 2-3 måneder)

5. Risk Assessment:
   [ ] Capacity verified in target region
   [ ] Budget approved for term length
   [ ] Traffic pattern stable (>1 month data)
   [ ] Compliance requirements met
   [ ] Scope configured (subscription/RG/MG)

Integrasjon med ADR-prosess

Når dokumentere reservation decisions:

  1. Context: Hvorfor vurderes reservation? (Cost optimization, stable workload, budget predictability)
  2. Decision: Hvilken reservation type/term? (1-month vs. 1-year, Regional vs. Global, scope)
  3. Alternatives considered:
    • Hourly (no reservation)
    • Commitment tier (hvis Cognitive Services)
    • Different scope/term lengths
  4. Consequences:
    • Positive: Cost savings (X% reduction), budget predictability
    • Negative: Reduced flexibility, risk of underutilization if traffic drops
    • Neutral: Administrative overhead for monitoring utilization

Bruk /architect:adr command for å generere ADR basert på denne vurderingen.


Kilder og verifisering

MCP Calls: 3 Unique Sources: 9

Kilde Type Last Verified
Save costs with Microsoft Foundry Provisioned Throughput Reservations Offisiell docs 2026-01
Understanding costs associated with provisioned throughput units (PTU) Offisiell docs 2026-01
Azure OpenAI provisioned Managed offering updates Offisiell docs 2025-08
Purchase commitment tier pricing Offisiell docs 2026-01
What is provisioned throughput? Offisiell docs 2026-01
Azure OpenAI Provisioned Managed Offering in Azure Government Offisiell docs 2025-05
View Azure reservation utilization Cost Management 2025-12
How reservation discounts are applied Cost Management 2025-12
Azure Pricing Calculator Pricing tool Live

Confidence markers:

  • HIGH — Direkte fra offisiell Microsoft Learn dokumentasjon (januar 2026)
  • ⚠️ MEDIUM — Estimerte priser (verifiser via Pricing Calculator for nøyaktig region/dato)
  • 💡 BEST PRACTICE — Basert på kombinasjon av docs + FinOps Framework principles

For Cosmo:

Denne kunnskapen er kritisk for cost optimization discussions med kunder. Viktigste takeaways:

  1. Deploy først, kjøp reservasjon etterpå — aldri motsatt vei
  2. Scope matters — Shared scope gir maksimal fleksibilitet for enterprise-kunder
  3. Reservations ≠ Commitments — Azure OpenAI bruker reservations, Cognitive Services bruker commitment tier
  4. Underutilization = tapt kostnad — Excess reserved PTUs går tapt (ingen rollover)
  5. Offentlig sektor — 1-year reservations aligner med statsbudsjettet (januar-start)

Bruk capacity calculator aktivt i kundedialog for å unngå over-/under-sizing.