# GPT-5 og GPT-4.1: Prismodeller og kostnadsoptimalisering

**Last updated:** 2026-04
**Status:** GA (GPT-4.1-serien), GA (GPT-5-serien, begrenset tilgang for gpt-5 og gpt-5-codex)
**Category:** Cost Optimization & FinOps for AI

---

## Introduksjon

GPT-5- og GPT-4.1-seriene er de to nyeste flaggskipmodellene fra OpenAI tilgjengelig i Azure AI Foundry. De representerer to distinkte designfilosofier: GPT-5 optimalisert for dyp resonnering og komplekse oppgaver, GPT-4.1 optimalisert for hastighet, gjennomstrømming og kostnadseffektivitet.

**Confidence:** Høy (basert på offisiell Microsoft-dokumentasjon, februar 2026)

Denne referansen dekker:
- Bekreftet og estimert prising per 1M tokens (USD og NOK)
- Deployment-typer og deres kostnadsimplikasjon
- Sammenligningstabeller (GPT-4o vs. GPT-4.1 vs. GPT-5)
- Copilot Credits-klassifisering per modell
- Optimaliserings­strategier og beslutningsveiledning

**Viktig merknad om priser:** Azure prisside (azure.microsoft.com/pricing) benytter JavaScript-rendering og returnerer tomme verdier ved programmatisk henting. Bekreftede priser er hentet fra Microsoft Learn-dokumentasjon og Content Understanding-eksempler. GPT-5-priser er ikke offentlig tilgjengelig som faste tall per februar 2026 — estimater er basert på offentliggjorte ratioer og prishistorikk.

---

## Kjernekomponenter

### 1. GPT-4.1-serien — Bekreftet prising

**Kilde:** Azure Content Understanding-dokumentasjon, Azure AI Foundry provisioned throughput-dokumentasjon (bekreftet 1:4 input/output-ratio)

| Modell | Input (per 1M tokens) | Output (per 1M tokens) | Cached Input | Kontekst |
|--------|-----------------------|------------------------|--------------|----------|
| `gpt-4.1` (Global) | **$2.00** | **$8.00** | ~$0.50 | 1M tokens (128K ved provisioned) |
| `gpt-4.1-mini` (Global) | **$0.40** | **$1.60** | ~$0.10 | 1M tokens (128K ved provisioned) |
| `gpt-4.1-nano` (Global) | **$0.10** | **$0.40** | ~$0.025 | 1M tokens (128K ved provisioned) |

**Confidence:** Høy for gpt-4.1 og gpt-4.1-mini (bekreftet via Content Understanding priseksempler og PTU-dokumentasjon). Moderat for gpt-4.1-nano (interpolert fra dokumenterte ratioer — 1:4 input/output).

**Nøkkelfakta:**
- 1 output token = 4 input tokens i PTU-utnyttelse (matchers prisratio)
- Kontekstvindu: 1 047 576 tokens (full), 128 000 tokens (standard og provisioned deployments), 300 000 tokens (batch deployments)
- Treningsdata: til og med mai 2024
- Versjon: `2025-04-14`
- Batch API: 50% rabatt på Global Standard-priser

**Tilgjengelige deployment-typer for GPT-4.1-serien:**
- Global Standard, Data Zone Standard, Regional (Standard og Provisioned)
- Priority Processing: tilgjengelig for gpt-4.1 (ikke mini/nano)

---

### 2. GPT-5-serien — Estimert prising

**Merk:** GPT-5-priser er ikke publisert som faste tall per februar 2026 (Azure prisside viser `$-`). Estimatene nedenfor er basert på:
1. Dokumentert PTU-ratio: 1 output token = 8 input tokens (kilde: offisiell PTU-dokumentasjon)
2. Offentlig OpenAI API-prising (openai.com/api/pricing) ved lansering august 2025
3. Prishistorikk og modellfamilieposisjonering

| Modell | Input (per 1M tokens) | Output (per 1M tokens) | Confidence | Merknader |
|--------|-----------------------|------------------------|------------|-----------|
| `gpt-5` (Global) | ~$10–15 | ~$40–60 | Lav–Moderat | 1:8 output/input-ratio bekreftet. Absolutt pris ikke publisert i Azure |
| `gpt-5-mini` (Global) | ~$1.50–3 | ~$6–12 | Lav–Moderat | Estimert. ~5–10x billigere enn gpt-5 basert på modellfamiliemønster |
| `gpt-5-nano` (Global) | ~$0.10–0.30 | ~$0.40–1.20 | Lav | Tilsvarer gpt-4.1-nano-prisnivå. Estimert |
| `gpt-5-chat` (Global) | ~$1.50–3 | ~$6–12 | Lav | Preview. Tilsvarer gpt-5-mini. Standard rate i Copilot Credits |

**OBLIGATORISK:** Verifiser alltid GPT-5-priser på [offisiell Azure OpenAI prisside](https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/) eller Azure Pricing Calculator før budsjettering.

**Tilgjengelighetsbegrensning:**
- `gpt-5` og `gpt-5-codex`: Krever registrering og godkjenning (begrenset tilgang)
- `gpt-5-mini`, `gpt-5-nano`, `gpt-5-chat`: Ingen registreringskrav
- Kontekstvindu: 400 000 tokens (272K input / 128K output for resonneringsmodeller)

---

### 3. Referanse: GPT-4o (sammenligning)

**Kilde:** Allment tilgjengelig fra Azure-dokumentasjon

| Modell | Input (per 1M tokens) | Output (per 1M tokens) | Kontekst |
|--------|-----------------------|------------------------|----------|
| `gpt-4o` (Global) | ~$2.50 | ~$10.00 | 128K |
| `gpt-4o-mini` (Global) | ~$0.15 | ~$0.60 | 128K |

**Confidence:** Høy (bredt dokumentert)

---

### 4. Deployment-typer og kostnadsimplikasjon

| Deployment-type | Prismodell | Datalagring | Best for | Prediktabilitet |
|-----------------|------------|-------------|----------|-----------------|
| **Global Standard** | Pay-per-token | Ingen garanti (trafikk rutes globalt) | Høyt volum, lavest pris, ikke-sensitive data | Lav (avhenger av bruk) |
| **Data Zone Standard** | Pay-per-token (~5–10% høyere enn Global) | EU- eller US-region garantert | Norske virksomheter med GDPR-krav, ikke-sensitiv produksjon | Lav (avhenger av bruk) |
| **Regional Standard** | Pay-per-token (~10–20% høyere enn Global) | Spesifikk region (f.eks. Norway East) | Personopplysninger, kritisk compliance | Lav (avhenger av bruk) |
| **Provisioned Throughput (PTU)** | Fast timepris per PTU | Velges ved deployment | Forutsigbart høyvolum, latens-SLA | Høy (fast kostnad uavhengig av bruk) |
| **Batch API** | 50% rabatt på Global Standard | Global | Ikke-sanntidsoppgaver (24t behandlingstid) | Moderat (avhenger av bruk) |

**PTU-gjennomstrømming per modell (bekreftet, offisiell dokumentasjon):**

| Modell | Input TPM per PTU | Latens-SLA (p50) | Min PTU (Global) | Min PTU (Regional) |
|--------|-------------------|------------------|-----------------|-------------------|
| `gpt-5` | 4 750 | 99% > 50 TPS | 15 | 50 |
| `gpt-5-mini` | 23 750 | 99% > 80 TPS | 15 | 25 |
| `gpt-4.1` | 3 000 | 99% > 80 TPS | 15 | 50 |
| `gpt-4.1-mini` | 14 900 | 99% > 90 TPS | 15 | 25 |
| `gpt-4.1-nano` | 59 400 | 99% > 100 TPS | 15 | 25 |
| `o4-mini` | 5 400 | 99% > 90 TPS | 15 | 25 |

**Confidence:** Høy (direkte fra offisiell PTU-dokumentasjon)

---

### 5. Sammenligningstabeller

#### 5a. Pris- og kapabilitetssammenligning

| Modell | Input (per 1M) | Output (per 1M) | Konfidensgrad | Kontekst | Resonneringsevne | Latens |
|--------|---------------|-----------------|---------------|----------|-----------------|--------|
| `gpt-4o-mini` | ~$0.15 | ~$0.60 | Høy | 128K | Lav | Lavest |
| `gpt-4.1-nano` | ~$0.10 | ~$0.40 | Moderat | 1M (128K PTU) | Lav | Lavest |
| `gpt-4.1-mini` | $0.40 | $1.60 | Høy | 1M (128K PTU) | Lav–Moderat | Lav |
| `gpt-4o` | ~$2.50 | ~$10.00 | Høy | 128K | Moderat | Moderat |
| `gpt-4.1` | $2.00 | $8.00 | Høy | 1M (128K PTU) | Moderat | Lav–Moderat |
| `gpt-5-nano` | ~$0.10–0.30 | ~$0.40–1.20 | Lav (estimert) | 400K | Moderat (resonnering) | Lav |
| `gpt-5-mini` | ~$1.50–3.00 | ~$6.00–12.00 | Lav (estimert) | 400K | Høy (resonnering) | Moderat |
| `gpt-5` | ~$10–15 | ~$40–60 | Lav (estimert) | 400K | Svært høy (resonnering) | Høy |

#### 5b. Relativ kostnad per 1 000 forespørsler (200 input + 100 output tokens)

| Modell | Kostnad (USD) | Kostnad (NOK, ~10.5 kurs) | Relativt vs. GPT-4.1 |
|--------|--------------|--------------------------|----------------------|
| `gpt-4.1-nano` | $0.06 | ~0.63 NOK | 95% billigere |
| `gpt-4.1-mini` | $0.24 | ~2.52 NOK | 80% billigere |
| `gpt-4.1` | $1.20 | ~12.60 NOK | Referanse |
| `gpt-5-mini` (estimert midtpunkt) | ~$0.90–1.80 | ~9–19 NOK | ~50% dyrere (estimert) |
| `gpt-5` (estimert midtpunkt) | ~$6–9 | ~63–95 NOK | ~7x dyrere (estimert) |

**Confidence:** Høy for gpt-4.1-serien. Lav for gpt-5-serien (estimerte priser).

---

### 6. NOK-kostnadsestimater

**Valutakurs brukt:** 1 USD = 10.5 NOK (veiledende, verifiser aktuell kurs)

#### Månedlig kostnadsestimat for typiske workloads

**Scenario A: Kundestøtte chatbot (100 000 forespørsler/mnd, 150 input + 100 output tokens)**

| Modell | USD/mnd | NOK/mnd | Anbefaling |
|--------|---------|---------|------------|
| `gpt-4.1-nano` | ~$5.50 | ~58 NOK | Enkel FAQ, høyt volum |
| `gpt-4.1-mini` | ~$22 | ~231 NOK | Standard chatbot |
| `gpt-4.1` | ~$110 | ~1 155 NOK | Kompleks kundesupport |
| `gpt-5-mini` (est.) | ~$70–140 | ~735–1 470 NOK | Kun om resonnering er kritisk |

**Scenario B: Dokumentanalysepipeline (10 000 dokumenter/mnd, 2 000 input + 500 output tokens)**

| Modell | USD/mnd | NOK/mnd | Anbefaling |
|--------|---------|---------|------------|
| `gpt-4.1-mini` | ~$88 | ~924 NOK | Standardanalyse |
| `gpt-4.1` | ~$440 | ~4 620 NOK | Juridisk/finansiell analyse |
| `gpt-5` (est.) | ~$2 750–4 100 | ~28 875–43 050 NOK | Kun om deep reasoning er nødvendig |

**Scenario C: Batch-prosessering (50% rabatt, 500 000 forespørsler/mnd, 200 input + 50 output tokens)**

| Modell | USD/mnd (batch) | NOK/mnd | Merknad |
|--------|----------------|---------|---------|
| `gpt-4.1-nano` | ~$7.00 | ~74 NOK | Klassifisering, tagging |
| `gpt-4.1-mini` | ~$28 | ~294 NOK | Sammendrag, analyse |
| `gpt-4.1` | ~$140 | ~1 470 NOK | Kompleks batch |

**Confidence:** Moderat (beregnet fra bekreftede GPT-4.1-priser. NOK-konvertering varierer med valutakurs).

---

### 7. Copilot Credits-klassifisering

Modeller i Copilot Studio og AI Builder (Power Platform) prises etter tre takstnivåer. Dette er direkte relevant for norske offentlige virksomheter som bruker Power Platform.

| Modell | Takst-nivå | Copilot Credits | Power Platform Credits |
|--------|-----------|----------------|----------------------|
| `gpt-4.1-mini` | **Basic** | Laveste forbruk | Laveste forbruk |
| `gpt-4.1` | **Standard** | Moderat forbruk | Moderat forbruk |
| `gpt-5-chat` (preview) | **Standard** | Moderat forbruk | Moderat forbruk |
| `gpt-5-reasoning` (preview) | **Premium** | Høyeste forbruk | Høyeste forbruk |
| `o3` | **Premium** | Høyeste forbruk | Høyeste forbruk |
| `Claude Sonnet 4.5` (experimental) | **Standard** | Moderat forbruk | Moderat forbruk |
| `Claude Opus 4.5` (experimental) | **Premium** | Høyeste forbruk | Høyeste forbruk |

*(Verified MCP 2026-04)*

**Viktige implikasjoner:**
- **GPT-4.1 mini er nå standardmodellen i Copilot Studio** (erstattet GPT-4o mini). GPT-4o og GPT-4o mini er kun tilgjengelig i US government-regioner.
- Copilot Studio inkluderer et månedlig kvantum av Copilot Credits. Å bruke gpt-5-reasoning eller o3 tapper disse vesentlig raskere enn gpt-4.1-mini.
- Standard-rate (gpt-4.1 og gpt-5-chat) er tilgjengelig uten ekstra tilleggslisens i de fleste planer.
- Premium-rate (gpt-5-reasoning, o3, Claude Opus 4.5) kan kreve pay-as-you-go-overskudd ved høyt volum.
- **Claude Sonnet 4.5 og Opus 4.5** er nå tilgjengelig i Copilot Studio (experimental, 200K kontekstvindu).
- **M365 Copilot (enterprise):** Inkluderer standardtilgang til GPT-5 (inkl. standard Copilot Chat). Priority Access krever M365 Copilot-lisens.

**Confidence:** Høy (basert på offisiell AI Builder/Copilot Studio-dokumentasjon, 2026-04)

---

### 8. GPT-5 Reasoning-nivåer og kostnad

GPT-5 introducerer fire justerbare tenkningsnivåer. Kostnad og latens skalerer med tenkningsdybde.

| Resonneringsnivå | Beskrivelse | Latens | Relativ kostnad | Bruksområde |
|-----------------|-------------|--------|-----------------|-------------|
| **Minimal** | Svært få interne resonneringstokens | Raskest | Lavest | Bulk-operasjoner, enkle transformasjoner |
| **Low** | Let resonnering, rask vurdering | Rask | Lav | Triage, korte svar, enkle redigeringer |
| **Medium (default)** | Balansert dybde vs. hastighet | Moderat | Middels | Innholdsdrafting, moderat koding, RAG Q&A |
| **High** | Dyp, flertrinns "think-through" | Tregest | Høyest | Kompleks planlegging, analyse, multi-hop reasoning |

**Viktig:** Samme resonneringsnivå-logikk gjelder for `gpt-5`, `gpt-5-mini` og `gpt-5-nano`. Absolutt kostnad og latens skalerer ned med mini og nano, men avveiningene er identiske.

**Parallelle verktøykall:** Støttes IKKE ved `Minimal` reasoning_effort. Bruk Low/Medium/High for agentbruk.

**Confidence:** Høy (direkte fra offisiell GPT-5 model choice guide, februar 2026)

---

### 9. Optimaliserings­strategier

#### Strategi 1: Modelltiering (Small → Medium → Large)

```
Trigger: Klassifiser forespørselskompleksitet FØR valg av modell

Tier 1 — Nano (enkle oppgaver):
  - Klassifisering, tagging, enkle strukturerte outputs
  - Modell: gpt-4.1-nano
  - Estimert kostnad: ~$0.10–0.40/1M tokens

Tier 2 — Mini (standard oppgaver):
  - Chatbots, drafting, RAG Q&A, oppsummering
  - Modell: gpt-4.1-mini
  - Estimert kostnad: ~$0.40–1.60/1M tokens

Tier 3 — Full (komplekse oppgaver):
  - Juridisk analyse, flertrinns planlegging, agenter
  - Modell: gpt-4.1 eller gpt-5-mini
  - Estimert kostnad: $2–8/1M tokens (gpt-4.1)
```

**Besparelsespotensial:** 60–80% vs. alltid bruke gpt-4.1

#### Strategi 2: Model Router (Azure AI Foundry)

Azure AI Foundry Model Router analyserer prompt-kompleksitet og velger automatisk den mest kostnadseffektive modellen.

- **Potensiell besparelse:** Opptil 60% vs. å alltid bruke GPT-5-familien (dokumentert av Microsoft)
- **Implementering:** Deploy Model Router i Azure AI Foundry, konfigurer underliggende modeller
- **Ingen kodeendringer:** Transparente for applikasjonen

**Confidence:** Høy (Model Router er GA-funksjonalitet, besparelsestallet er dokumentert av Microsoft)

#### Strategi 3: Batch API (50% rabatt)

For ikke-sanntidsoppgaver med 24-timers SLA:
- Nattlig rapportgenerering og sammendrag
- Innholdsmoderering
- Masseopplastings-analyse
- E-postklassifisering

**Besparelsespotensial:** Fast 50% rabatt på Global Standard-pris

#### Strategi 4: Prompt Caching (Cached Input)

Gjenbruk av identisk kontekst (system prompt, dokumenter) aktiverer cached input-prising:
- gpt-4.1: cached input ~$0.50/1M (75% rabatt vs. full input)
- Spesielt effektivt for RAG-løsninger med fast system prompt
- Krever identisk prefiks (prompt caching aktiveres automatisk for repeterende kontekst)

**Confidence:** Moderat (caching-ratio er estimert, ikke bekreftet for alle modeller per februar 2026)

#### Strategi 5: PTU ved forutsigbart høyt volum

**Bruk PTU når:**
- Volum er forutsigbart (>70% utnyttelse)
- Latens-SLA er kritisk
- Månedlig token-volum er høyt nok til at fast PTU-kostnad er lavere enn pay-per-token

**PTU break-even (illustrativt for gpt-4.1):**
```
Pay-per-token: 3 000 000 tokens/mnd × $2.00/1M = $6/mnd per ~1M monthly tokens
PTU: 1 PTU = 3 000 input TPM = ~130M tokens/mnd kapasitet
Break-even: Når pay-per-token overstiger PTU-timeprisen × 730 timer/mnd
```

Bruk [Azure AI Foundry PTU-kalkulator](https://ai.azure.com/resource/calculator) for presis beregning.

**Confidence:** Høy (PTU TPM-verdier er offisielt dokumentert. Break-even avhenger av PTU-timepris som ikke er publisert)

#### Strategi 6: Reasoning-nivå-optimalisering (GPT-5)

```python
def select_reasoning_effort(task_type: str) -> str:
    if task_type in ["classification", "summarization", "simple_qa"]:
        return "low"   # 40–60% billigere enn high
    elif task_type in ["content_drafting", "rag_qa", "moderate_coding"]:
        return "medium"  # Standard valg
    elif task_type in ["legal_analysis", "complex_planning", "multihop_reasoning"]:
        return "high"  # Maks nøyaktighet
    else:
        return "medium"  # Sikker default
```

**Besparelsespotensial:** 40–60% kostnadsreduksjon vs. alltid bruke `high` reasoning

---

## Beslutningsveiledning

### Beslutningstre: GPT-4.1 vs. GPT-5

```
START
  |
  V
Krever oppgaven dyp, flertrinns resonnering?
  ├─ JA → Er resonnering viktigere enn kostnad/latens?
  │        ├─ JA → GPT-5 (juster reasoning_effort)
  │        └─ NEI → GPT-4.1 (raskere, billigere, tilstrekkelig for de fleste)
  └─ NEI → Er oppgaven voluminøs og/eller latens-sensitiv?
            ├─ JA → GPT-4.1-mini eller GPT-4.1-nano
            └─ NEI → GPT-4.1-mini (balanse mellom kostnad og kvalitet)
```

### Scenario-basert anbefaling

| Scenario | Anbefalt modell | Kostnadsnivå (NOK/mnd, 100K forespørsler) |
|----------|-----------------|------------------------------------------|
| Enkel FAQ-bot | gpt-4.1-nano | ~58 NOK |
| Kundestøtte chatbot | gpt-4.1-mini + Model Router | ~231 NOK |
| Juridisk dokumentanalyse | gpt-4.1 eller gpt-5 (high) | ~1 155–8 000+ NOK |
| Kode-assistent | gpt-5-mini (medium reasoning) | Estimert ~700–1 500 NOK |
| Nattlig rapport (batch) | gpt-4.1-mini (batch) | ~116 NOK (50% rabatt) |
| Enterprise Copilot (Copilot Studio) | gpt-4.1 (Standard Credits) | Innenfor inkluderte Credits |
| RAG Q&A (norsk offentlig sektor) | gpt-4.1-mini + caching | ~116–231 NOK |

**Confidence:** Moderat (NOK-estimater basert på illustrative priser. GPT-5-scenarioer er estimert)

### Valg av deployment-type

```
Norsk offentlig sektor:
  Personopplysninger → Regional Standard (Norway East) + gpt-4.1-mini/gpt-4.1
  Ikke-sensitiv data → Data Zone Standard (EU) for litt lavere kostnad
  Høyvolum produksjon → PTU (ved forutsigbart volum)
  Utvikling/testing → Global Standard (lavest pris, ingen compliance-garanti)
  Batch (ikke-sanntid) → Batch API (50% rabatt på Global)
```

---

## Offentlig sektor (Norge)

### Compliance og dataplassering vs. kostnad

| Deployment-type | Garantert dataplassering | Estimert kostnadsnivå | Anbefaling |
|-----------------|--------------------------|----------------------|------------|
| Norway East Regional | Ja (Norway East) | Høyest (~10–20% over Global) | Personopplysninger (GDPR) |
| EU Data Zone | EU-region (ikke spesifikt Norway) | Moderat (~5–10% over Global) | Ikke-sensitive data, EU GDPR |
| Global Standard | Ingen garanti | Lavest | Kun ikke-sensitiv utvikling/test |

**Anbefaling for offentlig sektor:**
- All behandling av personopplysninger: **Regional Standard — Norway East**
- Ikke-sensitiv AI-bruk i produksjon: **Data Zone Standard (EU)** for moderat kostnadssparing
- Testing og utvikling: **Global Standard**
- Høyvolum stabile workloads: Vurder **PTU i Norway East** for latens-SLA + forutsigbar kostnad

### TCO-estimat for offentlig AI-prosjekt med GPT-4.1

| Kostnadselement | Estimat (50K forespørsler/mnd) | Optimalisering |
|-----------------|--------------------------------|----------------|
| gpt-4.1-mini inferens (Norway East) | ~1 300–2 600 NOK/mnd | Bytt til Data Zone hvis compliance tillater |
| gpt-4.1 for komplekse forespørsler (10%) | ~1 200 NOK/mnd | Model Router automatiserer valget |
| Azure AI Search (RAG) | 3 000–10 000 NOK/mnd | Optimaliser indeks og chunking |
| Azure Monitor/logging | 1 000–3 000 NOK/mnd | Sett sampling-rate |
| **Estimert total** | ~6 000–16 000 NOK/mnd | |

**Confidence:** Lav–Moderat (estimater er generelle. Varierer med volum, latens, og faktisk PTU-prising)

---

## Integrasjon med Microsoft-stakken

### Azure AI Foundry: Model Catalog og Router

- Alle GPT-4.1- og GPT-5-modeller tilgjengelig i [Azure AI Foundry](https://ai.azure.com)
- Model Router automatiserer modellvalg — opptil 60% kostnadssparing (dokumentert)
- Foundry PTU-kalkulator: [ai.azure.com/resource/calculator](https://ai.azure.com/resource/calculator)

### Copilot Studio

- Default modell: **gpt-4.1-mini** (Basic rate — laveste Copilot Credits-forbruk)
- Brukeren kan manuelt velge gpt-4.1 (Standard) eller gpt-5-reasoning (Premium) per prompt
- Copilot Credits-kvantum inkludert i lisenspakke; overskudd faktureres via pay-as-you-go

### AI Builder (Power Platform)

- Default modell: **gpt-4.1-mini** (Basic rate prompt builder credits)
- Modeller tilgjengelig: gpt-4.1-mini (Basic), gpt-4.1 (Standard), gpt-5-chat (Standard), gpt-5-reasoning (Premium), gpt-5.2-variants (experimental)
- Prompt builder credits forbrukes per kall; inkludert i premium Power Platform-planer (500 credits/bruker/mnd)

### Azure Cost Management

- Grupper kostnader etter `Meter` for per-modell kostnadssporing
- Sett budsjetter med alerts ved 50%, 75%, 90%
- Tag-strategi: `model`, `deployment-type`, `project`, `cost-center`

---

## Kostnad og lisensiering

### Lisensmodeller og AI-kostnadsdekning

| Produkt | Lisensmodell | GPT-4.1-mini | GPT-4.1 | GPT-5 |
|---------|-------------|-------------|--------|-------|
| **Azure OpenAI** | Pay-per-token / PTU | Betalt separat | Betalt separat | Betalt separat |
| **Copilot Studio** | Per bruker/mnd | Basic Credits (inkludert) | Standard Credits (inkludert til volum-limit) | Premium Credits (tillegg ved høyt volum) |
| **Power Platform (premium)** | Per bruker/mnd | Basic prompt builder credits | Standard credits | Premium credits (ekstra) |
| **M365 Copilot** | Per bruker/mnd (~360 USD/bruker) | Inkludert | Inkludert | Standard-tilgang inkludert |

### GPT-5 tilgjengelighets- og registreringsstatus

| Modell | Tilgjengelighet | Registrering |
|--------|----------------|-------------|
| `gpt-5` | GA (begrenset) | Krever godkjenning (aka.ms/oai/gpt5access) |
| `gpt-5-mini` | GA | Ikke nødvendig |
| `gpt-5-nano` | GA | Ikke nødvendig |
| `gpt-5-chat` | Preview (2 versjoner) | Ikke nødvendig |
| `gpt-5-codex` | GA (begrenset) | Krever godkjenning |
| `gpt-5-pro` | GA (begrenset) | Kun MCA-E/Default-abonnementer |

---

## For arkitekten (Cosmo)

### Når bruke denne referansen

**Triggers:**
- Bruker spør om priser på GPT-4.1 eller GPT-5
- Bruker vil vite forskjellen mellom GPT-4.1-nano, mini og full
- Budsjettering av Azure OpenAI-kostnader (NOK)
- Valg mellom GPT-4.1 og GPT-5 for et gitt use case
- Copilot Credits-planlegging i Copilot Studio eller AI Builder

### Rådgivningsprosess

**1. Bekreft bruksbehovet:**
- Latenskrav (sanntid < 200ms? Batch OK?)
- Resonneringsbehov (enkel klassifisering vs. juridisk analyse)
- Volum (forespørsler/mnd, tokens/forespørsel)
- Compliance (Norway East, EU Data Zone, Global?)
- Platform (Azure OpenAI direkte, Copilot Studio, AI Builder)

**2. Velg modell med beslutningstreet:**
- Bruk treet i "Beslutningsveiledning"
- Default: Start med gpt-4.1-mini. Oppgrader kun ved bevist behov.

**3. Estimer kostnad:**
- Bekreftede priser: gpt-4.1-serien
- Estimerte priser: gpt-5-serien (marker alltid som estimat)
- Konverter til NOK (10.5 NOK/USD veiledende)
- Inkluder deployment-type-premie for Norway East

**4. Valider med offisiell kilde:**
- Alltid linke til [Azure OpenAI Pricing](https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/)
- For PTU: [Azure AI Foundry Calculator](https://ai.azure.com/resource/calculator)

### Confidence-markers i rådgivning

| Situasjon | Marker |
|-----------|--------|
| GPT-4.1-priser | "Bekreftet $2.00/$8.00 per 1M tokens (input/output)" |
| GPT-5-priser | "Estimert ~$10–15/$40–60 per 1M tokens — verifiser på prisside" |
| NOK-konvertering | "Indikativt ved kurs 10.5 NOK/USD — verifiser aktuell kurs" |
| Copilot Credits | "Bekreftet Basic/Standard/Premium-klassifisering per modell" |

### Vanlige spørsmål og svar

**Q: "Er GPT-5 alltid bedre enn GPT-4.1?"**
**A:** Nei. GPT-5 er bedre for dyp resonnering. For sanntids-chatbots, høyvolum-RAG og enkle oppgaver er GPT-4.1 raskere, billigere og tilstrekkelig god. Start med GPT-4.1.

**Q: "Hva koster GPT-5 i Norge?"**
**A:** Priser er ikke offentlig tilgjengelig per februar 2026. Basert på PTU-dokumentasjon (1:8 ratio) og OpenAI API-annonsering er det estimert ~$10–15 per 1M input-tokens. Verifiser alltid på Azure prisside eller kontakt Microsoft.

**Q: "Skal vi bruke gpt-4.1-mini eller gpt-4.1 i Copilot Studio?"**
**A:** Start med gpt-4.1-mini (Basic rate, laveste Credits-forbruk). Bytt til gpt-4.1 kun for oppgaver som krever mer kompleks resonnering eller høyere kvalitet — test og mål først.

**Q: "Hva er break-even for PTU vs. pay-per-token?"**
**A:** Bruk [Azure AI Foundry PTU-kalkulator](https://ai.azure.com/resource/calculator). Som tommelfingerregel: PTU er lønnsomt ved >70% gjennomsnittlig utnyttelse og stabilt volum over 3+ måneder.

**Q: "Påvirker ny GPT-5-tilgjengelighet Copilot Credits-forbruket vårt?"**
**A:** Ja. Hvis brukere i Copilot Studio velger gpt-5-reasoning (Preview, Premium rate) i stedet for gpt-4.1-mini (Basic), kan Credits-forbruket øke 5–10x. Overvåk forbruk via Power Platform admin center og sett budsjetter.

### Vanlige fallgruver

| Fallgruve | Konsekvens | Hvordan unngå |
|-----------|------------|---------------|
| Bruke GPT-5 for enkle chatbot-svar | 5–20x høyere kostnad enn nødvendig | Start alltid med GPT-4.1-mini. Oppgrader kun ved bevist behov |
| Ikke skille mellom Global og Regional prising | 10–20% budsjett-avvik | Inkluder alltid deployment-type-premie i estimater for norsk sektor |
| Oppgi GPT-5-priser som bekreftet | Budsjett-overskridelse eller undervurdering | Marker alltid GPT-5-priser som estimert |
| Glemme Batch API-rabatt for natt-jobber | 2x høyere kostnad enn nødvendig | Vurder Batch API for alle ikke-sanntids workloads |
| Ikke monitorere Copilot Credits-forbruk | Uventet faktura ved GPT-5/o3-bruk | Sett Credits-budsjetter i Power Platform admin center |

---

## Kilder og verifisering

### Primærkilder (Microsoft Learn, bekreftet februar 2026)

1. **GPT-5 vs GPT-4.1: choosing the right model for your use case**
   URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/how-to/model-choice-guide?view=foundry-classic
   Hentet: 2026-02
   Innhold: Modellsammenligning, reasoning-nivåer, latens-trade-offs, use-case guidance

2. **Foundry Models sold directly by Azure — GPT-4.1 og GPT-5-serien**
   URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/concepts/models-sold-directly-by-azure?view=foundry-classic
   Hentet: 2026-02
   Innhold: Kontekstvindu, max output tokens, treningsdata, versjonsoversikt, tilgjengelighetskrav

3. **Provisioned throughput unit (PTU) costs and billing**
   URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding?view=foundry-classic
   Hentet: 2026-02
   Innhold: PTU-kapasitet per modell (TPM/PTU), min deployment, latens-SLA, input/output-ratio (1:4 for gpt-4.1, 1:8 for gpt-5)

4. **Pricing for Azure Content Understanding in Foundry Tools**
   URL: https://learn.microsoft.com/azure/ai-services/content-understanding/pricing-explainer
   Hentet: 2026-02
   Innhold: Priseksempler med gpt-4.1 Global ($2/$8) og gpt-4.1-mini Global ($0.40/$1.60) bekreftet

5. **Azure OpenAI in Microsoft Foundry Models quotas and limits**
   URL: https://learn.microsoft.com/azure/ai-foundry/openai/quotas-limits?view=foundry-classic
   Hentet: 2026-02
   Innhold: GPT-5- og GPT-4.1-seriens kvotestruktur, usage tiers, deployment-typer

6. **Change the model version and settings (AI Builder/Copilot Studio)**
   URL: https://learn.microsoft.com/microsoft-copilot-studio/prompt-model-settings
   Hentet: 2026-02
   Innhold: Copilot Credits-klassifisering (Basic/Standard/Premium) per modell, tilgjengelige modeller

7. **Cost management for fine-tuning**
   URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic
   Hentet: 2026-02
   Innhold: Fine-tuning kostnad, hosting $1.70/time (o4-mini eksempel)

8. **Plan and manage costs for Microsoft Foundry**
   URL: https://learn.microsoft.com/azure/ai-foundry/concepts/manage-costs?view=foundry-classic
   Hentet: 2026-02
   Innhold: Billing-modell, token-basert prising, 1K-token enheter

### Referanseprisside (verifiser for oppdaterte tall)

9. **Azure OpenAI Pricing Page**
   URL: https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/
   Note: Dynamisk side (krever JavaScript). Sjekk manuelt for eksakte GPT-5-priser når de publiseres.

10. **Azure AI Foundry PTU Calculator**
    URL: https://ai.azure.com/resource/calculator
    Note: Beregn PTU break-even for spesifikke workloads

### Verifiseringsstatus

| Påstand | Kilde | Confidence |
|---------|-------|------------|
| gpt-4.1 Global: $2.00 input, $8.00 output per 1M | Kilde 4 (Content Understanding eksempel) | Høy |
| gpt-4.1-mini Global: $0.40 input, $1.60 output per 1M | Kilde 4 (Content Understanding eksempel) | Høy |
| gpt-5: 1 output token = 8 input tokens (PTU-ratio) | Kilde 3 (PTU-dokumentasjon) | Høy |
| gpt-4.1: 1 output token = 4 input tokens (PTU-ratio) | Kilde 3 (PTU-dokumentasjon) | Høy |
| gpt-4.1 PTU: 3 000 TPM/PTU | Kilde 3 | Høy |
| gpt-5 PTU: 4 750 TPM/PTU | Kilde 3 | Høy |
| gpt-4.1-mini Copilot: Basic rate | Kilde 6 | Høy |
| gpt-4.1 Copilot: Standard rate | Kilde 6 | Høy |
| gpt-5-reasoning Copilot: Premium rate | Kilde 6 | Høy |
| Batch API: 50% rabatt | Kilde 1/Azure prisside | Høy |
| GPT-5 absolutte tokenpriser | Ikke bekreftet (Azure prisside $-) | Lav |
| gpt-4.1-nano prising | Ikke direkte bekreftet, interpolert | Moderat |

**Totalt antall kilder:** 10 (8 primære Microsoft Learn, 2 pricing-referanser)
**MCP-kall brukt:** 5 (4x docs_search, 1x docs_fetch — model-choice-guide)

### Siste oppdatering og gyldighet

**Dokumentasjonsdato:** Februar 2026
**Bekreftede priser gyldige per:** Februar 2026 (GPT-4.1-serien)
**Estimerte priser:** GPT-5-serien — verifiser på offisiell prisside
**Neste review anbefalt:** Mai 2026 (GPT-5-priser forventes publisert; sjekk kvartalsvis)

---

**Dokumenteier:** Cosmo Skyberg, Microsoft AI Solution Architect
**Godkjent for:** Offentlig sektor Norge, Enterprise Azure-kunder
**Versjon:** 1.0