# GPT-5 og GPT-4.1: Prismodeller og kostnadsoptimalisering **Last updated:** 2026-04 **Status:** GA (GPT-4.1-serien), GA (GPT-5-serien, begrenset tilgang for gpt-5 og gpt-5-codex) **Category:** Cost Optimization & FinOps for AI --- ## Introduksjon GPT-5- og GPT-4.1-seriene er de to nyeste flaggskipmodellene fra OpenAI tilgjengelig i Azure AI Foundry. De representerer to distinkte designfilosofier: GPT-5 optimalisert for dyp resonnering og komplekse oppgaver, GPT-4.1 optimalisert for hastighet, gjennomstrømming og kostnadseffektivitet. **Confidence:** Høy (basert på offisiell Microsoft-dokumentasjon, februar 2026) Denne referansen dekker: - Bekreftet og estimert prising per 1M tokens (USD og NOK) - Deployment-typer og deres kostnadsimplikasjon - Sammenligningstabeller (GPT-4o vs. GPT-4.1 vs. GPT-5) - Copilot Credits-klassifisering per modell - Optimaliserings­strategier og beslutningsveiledning **Viktig merknad om priser:** Azure prisside (azure.microsoft.com/pricing) benytter JavaScript-rendering og returnerer tomme verdier ved programmatisk henting. Bekreftede priser er hentet fra Microsoft Learn-dokumentasjon og Content Understanding-eksempler. GPT-5-priser er ikke offentlig tilgjengelig som faste tall per februar 2026 — estimater er basert på offentliggjorte ratioer og prishistorikk. --- ## Kjernekomponenter ### 1. GPT-4.1-serien — Bekreftet prising **Kilde:** Azure Content Understanding-dokumentasjon, Azure AI Foundry provisioned throughput-dokumentasjon (bekreftet 1:4 input/output-ratio) | Modell | Input (per 1M tokens) | Output (per 1M tokens) | Cached Input | Kontekst | |--------|-----------------------|------------------------|--------------|----------| | `gpt-4.1` (Global) | **$2.00** | **$8.00** | ~$0.50 | 1M tokens (128K ved provisioned) | | `gpt-4.1-mini` (Global) | **$0.40** | **$1.60** | ~$0.10 | 1M tokens (128K ved provisioned) | | `gpt-4.1-nano` (Global) | **$0.10** | **$0.40** | ~$0.025 | 1M tokens (128K ved provisioned) | **Confidence:** Høy for gpt-4.1 og gpt-4.1-mini (bekreftet via Content Understanding priseksempler og PTU-dokumentasjon). Moderat for gpt-4.1-nano (interpolert fra dokumenterte ratioer — 1:4 input/output). **Nøkkelfakta:** - 1 output token = 4 input tokens i PTU-utnyttelse (matchers prisratio) - Kontekstvindu: 1 047 576 tokens (full), 128 000 tokens (standard og provisioned deployments), 300 000 tokens (batch deployments) - Treningsdata: til og med mai 2024 - Versjon: `2025-04-14` - Batch API: 50% rabatt på Global Standard-priser **Tilgjengelige deployment-typer for GPT-4.1-serien:** - Global Standard, Data Zone Standard, Regional (Standard og Provisioned) - Priority Processing: tilgjengelig for gpt-4.1 (ikke mini/nano) --- ### 2. GPT-5-serien — Estimert prising **Merk:** GPT-5-priser er ikke publisert som faste tall per februar 2026 (Azure prisside viser `$-`). Estimatene nedenfor er basert på: 1. Dokumentert PTU-ratio: 1 output token = 8 input tokens (kilde: offisiell PTU-dokumentasjon) 2. Offentlig OpenAI API-prising (openai.com/api/pricing) ved lansering august 2025 3. Prishistorikk og modellfamilieposisjonering | Modell | Input (per 1M tokens) | Output (per 1M tokens) | Confidence | Merknader | |--------|-----------------------|------------------------|------------|-----------| | `gpt-5` (Global) | ~$10–15 | ~$40–60 | Lav–Moderat | 1:8 output/input-ratio bekreftet. Absolutt pris ikke publisert i Azure | | `gpt-5-mini` (Global) | ~$1.50–3 | ~$6–12 | Lav–Moderat | Estimert. ~5–10x billigere enn gpt-5 basert på modellfamiliemønster | | `gpt-5-nano` (Global) | ~$0.10–0.30 | ~$0.40–1.20 | Lav | Tilsvarer gpt-4.1-nano-prisnivå. Estimert | | `gpt-5-chat` (Global) | ~$1.50–3 | ~$6–12 | Lav | Preview. Tilsvarer gpt-5-mini. Standard rate i Copilot Credits | **OBLIGATORISK:** Verifiser alltid GPT-5-priser på [offisiell Azure OpenAI prisside](https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/) eller Azure Pricing Calculator før budsjettering. **Tilgjengelighetsbegrensning:** - `gpt-5` og `gpt-5-codex`: Krever registrering og godkjenning (begrenset tilgang) - `gpt-5-mini`, `gpt-5-nano`, `gpt-5-chat`: Ingen registreringskrav - Kontekstvindu: 400 000 tokens (272K input / 128K output for resonneringsmodeller) --- ### 3. Referanse: GPT-4o (sammenligning) **Kilde:** Allment tilgjengelig fra Azure-dokumentasjon | Modell | Input (per 1M tokens) | Output (per 1M tokens) | Kontekst | |--------|-----------------------|------------------------|----------| | `gpt-4o` (Global) | ~$2.50 | ~$10.00 | 128K | | `gpt-4o-mini` (Global) | ~$0.15 | ~$0.60 | 128K | **Confidence:** Høy (bredt dokumentert) --- ### 4. Deployment-typer og kostnadsimplikasjon | Deployment-type | Prismodell | Datalagring | Best for | Prediktabilitet | |-----------------|------------|-------------|----------|-----------------| | **Global Standard** | Pay-per-token | Ingen garanti (trafikk rutes globalt) | Høyt volum, lavest pris, ikke-sensitive data | Lav (avhenger av bruk) | | **Data Zone Standard** | Pay-per-token (~5–10% høyere enn Global) | EU- eller US-region garantert | Norske virksomheter med GDPR-krav, ikke-sensitiv produksjon | Lav (avhenger av bruk) | | **Regional Standard** | Pay-per-token (~10–20% høyere enn Global) | Spesifikk region (f.eks. Norway East) | Personopplysninger, kritisk compliance | Lav (avhenger av bruk) | | **Provisioned Throughput (PTU)** | Fast timepris per PTU | Velges ved deployment | Forutsigbart høyvolum, latens-SLA | Høy (fast kostnad uavhengig av bruk) | | **Batch API** | 50% rabatt på Global Standard | Global | Ikke-sanntidsoppgaver (24t behandlingstid) | Moderat (avhenger av bruk) | **PTU-gjennomstrømming per modell (bekreftet, offisiell dokumentasjon):** | Modell | Input TPM per PTU | Latens-SLA (p50) | Min PTU (Global) | Min PTU (Regional) | |--------|-------------------|------------------|-----------------|-------------------| | `gpt-5` | 4 750 | 99% > 50 TPS | 15 | 50 | | `gpt-5-mini` | 23 750 | 99% > 80 TPS | 15 | 25 | | `gpt-4.1` | 3 000 | 99% > 80 TPS | 15 | 50 | | `gpt-4.1-mini` | 14 900 | 99% > 90 TPS | 15 | 25 | | `gpt-4.1-nano` | 59 400 | 99% > 100 TPS | 15 | 25 | | `o4-mini` | 5 400 | 99% > 90 TPS | 15 | 25 | **Confidence:** Høy (direkte fra offisiell PTU-dokumentasjon) --- ### 5. Sammenligningstabeller #### 5a. Pris- og kapabilitetssammenligning | Modell | Input (per 1M) | Output (per 1M) | Konfidensgrad | Kontekst | Resonneringsevne | Latens | |--------|---------------|-----------------|---------------|----------|-----------------|--------| | `gpt-4o-mini` | ~$0.15 | ~$0.60 | Høy | 128K | Lav | Lavest | | `gpt-4.1-nano` | ~$0.10 | ~$0.40 | Moderat | 1M (128K PTU) | Lav | Lavest | | `gpt-4.1-mini` | $0.40 | $1.60 | Høy | 1M (128K PTU) | Lav–Moderat | Lav | | `gpt-4o` | ~$2.50 | ~$10.00 | Høy | 128K | Moderat | Moderat | | `gpt-4.1` | $2.00 | $8.00 | Høy | 1M (128K PTU) | Moderat | Lav–Moderat | | `gpt-5-nano` | ~$0.10–0.30 | ~$0.40–1.20 | Lav (estimert) | 400K | Moderat (resonnering) | Lav | | `gpt-5-mini` | ~$1.50–3.00 | ~$6.00–12.00 | Lav (estimert) | 400K | Høy (resonnering) | Moderat | | `gpt-5` | ~$10–15 | ~$40–60 | Lav (estimert) | 400K | Svært høy (resonnering) | Høy | #### 5b. Relativ kostnad per 1 000 forespørsler (200 input + 100 output tokens) | Modell | Kostnad (USD) | Kostnad (NOK, ~10.5 kurs) | Relativt vs. GPT-4.1 | |--------|--------------|--------------------------|----------------------| | `gpt-4.1-nano` | $0.06 | ~0.63 NOK | 95% billigere | | `gpt-4.1-mini` | $0.24 | ~2.52 NOK | 80% billigere | | `gpt-4.1` | $1.20 | ~12.60 NOK | Referanse | | `gpt-5-mini` (estimert midtpunkt) | ~$0.90–1.80 | ~9–19 NOK | ~50% dyrere (estimert) | | `gpt-5` (estimert midtpunkt) | ~$6–9 | ~63–95 NOK | ~7x dyrere (estimert) | **Confidence:** Høy for gpt-4.1-serien. Lav for gpt-5-serien (estimerte priser). --- ### 6. NOK-kostnadsestimater **Valutakurs brukt:** 1 USD = 10.5 NOK (veiledende, verifiser aktuell kurs) #### Månedlig kostnadsestimat for typiske workloads **Scenario A: Kundestøtte chatbot (100 000 forespørsler/mnd, 150 input + 100 output tokens)** | Modell | USD/mnd | NOK/mnd | Anbefaling | |--------|---------|---------|------------| | `gpt-4.1-nano` | ~$5.50 | ~58 NOK | Enkel FAQ, høyt volum | | `gpt-4.1-mini` | ~$22 | ~231 NOK | Standard chatbot | | `gpt-4.1` | ~$110 | ~1 155 NOK | Kompleks kundesupport | | `gpt-5-mini` (est.) | ~$70–140 | ~735–1 470 NOK | Kun om resonnering er kritisk | **Scenario B: Dokumentanalysepipeline (10 000 dokumenter/mnd, 2 000 input + 500 output tokens)** | Modell | USD/mnd | NOK/mnd | Anbefaling | |--------|---------|---------|------------| | `gpt-4.1-mini` | ~$88 | ~924 NOK | Standardanalyse | | `gpt-4.1` | ~$440 | ~4 620 NOK | Juridisk/finansiell analyse | | `gpt-5` (est.) | ~$2 750–4 100 | ~28 875–43 050 NOK | Kun om deep reasoning er nødvendig | **Scenario C: Batch-prosessering (50% rabatt, 500 000 forespørsler/mnd, 200 input + 50 output tokens)** | Modell | USD/mnd (batch) | NOK/mnd | Merknad | |--------|----------------|---------|---------| | `gpt-4.1-nano` | ~$7.00 | ~74 NOK | Klassifisering, tagging | | `gpt-4.1-mini` | ~$28 | ~294 NOK | Sammendrag, analyse | | `gpt-4.1` | ~$140 | ~1 470 NOK | Kompleks batch | **Confidence:** Moderat (beregnet fra bekreftede GPT-4.1-priser. NOK-konvertering varierer med valutakurs). --- ### 7. Copilot Credits-klassifisering Modeller i Copilot Studio og AI Builder (Power Platform) prises etter tre takstnivåer. Dette er direkte relevant for norske offentlige virksomheter som bruker Power Platform. | Modell | Takst-nivå | Copilot Credits | Power Platform Credits | |--------|-----------|----------------|----------------------| | `gpt-4.1-mini` | **Basic** | Laveste forbruk | Laveste forbruk | | `gpt-4.1` | **Standard** | Moderat forbruk | Moderat forbruk | | `gpt-5-chat` (preview) | **Standard** | Moderat forbruk | Moderat forbruk | | `gpt-5-reasoning` (preview) | **Premium** | Høyeste forbruk | Høyeste forbruk | | `o3` | **Premium** | Høyeste forbruk | Høyeste forbruk | | `Claude Sonnet 4.5` (experimental) | **Standard** | Moderat forbruk | Moderat forbruk | | `Claude Opus 4.5` (experimental) | **Premium** | Høyeste forbruk | Høyeste forbruk | *(Verified MCP 2026-04)* **Viktige implikasjoner:** - **GPT-4.1 mini er nå standardmodellen i Copilot Studio** (erstattet GPT-4o mini). GPT-4o og GPT-4o mini er kun tilgjengelig i US government-regioner. - Copilot Studio inkluderer et månedlig kvantum av Copilot Credits. Å bruke gpt-5-reasoning eller o3 tapper disse vesentlig raskere enn gpt-4.1-mini. - Standard-rate (gpt-4.1 og gpt-5-chat) er tilgjengelig uten ekstra tilleggslisens i de fleste planer. - Premium-rate (gpt-5-reasoning, o3, Claude Opus 4.5) kan kreve pay-as-you-go-overskudd ved høyt volum. - **Claude Sonnet 4.5 og Opus 4.5** er nå tilgjengelig i Copilot Studio (experimental, 200K kontekstvindu). - **M365 Copilot (enterprise):** Inkluderer standardtilgang til GPT-5 (inkl. standard Copilot Chat). Priority Access krever M365 Copilot-lisens. **Confidence:** Høy (basert på offisiell AI Builder/Copilot Studio-dokumentasjon, 2026-04) --- ### 8. GPT-5 Reasoning-nivåer og kostnad GPT-5 introducerer fire justerbare tenkningsnivåer. Kostnad og latens skalerer med tenkningsdybde. | Resonneringsnivå | Beskrivelse | Latens | Relativ kostnad | Bruksområde | |-----------------|-------------|--------|-----------------|-------------| | **Minimal** | Svært få interne resonneringstokens | Raskest | Lavest | Bulk-operasjoner, enkle transformasjoner | | **Low** | Let resonnering, rask vurdering | Rask | Lav | Triage, korte svar, enkle redigeringer | | **Medium (default)** | Balansert dybde vs. hastighet | Moderat | Middels | Innholdsdrafting, moderat koding, RAG Q&A | | **High** | Dyp, flertrinns "think-through" | Tregest | Høyest | Kompleks planlegging, analyse, multi-hop reasoning | **Viktig:** Samme resonneringsnivå-logikk gjelder for `gpt-5`, `gpt-5-mini` og `gpt-5-nano`. Absolutt kostnad og latens skalerer ned med mini og nano, men avveiningene er identiske. **Parallelle verktøykall:** Støttes IKKE ved `Minimal` reasoning_effort. Bruk Low/Medium/High for agentbruk. **Confidence:** Høy (direkte fra offisiell GPT-5 model choice guide, februar 2026) --- ### 9. Optimaliserings­strategier #### Strategi 1: Modelltiering (Small → Medium → Large) ``` Trigger: Klassifiser forespørselskompleksitet FØR valg av modell Tier 1 — Nano (enkle oppgaver): - Klassifisering, tagging, enkle strukturerte outputs - Modell: gpt-4.1-nano - Estimert kostnad: ~$0.10–0.40/1M tokens Tier 2 — Mini (standard oppgaver): - Chatbots, drafting, RAG Q&A, oppsummering - Modell: gpt-4.1-mini - Estimert kostnad: ~$0.40–1.60/1M tokens Tier 3 — Full (komplekse oppgaver): - Juridisk analyse, flertrinns planlegging, agenter - Modell: gpt-4.1 eller gpt-5-mini - Estimert kostnad: $2–8/1M tokens (gpt-4.1) ``` **Besparelsespotensial:** 60–80% vs. alltid bruke gpt-4.1 #### Strategi 2: Model Router (Azure AI Foundry) Azure AI Foundry Model Router analyserer prompt-kompleksitet og velger automatisk den mest kostnadseffektive modellen. - **Potensiell besparelse:** Opptil 60% vs. å alltid bruke GPT-5-familien (dokumentert av Microsoft) - **Implementering:** Deploy Model Router i Azure AI Foundry, konfigurer underliggende modeller - **Ingen kodeendringer:** Transparente for applikasjonen **Confidence:** Høy (Model Router er GA-funksjonalitet, besparelsestallet er dokumentert av Microsoft) #### Strategi 3: Batch API (50% rabatt) For ikke-sanntidsoppgaver med 24-timers SLA: - Nattlig rapportgenerering og sammendrag - Innholdsmoderering - Masseopplastings-analyse - E-postklassifisering **Besparelsespotensial:** Fast 50% rabatt på Global Standard-pris #### Strategi 4: Prompt Caching (Cached Input) Gjenbruk av identisk kontekst (system prompt, dokumenter) aktiverer cached input-prising: - gpt-4.1: cached input ~$0.50/1M (75% rabatt vs. full input) - Spesielt effektivt for RAG-løsninger med fast system prompt - Krever identisk prefiks (prompt caching aktiveres automatisk for repeterende kontekst) **Confidence:** Moderat (caching-ratio er estimert, ikke bekreftet for alle modeller per februar 2026) #### Strategi 5: PTU ved forutsigbart høyt volum **Bruk PTU når:** - Volum er forutsigbart (>70% utnyttelse) - Latens-SLA er kritisk - Månedlig token-volum er høyt nok til at fast PTU-kostnad er lavere enn pay-per-token **PTU break-even (illustrativt for gpt-4.1):** ``` Pay-per-token: 3 000 000 tokens/mnd × $2.00/1M = $6/mnd per ~1M monthly tokens PTU: 1 PTU = 3 000 input TPM = ~130M tokens/mnd kapasitet Break-even: Når pay-per-token overstiger PTU-timeprisen × 730 timer/mnd ``` Bruk [Azure AI Foundry PTU-kalkulator](https://ai.azure.com/resource/calculator) for presis beregning. **Confidence:** Høy (PTU TPM-verdier er offisielt dokumentert. Break-even avhenger av PTU-timepris som ikke er publisert) #### Strategi 6: Reasoning-nivå-optimalisering (GPT-5) ```python def select_reasoning_effort(task_type: str) -> str: if task_type in ["classification", "summarization", "simple_qa"]: return "low" # 40–60% billigere enn high elif task_type in ["content_drafting", "rag_qa", "moderate_coding"]: return "medium" # Standard valg elif task_type in ["legal_analysis", "complex_planning", "multihop_reasoning"]: return "high" # Maks nøyaktighet else: return "medium" # Sikker default ``` **Besparelsespotensial:** 40–60% kostnadsreduksjon vs. alltid bruke `high` reasoning --- ## Beslutningsveiledning ### Beslutningstre: GPT-4.1 vs. GPT-5 ``` START | V Krever oppgaven dyp, flertrinns resonnering? ├─ JA → Er resonnering viktigere enn kostnad/latens? │ ├─ JA → GPT-5 (juster reasoning_effort) │ └─ NEI → GPT-4.1 (raskere, billigere, tilstrekkelig for de fleste) └─ NEI → Er oppgaven voluminøs og/eller latens-sensitiv? ├─ JA → GPT-4.1-mini eller GPT-4.1-nano └─ NEI → GPT-4.1-mini (balanse mellom kostnad og kvalitet) ``` ### Scenario-basert anbefaling | Scenario | Anbefalt modell | Kostnadsnivå (NOK/mnd, 100K forespørsler) | |----------|-----------------|------------------------------------------| | Enkel FAQ-bot | gpt-4.1-nano | ~58 NOK | | Kundestøtte chatbot | gpt-4.1-mini + Model Router | ~231 NOK | | Juridisk dokumentanalyse | gpt-4.1 eller gpt-5 (high) | ~1 155–8 000+ NOK | | Kode-assistent | gpt-5-mini (medium reasoning) | Estimert ~700–1 500 NOK | | Nattlig rapport (batch) | gpt-4.1-mini (batch) | ~116 NOK (50% rabatt) | | Enterprise Copilot (Copilot Studio) | gpt-4.1 (Standard Credits) | Innenfor inkluderte Credits | | RAG Q&A (norsk offentlig sektor) | gpt-4.1-mini + caching | ~116–231 NOK | **Confidence:** Moderat (NOK-estimater basert på illustrative priser. GPT-5-scenarioer er estimert) ### Valg av deployment-type ``` Norsk offentlig sektor: Personopplysninger → Regional Standard (Norway East) + gpt-4.1-mini/gpt-4.1 Ikke-sensitiv data → Data Zone Standard (EU) for litt lavere kostnad Høyvolum produksjon → PTU (ved forutsigbart volum) Utvikling/testing → Global Standard (lavest pris, ingen compliance-garanti) Batch (ikke-sanntid) → Batch API (50% rabatt på Global) ``` --- ## Offentlig sektor (Norge) ### Compliance og dataplassering vs. kostnad | Deployment-type | Garantert dataplassering | Estimert kostnadsnivå | Anbefaling | |-----------------|--------------------------|----------------------|------------| | Norway East Regional | Ja (Norway East) | Høyest (~10–20% over Global) | Personopplysninger (GDPR) | | EU Data Zone | EU-region (ikke spesifikt Norway) | Moderat (~5–10% over Global) | Ikke-sensitive data, EU GDPR | | Global Standard | Ingen garanti | Lavest | Kun ikke-sensitiv utvikling/test | **Anbefaling for offentlig sektor:** - All behandling av personopplysninger: **Regional Standard — Norway East** - Ikke-sensitiv AI-bruk i produksjon: **Data Zone Standard (EU)** for moderat kostnadssparing - Testing og utvikling: **Global Standard** - Høyvolum stabile workloads: Vurder **PTU i Norway East** for latens-SLA + forutsigbar kostnad ### TCO-estimat for offentlig AI-prosjekt med GPT-4.1 | Kostnadselement | Estimat (50K forespørsler/mnd) | Optimalisering | |-----------------|--------------------------------|----------------| | gpt-4.1-mini inferens (Norway East) | ~1 300–2 600 NOK/mnd | Bytt til Data Zone hvis compliance tillater | | gpt-4.1 for komplekse forespørsler (10%) | ~1 200 NOK/mnd | Model Router automatiserer valget | | Azure AI Search (RAG) | 3 000–10 000 NOK/mnd | Optimaliser indeks og chunking | | Azure Monitor/logging | 1 000–3 000 NOK/mnd | Sett sampling-rate | | **Estimert total** | ~6 000–16 000 NOK/mnd | | **Confidence:** Lav–Moderat (estimater er generelle. Varierer med volum, latens, og faktisk PTU-prising) --- ## Integrasjon med Microsoft-stakken ### Azure AI Foundry: Model Catalog og Router - Alle GPT-4.1- og GPT-5-modeller tilgjengelig i [Azure AI Foundry](https://ai.azure.com) - Model Router automatiserer modellvalg — opptil 60% kostnadssparing (dokumentert) - Foundry PTU-kalkulator: [ai.azure.com/resource/calculator](https://ai.azure.com/resource/calculator) ### Copilot Studio - Default modell: **gpt-4.1-mini** (Basic rate — laveste Copilot Credits-forbruk) - Brukeren kan manuelt velge gpt-4.1 (Standard) eller gpt-5-reasoning (Premium) per prompt - Copilot Credits-kvantum inkludert i lisenspakke; overskudd faktureres via pay-as-you-go ### AI Builder (Power Platform) - Default modell: **gpt-4.1-mini** (Basic rate prompt builder credits) - Modeller tilgjengelig: gpt-4.1-mini (Basic), gpt-4.1 (Standard), gpt-5-chat (Standard), gpt-5-reasoning (Premium), gpt-5.2-variants (experimental) - Prompt builder credits forbrukes per kall; inkludert i premium Power Platform-planer (500 credits/bruker/mnd) ### Azure Cost Management - Grupper kostnader etter `Meter` for per-modell kostnadssporing - Sett budsjetter med alerts ved 50%, 75%, 90% - Tag-strategi: `model`, `deployment-type`, `project`, `cost-center` --- ## Kostnad og lisensiering ### Lisensmodeller og AI-kostnadsdekning | Produkt | Lisensmodell | GPT-4.1-mini | GPT-4.1 | GPT-5 | |---------|-------------|-------------|--------|-------| | **Azure OpenAI** | Pay-per-token / PTU | Betalt separat | Betalt separat | Betalt separat | | **Copilot Studio** | Per bruker/mnd | Basic Credits (inkludert) | Standard Credits (inkludert til volum-limit) | Premium Credits (tillegg ved høyt volum) | | **Power Platform (premium)** | Per bruker/mnd | Basic prompt builder credits | Standard credits | Premium credits (ekstra) | | **M365 Copilot** | Per bruker/mnd (~360 USD/bruker) | Inkludert | Inkludert | Standard-tilgang inkludert | ### GPT-5 tilgjengelighets- og registreringsstatus | Modell | Tilgjengelighet | Registrering | |--------|----------------|-------------| | `gpt-5` | GA (begrenset) | Krever godkjenning (aka.ms/oai/gpt5access) | | `gpt-5-mini` | GA | Ikke nødvendig | | `gpt-5-nano` | GA | Ikke nødvendig | | `gpt-5-chat` | Preview (2 versjoner) | Ikke nødvendig | | `gpt-5-codex` | GA (begrenset) | Krever godkjenning | | `gpt-5-pro` | GA (begrenset) | Kun MCA-E/Default-abonnementer | --- ## For arkitekten (Cosmo) ### Når bruke denne referansen **Triggers:** - Bruker spør om priser på GPT-4.1 eller GPT-5 - Bruker vil vite forskjellen mellom GPT-4.1-nano, mini og full - Budsjettering av Azure OpenAI-kostnader (NOK) - Valg mellom GPT-4.1 og GPT-5 for et gitt use case - Copilot Credits-planlegging i Copilot Studio eller AI Builder ### Rådgivningsprosess **1. Bekreft bruksbehovet:** - Latenskrav (sanntid < 200ms? Batch OK?) - Resonneringsbehov (enkel klassifisering vs. juridisk analyse) - Volum (forespørsler/mnd, tokens/forespørsel) - Compliance (Norway East, EU Data Zone, Global?) - Platform (Azure OpenAI direkte, Copilot Studio, AI Builder) **2. Velg modell med beslutningstreet:** - Bruk treet i "Beslutningsveiledning" - Default: Start med gpt-4.1-mini. Oppgrader kun ved bevist behov. **3. Estimer kostnad:** - Bekreftede priser: gpt-4.1-serien - Estimerte priser: gpt-5-serien (marker alltid som estimat) - Konverter til NOK (10.5 NOK/USD veiledende) - Inkluder deployment-type-premie for Norway East **4. Valider med offisiell kilde:** - Alltid linke til [Azure OpenAI Pricing](https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/) - For PTU: [Azure AI Foundry Calculator](https://ai.azure.com/resource/calculator) ### Confidence-markers i rådgivning | Situasjon | Marker | |-----------|--------| | GPT-4.1-priser | "Bekreftet $2.00/$8.00 per 1M tokens (input/output)" | | GPT-5-priser | "Estimert ~$10–15/$40–60 per 1M tokens — verifiser på prisside" | | NOK-konvertering | "Indikativt ved kurs 10.5 NOK/USD — verifiser aktuell kurs" | | Copilot Credits | "Bekreftet Basic/Standard/Premium-klassifisering per modell" | ### Vanlige spørsmål og svar **Q: "Er GPT-5 alltid bedre enn GPT-4.1?"** **A:** Nei. GPT-5 er bedre for dyp resonnering. For sanntids-chatbots, høyvolum-RAG og enkle oppgaver er GPT-4.1 raskere, billigere og tilstrekkelig god. Start med GPT-4.1. **Q: "Hva koster GPT-5 i Norge?"** **A:** Priser er ikke offentlig tilgjengelig per februar 2026. Basert på PTU-dokumentasjon (1:8 ratio) og OpenAI API-annonsering er det estimert ~$10–15 per 1M input-tokens. Verifiser alltid på Azure prisside eller kontakt Microsoft. **Q: "Skal vi bruke gpt-4.1-mini eller gpt-4.1 i Copilot Studio?"** **A:** Start med gpt-4.1-mini (Basic rate, laveste Credits-forbruk). Bytt til gpt-4.1 kun for oppgaver som krever mer kompleks resonnering eller høyere kvalitet — test og mål først. **Q: "Hva er break-even for PTU vs. pay-per-token?"** **A:** Bruk [Azure AI Foundry PTU-kalkulator](https://ai.azure.com/resource/calculator). Som tommelfingerregel: PTU er lønnsomt ved >70% gjennomsnittlig utnyttelse og stabilt volum over 3+ måneder. **Q: "Påvirker ny GPT-5-tilgjengelighet Copilot Credits-forbruket vårt?"** **A:** Ja. Hvis brukere i Copilot Studio velger gpt-5-reasoning (Preview, Premium rate) i stedet for gpt-4.1-mini (Basic), kan Credits-forbruket øke 5–10x. Overvåk forbruk via Power Platform admin center og sett budsjetter. ### Vanlige fallgruver | Fallgruve | Konsekvens | Hvordan unngå | |-----------|------------|---------------| | Bruke GPT-5 for enkle chatbot-svar | 5–20x høyere kostnad enn nødvendig | Start alltid med GPT-4.1-mini. Oppgrader kun ved bevist behov | | Ikke skille mellom Global og Regional prising | 10–20% budsjett-avvik | Inkluder alltid deployment-type-premie i estimater for norsk sektor | | Oppgi GPT-5-priser som bekreftet | Budsjett-overskridelse eller undervurdering | Marker alltid GPT-5-priser som estimert | | Glemme Batch API-rabatt for natt-jobber | 2x høyere kostnad enn nødvendig | Vurder Batch API for alle ikke-sanntids workloads | | Ikke monitorere Copilot Credits-forbruk | Uventet faktura ved GPT-5/o3-bruk | Sett Credits-budsjetter i Power Platform admin center | --- ## Kilder og verifisering ### Primærkilder (Microsoft Learn, bekreftet februar 2026) 1. **GPT-5 vs GPT-4.1: choosing the right model for your use case** URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/how-to/model-choice-guide?view=foundry-classic Hentet: 2026-02 Innhold: Modellsammenligning, reasoning-nivåer, latens-trade-offs, use-case guidance 2. **Foundry Models sold directly by Azure — GPT-4.1 og GPT-5-serien** URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/concepts/models-sold-directly-by-azure?view=foundry-classic Hentet: 2026-02 Innhold: Kontekstvindu, max output tokens, treningsdata, versjonsoversikt, tilgjengelighetskrav 3. **Provisioned throughput unit (PTU) costs and billing** URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding?view=foundry-classic Hentet: 2026-02 Innhold: PTU-kapasitet per modell (TPM/PTU), min deployment, latens-SLA, input/output-ratio (1:4 for gpt-4.1, 1:8 for gpt-5) 4. **Pricing for Azure Content Understanding in Foundry Tools** URL: https://learn.microsoft.com/azure/ai-services/content-understanding/pricing-explainer Hentet: 2026-02 Innhold: Priseksempler med gpt-4.1 Global ($2/$8) og gpt-4.1-mini Global ($0.40/$1.60) bekreftet 5. **Azure OpenAI in Microsoft Foundry Models quotas and limits** URL: https://learn.microsoft.com/azure/ai-foundry/openai/quotas-limits?view=foundry-classic Hentet: 2026-02 Innhold: GPT-5- og GPT-4.1-seriens kvotestruktur, usage tiers, deployment-typer 6. **Change the model version and settings (AI Builder/Copilot Studio)** URL: https://learn.microsoft.com/microsoft-copilot-studio/prompt-model-settings Hentet: 2026-02 Innhold: Copilot Credits-klassifisering (Basic/Standard/Premium) per modell, tilgjengelige modeller 7. **Cost management for fine-tuning** URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic Hentet: 2026-02 Innhold: Fine-tuning kostnad, hosting $1.70/time (o4-mini eksempel) 8. **Plan and manage costs for Microsoft Foundry** URL: https://learn.microsoft.com/azure/ai-foundry/concepts/manage-costs?view=foundry-classic Hentet: 2026-02 Innhold: Billing-modell, token-basert prising, 1K-token enheter ### Referanseprisside (verifiser for oppdaterte tall) 9. **Azure OpenAI Pricing Page** URL: https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/ Note: Dynamisk side (krever JavaScript). Sjekk manuelt for eksakte GPT-5-priser når de publiseres. 10. **Azure AI Foundry PTU Calculator** URL: https://ai.azure.com/resource/calculator Note: Beregn PTU break-even for spesifikke workloads ### Verifiseringsstatus | Påstand | Kilde | Confidence | |---------|-------|------------| | gpt-4.1 Global: $2.00 input, $8.00 output per 1M | Kilde 4 (Content Understanding eksempel) | Høy | | gpt-4.1-mini Global: $0.40 input, $1.60 output per 1M | Kilde 4 (Content Understanding eksempel) | Høy | | gpt-5: 1 output token = 8 input tokens (PTU-ratio) | Kilde 3 (PTU-dokumentasjon) | Høy | | gpt-4.1: 1 output token = 4 input tokens (PTU-ratio) | Kilde 3 (PTU-dokumentasjon) | Høy | | gpt-4.1 PTU: 3 000 TPM/PTU | Kilde 3 | Høy | | gpt-5 PTU: 4 750 TPM/PTU | Kilde 3 | Høy | | gpt-4.1-mini Copilot: Basic rate | Kilde 6 | Høy | | gpt-4.1 Copilot: Standard rate | Kilde 6 | Høy | | gpt-5-reasoning Copilot: Premium rate | Kilde 6 | Høy | | Batch API: 50% rabatt | Kilde 1/Azure prisside | Høy | | GPT-5 absolutte tokenpriser | Ikke bekreftet (Azure prisside $-) | Lav | | gpt-4.1-nano prising | Ikke direkte bekreftet, interpolert | Moderat | **Totalt antall kilder:** 10 (8 primære Microsoft Learn, 2 pricing-referanser) **MCP-kall brukt:** 5 (4x docs_search, 1x docs_fetch — model-choice-guide) ### Siste oppdatering og gyldighet **Dokumentasjonsdato:** Februar 2026 **Bekreftede priser gyldige per:** Februar 2026 (GPT-4.1-serien) **Estimerte priser:** GPT-5-serien — verifiser på offisiell prisside **Neste review anbefalt:** Mai 2026 (GPT-5-priser forventes publisert; sjekk kvartalsvis) --- **Dokumenteier:** Cosmo Skyberg, Microsoft AI Solution Architect **Godkjent for:** Offentlig sektor Norge, Enterprise Azure-kunder **Versjon:** 1.0