Updated 66 stale knowledge base reference files (10 critical, 56 high) across all 5 skills using Microsoft Learn MCP research. Key factual updates: - Groundedness Detection API: `correction` → `mitigating` param, `correctedText` → `correctionText` (breaking change) - Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini); Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx) - Agentic Retrieval: still public preview; 50M free tokens/month - Azure security baselines: "Cognitive Services" → "Foundry Tools" - Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines - MLflow 3 GenAI: new Feedback/Expectation data model - Token tracking doc: "Azure OpenAI in Foundry Models through a gateway" - Agent Registry: Risks column (M365 E7), Graph API (preview) - Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles - ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot - Zero Trust: CAE now via Conditional Access, Strict Location Enforcement - Purview: new Fabric Copilots/agents governance section - AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python) All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added. Build registry: 1341 URLs from 387 files (+2 new URLs). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
29 KiB
GPT-5 og GPT-4.1: Prismodeller og kostnadsoptimalisering
Last updated: 2026-04 Status: GA (GPT-4.1-serien), GA (GPT-5-serien, begrenset tilgang for gpt-5 og gpt-5-codex) Category: Cost Optimization & FinOps for AI
Introduksjon
GPT-5- og GPT-4.1-seriene er de to nyeste flaggskipmodellene fra OpenAI tilgjengelig i Azure AI Foundry. De representerer to distinkte designfilosofier: GPT-5 optimalisert for dyp resonnering og komplekse oppgaver, GPT-4.1 optimalisert for hastighet, gjennomstrømming og kostnadseffektivitet.
Confidence: Høy (basert på offisiell Microsoft-dokumentasjon, februar 2026)
Denne referansen dekker:
- Bekreftet og estimert prising per 1M tokens (USD og NOK)
- Deployment-typer og deres kostnadsimplikasjon
- Sammenligningstabeller (GPT-4o vs. GPT-4.1 vs. GPT-5)
- Copilot Credits-klassifisering per modell
- Optimaliseringsstrategier og beslutningsveiledning
Viktig merknad om priser: Azure prisside (azure.microsoft.com/pricing) benytter JavaScript-rendering og returnerer tomme verdier ved programmatisk henting. Bekreftede priser er hentet fra Microsoft Learn-dokumentasjon og Content Understanding-eksempler. GPT-5-priser er ikke offentlig tilgjengelig som faste tall per februar 2026 — estimater er basert på offentliggjorte ratioer og prishistorikk.
Kjernekomponenter
1. GPT-4.1-serien — Bekreftet prising
Kilde: Azure Content Understanding-dokumentasjon, Azure AI Foundry provisioned throughput-dokumentasjon (bekreftet 1:4 input/output-ratio)
| Modell | Input (per 1M tokens) | Output (per 1M tokens) | Cached Input | Kontekst |
|---|---|---|---|---|
gpt-4.1 (Global) |
$2.00 | $8.00 | ~$0.50 | 1M tokens (128K ved provisioned) |
gpt-4.1-mini (Global) |
$0.40 | $1.60 | ~$0.10 | 1M tokens (128K ved provisioned) |
gpt-4.1-nano (Global) |
$0.10 | $0.40 | ~$0.025 | 1M tokens (128K ved provisioned) |
Confidence: Høy for gpt-4.1 og gpt-4.1-mini (bekreftet via Content Understanding priseksempler og PTU-dokumentasjon). Moderat for gpt-4.1-nano (interpolert fra dokumenterte ratioer — 1:4 input/output).
Nøkkelfakta:
- 1 output token = 4 input tokens i PTU-utnyttelse (matchers prisratio)
- Kontekstvindu: 1 047 576 tokens (full), 128 000 tokens (standard og provisioned deployments), 300 000 tokens (batch deployments)
- Treningsdata: til og med mai 2024
- Versjon:
2025-04-14 - Batch API: 50% rabatt på Global Standard-priser
Tilgjengelige deployment-typer for GPT-4.1-serien:
- Global Standard, Data Zone Standard, Regional (Standard og Provisioned)
- Priority Processing: tilgjengelig for gpt-4.1 (ikke mini/nano)
2. GPT-5-serien — Estimert prising
Merk: GPT-5-priser er ikke publisert som faste tall per februar 2026 (Azure prisside viser $-). Estimatene nedenfor er basert på:
- Dokumentert PTU-ratio: 1 output token = 8 input tokens (kilde: offisiell PTU-dokumentasjon)
- Offentlig OpenAI API-prising (openai.com/api/pricing) ved lansering august 2025
- Prishistorikk og modellfamilieposisjonering
| Modell | Input (per 1M tokens) | Output (per 1M tokens) | Confidence | Merknader |
|---|---|---|---|---|
gpt-5 (Global) |
~$10–15 | ~$40–60 | Lav–Moderat | 1:8 output/input-ratio bekreftet. Absolutt pris ikke publisert i Azure |
gpt-5-mini (Global) |
~$1.50–3 | ~$6–12 | Lav–Moderat | Estimert. ~5–10x billigere enn gpt-5 basert på modellfamiliemønster |
gpt-5-nano (Global) |
~$0.10–0.30 | ~$0.40–1.20 | Lav | Tilsvarer gpt-4.1-nano-prisnivå. Estimert |
gpt-5-chat (Global) |
~$1.50–3 | ~$6–12 | Lav | Preview. Tilsvarer gpt-5-mini. Standard rate i Copilot Credits |
OBLIGATORISK: Verifiser alltid GPT-5-priser på offisiell Azure OpenAI prisside eller Azure Pricing Calculator før budsjettering.
Tilgjengelighetsbegrensning:
gpt-5oggpt-5-codex: Krever registrering og godkjenning (begrenset tilgang)gpt-5-mini,gpt-5-nano,gpt-5-chat: Ingen registreringskrav- Kontekstvindu: 400 000 tokens (272K input / 128K output for resonneringsmodeller)
3. Referanse: GPT-4o (sammenligning)
Kilde: Allment tilgjengelig fra Azure-dokumentasjon
| Modell | Input (per 1M tokens) | Output (per 1M tokens) | Kontekst |
|---|---|---|---|
gpt-4o (Global) |
~$2.50 | ~$10.00 | 128K |
gpt-4o-mini (Global) |
~$0.15 | ~$0.60 | 128K |
Confidence: Høy (bredt dokumentert)
4. Deployment-typer og kostnadsimplikasjon
| Deployment-type | Prismodell | Datalagring | Best for | Prediktabilitet |
|---|---|---|---|---|
| Global Standard | Pay-per-token | Ingen garanti (trafikk rutes globalt) | Høyt volum, lavest pris, ikke-sensitive data | Lav (avhenger av bruk) |
| Data Zone Standard | Pay-per-token (~5–10% høyere enn Global) | EU- eller US-region garantert | Norske virksomheter med GDPR-krav, ikke-sensitiv produksjon | Lav (avhenger av bruk) |
| Regional Standard | Pay-per-token (~10–20% høyere enn Global) | Spesifikk region (f.eks. Norway East) | Personopplysninger, kritisk compliance | Lav (avhenger av bruk) |
| Provisioned Throughput (PTU) | Fast timepris per PTU | Velges ved deployment | Forutsigbart høyvolum, latens-SLA | Høy (fast kostnad uavhengig av bruk) |
| Batch API | 50% rabatt på Global Standard | Global | Ikke-sanntidsoppgaver (24t behandlingstid) | Moderat (avhenger av bruk) |
PTU-gjennomstrømming per modell (bekreftet, offisiell dokumentasjon):
| Modell | Input TPM per PTU | Latens-SLA (p50) | Min PTU (Global) | Min PTU (Regional) |
|---|---|---|---|---|
gpt-5 |
4 750 | 99% > 50 TPS | 15 | 50 |
gpt-5-mini |
23 750 | 99% > 80 TPS | 15 | 25 |
gpt-4.1 |
3 000 | 99% > 80 TPS | 15 | 50 |
gpt-4.1-mini |
14 900 | 99% > 90 TPS | 15 | 25 |
gpt-4.1-nano |
59 400 | 99% > 100 TPS | 15 | 25 |
o4-mini |
5 400 | 99% > 90 TPS | 15 | 25 |
Confidence: Høy (direkte fra offisiell PTU-dokumentasjon)
5. Sammenligningstabeller
5a. Pris- og kapabilitetssammenligning
| Modell | Input (per 1M) | Output (per 1M) | Konfidensgrad | Kontekst | Resonneringsevne | Latens |
|---|---|---|---|---|---|---|
gpt-4o-mini |
~$0.15 | ~$0.60 | Høy | 128K | Lav | Lavest |
gpt-4.1-nano |
~$0.10 | ~$0.40 | Moderat | 1M (128K PTU) | Lav | Lavest |
gpt-4.1-mini |
$0.40 | $1.60 | Høy | 1M (128K PTU) | Lav–Moderat | Lav |
gpt-4o |
~$2.50 | ~$10.00 | Høy | 128K | Moderat | Moderat |
gpt-4.1 |
$2.00 | $8.00 | Høy | 1M (128K PTU) | Moderat | Lav–Moderat |
gpt-5-nano |
~$0.10–0.30 | ~$0.40–1.20 | Lav (estimert) | 400K | Moderat (resonnering) | Lav |
gpt-5-mini |
~$1.50–3.00 | ~$6.00–12.00 | Lav (estimert) | 400K | Høy (resonnering) | Moderat |
gpt-5 |
~$10–15 | ~$40–60 | Lav (estimert) | 400K | Svært høy (resonnering) | Høy |
5b. Relativ kostnad per 1 000 forespørsler (200 input + 100 output tokens)
| Modell | Kostnad (USD) | Kostnad (NOK, ~10.5 kurs) | Relativt vs. GPT-4.1 |
|---|---|---|---|
gpt-4.1-nano |
$0.06 | ~0.63 NOK | 95% billigere |
gpt-4.1-mini |
$0.24 | ~2.52 NOK | 80% billigere |
gpt-4.1 |
$1.20 | ~12.60 NOK | Referanse |
gpt-5-mini (estimert midtpunkt) |
~$0.90–1.80 | ~9–19 NOK | ~50% dyrere (estimert) |
gpt-5 (estimert midtpunkt) |
~$6–9 | ~63–95 NOK | ~7x dyrere (estimert) |
Confidence: Høy for gpt-4.1-serien. Lav for gpt-5-serien (estimerte priser).
6. NOK-kostnadsestimater
Valutakurs brukt: 1 USD = 10.5 NOK (veiledende, verifiser aktuell kurs)
Månedlig kostnadsestimat for typiske workloads
Scenario A: Kundestøtte chatbot (100 000 forespørsler/mnd, 150 input + 100 output tokens)
| Modell | USD/mnd | NOK/mnd | Anbefaling |
|---|---|---|---|
gpt-4.1-nano |
~$5.50 | ~58 NOK | Enkel FAQ, høyt volum |
gpt-4.1-mini |
~$22 | ~231 NOK | Standard chatbot |
gpt-4.1 |
~$110 | ~1 155 NOK | Kompleks kundesupport |
gpt-5-mini (est.) |
~$70–140 | ~735–1 470 NOK | Kun om resonnering er kritisk |
Scenario B: Dokumentanalysepipeline (10 000 dokumenter/mnd, 2 000 input + 500 output tokens)
| Modell | USD/mnd | NOK/mnd | Anbefaling |
|---|---|---|---|
gpt-4.1-mini |
~$88 | ~924 NOK | Standardanalyse |
gpt-4.1 |
~$440 | ~4 620 NOK | Juridisk/finansiell analyse |
gpt-5 (est.) |
~$2 750–4 100 | ~28 875–43 050 NOK | Kun om deep reasoning er nødvendig |
Scenario C: Batch-prosessering (50% rabatt, 500 000 forespørsler/mnd, 200 input + 50 output tokens)
| Modell | USD/mnd (batch) | NOK/mnd | Merknad |
|---|---|---|---|
gpt-4.1-nano |
~$7.00 | ~74 NOK | Klassifisering, tagging |
gpt-4.1-mini |
~$28 | ~294 NOK | Sammendrag, analyse |
gpt-4.1 |
~$140 | ~1 470 NOK | Kompleks batch |
Confidence: Moderat (beregnet fra bekreftede GPT-4.1-priser. NOK-konvertering varierer med valutakurs).
7. Copilot Credits-klassifisering
Modeller i Copilot Studio og AI Builder (Power Platform) prises etter tre takstnivåer. Dette er direkte relevant for norske offentlige virksomheter som bruker Power Platform.
| Modell | Takst-nivå | Copilot Credits | Power Platform Credits |
|---|---|---|---|
gpt-4.1-mini |
Basic | Laveste forbruk | Laveste forbruk |
gpt-4.1 |
Standard | Moderat forbruk | Moderat forbruk |
gpt-5-chat (preview) |
Standard | Moderat forbruk | Moderat forbruk |
gpt-5-reasoning (preview) |
Premium | Høyeste forbruk | Høyeste forbruk |
o3 |
Premium | Høyeste forbruk | Høyeste forbruk |
Claude Sonnet 4.5 (experimental) |
Standard | Moderat forbruk | Moderat forbruk |
Claude Opus 4.5 (experimental) |
Premium | Høyeste forbruk | Høyeste forbruk |
(Verified MCP 2026-04)
Viktige implikasjoner:
- GPT-4.1 mini er nå standardmodellen i Copilot Studio (erstattet GPT-4o mini). GPT-4o og GPT-4o mini er kun tilgjengelig i US government-regioner.
- Copilot Studio inkluderer et månedlig kvantum av Copilot Credits. Å bruke gpt-5-reasoning eller o3 tapper disse vesentlig raskere enn gpt-4.1-mini.
- Standard-rate (gpt-4.1 og gpt-5-chat) er tilgjengelig uten ekstra tilleggslisens i de fleste planer.
- Premium-rate (gpt-5-reasoning, o3, Claude Opus 4.5) kan kreve pay-as-you-go-overskudd ved høyt volum.
- Claude Sonnet 4.5 og Opus 4.5 er nå tilgjengelig i Copilot Studio (experimental, 200K kontekstvindu).
- M365 Copilot (enterprise): Inkluderer standardtilgang til GPT-5 (inkl. standard Copilot Chat). Priority Access krever M365 Copilot-lisens.
Confidence: Høy (basert på offisiell AI Builder/Copilot Studio-dokumentasjon, 2026-04)
8. GPT-5 Reasoning-nivåer og kostnad
GPT-5 introducerer fire justerbare tenkningsnivåer. Kostnad og latens skalerer med tenkningsdybde.
| Resonneringsnivå | Beskrivelse | Latens | Relativ kostnad | Bruksområde |
|---|---|---|---|---|
| Minimal | Svært få interne resonneringstokens | Raskest | Lavest | Bulk-operasjoner, enkle transformasjoner |
| Low | Let resonnering, rask vurdering | Rask | Lav | Triage, korte svar, enkle redigeringer |
| Medium (default) | Balansert dybde vs. hastighet | Moderat | Middels | Innholdsdrafting, moderat koding, RAG Q&A |
| High | Dyp, flertrinns "think-through" | Tregest | Høyest | Kompleks planlegging, analyse, multi-hop reasoning |
Viktig: Samme resonneringsnivå-logikk gjelder for gpt-5, gpt-5-mini og gpt-5-nano. Absolutt kostnad og latens skalerer ned med mini og nano, men avveiningene er identiske.
Parallelle verktøykall: Støttes IKKE ved Minimal reasoning_effort. Bruk Low/Medium/High for agentbruk.
Confidence: Høy (direkte fra offisiell GPT-5 model choice guide, februar 2026)
9. Optimaliseringsstrategier
Strategi 1: Modelltiering (Small → Medium → Large)
Trigger: Klassifiser forespørselskompleksitet FØR valg av modell
Tier 1 — Nano (enkle oppgaver):
- Klassifisering, tagging, enkle strukturerte outputs
- Modell: gpt-4.1-nano
- Estimert kostnad: ~$0.10–0.40/1M tokens
Tier 2 — Mini (standard oppgaver):
- Chatbots, drafting, RAG Q&A, oppsummering
- Modell: gpt-4.1-mini
- Estimert kostnad: ~$0.40–1.60/1M tokens
Tier 3 — Full (komplekse oppgaver):
- Juridisk analyse, flertrinns planlegging, agenter
- Modell: gpt-4.1 eller gpt-5-mini
- Estimert kostnad: $2–8/1M tokens (gpt-4.1)
Besparelsespotensial: 60–80% vs. alltid bruke gpt-4.1
Strategi 2: Model Router (Azure AI Foundry)
Azure AI Foundry Model Router analyserer prompt-kompleksitet og velger automatisk den mest kostnadseffektive modellen.
- Potensiell besparelse: Opptil 60% vs. å alltid bruke GPT-5-familien (dokumentert av Microsoft)
- Implementering: Deploy Model Router i Azure AI Foundry, konfigurer underliggende modeller
- Ingen kodeendringer: Transparente for applikasjonen
Confidence: Høy (Model Router er GA-funksjonalitet, besparelsestallet er dokumentert av Microsoft)
Strategi 3: Batch API (50% rabatt)
For ikke-sanntidsoppgaver med 24-timers SLA:
- Nattlig rapportgenerering og sammendrag
- Innholdsmoderering
- Masseopplastings-analyse
- E-postklassifisering
Besparelsespotensial: Fast 50% rabatt på Global Standard-pris
Strategi 4: Prompt Caching (Cached Input)
Gjenbruk av identisk kontekst (system prompt, dokumenter) aktiverer cached input-prising:
- gpt-4.1: cached input ~$0.50/1M (75% rabatt vs. full input)
- Spesielt effektivt for RAG-løsninger med fast system prompt
- Krever identisk prefiks (prompt caching aktiveres automatisk for repeterende kontekst)
Confidence: Moderat (caching-ratio er estimert, ikke bekreftet for alle modeller per februar 2026)
Strategi 5: PTU ved forutsigbart høyt volum
Bruk PTU når:
- Volum er forutsigbart (>70% utnyttelse)
- Latens-SLA er kritisk
- Månedlig token-volum er høyt nok til at fast PTU-kostnad er lavere enn pay-per-token
PTU break-even (illustrativt for gpt-4.1):
Pay-per-token: 3 000 000 tokens/mnd × $2.00/1M = $6/mnd per ~1M monthly tokens
PTU: 1 PTU = 3 000 input TPM = ~130M tokens/mnd kapasitet
Break-even: Når pay-per-token overstiger PTU-timeprisen × 730 timer/mnd
Bruk Azure AI Foundry PTU-kalkulator for presis beregning.
Confidence: Høy (PTU TPM-verdier er offisielt dokumentert. Break-even avhenger av PTU-timepris som ikke er publisert)
Strategi 6: Reasoning-nivå-optimalisering (GPT-5)
def select_reasoning_effort(task_type: str) -> str:
if task_type in ["classification", "summarization", "simple_qa"]:
return "low" # 40–60% billigere enn high
elif task_type in ["content_drafting", "rag_qa", "moderate_coding"]:
return "medium" # Standard valg
elif task_type in ["legal_analysis", "complex_planning", "multihop_reasoning"]:
return "high" # Maks nøyaktighet
else:
return "medium" # Sikker default
Besparelsespotensial: 40–60% kostnadsreduksjon vs. alltid bruke high reasoning
Beslutningsveiledning
Beslutningstre: GPT-4.1 vs. GPT-5
START
|
V
Krever oppgaven dyp, flertrinns resonnering?
├─ JA → Er resonnering viktigere enn kostnad/latens?
│ ├─ JA → GPT-5 (juster reasoning_effort)
│ └─ NEI → GPT-4.1 (raskere, billigere, tilstrekkelig for de fleste)
└─ NEI → Er oppgaven voluminøs og/eller latens-sensitiv?
├─ JA → GPT-4.1-mini eller GPT-4.1-nano
└─ NEI → GPT-4.1-mini (balanse mellom kostnad og kvalitet)
Scenario-basert anbefaling
| Scenario | Anbefalt modell | Kostnadsnivå (NOK/mnd, 100K forespørsler) |
|---|---|---|
| Enkel FAQ-bot | gpt-4.1-nano | ~58 NOK |
| Kundestøtte chatbot | gpt-4.1-mini + Model Router | ~231 NOK |
| Juridisk dokumentanalyse | gpt-4.1 eller gpt-5 (high) | ~1 155–8 000+ NOK |
| Kode-assistent | gpt-5-mini (medium reasoning) | Estimert ~700–1 500 NOK |
| Nattlig rapport (batch) | gpt-4.1-mini (batch) | ~116 NOK (50% rabatt) |
| Enterprise Copilot (Copilot Studio) | gpt-4.1 (Standard Credits) | Innenfor inkluderte Credits |
| RAG Q&A (norsk offentlig sektor) | gpt-4.1-mini + caching | ~116–231 NOK |
Confidence: Moderat (NOK-estimater basert på illustrative priser. GPT-5-scenarioer er estimert)
Valg av deployment-type
Norsk offentlig sektor:
Personopplysninger → Regional Standard (Norway East) + gpt-4.1-mini/gpt-4.1
Ikke-sensitiv data → Data Zone Standard (EU) for litt lavere kostnad
Høyvolum produksjon → PTU (ved forutsigbart volum)
Utvikling/testing → Global Standard (lavest pris, ingen compliance-garanti)
Batch (ikke-sanntid) → Batch API (50% rabatt på Global)
Offentlig sektor (Norge)
Compliance og dataplassering vs. kostnad
| Deployment-type | Garantert dataplassering | Estimert kostnadsnivå | Anbefaling |
|---|---|---|---|
| Norway East Regional | Ja (Norway East) | Høyest (~10–20% over Global) | Personopplysninger (GDPR) |
| EU Data Zone | EU-region (ikke spesifikt Norway) | Moderat (~5–10% over Global) | Ikke-sensitive data, EU GDPR |
| Global Standard | Ingen garanti | Lavest | Kun ikke-sensitiv utvikling/test |
Anbefaling for offentlig sektor:
- All behandling av personopplysninger: Regional Standard — Norway East
- Ikke-sensitiv AI-bruk i produksjon: Data Zone Standard (EU) for moderat kostnadssparing
- Testing og utvikling: Global Standard
- Høyvolum stabile workloads: Vurder PTU i Norway East for latens-SLA + forutsigbar kostnad
TCO-estimat for offentlig AI-prosjekt med GPT-4.1
| Kostnadselement | Estimat (50K forespørsler/mnd) | Optimalisering |
|---|---|---|
| gpt-4.1-mini inferens (Norway East) | ~1 300–2 600 NOK/mnd | Bytt til Data Zone hvis compliance tillater |
| gpt-4.1 for komplekse forespørsler (10%) | ~1 200 NOK/mnd | Model Router automatiserer valget |
| Azure AI Search (RAG) | 3 000–10 000 NOK/mnd | Optimaliser indeks og chunking |
| Azure Monitor/logging | 1 000–3 000 NOK/mnd | Sett sampling-rate |
| Estimert total | ~6 000–16 000 NOK/mnd |
Confidence: Lav–Moderat (estimater er generelle. Varierer med volum, latens, og faktisk PTU-prising)
Integrasjon med Microsoft-stakken
Azure AI Foundry: Model Catalog og Router
- Alle GPT-4.1- og GPT-5-modeller tilgjengelig i Azure AI Foundry
- Model Router automatiserer modellvalg — opptil 60% kostnadssparing (dokumentert)
- Foundry PTU-kalkulator: ai.azure.com/resource/calculator
Copilot Studio
- Default modell: gpt-4.1-mini (Basic rate — laveste Copilot Credits-forbruk)
- Brukeren kan manuelt velge gpt-4.1 (Standard) eller gpt-5-reasoning (Premium) per prompt
- Copilot Credits-kvantum inkludert i lisenspakke; overskudd faktureres via pay-as-you-go
AI Builder (Power Platform)
- Default modell: gpt-4.1-mini (Basic rate prompt builder credits)
- Modeller tilgjengelig: gpt-4.1-mini (Basic), gpt-4.1 (Standard), gpt-5-chat (Standard), gpt-5-reasoning (Premium), gpt-5.2-variants (experimental)
- Prompt builder credits forbrukes per kall; inkludert i premium Power Platform-planer (500 credits/bruker/mnd)
Azure Cost Management
- Grupper kostnader etter
Meterfor per-modell kostnadssporing - Sett budsjetter med alerts ved 50%, 75%, 90%
- Tag-strategi:
model,deployment-type,project,cost-center
Kostnad og lisensiering
Lisensmodeller og AI-kostnadsdekning
| Produkt | Lisensmodell | GPT-4.1-mini | GPT-4.1 | GPT-5 |
|---|---|---|---|---|
| Azure OpenAI | Pay-per-token / PTU | Betalt separat | Betalt separat | Betalt separat |
| Copilot Studio | Per bruker/mnd | Basic Credits (inkludert) | Standard Credits (inkludert til volum-limit) | Premium Credits (tillegg ved høyt volum) |
| Power Platform (premium) | Per bruker/mnd | Basic prompt builder credits | Standard credits | Premium credits (ekstra) |
| M365 Copilot | Per bruker/mnd (~360 USD/bruker) | Inkludert | Inkludert | Standard-tilgang inkludert |
GPT-5 tilgjengelighets- og registreringsstatus
| Modell | Tilgjengelighet | Registrering |
|---|---|---|
gpt-5 |
GA (begrenset) | Krever godkjenning (aka.ms/oai/gpt5access) |
gpt-5-mini |
GA | Ikke nødvendig |
gpt-5-nano |
GA | Ikke nødvendig |
gpt-5-chat |
Preview (2 versjoner) | Ikke nødvendig |
gpt-5-codex |
GA (begrenset) | Krever godkjenning |
gpt-5-pro |
GA (begrenset) | Kun MCA-E/Default-abonnementer |
For arkitekten (Cosmo)
Når bruke denne referansen
Triggers:
- Bruker spør om priser på GPT-4.1 eller GPT-5
- Bruker vil vite forskjellen mellom GPT-4.1-nano, mini og full
- Budsjettering av Azure OpenAI-kostnader (NOK)
- Valg mellom GPT-4.1 og GPT-5 for et gitt use case
- Copilot Credits-planlegging i Copilot Studio eller AI Builder
Rådgivningsprosess
1. Bekreft bruksbehovet:
- Latenskrav (sanntid < 200ms? Batch OK?)
- Resonneringsbehov (enkel klassifisering vs. juridisk analyse)
- Volum (forespørsler/mnd, tokens/forespørsel)
- Compliance (Norway East, EU Data Zone, Global?)
- Platform (Azure OpenAI direkte, Copilot Studio, AI Builder)
2. Velg modell med beslutningstreet:
- Bruk treet i "Beslutningsveiledning"
- Default: Start med gpt-4.1-mini. Oppgrader kun ved bevist behov.
3. Estimer kostnad:
- Bekreftede priser: gpt-4.1-serien
- Estimerte priser: gpt-5-serien (marker alltid som estimat)
- Konverter til NOK (10.5 NOK/USD veiledende)
- Inkluder deployment-type-premie for Norway East
4. Valider med offisiell kilde:
- Alltid linke til Azure OpenAI Pricing
- For PTU: Azure AI Foundry Calculator
Confidence-markers i rådgivning
| Situasjon | Marker |
|---|---|
| GPT-4.1-priser | "Bekreftet $2.00/$8.00 per 1M tokens (input/output)" |
| GPT-5-priser | "Estimert ~$10–15/$40–60 per 1M tokens — verifiser på prisside" |
| NOK-konvertering | "Indikativt ved kurs 10.5 NOK/USD — verifiser aktuell kurs" |
| Copilot Credits | "Bekreftet Basic/Standard/Premium-klassifisering per modell" |
Vanlige spørsmål og svar
Q: "Er GPT-5 alltid bedre enn GPT-4.1?" A: Nei. GPT-5 er bedre for dyp resonnering. For sanntids-chatbots, høyvolum-RAG og enkle oppgaver er GPT-4.1 raskere, billigere og tilstrekkelig god. Start med GPT-4.1.
Q: "Hva koster GPT-5 i Norge?" A: Priser er ikke offentlig tilgjengelig per februar 2026. Basert på PTU-dokumentasjon (1:8 ratio) og OpenAI API-annonsering er det estimert ~$10–15 per 1M input-tokens. Verifiser alltid på Azure prisside eller kontakt Microsoft.
Q: "Skal vi bruke gpt-4.1-mini eller gpt-4.1 i Copilot Studio?" A: Start med gpt-4.1-mini (Basic rate, laveste Credits-forbruk). Bytt til gpt-4.1 kun for oppgaver som krever mer kompleks resonnering eller høyere kvalitet — test og mål først.
Q: "Hva er break-even for PTU vs. pay-per-token?" A: Bruk Azure AI Foundry PTU-kalkulator. Som tommelfingerregel: PTU er lønnsomt ved >70% gjennomsnittlig utnyttelse og stabilt volum over 3+ måneder.
Q: "Påvirker ny GPT-5-tilgjengelighet Copilot Credits-forbruket vårt?" A: Ja. Hvis brukere i Copilot Studio velger gpt-5-reasoning (Preview, Premium rate) i stedet for gpt-4.1-mini (Basic), kan Credits-forbruket øke 5–10x. Overvåk forbruk via Power Platform admin center og sett budsjetter.
Vanlige fallgruver
| Fallgruve | Konsekvens | Hvordan unngå |
|---|---|---|
| Bruke GPT-5 for enkle chatbot-svar | 5–20x høyere kostnad enn nødvendig | Start alltid med GPT-4.1-mini. Oppgrader kun ved bevist behov |
| Ikke skille mellom Global og Regional prising | 10–20% budsjett-avvik | Inkluder alltid deployment-type-premie i estimater for norsk sektor |
| Oppgi GPT-5-priser som bekreftet | Budsjett-overskridelse eller undervurdering | Marker alltid GPT-5-priser som estimert |
| Glemme Batch API-rabatt for natt-jobber | 2x høyere kostnad enn nødvendig | Vurder Batch API for alle ikke-sanntids workloads |
| Ikke monitorere Copilot Credits-forbruk | Uventet faktura ved GPT-5/o3-bruk | Sett Credits-budsjetter i Power Platform admin center |
Kilder og verifisering
Primærkilder (Microsoft Learn, bekreftet februar 2026)
-
GPT-5 vs GPT-4.1: choosing the right model for your use case URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/how-to/model-choice-guide?view=foundry-classic Hentet: 2026-02 Innhold: Modellsammenligning, reasoning-nivåer, latens-trade-offs, use-case guidance
-
Foundry Models sold directly by Azure — GPT-4.1 og GPT-5-serien URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/concepts/models-sold-directly-by-azure?view=foundry-classic Hentet: 2026-02 Innhold: Kontekstvindu, max output tokens, treningsdata, versjonsoversikt, tilgjengelighetskrav
-
Provisioned throughput unit (PTU) costs and billing URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding?view=foundry-classic Hentet: 2026-02 Innhold: PTU-kapasitet per modell (TPM/PTU), min deployment, latens-SLA, input/output-ratio (1:4 for gpt-4.1, 1:8 for gpt-5)
-
Pricing for Azure Content Understanding in Foundry Tools URL: https://learn.microsoft.com/azure/ai-services/content-understanding/pricing-explainer Hentet: 2026-02 Innhold: Priseksempler med gpt-4.1 Global ($2/$8) og gpt-4.1-mini Global ($0.40/$1.60) bekreftet
-
Azure OpenAI in Microsoft Foundry Models quotas and limits URL: https://learn.microsoft.com/azure/ai-foundry/openai/quotas-limits?view=foundry-classic Hentet: 2026-02 Innhold: GPT-5- og GPT-4.1-seriens kvotestruktur, usage tiers, deployment-typer
-
Change the model version and settings (AI Builder/Copilot Studio) URL: https://learn.microsoft.com/microsoft-copilot-studio/prompt-model-settings Hentet: 2026-02 Innhold: Copilot Credits-klassifisering (Basic/Standard/Premium) per modell, tilgjengelige modeller
-
Cost management for fine-tuning URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic Hentet: 2026-02 Innhold: Fine-tuning kostnad, hosting $1.70/time (o4-mini eksempel)
-
Plan and manage costs for Microsoft Foundry URL: https://learn.microsoft.com/azure/ai-foundry/concepts/manage-costs?view=foundry-classic Hentet: 2026-02 Innhold: Billing-modell, token-basert prising, 1K-token enheter
Referanseprisside (verifiser for oppdaterte tall)
-
Azure OpenAI Pricing Page URL: https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/ Note: Dynamisk side (krever JavaScript). Sjekk manuelt for eksakte GPT-5-priser når de publiseres.
-
Azure AI Foundry PTU Calculator URL: https://ai.azure.com/resource/calculator Note: Beregn PTU break-even for spesifikke workloads
Verifiseringsstatus
| Påstand | Kilde | Confidence |
|---|---|---|
| gpt-4.1 Global: $2.00 input, $8.00 output per 1M | Kilde 4 (Content Understanding eksempel) | Høy |
| gpt-4.1-mini Global: $0.40 input, $1.60 output per 1M | Kilde 4 (Content Understanding eksempel) | Høy |
| gpt-5: 1 output token = 8 input tokens (PTU-ratio) | Kilde 3 (PTU-dokumentasjon) | Høy |
| gpt-4.1: 1 output token = 4 input tokens (PTU-ratio) | Kilde 3 (PTU-dokumentasjon) | Høy |
| gpt-4.1 PTU: 3 000 TPM/PTU | Kilde 3 | Høy |
| gpt-5 PTU: 4 750 TPM/PTU | Kilde 3 | Høy |
| gpt-4.1-mini Copilot: Basic rate | Kilde 6 | Høy |
| gpt-4.1 Copilot: Standard rate | Kilde 6 | Høy |
| gpt-5-reasoning Copilot: Premium rate | Kilde 6 | Høy |
| Batch API: 50% rabatt | Kilde 1/Azure prisside | Høy |
| GPT-5 absolutte tokenpriser | Ikke bekreftet (Azure prisside $-) | Lav |
| gpt-4.1-nano prising | Ikke direkte bekreftet, interpolert | Moderat |
Totalt antall kilder: 10 (8 primære Microsoft Learn, 2 pricing-referanser) MCP-kall brukt: 5 (4x docs_search, 1x docs_fetch — model-choice-guide)
Siste oppdatering og gyldighet
Dokumentasjonsdato: Februar 2026 Bekreftede priser gyldige per: Februar 2026 (GPT-4.1-serien) Estimerte priser: GPT-5-serien — verifiser på offisiell prisside Neste review anbefalt: Mai 2026 (GPT-5-priser forventes publisert; sjekk kvartalsvis)
Dokumenteier: Cosmo Skyberg, Microsoft AI Solution Architect Godkjent for: Offentlig sektor Norge, Enterprise Azure-kunder Versjon: 1.0