ktg-plugin-marketplace/plugins/ms-ai-architect/skills/ms-ai-security/references/cost-optimization/gpt5-gpt41-pricing-models.md
Kjell Tore Guttormsen ad8a411f38 docs(architect): weekly KB update — 66 files refreshed (2026-04)
Updated 66 stale knowledge base reference files (10 critical, 56 high)
across all 5 skills using Microsoft Learn MCP research.

Key factual updates:
- Groundedness Detection API: `correction` → `mitigating` param,
  `correctedText` → `correctionText` (breaking change)
- Copilot Studio: GPT-4.1 mini now default (was GPT-4o mini);
  Claude Sonnet 4.5 + Opus 4.5 added (experimental, 200K ctx)
- Agentic Retrieval: still public preview; 50M free tokens/month
- Azure security baselines: "Cognitive Services" → "Foundry Tools"
- Databricks: Delta Live Tables → Lakeflow Spark Declarative Pipelines
- MLflow 3 GenAI: new Feedback/Expectation data model
- Token tracking doc: "Azure OpenAI in Foundry Models through a gateway"
- Agent Registry: Risks column (M365 E7), Graph API (preview)
- Copilot DLP: new Entra AI Admin + Purview Data Security AI Admin roles
- ISO/IEC 42001: scope expanded to M365 Copilot, Foundry, Security Copilot
- Zero Trust: CAE now via Conditional Access, Strict Location Enforcement
- Purview: new Fabric Copilots/agents governance section
- AG-UI HITL: ApprovalRequiredAIFunction (C#), @tool approval_mode (Python)

All files: Last updated → 2026-04, *(Verified MCP 2026-04)* markers added.
Build registry: 1341 URLs from 387 files (+2 new URLs).

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-09 22:41:26 +02:00

29 KiB
Raw Blame History

GPT-5 og GPT-4.1: Prismodeller og kostnadsoptimalisering

Last updated: 2026-04 Status: GA (GPT-4.1-serien), GA (GPT-5-serien, begrenset tilgang for gpt-5 og gpt-5-codex) Category: Cost Optimization & FinOps for AI


Introduksjon

GPT-5- og GPT-4.1-seriene er de to nyeste flaggskipmodellene fra OpenAI tilgjengelig i Azure AI Foundry. De representerer to distinkte designfilosofier: GPT-5 optimalisert for dyp resonnering og komplekse oppgaver, GPT-4.1 optimalisert for hastighet, gjennomstrømming og kostnadseffektivitet.

Confidence: Høy (basert på offisiell Microsoft-dokumentasjon, februar 2026)

Denne referansen dekker:

  • Bekreftet og estimert prising per 1M tokens (USD og NOK)
  • Deployment-typer og deres kostnadsimplikasjon
  • Sammenligningstabeller (GPT-4o vs. GPT-4.1 vs. GPT-5)
  • Copilot Credits-klassifisering per modell
  • Optimaliserings­strategier og beslutningsveiledning

Viktig merknad om priser: Azure prisside (azure.microsoft.com/pricing) benytter JavaScript-rendering og returnerer tomme verdier ved programmatisk henting. Bekreftede priser er hentet fra Microsoft Learn-dokumentasjon og Content Understanding-eksempler. GPT-5-priser er ikke offentlig tilgjengelig som faste tall per februar 2026 — estimater er basert på offentliggjorte ratioer og prishistorikk.


Kjernekomponenter

1. GPT-4.1-serien — Bekreftet prising

Kilde: Azure Content Understanding-dokumentasjon, Azure AI Foundry provisioned throughput-dokumentasjon (bekreftet 1:4 input/output-ratio)

Modell Input (per 1M tokens) Output (per 1M tokens) Cached Input Kontekst
gpt-4.1 (Global) $2.00 $8.00 ~$0.50 1M tokens (128K ved provisioned)
gpt-4.1-mini (Global) $0.40 $1.60 ~$0.10 1M tokens (128K ved provisioned)
gpt-4.1-nano (Global) $0.10 $0.40 ~$0.025 1M tokens (128K ved provisioned)

Confidence: Høy for gpt-4.1 og gpt-4.1-mini (bekreftet via Content Understanding priseksempler og PTU-dokumentasjon). Moderat for gpt-4.1-nano (interpolert fra dokumenterte ratioer — 1:4 input/output).

Nøkkelfakta:

  • 1 output token = 4 input tokens i PTU-utnyttelse (matchers prisratio)
  • Kontekstvindu: 1 047 576 tokens (full), 128 000 tokens (standard og provisioned deployments), 300 000 tokens (batch deployments)
  • Treningsdata: til og med mai 2024
  • Versjon: 2025-04-14
  • Batch API: 50% rabatt på Global Standard-priser

Tilgjengelige deployment-typer for GPT-4.1-serien:

  • Global Standard, Data Zone Standard, Regional (Standard og Provisioned)
  • Priority Processing: tilgjengelig for gpt-4.1 (ikke mini/nano)

2. GPT-5-serien — Estimert prising

Merk: GPT-5-priser er ikke publisert som faste tall per februar 2026 (Azure prisside viser $-). Estimatene nedenfor er basert på:

  1. Dokumentert PTU-ratio: 1 output token = 8 input tokens (kilde: offisiell PTU-dokumentasjon)
  2. Offentlig OpenAI API-prising (openai.com/api/pricing) ved lansering august 2025
  3. Prishistorikk og modellfamilieposisjonering
Modell Input (per 1M tokens) Output (per 1M tokens) Confidence Merknader
gpt-5 (Global) ~$1015 ~$4060 LavModerat 1:8 output/input-ratio bekreftet. Absolutt pris ikke publisert i Azure
gpt-5-mini (Global) ~$1.503 ~$612 LavModerat Estimert. ~510x billigere enn gpt-5 basert på modellfamiliemønster
gpt-5-nano (Global) ~$0.100.30 ~$0.401.20 Lav Tilsvarer gpt-4.1-nano-prisnivå. Estimert
gpt-5-chat (Global) ~$1.503 ~$612 Lav Preview. Tilsvarer gpt-5-mini. Standard rate i Copilot Credits

OBLIGATORISK: Verifiser alltid GPT-5-priser på offisiell Azure OpenAI prisside eller Azure Pricing Calculator før budsjettering.

Tilgjengelighetsbegrensning:

  • gpt-5 og gpt-5-codex: Krever registrering og godkjenning (begrenset tilgang)
  • gpt-5-mini, gpt-5-nano, gpt-5-chat: Ingen registreringskrav
  • Kontekstvindu: 400 000 tokens (272K input / 128K output for resonneringsmodeller)

3. Referanse: GPT-4o (sammenligning)

Kilde: Allment tilgjengelig fra Azure-dokumentasjon

Modell Input (per 1M tokens) Output (per 1M tokens) Kontekst
gpt-4o (Global) ~$2.50 ~$10.00 128K
gpt-4o-mini (Global) ~$0.15 ~$0.60 128K

Confidence: Høy (bredt dokumentert)


4. Deployment-typer og kostnadsimplikasjon

Deployment-type Prismodell Datalagring Best for Prediktabilitet
Global Standard Pay-per-token Ingen garanti (trafikk rutes globalt) Høyt volum, lavest pris, ikke-sensitive data Lav (avhenger av bruk)
Data Zone Standard Pay-per-token (~510% høyere enn Global) EU- eller US-region garantert Norske virksomheter med GDPR-krav, ikke-sensitiv produksjon Lav (avhenger av bruk)
Regional Standard Pay-per-token (~1020% høyere enn Global) Spesifikk region (f.eks. Norway East) Personopplysninger, kritisk compliance Lav (avhenger av bruk)
Provisioned Throughput (PTU) Fast timepris per PTU Velges ved deployment Forutsigbart høyvolum, latens-SLA Høy (fast kostnad uavhengig av bruk)
Batch API 50% rabatt på Global Standard Global Ikke-sanntidsoppgaver (24t behandlingstid) Moderat (avhenger av bruk)

PTU-gjennomstrømming per modell (bekreftet, offisiell dokumentasjon):

Modell Input TPM per PTU Latens-SLA (p50) Min PTU (Global) Min PTU (Regional)
gpt-5 4 750 99% > 50 TPS 15 50
gpt-5-mini 23 750 99% > 80 TPS 15 25
gpt-4.1 3 000 99% > 80 TPS 15 50
gpt-4.1-mini 14 900 99% > 90 TPS 15 25
gpt-4.1-nano 59 400 99% > 100 TPS 15 25
o4-mini 5 400 99% > 90 TPS 15 25

Confidence: Høy (direkte fra offisiell PTU-dokumentasjon)


5. Sammenligningstabeller

5a. Pris- og kapabilitetssammenligning

Modell Input (per 1M) Output (per 1M) Konfidensgrad Kontekst Resonneringsevne Latens
gpt-4o-mini ~$0.15 ~$0.60 Høy 128K Lav Lavest
gpt-4.1-nano ~$0.10 ~$0.40 Moderat 1M (128K PTU) Lav Lavest
gpt-4.1-mini $0.40 $1.60 Høy 1M (128K PTU) LavModerat Lav
gpt-4o ~$2.50 ~$10.00 Høy 128K Moderat Moderat
gpt-4.1 $2.00 $8.00 Høy 1M (128K PTU) Moderat LavModerat
gpt-5-nano ~$0.100.30 ~$0.401.20 Lav (estimert) 400K Moderat (resonnering) Lav
gpt-5-mini ~$1.503.00 ~$6.0012.00 Lav (estimert) 400K Høy (resonnering) Moderat
gpt-5 ~$1015 ~$4060 Lav (estimert) 400K Svært høy (resonnering) Høy

5b. Relativ kostnad per 1 000 forespørsler (200 input + 100 output tokens)

Modell Kostnad (USD) Kostnad (NOK, ~10.5 kurs) Relativt vs. GPT-4.1
gpt-4.1-nano $0.06 ~0.63 NOK 95% billigere
gpt-4.1-mini $0.24 ~2.52 NOK 80% billigere
gpt-4.1 $1.20 ~12.60 NOK Referanse
gpt-5-mini (estimert midtpunkt) ~$0.901.80 ~919 NOK ~50% dyrere (estimert)
gpt-5 (estimert midtpunkt) ~$69 ~6395 NOK ~7x dyrere (estimert)

Confidence: Høy for gpt-4.1-serien. Lav for gpt-5-serien (estimerte priser).


6. NOK-kostnadsestimater

Valutakurs brukt: 1 USD = 10.5 NOK (veiledende, verifiser aktuell kurs)

Månedlig kostnadsestimat for typiske workloads

Scenario A: Kundestøtte chatbot (100 000 forespørsler/mnd, 150 input + 100 output tokens)

Modell USD/mnd NOK/mnd Anbefaling
gpt-4.1-nano ~$5.50 ~58 NOK Enkel FAQ, høyt volum
gpt-4.1-mini ~$22 ~231 NOK Standard chatbot
gpt-4.1 ~$110 ~1 155 NOK Kompleks kundesupport
gpt-5-mini (est.) ~$70140 ~7351 470 NOK Kun om resonnering er kritisk

Scenario B: Dokumentanalysepipeline (10 000 dokumenter/mnd, 2 000 input + 500 output tokens)

Modell USD/mnd NOK/mnd Anbefaling
gpt-4.1-mini ~$88 ~924 NOK Standardanalyse
gpt-4.1 ~$440 ~4 620 NOK Juridisk/finansiell analyse
gpt-5 (est.) ~$2 7504 100 ~28 87543 050 NOK Kun om deep reasoning er nødvendig

Scenario C: Batch-prosessering (50% rabatt, 500 000 forespørsler/mnd, 200 input + 50 output tokens)

Modell USD/mnd (batch) NOK/mnd Merknad
gpt-4.1-nano ~$7.00 ~74 NOK Klassifisering, tagging
gpt-4.1-mini ~$28 ~294 NOK Sammendrag, analyse
gpt-4.1 ~$140 ~1 470 NOK Kompleks batch

Confidence: Moderat (beregnet fra bekreftede GPT-4.1-priser. NOK-konvertering varierer med valutakurs).


7. Copilot Credits-klassifisering

Modeller i Copilot Studio og AI Builder (Power Platform) prises etter tre takstnivåer. Dette er direkte relevant for norske offentlige virksomheter som bruker Power Platform.

Modell Takst-nivå Copilot Credits Power Platform Credits
gpt-4.1-mini Basic Laveste forbruk Laveste forbruk
gpt-4.1 Standard Moderat forbruk Moderat forbruk
gpt-5-chat (preview) Standard Moderat forbruk Moderat forbruk
gpt-5-reasoning (preview) Premium Høyeste forbruk Høyeste forbruk
o3 Premium Høyeste forbruk Høyeste forbruk
Claude Sonnet 4.5 (experimental) Standard Moderat forbruk Moderat forbruk
Claude Opus 4.5 (experimental) Premium Høyeste forbruk Høyeste forbruk

(Verified MCP 2026-04)

Viktige implikasjoner:

  • GPT-4.1 mini er nå standardmodellen i Copilot Studio (erstattet GPT-4o mini). GPT-4o og GPT-4o mini er kun tilgjengelig i US government-regioner.
  • Copilot Studio inkluderer et månedlig kvantum av Copilot Credits. Å bruke gpt-5-reasoning eller o3 tapper disse vesentlig raskere enn gpt-4.1-mini.
  • Standard-rate (gpt-4.1 og gpt-5-chat) er tilgjengelig uten ekstra tilleggslisens i de fleste planer.
  • Premium-rate (gpt-5-reasoning, o3, Claude Opus 4.5) kan kreve pay-as-you-go-overskudd ved høyt volum.
  • Claude Sonnet 4.5 og Opus 4.5 er nå tilgjengelig i Copilot Studio (experimental, 200K kontekstvindu).
  • M365 Copilot (enterprise): Inkluderer standardtilgang til GPT-5 (inkl. standard Copilot Chat). Priority Access krever M365 Copilot-lisens.

Confidence: Høy (basert på offisiell AI Builder/Copilot Studio-dokumentasjon, 2026-04)


8. GPT-5 Reasoning-nivåer og kostnad

GPT-5 introducerer fire justerbare tenkningsnivåer. Kostnad og latens skalerer med tenkningsdybde.

Resonneringsnivå Beskrivelse Latens Relativ kostnad Bruksområde
Minimal Svært få interne resonneringstokens Raskest Lavest Bulk-operasjoner, enkle transformasjoner
Low Let resonnering, rask vurdering Rask Lav Triage, korte svar, enkle redigeringer
Medium (default) Balansert dybde vs. hastighet Moderat Middels Innholdsdrafting, moderat koding, RAG Q&A
High Dyp, flertrinns "think-through" Tregest Høyest Kompleks planlegging, analyse, multi-hop reasoning

Viktig: Samme resonneringsnivå-logikk gjelder for gpt-5, gpt-5-mini og gpt-5-nano. Absolutt kostnad og latens skalerer ned med mini og nano, men avveiningene er identiske.

Parallelle verktøykall: Støttes IKKE ved Minimal reasoning_effort. Bruk Low/Medium/High for agentbruk.

Confidence: Høy (direkte fra offisiell GPT-5 model choice guide, februar 2026)


9. Optimaliserings­strategier

Strategi 1: Modelltiering (Small → Medium → Large)

Trigger: Klassifiser forespørselskompleksitet FØR valg av modell

Tier 1 — Nano (enkle oppgaver):
  - Klassifisering, tagging, enkle strukturerte outputs
  - Modell: gpt-4.1-nano
  - Estimert kostnad: ~$0.100.40/1M tokens

Tier 2 — Mini (standard oppgaver):
  - Chatbots, drafting, RAG Q&A, oppsummering
  - Modell: gpt-4.1-mini
  - Estimert kostnad: ~$0.401.60/1M tokens

Tier 3 — Full (komplekse oppgaver):
  - Juridisk analyse, flertrinns planlegging, agenter
  - Modell: gpt-4.1 eller gpt-5-mini
  - Estimert kostnad: $28/1M tokens (gpt-4.1)

Besparelsespotensial: 6080% vs. alltid bruke gpt-4.1

Strategi 2: Model Router (Azure AI Foundry)

Azure AI Foundry Model Router analyserer prompt-kompleksitet og velger automatisk den mest kostnadseffektive modellen.

  • Potensiell besparelse: Opptil 60% vs. å alltid bruke GPT-5-familien (dokumentert av Microsoft)
  • Implementering: Deploy Model Router i Azure AI Foundry, konfigurer underliggende modeller
  • Ingen kodeendringer: Transparente for applikasjonen

Confidence: Høy (Model Router er GA-funksjonalitet, besparelsestallet er dokumentert av Microsoft)

Strategi 3: Batch API (50% rabatt)

For ikke-sanntidsoppgaver med 24-timers SLA:

  • Nattlig rapportgenerering og sammendrag
  • Innholdsmoderering
  • Masseopplastings-analyse
  • E-postklassifisering

Besparelsespotensial: Fast 50% rabatt på Global Standard-pris

Strategi 4: Prompt Caching (Cached Input)

Gjenbruk av identisk kontekst (system prompt, dokumenter) aktiverer cached input-prising:

  • gpt-4.1: cached input ~$0.50/1M (75% rabatt vs. full input)
  • Spesielt effektivt for RAG-løsninger med fast system prompt
  • Krever identisk prefiks (prompt caching aktiveres automatisk for repeterende kontekst)

Confidence: Moderat (caching-ratio er estimert, ikke bekreftet for alle modeller per februar 2026)

Strategi 5: PTU ved forutsigbart høyt volum

Bruk PTU når:

  • Volum er forutsigbart (>70% utnyttelse)
  • Latens-SLA er kritisk
  • Månedlig token-volum er høyt nok til at fast PTU-kostnad er lavere enn pay-per-token

PTU break-even (illustrativt for gpt-4.1):

Pay-per-token: 3 000 000 tokens/mnd × $2.00/1M = $6/mnd per ~1M monthly tokens
PTU: 1 PTU = 3 000 input TPM = ~130M tokens/mnd kapasitet
Break-even: Når pay-per-token overstiger PTU-timeprisen × 730 timer/mnd

Bruk Azure AI Foundry PTU-kalkulator for presis beregning.

Confidence: Høy (PTU TPM-verdier er offisielt dokumentert. Break-even avhenger av PTU-timepris som ikke er publisert)

Strategi 6: Reasoning-nivå-optimalisering (GPT-5)

def select_reasoning_effort(task_type: str) -> str:
    if task_type in ["classification", "summarization", "simple_qa"]:
        return "low"   # 4060% billigere enn high
    elif task_type in ["content_drafting", "rag_qa", "moderate_coding"]:
        return "medium"  # Standard valg
    elif task_type in ["legal_analysis", "complex_planning", "multihop_reasoning"]:
        return "high"  # Maks nøyaktighet
    else:
        return "medium"  # Sikker default

Besparelsespotensial: 4060% kostnadsreduksjon vs. alltid bruke high reasoning


Beslutningsveiledning

Beslutningstre: GPT-4.1 vs. GPT-5

START
  |
  V
Krever oppgaven dyp, flertrinns resonnering?
  ├─ JA → Er resonnering viktigere enn kostnad/latens?
  │        ├─ JA → GPT-5 (juster reasoning_effort)
  │        └─ NEI → GPT-4.1 (raskere, billigere, tilstrekkelig for de fleste)
  └─ NEI → Er oppgaven voluminøs og/eller latens-sensitiv?
            ├─ JA → GPT-4.1-mini eller GPT-4.1-nano
            └─ NEI → GPT-4.1-mini (balanse mellom kostnad og kvalitet)

Scenario-basert anbefaling

Scenario Anbefalt modell Kostnadsnivå (NOK/mnd, 100K forespørsler)
Enkel FAQ-bot gpt-4.1-nano ~58 NOK
Kundestøtte chatbot gpt-4.1-mini + Model Router ~231 NOK
Juridisk dokumentanalyse gpt-4.1 eller gpt-5 (high) ~1 1558 000+ NOK
Kode-assistent gpt-5-mini (medium reasoning) Estimert ~7001 500 NOK
Nattlig rapport (batch) gpt-4.1-mini (batch) ~116 NOK (50% rabatt)
Enterprise Copilot (Copilot Studio) gpt-4.1 (Standard Credits) Innenfor inkluderte Credits
RAG Q&A (norsk offentlig sektor) gpt-4.1-mini + caching ~116231 NOK

Confidence: Moderat (NOK-estimater basert på illustrative priser. GPT-5-scenarioer er estimert)

Valg av deployment-type

Norsk offentlig sektor:
  Personopplysninger → Regional Standard (Norway East) + gpt-4.1-mini/gpt-4.1
  Ikke-sensitiv data → Data Zone Standard (EU) for litt lavere kostnad
  Høyvolum produksjon → PTU (ved forutsigbart volum)
  Utvikling/testing → Global Standard (lavest pris, ingen compliance-garanti)
  Batch (ikke-sanntid) → Batch API (50% rabatt på Global)

Offentlig sektor (Norge)

Compliance og dataplassering vs. kostnad

Deployment-type Garantert dataplassering Estimert kostnadsnivå Anbefaling
Norway East Regional Ja (Norway East) Høyest (~1020% over Global) Personopplysninger (GDPR)
EU Data Zone EU-region (ikke spesifikt Norway) Moderat (~510% over Global) Ikke-sensitive data, EU GDPR
Global Standard Ingen garanti Lavest Kun ikke-sensitiv utvikling/test

Anbefaling for offentlig sektor:

  • All behandling av personopplysninger: Regional Standard — Norway East
  • Ikke-sensitiv AI-bruk i produksjon: Data Zone Standard (EU) for moderat kostnadssparing
  • Testing og utvikling: Global Standard
  • Høyvolum stabile workloads: Vurder PTU i Norway East for latens-SLA + forutsigbar kostnad

TCO-estimat for offentlig AI-prosjekt med GPT-4.1

Kostnadselement Estimat (50K forespørsler/mnd) Optimalisering
gpt-4.1-mini inferens (Norway East) ~1 3002 600 NOK/mnd Bytt til Data Zone hvis compliance tillater
gpt-4.1 for komplekse forespørsler (10%) ~1 200 NOK/mnd Model Router automatiserer valget
Azure AI Search (RAG) 3 00010 000 NOK/mnd Optimaliser indeks og chunking
Azure Monitor/logging 1 0003 000 NOK/mnd Sett sampling-rate
Estimert total ~6 00016 000 NOK/mnd

Confidence: LavModerat (estimater er generelle. Varierer med volum, latens, og faktisk PTU-prising)


Integrasjon med Microsoft-stakken

Azure AI Foundry: Model Catalog og Router

Copilot Studio

  • Default modell: gpt-4.1-mini (Basic rate — laveste Copilot Credits-forbruk)
  • Brukeren kan manuelt velge gpt-4.1 (Standard) eller gpt-5-reasoning (Premium) per prompt
  • Copilot Credits-kvantum inkludert i lisenspakke; overskudd faktureres via pay-as-you-go

AI Builder (Power Platform)

  • Default modell: gpt-4.1-mini (Basic rate prompt builder credits)
  • Modeller tilgjengelig: gpt-4.1-mini (Basic), gpt-4.1 (Standard), gpt-5-chat (Standard), gpt-5-reasoning (Premium), gpt-5.2-variants (experimental)
  • Prompt builder credits forbrukes per kall; inkludert i premium Power Platform-planer (500 credits/bruker/mnd)

Azure Cost Management

  • Grupper kostnader etter Meter for per-modell kostnadssporing
  • Sett budsjetter med alerts ved 50%, 75%, 90%
  • Tag-strategi: model, deployment-type, project, cost-center

Kostnad og lisensiering

Lisensmodeller og AI-kostnadsdekning

Produkt Lisensmodell GPT-4.1-mini GPT-4.1 GPT-5
Azure OpenAI Pay-per-token / PTU Betalt separat Betalt separat Betalt separat
Copilot Studio Per bruker/mnd Basic Credits (inkludert) Standard Credits (inkludert til volum-limit) Premium Credits (tillegg ved høyt volum)
Power Platform (premium) Per bruker/mnd Basic prompt builder credits Standard credits Premium credits (ekstra)
M365 Copilot Per bruker/mnd (~360 USD/bruker) Inkludert Inkludert Standard-tilgang inkludert

GPT-5 tilgjengelighets- og registreringsstatus

Modell Tilgjengelighet Registrering
gpt-5 GA (begrenset) Krever godkjenning (aka.ms/oai/gpt5access)
gpt-5-mini GA Ikke nødvendig
gpt-5-nano GA Ikke nødvendig
gpt-5-chat Preview (2 versjoner) Ikke nødvendig
gpt-5-codex GA (begrenset) Krever godkjenning
gpt-5-pro GA (begrenset) Kun MCA-E/Default-abonnementer

For arkitekten (Cosmo)

Når bruke denne referansen

Triggers:

  • Bruker spør om priser på GPT-4.1 eller GPT-5
  • Bruker vil vite forskjellen mellom GPT-4.1-nano, mini og full
  • Budsjettering av Azure OpenAI-kostnader (NOK)
  • Valg mellom GPT-4.1 og GPT-5 for et gitt use case
  • Copilot Credits-planlegging i Copilot Studio eller AI Builder

Rådgivningsprosess

1. Bekreft bruksbehovet:

  • Latenskrav (sanntid < 200ms? Batch OK?)
  • Resonneringsbehov (enkel klassifisering vs. juridisk analyse)
  • Volum (forespørsler/mnd, tokens/forespørsel)
  • Compliance (Norway East, EU Data Zone, Global?)
  • Platform (Azure OpenAI direkte, Copilot Studio, AI Builder)

2. Velg modell med beslutningstreet:

  • Bruk treet i "Beslutningsveiledning"
  • Default: Start med gpt-4.1-mini. Oppgrader kun ved bevist behov.

3. Estimer kostnad:

  • Bekreftede priser: gpt-4.1-serien
  • Estimerte priser: gpt-5-serien (marker alltid som estimat)
  • Konverter til NOK (10.5 NOK/USD veiledende)
  • Inkluder deployment-type-premie for Norway East

4. Valider med offisiell kilde:

Confidence-markers i rådgivning

Situasjon Marker
GPT-4.1-priser "Bekreftet $2.00/$8.00 per 1M tokens (input/output)"
GPT-5-priser "Estimert ~$1015/$4060 per 1M tokens — verifiser på prisside"
NOK-konvertering "Indikativt ved kurs 10.5 NOK/USD — verifiser aktuell kurs"
Copilot Credits "Bekreftet Basic/Standard/Premium-klassifisering per modell"

Vanlige spørsmål og svar

Q: "Er GPT-5 alltid bedre enn GPT-4.1?" A: Nei. GPT-5 er bedre for dyp resonnering. For sanntids-chatbots, høyvolum-RAG og enkle oppgaver er GPT-4.1 raskere, billigere og tilstrekkelig god. Start med GPT-4.1.

Q: "Hva koster GPT-5 i Norge?" A: Priser er ikke offentlig tilgjengelig per februar 2026. Basert på PTU-dokumentasjon (1:8 ratio) og OpenAI API-annonsering er det estimert ~$1015 per 1M input-tokens. Verifiser alltid på Azure prisside eller kontakt Microsoft.

Q: "Skal vi bruke gpt-4.1-mini eller gpt-4.1 i Copilot Studio?" A: Start med gpt-4.1-mini (Basic rate, laveste Credits-forbruk). Bytt til gpt-4.1 kun for oppgaver som krever mer kompleks resonnering eller høyere kvalitet — test og mål først.

Q: "Hva er break-even for PTU vs. pay-per-token?" A: Bruk Azure AI Foundry PTU-kalkulator. Som tommelfingerregel: PTU er lønnsomt ved >70% gjennomsnittlig utnyttelse og stabilt volum over 3+ måneder.

Q: "Påvirker ny GPT-5-tilgjengelighet Copilot Credits-forbruket vårt?" A: Ja. Hvis brukere i Copilot Studio velger gpt-5-reasoning (Preview, Premium rate) i stedet for gpt-4.1-mini (Basic), kan Credits-forbruket øke 510x. Overvåk forbruk via Power Platform admin center og sett budsjetter.

Vanlige fallgruver

Fallgruve Konsekvens Hvordan unngå
Bruke GPT-5 for enkle chatbot-svar 520x høyere kostnad enn nødvendig Start alltid med GPT-4.1-mini. Oppgrader kun ved bevist behov
Ikke skille mellom Global og Regional prising 1020% budsjett-avvik Inkluder alltid deployment-type-premie i estimater for norsk sektor
Oppgi GPT-5-priser som bekreftet Budsjett-overskridelse eller undervurdering Marker alltid GPT-5-priser som estimert
Glemme Batch API-rabatt for natt-jobber 2x høyere kostnad enn nødvendig Vurder Batch API for alle ikke-sanntids workloads
Ikke monitorere Copilot Credits-forbruk Uventet faktura ved GPT-5/o3-bruk Sett Credits-budsjetter i Power Platform admin center

Kilder og verifisering

Primærkilder (Microsoft Learn, bekreftet februar 2026)

  1. GPT-5 vs GPT-4.1: choosing the right model for your use case URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/how-to/model-choice-guide?view=foundry-classic Hentet: 2026-02 Innhold: Modellsammenligning, reasoning-nivåer, latens-trade-offs, use-case guidance

  2. Foundry Models sold directly by Azure — GPT-4.1 og GPT-5-serien URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/concepts/models-sold-directly-by-azure?view=foundry-classic Hentet: 2026-02 Innhold: Kontekstvindu, max output tokens, treningsdata, versjonsoversikt, tilgjengelighetskrav

  3. Provisioned throughput unit (PTU) costs and billing URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding?view=foundry-classic Hentet: 2026-02 Innhold: PTU-kapasitet per modell (TPM/PTU), min deployment, latens-SLA, input/output-ratio (1:4 for gpt-4.1, 1:8 for gpt-5)

  4. Pricing for Azure Content Understanding in Foundry Tools URL: https://learn.microsoft.com/azure/ai-services/content-understanding/pricing-explainer Hentet: 2026-02 Innhold: Priseksempler med gpt-4.1 Global ($2/$8) og gpt-4.1-mini Global ($0.40/$1.60) bekreftet

  5. Azure OpenAI in Microsoft Foundry Models quotas and limits URL: https://learn.microsoft.com/azure/ai-foundry/openai/quotas-limits?view=foundry-classic Hentet: 2026-02 Innhold: GPT-5- og GPT-4.1-seriens kvotestruktur, usage tiers, deployment-typer

  6. Change the model version and settings (AI Builder/Copilot Studio) URL: https://learn.microsoft.com/microsoft-copilot-studio/prompt-model-settings Hentet: 2026-02 Innhold: Copilot Credits-klassifisering (Basic/Standard/Premium) per modell, tilgjengelige modeller

  7. Cost management for fine-tuning URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic Hentet: 2026-02 Innhold: Fine-tuning kostnad, hosting $1.70/time (o4-mini eksempel)

  8. Plan and manage costs for Microsoft Foundry URL: https://learn.microsoft.com/azure/ai-foundry/concepts/manage-costs?view=foundry-classic Hentet: 2026-02 Innhold: Billing-modell, token-basert prising, 1K-token enheter

Referanseprisside (verifiser for oppdaterte tall)

  1. Azure OpenAI Pricing Page URL: https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/ Note: Dynamisk side (krever JavaScript). Sjekk manuelt for eksakte GPT-5-priser når de publiseres.

  2. Azure AI Foundry PTU Calculator URL: https://ai.azure.com/resource/calculator Note: Beregn PTU break-even for spesifikke workloads

Verifiseringsstatus

Påstand Kilde Confidence
gpt-4.1 Global: $2.00 input, $8.00 output per 1M Kilde 4 (Content Understanding eksempel) Høy
gpt-4.1-mini Global: $0.40 input, $1.60 output per 1M Kilde 4 (Content Understanding eksempel) Høy
gpt-5: 1 output token = 8 input tokens (PTU-ratio) Kilde 3 (PTU-dokumentasjon) Høy
gpt-4.1: 1 output token = 4 input tokens (PTU-ratio) Kilde 3 (PTU-dokumentasjon) Høy
gpt-4.1 PTU: 3 000 TPM/PTU Kilde 3 Høy
gpt-5 PTU: 4 750 TPM/PTU Kilde 3 Høy
gpt-4.1-mini Copilot: Basic rate Kilde 6 Høy
gpt-4.1 Copilot: Standard rate Kilde 6 Høy
gpt-5-reasoning Copilot: Premium rate Kilde 6 Høy
Batch API: 50% rabatt Kilde 1/Azure prisside Høy
GPT-5 absolutte tokenpriser Ikke bekreftet (Azure prisside $-) Lav
gpt-4.1-nano prising Ikke direkte bekreftet, interpolert Moderat

Totalt antall kilder: 10 (8 primære Microsoft Learn, 2 pricing-referanser) MCP-kall brukt: 5 (4x docs_search, 1x docs_fetch — model-choice-guide)

Siste oppdatering og gyldighet

Dokumentasjonsdato: Februar 2026 Bekreftede priser gyldige per: Februar 2026 (GPT-4.1-serien) Estimerte priser: GPT-5-serien — verifiser på offisiell prisside Neste review anbefalt: Mai 2026 (GPT-5-priser forventes publisert; sjekk kvartalsvis)


Dokumenteier: Cosmo Skyberg, Microsoft AI Solution Architect Godkjent for: Offentlig sektor Norge, Enterprise Azure-kunder Versjon: 1.0