ktg-plugin-marketplace/plugins/ms-ai-architect/skills/ms-ai-security/references/cost-optimization/gpt5-gpt41-pricing-models.md
Kjell Tore Guttormsen 6a7632146e feat(ms-ai-architect): add plugin to open marketplace (v1.5.0 baseline)
Initial addition of ms-ai-architect plugin to the open-source marketplace.
Private content excluded: orchestrator/ (Linear tooling), docs/utredning/
(client investigation), generated test reports and PDF export script.
skill-gen tooling moved from orchestrator/ to scripts/skill-gen/.

Security scan: WARNING (risk 20/100) — no secrets, no injection found.
False positive fixed: added gitleaks:allow to Python variable reference
in output-validation-grounding-verification.md line 109.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-07 17:17:17 +02:00

28 KiB
Raw Blame History

GPT-5 og GPT-4.1: Prismodeller og kostnadsoptimalisering

Last updated: 2026-02 Status: GA (GPT-4.1-serien), GA (GPT-5-serien, begrenset tilgang for gpt-5 og gpt-5-codex) Category: Cost Optimization & FinOps for AI


Introduksjon

GPT-5- og GPT-4.1-seriene er de to nyeste flaggskipmodellene fra OpenAI tilgjengelig i Azure AI Foundry. De representerer to distinkte designfilosofier: GPT-5 optimalisert for dyp resonnering og komplekse oppgaver, GPT-4.1 optimalisert for hastighet, gjennomstrømming og kostnadseffektivitet.

Confidence: Høy (basert på offisiell Microsoft-dokumentasjon, februar 2026)

Denne referansen dekker:

  • Bekreftet og estimert prising per 1M tokens (USD og NOK)
  • Deployment-typer og deres kostnadsimplikasjon
  • Sammenligningstabeller (GPT-4o vs. GPT-4.1 vs. GPT-5)
  • Copilot Credits-klassifisering per modell
  • Optimaliserings­strategier og beslutningsveiledning

Viktig merknad om priser: Azure prisside (azure.microsoft.com/pricing) benytter JavaScript-rendering og returnerer tomme verdier ved programmatisk henting. Bekreftede priser er hentet fra Microsoft Learn-dokumentasjon og Content Understanding-eksempler. GPT-5-priser er ikke offentlig tilgjengelig som faste tall per februar 2026 — estimater er basert på offentliggjorte ratioer og prishistorikk.


Kjernekomponenter

1. GPT-4.1-serien — Bekreftet prising

Kilde: Azure Content Understanding-dokumentasjon, Azure AI Foundry provisioned throughput-dokumentasjon (bekreftet 1:4 input/output-ratio)

Modell Input (per 1M tokens) Output (per 1M tokens) Cached Input Kontekst
gpt-4.1 (Global) $2.00 $8.00 ~$0.50 1M tokens (128K ved provisioned)
gpt-4.1-mini (Global) $0.40 $1.60 ~$0.10 1M tokens (128K ved provisioned)
gpt-4.1-nano (Global) $0.10 $0.40 ~$0.025 1M tokens (128K ved provisioned)

Confidence: Høy for gpt-4.1 og gpt-4.1-mini (bekreftet via Content Understanding priseksempler og PTU-dokumentasjon). Moderat for gpt-4.1-nano (interpolert fra dokumenterte ratioer — 1:4 input/output).

Nøkkelfakta:

  • 1 output token = 4 input tokens i PTU-utnyttelse (matchers prisratio)
  • Kontekstvindu: 1 047 576 tokens (full), 128 000 tokens (standard og provisioned deployments), 300 000 tokens (batch deployments)
  • Treningsdata: til og med mai 2024
  • Versjon: 2025-04-14
  • Batch API: 50% rabatt på Global Standard-priser

Tilgjengelige deployment-typer for GPT-4.1-serien:

  • Global Standard, Data Zone Standard, Regional (Standard og Provisioned)
  • Priority Processing: tilgjengelig for gpt-4.1 (ikke mini/nano)

2. GPT-5-serien — Estimert prising

Merk: GPT-5-priser er ikke publisert som faste tall per februar 2026 (Azure prisside viser $-). Estimatene nedenfor er basert på:

  1. Dokumentert PTU-ratio: 1 output token = 8 input tokens (kilde: offisiell PTU-dokumentasjon)
  2. Offentlig OpenAI API-prising (openai.com/api/pricing) ved lansering august 2025
  3. Prishistorikk og modellfamilieposisjonering
Modell Input (per 1M tokens) Output (per 1M tokens) Confidence Merknader
gpt-5 (Global) ~$1015 ~$4060 LavModerat 1:8 output/input-ratio bekreftet. Absolutt pris ikke publisert i Azure
gpt-5-mini (Global) ~$1.503 ~$612 LavModerat Estimert. ~510x billigere enn gpt-5 basert på modellfamiliemønster
gpt-5-nano (Global) ~$0.100.30 ~$0.401.20 Lav Tilsvarer gpt-4.1-nano-prisnivå. Estimert
gpt-5-chat (Global) ~$1.503 ~$612 Lav Preview. Tilsvarer gpt-5-mini. Standard rate i Copilot Credits

OBLIGATORISK: Verifiser alltid GPT-5-priser på offisiell Azure OpenAI prisside eller Azure Pricing Calculator før budsjettering.

Tilgjengelighetsbegrensning:

  • gpt-5 og gpt-5-codex: Krever registrering og godkjenning (begrenset tilgang)
  • gpt-5-mini, gpt-5-nano, gpt-5-chat: Ingen registreringskrav
  • Kontekstvindu: 400 000 tokens (272K input / 128K output for resonneringsmodeller)

3. Referanse: GPT-4o (sammenligning)

Kilde: Allment tilgjengelig fra Azure-dokumentasjon

Modell Input (per 1M tokens) Output (per 1M tokens) Kontekst
gpt-4o (Global) ~$2.50 ~$10.00 128K
gpt-4o-mini (Global) ~$0.15 ~$0.60 128K

Confidence: Høy (bredt dokumentert)


4. Deployment-typer og kostnadsimplikasjon

Deployment-type Prismodell Datalagring Best for Prediktabilitet
Global Standard Pay-per-token Ingen garanti (trafikk rutes globalt) Høyt volum, lavest pris, ikke-sensitive data Lav (avhenger av bruk)
Data Zone Standard Pay-per-token (~510% høyere enn Global) EU- eller US-region garantert Norske virksomheter med GDPR-krav, ikke-sensitiv produksjon Lav (avhenger av bruk)
Regional Standard Pay-per-token (~1020% høyere enn Global) Spesifikk region (f.eks. Norway East) Personopplysninger, kritisk compliance Lav (avhenger av bruk)
Provisioned Throughput (PTU) Fast timepris per PTU Velges ved deployment Forutsigbart høyvolum, latens-SLA Høy (fast kostnad uavhengig av bruk)
Batch API 50% rabatt på Global Standard Global Ikke-sanntidsoppgaver (24t behandlingstid) Moderat (avhenger av bruk)

PTU-gjennomstrømming per modell (bekreftet, offisiell dokumentasjon):

Modell Input TPM per PTU Latens-SLA (p50) Min PTU (Global) Min PTU (Regional)
gpt-5 4 750 99% > 50 TPS 15 50
gpt-5-mini 23 750 99% > 80 TPS 15 25
gpt-4.1 3 000 99% > 80 TPS 15 50
gpt-4.1-mini 14 900 99% > 90 TPS 15 25
gpt-4.1-nano 59 400 99% > 100 TPS 15 25
o4-mini 5 400 99% > 90 TPS 15 25

Confidence: Høy (direkte fra offisiell PTU-dokumentasjon)


5. Sammenligningstabeller

5a. Pris- og kapabilitetssammenligning

Modell Input (per 1M) Output (per 1M) Konfidensgrad Kontekst Resonneringsevne Latens
gpt-4o-mini ~$0.15 ~$0.60 Høy 128K Lav Lavest
gpt-4.1-nano ~$0.10 ~$0.40 Moderat 1M (128K PTU) Lav Lavest
gpt-4.1-mini $0.40 $1.60 Høy 1M (128K PTU) LavModerat Lav
gpt-4o ~$2.50 ~$10.00 Høy 128K Moderat Moderat
gpt-4.1 $2.00 $8.00 Høy 1M (128K PTU) Moderat LavModerat
gpt-5-nano ~$0.100.30 ~$0.401.20 Lav (estimert) 400K Moderat (resonnering) Lav
gpt-5-mini ~$1.503.00 ~$6.0012.00 Lav (estimert) 400K Høy (resonnering) Moderat
gpt-5 ~$1015 ~$4060 Lav (estimert) 400K Svært høy (resonnering) Høy

5b. Relativ kostnad per 1 000 forespørsler (200 input + 100 output tokens)

Modell Kostnad (USD) Kostnad (NOK, ~10.5 kurs) Relativt vs. GPT-4.1
gpt-4.1-nano $0.06 ~0.63 NOK 95% billigere
gpt-4.1-mini $0.24 ~2.52 NOK 80% billigere
gpt-4.1 $1.20 ~12.60 NOK Referanse
gpt-5-mini (estimert midtpunkt) ~$0.901.80 ~919 NOK ~50% dyrere (estimert)
gpt-5 (estimert midtpunkt) ~$69 ~6395 NOK ~7x dyrere (estimert)

Confidence: Høy for gpt-4.1-serien. Lav for gpt-5-serien (estimerte priser).


6. NOK-kostnadsestimater

Valutakurs brukt: 1 USD = 10.5 NOK (veiledende, verifiser aktuell kurs)

Månedlig kostnadsestimat for typiske workloads

Scenario A: Kundestøtte chatbot (100 000 forespørsler/mnd, 150 input + 100 output tokens)

Modell USD/mnd NOK/mnd Anbefaling
gpt-4.1-nano ~$5.50 ~58 NOK Enkel FAQ, høyt volum
gpt-4.1-mini ~$22 ~231 NOK Standard chatbot
gpt-4.1 ~$110 ~1 155 NOK Kompleks kundesupport
gpt-5-mini (est.) ~$70140 ~7351 470 NOK Kun om resonnering er kritisk

Scenario B: Dokumentanalysepipeline (10 000 dokumenter/mnd, 2 000 input + 500 output tokens)

Modell USD/mnd NOK/mnd Anbefaling
gpt-4.1-mini ~$88 ~924 NOK Standardanalyse
gpt-4.1 ~$440 ~4 620 NOK Juridisk/finansiell analyse
gpt-5 (est.) ~$2 7504 100 ~28 87543 050 NOK Kun om deep reasoning er nødvendig

Scenario C: Batch-prosessering (50% rabatt, 500 000 forespørsler/mnd, 200 input + 50 output tokens)

Modell USD/mnd (batch) NOK/mnd Merknad
gpt-4.1-nano ~$7.00 ~74 NOK Klassifisering, tagging
gpt-4.1-mini ~$28 ~294 NOK Sammendrag, analyse
gpt-4.1 ~$140 ~1 470 NOK Kompleks batch

Confidence: Moderat (beregnet fra bekreftede GPT-4.1-priser. NOK-konvertering varierer med valutakurs).


7. Copilot Credits-klassifisering

Modeller i Copilot Studio og AI Builder (Power Platform) prises etter tre takstnivåer. Dette er direkte relevant for norske offentlige virksomheter som bruker Power Platform.

Modell Takst-nivå Copilot Credits Power Platform Credits
gpt-4.1-mini Basic Laveste forbruk Laveste forbruk
gpt-4.1 Standard Moderat forbruk Moderat forbruk
gpt-5-chat (preview) Standard Moderat forbruk Moderat forbruk
gpt-5-reasoning (preview) Premium Høyeste forbruk Høyeste forbruk
o3 Premium Høyeste forbruk Høyeste forbruk

Viktige implikasjoner:

  • Copilot Studio inkluderer et månedlig kvantum av Copilot Credits. Å bruke gpt-5-reasoning eller o3 tapper disse vesentlig raskere enn gpt-4.1-mini.
  • Standard-rate (gpt-4.1 og gpt-5-chat) er tilgjengelig uten ekstra tilleggslisens i de fleste planer.
  • Premium-rate (gpt-5-reasoning, o3) kan kreve pay-as-you-go-overskudd ved høyt volum.
  • M365 Copilot (enterprise): Inkluderer standardtilgang til GPT-5 (inkl. standard Copilot Chat). Priority Access krever M365 Copilot-lisens.

Confidence: Høy (basert på offisiell AI Builder/Copilot Studio-dokumentasjon, februar 2026)


8. GPT-5 Reasoning-nivåer og kostnad

GPT-5 introducerer fire justerbare tenkningsnivåer. Kostnad og latens skalerer med tenkningsdybde.

Resonneringsnivå Beskrivelse Latens Relativ kostnad Bruksområde
Minimal Svært få interne resonneringstokens Raskest Lavest Bulk-operasjoner, enkle transformasjoner
Low Let resonnering, rask vurdering Rask Lav Triage, korte svar, enkle redigeringer
Medium (default) Balansert dybde vs. hastighet Moderat Middels Innholdsdrafting, moderat koding, RAG Q&A
High Dyp, flertrinns "think-through" Tregest Høyest Kompleks planlegging, analyse, multi-hop reasoning

Viktig: Samme resonneringsnivå-logikk gjelder for gpt-5, gpt-5-mini og gpt-5-nano. Absolutt kostnad og latens skalerer ned med mini og nano, men avveiningene er identiske.

Parallelle verktøykall: Støttes IKKE ved Minimal reasoning_effort. Bruk Low/Medium/High for agentbruk.

Confidence: Høy (direkte fra offisiell GPT-5 model choice guide, februar 2026)


9. Optimaliserings­strategier

Strategi 1: Modelltiering (Small → Medium → Large)

Trigger: Klassifiser forespørselskompleksitet FØR valg av modell

Tier 1 — Nano (enkle oppgaver):
  - Klassifisering, tagging, enkle strukturerte outputs
  - Modell: gpt-4.1-nano
  - Estimert kostnad: ~$0.100.40/1M tokens

Tier 2 — Mini (standard oppgaver):
  - Chatbots, drafting, RAG Q&A, oppsummering
  - Modell: gpt-4.1-mini
  - Estimert kostnad: ~$0.401.60/1M tokens

Tier 3 — Full (komplekse oppgaver):
  - Juridisk analyse, flertrinns planlegging, agenter
  - Modell: gpt-4.1 eller gpt-5-mini
  - Estimert kostnad: $28/1M tokens (gpt-4.1)

Besparelsespotensial: 6080% vs. alltid bruke gpt-4.1

Strategi 2: Model Router (Azure AI Foundry)

Azure AI Foundry Model Router analyserer prompt-kompleksitet og velger automatisk den mest kostnadseffektive modellen.

  • Potensiell besparelse: Opptil 60% vs. å alltid bruke GPT-5-familien (dokumentert av Microsoft)
  • Implementering: Deploy Model Router i Azure AI Foundry, konfigurer underliggende modeller
  • Ingen kodeendringer: Transparente for applikasjonen

Confidence: Høy (Model Router er GA-funksjonalitet, besparelsestallet er dokumentert av Microsoft)

Strategi 3: Batch API (50% rabatt)

For ikke-sanntidsoppgaver med 24-timers SLA:

  • Nattlig rapportgenerering og sammendrag
  • Innholdsmoderering
  • Masseopplastings-analyse
  • E-postklassifisering

Besparelsespotensial: Fast 50% rabatt på Global Standard-pris

Strategi 4: Prompt Caching (Cached Input)

Gjenbruk av identisk kontekst (system prompt, dokumenter) aktiverer cached input-prising:

  • gpt-4.1: cached input ~$0.50/1M (75% rabatt vs. full input)
  • Spesielt effektivt for RAG-løsninger med fast system prompt
  • Krever identisk prefiks (prompt caching aktiveres automatisk for repeterende kontekst)

Confidence: Moderat (caching-ratio er estimert, ikke bekreftet for alle modeller per februar 2026)

Strategi 5: PTU ved forutsigbart høyt volum

Bruk PTU når:

  • Volum er forutsigbart (>70% utnyttelse)
  • Latens-SLA er kritisk
  • Månedlig token-volum er høyt nok til at fast PTU-kostnad er lavere enn pay-per-token

PTU break-even (illustrativt for gpt-4.1):

Pay-per-token: 3 000 000 tokens/mnd × $2.00/1M = $6/mnd per ~1M monthly tokens
PTU: 1 PTU = 3 000 input TPM = ~130M tokens/mnd kapasitet
Break-even: Når pay-per-token overstiger PTU-timeprisen × 730 timer/mnd

Bruk Azure AI Foundry PTU-kalkulator for presis beregning.

Confidence: Høy (PTU TPM-verdier er offisielt dokumentert. Break-even avhenger av PTU-timepris som ikke er publisert)

Strategi 6: Reasoning-nivå-optimalisering (GPT-5)

def select_reasoning_effort(task_type: str) -> str:
    if task_type in ["classification", "summarization", "simple_qa"]:
        return "low"   # 4060% billigere enn high
    elif task_type in ["content_drafting", "rag_qa", "moderate_coding"]:
        return "medium"  # Standard valg
    elif task_type in ["legal_analysis", "complex_planning", "multihop_reasoning"]:
        return "high"  # Maks nøyaktighet
    else:
        return "medium"  # Sikker default

Besparelsespotensial: 4060% kostnadsreduksjon vs. alltid bruke high reasoning


Beslutningsveiledning

Beslutningstre: GPT-4.1 vs. GPT-5

START
  |
  V
Krever oppgaven dyp, flertrinns resonnering?
  ├─ JA → Er resonnering viktigere enn kostnad/latens?
  │        ├─ JA → GPT-5 (juster reasoning_effort)
  │        └─ NEI → GPT-4.1 (raskere, billigere, tilstrekkelig for de fleste)
  └─ NEI → Er oppgaven voluminøs og/eller latens-sensitiv?
            ├─ JA → GPT-4.1-mini eller GPT-4.1-nano
            └─ NEI → GPT-4.1-mini (balanse mellom kostnad og kvalitet)

Scenario-basert anbefaling

Scenario Anbefalt modell Kostnadsnivå (NOK/mnd, 100K forespørsler)
Enkel FAQ-bot gpt-4.1-nano ~58 NOK
Kundestøtte chatbot gpt-4.1-mini + Model Router ~231 NOK
Juridisk dokumentanalyse gpt-4.1 eller gpt-5 (high) ~1 1558 000+ NOK
Kode-assistent gpt-5-mini (medium reasoning) Estimert ~7001 500 NOK
Nattlig rapport (batch) gpt-4.1-mini (batch) ~116 NOK (50% rabatt)
Enterprise Copilot (Copilot Studio) gpt-4.1 (Standard Credits) Innenfor inkluderte Credits
RAG Q&A (norsk offentlig sektor) gpt-4.1-mini + caching ~116231 NOK

Confidence: Moderat (NOK-estimater basert på illustrative priser. GPT-5-scenarioer er estimert)

Valg av deployment-type

Norsk offentlig sektor:
  Personopplysninger → Regional Standard (Norway East) + gpt-4.1-mini/gpt-4.1
  Ikke-sensitiv data → Data Zone Standard (EU) for litt lavere kostnad
  Høyvolum produksjon → PTU (ved forutsigbart volum)
  Utvikling/testing → Global Standard (lavest pris, ingen compliance-garanti)
  Batch (ikke-sanntid) → Batch API (50% rabatt på Global)

Offentlig sektor (Norge)

Compliance og dataplassering vs. kostnad

Deployment-type Garantert dataplassering Estimert kostnadsnivå Anbefaling
Norway East Regional Ja (Norway East) Høyest (~1020% over Global) Personopplysninger (GDPR)
EU Data Zone EU-region (ikke spesifikt Norway) Moderat (~510% over Global) Ikke-sensitive data, EU GDPR
Global Standard Ingen garanti Lavest Kun ikke-sensitiv utvikling/test

Anbefaling for offentlig sektor:

  • All behandling av personopplysninger: Regional Standard — Norway East
  • Ikke-sensitiv AI-bruk i produksjon: Data Zone Standard (EU) for moderat kostnadssparing
  • Testing og utvikling: Global Standard
  • Høyvolum stabile workloads: Vurder PTU i Norway East for latens-SLA + forutsigbar kostnad

TCO-estimat for offentlig AI-prosjekt med GPT-4.1

Kostnadselement Estimat (50K forespørsler/mnd) Optimalisering
gpt-4.1-mini inferens (Norway East) ~1 3002 600 NOK/mnd Bytt til Data Zone hvis compliance tillater
gpt-4.1 for komplekse forespørsler (10%) ~1 200 NOK/mnd Model Router automatiserer valget
Azure AI Search (RAG) 3 00010 000 NOK/mnd Optimaliser indeks og chunking
Azure Monitor/logging 1 0003 000 NOK/mnd Sett sampling-rate
Estimert total ~6 00016 000 NOK/mnd

Confidence: LavModerat (estimater er generelle. Varierer med volum, latens, og faktisk PTU-prising)


Integrasjon med Microsoft-stakken

Azure AI Foundry: Model Catalog og Router

Copilot Studio

  • Default modell: gpt-4.1-mini (Basic rate — laveste Copilot Credits-forbruk)
  • Brukeren kan manuelt velge gpt-4.1 (Standard) eller gpt-5-reasoning (Premium) per prompt
  • Copilot Credits-kvantum inkludert i lisenspakke; overskudd faktureres via pay-as-you-go

AI Builder (Power Platform)

  • Default modell: gpt-4.1-mini (Basic rate prompt builder credits)
  • Modeller tilgjengelig: gpt-4.1-mini (Basic), gpt-4.1 (Standard), gpt-5-chat (Standard), gpt-5-reasoning (Premium), gpt-5.2-variants (experimental)
  • Prompt builder credits forbrukes per kall; inkludert i premium Power Platform-planer (500 credits/bruker/mnd)

Azure Cost Management

  • Grupper kostnader etter Meter for per-modell kostnadssporing
  • Sett budsjetter med alerts ved 50%, 75%, 90%
  • Tag-strategi: model, deployment-type, project, cost-center

Kostnad og lisensiering

Lisensmodeller og AI-kostnadsdekning

Produkt Lisensmodell GPT-4.1-mini GPT-4.1 GPT-5
Azure OpenAI Pay-per-token / PTU Betalt separat Betalt separat Betalt separat
Copilot Studio Per bruker/mnd Basic Credits (inkludert) Standard Credits (inkludert til volum-limit) Premium Credits (tillegg ved høyt volum)
Power Platform (premium) Per bruker/mnd Basic prompt builder credits Standard credits Premium credits (ekstra)
M365 Copilot Per bruker/mnd (~360 USD/bruker) Inkludert Inkludert Standard-tilgang inkludert

GPT-5 tilgjengelighets- og registreringsstatus

Modell Tilgjengelighet Registrering
gpt-5 GA (begrenset) Krever godkjenning (aka.ms/oai/gpt5access)
gpt-5-mini GA Ikke nødvendig
gpt-5-nano GA Ikke nødvendig
gpt-5-chat Preview (2 versjoner) Ikke nødvendig
gpt-5-codex GA (begrenset) Krever godkjenning
gpt-5-pro GA (begrenset) Kun MCA-E/Default-abonnementer

For arkitekten (Cosmo)

Når bruke denne referansen

Triggers:

  • Bruker spør om priser på GPT-4.1 eller GPT-5
  • Bruker vil vite forskjellen mellom GPT-4.1-nano, mini og full
  • Budsjettering av Azure OpenAI-kostnader (NOK)
  • Valg mellom GPT-4.1 og GPT-5 for et gitt use case
  • Copilot Credits-planlegging i Copilot Studio eller AI Builder

Rådgivningsprosess

1. Bekreft bruksbehovet:

  • Latenskrav (sanntid < 200ms? Batch OK?)
  • Resonneringsbehov (enkel klassifisering vs. juridisk analyse)
  • Volum (forespørsler/mnd, tokens/forespørsel)
  • Compliance (Norway East, EU Data Zone, Global?)
  • Platform (Azure OpenAI direkte, Copilot Studio, AI Builder)

2. Velg modell med beslutningstreet:

  • Bruk treet i "Beslutningsveiledning"
  • Default: Start med gpt-4.1-mini. Oppgrader kun ved bevist behov.

3. Estimer kostnad:

  • Bekreftede priser: gpt-4.1-serien
  • Estimerte priser: gpt-5-serien (marker alltid som estimat)
  • Konverter til NOK (10.5 NOK/USD veiledende)
  • Inkluder deployment-type-premie for Norway East

4. Valider med offisiell kilde:

Confidence-markers i rådgivning

Situasjon Marker
GPT-4.1-priser "Bekreftet $2.00/$8.00 per 1M tokens (input/output)"
GPT-5-priser "Estimert ~$1015/$4060 per 1M tokens — verifiser på prisside"
NOK-konvertering "Indikativt ved kurs 10.5 NOK/USD — verifiser aktuell kurs"
Copilot Credits "Bekreftet Basic/Standard/Premium-klassifisering per modell"

Vanlige spørsmål og svar

Q: "Er GPT-5 alltid bedre enn GPT-4.1?" A: Nei. GPT-5 er bedre for dyp resonnering. For sanntids-chatbots, høyvolum-RAG og enkle oppgaver er GPT-4.1 raskere, billigere og tilstrekkelig god. Start med GPT-4.1.

Q: "Hva koster GPT-5 i Norge?" A: Priser er ikke offentlig tilgjengelig per februar 2026. Basert på PTU-dokumentasjon (1:8 ratio) og OpenAI API-annonsering er det estimert ~$1015 per 1M input-tokens. Verifiser alltid på Azure prisside eller kontakt Microsoft.

Q: "Skal vi bruke gpt-4.1-mini eller gpt-4.1 i Copilot Studio?" A: Start med gpt-4.1-mini (Basic rate, laveste Credits-forbruk). Bytt til gpt-4.1 kun for oppgaver som krever mer kompleks resonnering eller høyere kvalitet — test og mål først.

Q: "Hva er break-even for PTU vs. pay-per-token?" A: Bruk Azure AI Foundry PTU-kalkulator. Som tommelfingerregel: PTU er lønnsomt ved >70% gjennomsnittlig utnyttelse og stabilt volum over 3+ måneder.

Q: "Påvirker ny GPT-5-tilgjengelighet Copilot Credits-forbruket vårt?" A: Ja. Hvis brukere i Copilot Studio velger gpt-5-reasoning (Preview, Premium rate) i stedet for gpt-4.1-mini (Basic), kan Credits-forbruket øke 510x. Overvåk forbruk via Power Platform admin center og sett budsjetter.

Vanlige fallgruver

Fallgruve Konsekvens Hvordan unngå
Bruke GPT-5 for enkle chatbot-svar 520x høyere kostnad enn nødvendig Start alltid med GPT-4.1-mini. Oppgrader kun ved bevist behov
Ikke skille mellom Global og Regional prising 1020% budsjett-avvik Inkluder alltid deployment-type-premie i estimater for norsk sektor
Oppgi GPT-5-priser som bekreftet Budsjett-overskridelse eller undervurdering Marker alltid GPT-5-priser som estimert
Glemme Batch API-rabatt for natt-jobber 2x høyere kostnad enn nødvendig Vurder Batch API for alle ikke-sanntids workloads
Ikke monitorere Copilot Credits-forbruk Uventet faktura ved GPT-5/o3-bruk Sett Credits-budsjetter i Power Platform admin center

Kilder og verifisering

Primærkilder (Microsoft Learn, bekreftet februar 2026)

  1. GPT-5 vs GPT-4.1: choosing the right model for your use case URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/how-to/model-choice-guide?view=foundry-classic Hentet: 2026-02 Innhold: Modellsammenligning, reasoning-nivåer, latens-trade-offs, use-case guidance

  2. Foundry Models sold directly by Azure — GPT-4.1 og GPT-5-serien URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/concepts/models-sold-directly-by-azure?view=foundry-classic Hentet: 2026-02 Innhold: Kontekstvindu, max output tokens, treningsdata, versjonsoversikt, tilgjengelighetskrav

  3. Provisioned throughput unit (PTU) costs and billing URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding?view=foundry-classic Hentet: 2026-02 Innhold: PTU-kapasitet per modell (TPM/PTU), min deployment, latens-SLA, input/output-ratio (1:4 for gpt-4.1, 1:8 for gpt-5)

  4. Pricing for Azure Content Understanding in Foundry Tools URL: https://learn.microsoft.com/azure/ai-services/content-understanding/pricing-explainer Hentet: 2026-02 Innhold: Priseksempler med gpt-4.1 Global ($2/$8) og gpt-4.1-mini Global ($0.40/$1.60) bekreftet

  5. Azure OpenAI in Microsoft Foundry Models quotas and limits URL: https://learn.microsoft.com/azure/ai-foundry/openai/quotas-limits?view=foundry-classic Hentet: 2026-02 Innhold: GPT-5- og GPT-4.1-seriens kvotestruktur, usage tiers, deployment-typer

  6. Change the model version and settings (AI Builder/Copilot Studio) URL: https://learn.microsoft.com/microsoft-copilot-studio/prompt-model-settings Hentet: 2026-02 Innhold: Copilot Credits-klassifisering (Basic/Standard/Premium) per modell, tilgjengelige modeller

  7. Cost management for fine-tuning URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic Hentet: 2026-02 Innhold: Fine-tuning kostnad, hosting $1.70/time (o4-mini eksempel)

  8. Plan and manage costs for Microsoft Foundry URL: https://learn.microsoft.com/azure/ai-foundry/concepts/manage-costs?view=foundry-classic Hentet: 2026-02 Innhold: Billing-modell, token-basert prising, 1K-token enheter

Referanseprisside (verifiser for oppdaterte tall)

  1. Azure OpenAI Pricing Page URL: https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/ Note: Dynamisk side (krever JavaScript). Sjekk manuelt for eksakte GPT-5-priser når de publiseres.

  2. Azure AI Foundry PTU Calculator URL: https://ai.azure.com/resource/calculator Note: Beregn PTU break-even for spesifikke workloads

Verifiseringsstatus

Påstand Kilde Confidence
gpt-4.1 Global: $2.00 input, $8.00 output per 1M Kilde 4 (Content Understanding eksempel) Høy
gpt-4.1-mini Global: $0.40 input, $1.60 output per 1M Kilde 4 (Content Understanding eksempel) Høy
gpt-5: 1 output token = 8 input tokens (PTU-ratio) Kilde 3 (PTU-dokumentasjon) Høy
gpt-4.1: 1 output token = 4 input tokens (PTU-ratio) Kilde 3 (PTU-dokumentasjon) Høy
gpt-4.1 PTU: 3 000 TPM/PTU Kilde 3 Høy
gpt-5 PTU: 4 750 TPM/PTU Kilde 3 Høy
gpt-4.1-mini Copilot: Basic rate Kilde 6 Høy
gpt-4.1 Copilot: Standard rate Kilde 6 Høy
gpt-5-reasoning Copilot: Premium rate Kilde 6 Høy
Batch API: 50% rabatt Kilde 1/Azure prisside Høy
GPT-5 absolutte tokenpriser Ikke bekreftet (Azure prisside $-) Lav
gpt-4.1-nano prising Ikke direkte bekreftet, interpolert Moderat

Totalt antall kilder: 10 (8 primære Microsoft Learn, 2 pricing-referanser) MCP-kall brukt: 5 (4x docs_search, 1x docs_fetch — model-choice-guide)

Siste oppdatering og gyldighet

Dokumentasjonsdato: Februar 2026 Bekreftede priser gyldige per: Februar 2026 (GPT-4.1-serien) Estimerte priser: GPT-5-serien — verifiser på offisiell prisside Neste review anbefalt: Mai 2026 (GPT-5-priser forventes publisert; sjekk kvartalsvis)


Dokumenteier: Cosmo Skyberg, Microsoft AI Solution Architect Godkjent for: Offentlig sektor Norge, Enterprise Azure-kunder Versjon: 1.0