Kjell Tore Guttormsen 6a7632146e feat(ms-ai-architect): add plugin to open marketplace (v1.5.0 baseline)

Initial addition of ms-ai-architect plugin to the open-source marketplace.
Private content excluded: orchestrator/ (Linear tooling), docs/utredning/
(client investigation), generated test reports and PDF export script.
skill-gen tooling moved from orchestrator/ to scripts/skill-gen/.

Security scan: WARNING (risk 20/100) — no secrets, no injection found.
False positive fixed: added gitleaks:allow to Python variable reference
in output-validation-grounding-verification.md line 109.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

2026-04-07 17:17:17 +02:00

28 KiB

Raw Blame History

GPT-5 og GPT-4.1: Prismodeller og kostnadsoptimalisering

Last updated: 2026-02 Status: GA (GPT-4.1-serien), GA (GPT-5-serien, begrenset tilgang for gpt-5 og gpt-5-codex) Category: Cost Optimization & FinOps for AI

Introduksjon

GPT-5- og GPT-4.1-seriene er de to nyeste flaggskipmodellene fra OpenAI tilgjengelig i Azure AI Foundry. De representerer to distinkte designfilosofier: GPT-5 optimalisert for dyp resonnering og komplekse oppgaver, GPT-4.1 optimalisert for hastighet, gjennomstrømming og kostnadseffektivitet.

Confidence: Høy (basert på offisiell Microsoft-dokumentasjon, februar 2026)

Denne referansen dekker:

Bekreftet og estimert prising per 1M tokens (USD og NOK)
Deployment-typer og deres kostnadsimplikasjon
Sammenligningstabeller (GPT-4o vs. GPT-4.1 vs. GPT-5)
Copilot Credits-klassifisering per modell
Optimaliseringsstrategier og beslutningsveiledning

Viktig merknad om priser: Azure prisside (azure.microsoft.com/pricing) benytter JavaScript-rendering og returnerer tomme verdier ved programmatisk henting. Bekreftede priser er hentet fra Microsoft Learn-dokumentasjon og Content Understanding-eksempler. GPT-5-priser er ikke offentlig tilgjengelig som faste tall per februar 2026 — estimater er basert på offentliggjorte ratioer og prishistorikk.

Kjernekomponenter

1. GPT-4.1-serien — Bekreftet prising

Kilde: Azure Content Understanding-dokumentasjon, Azure AI Foundry provisioned throughput-dokumentasjon (bekreftet 1:4 input/output-ratio)

Modell	Input (per 1M tokens)	Output (per 1M tokens)	Cached Input	Kontekst
`gpt-4.1` (Global)	$2.00	$8.00	~$0.50	1M tokens (128K ved provisioned)
`gpt-4.1-mini` (Global)	$0.40	$1.60	~$0.10	1M tokens (128K ved provisioned)
`gpt-4.1-nano` (Global)	$0.10	$0.40	~$0.025	1M tokens (128K ved provisioned)

Confidence: Høy for gpt-4.1 og gpt-4.1-mini (bekreftet via Content Understanding priseksempler og PTU-dokumentasjon). Moderat for gpt-4.1-nano (interpolert fra dokumenterte ratioer — 1:4 input/output).

Nøkkelfakta:

1 output token = 4 input tokens i PTU-utnyttelse (matchers prisratio)
Kontekstvindu: 1 047 576 tokens (full), 128 000 tokens (standard og provisioned deployments), 300 000 tokens (batch deployments)
Treningsdata: til og med mai 2024
Versjon: 2025-04-14
Batch API: 50% rabatt på Global Standard-priser

Tilgjengelige deployment-typer for GPT-4.1-serien:

Global Standard, Data Zone Standard, Regional (Standard og Provisioned)
Priority Processing: tilgjengelig for gpt-4.1 (ikke mini/nano)

2. GPT-5-serien — Estimert prising

Merk: GPT-5-priser er ikke publisert som faste tall per februar 2026 (Azure prisside viser $-). Estimatene nedenfor er basert på:

Dokumentert PTU-ratio: 1 output token = 8 input tokens (kilde: offisiell PTU-dokumentasjon)
Offentlig OpenAI API-prising (openai.com/api/pricing) ved lansering august 2025
Prishistorikk og modellfamilieposisjonering

Modell	Input (per 1M tokens)	Output (per 1M tokens)	Confidence	Merknader
`gpt-5` (Global)	~$10–15	~$40–60	Lav–Moderat	1:8 output/input-ratio bekreftet. Absolutt pris ikke publisert i Azure
`gpt-5-mini` (Global)	~$1.50–3	~$6–12	Lav–Moderat	Estimert. ~5–10x billigere enn gpt-5 basert på modellfamiliemønster
`gpt-5-nano` (Global)	~$0.10–0.30	~$0.40–1.20	Lav	Tilsvarer gpt-4.1-nano-prisnivå. Estimert
`gpt-5-chat` (Global)	~$1.50–3	~$6–12	Lav	Preview. Tilsvarer gpt-5-mini. Standard rate i Copilot Credits

OBLIGATORISK: Verifiser alltid GPT-5-priser på offisiell Azure OpenAI prisside eller Azure Pricing Calculator før budsjettering.

Tilgjengelighetsbegrensning:

gpt-5 og gpt-5-codex: Krever registrering og godkjenning (begrenset tilgang)
gpt-5-mini, gpt-5-nano, gpt-5-chat: Ingen registreringskrav
Kontekstvindu: 400 000 tokens (272K input / 128K output for resonneringsmodeller)

3. Referanse: GPT-4o (sammenligning)

Kilde: Allment tilgjengelig fra Azure-dokumentasjon

Modell	Input (per 1M tokens)	Output (per 1M tokens)	Kontekst
`gpt-4o` (Global)	~$2.50	~$10.00	128K
`gpt-4o-mini` (Global)	~$0.15	~$0.60	128K

Confidence: Høy (bredt dokumentert)

4. Deployment-typer og kostnadsimplikasjon

Deployment-type	Prismodell	Datalagring	Best for	Prediktabilitet
Global Standard	Pay-per-token	Ingen garanti (trafikk rutes globalt)	Høyt volum, lavest pris, ikke-sensitive data	Lav (avhenger av bruk)
Data Zone Standard	Pay-per-token (~5–10% høyere enn Global)	EU- eller US-region garantert	Norske virksomheter med GDPR-krav, ikke-sensitiv produksjon	Lav (avhenger av bruk)
Regional Standard	Pay-per-token (~10–20% høyere enn Global)	Spesifikk region (f.eks. Norway East)	Personopplysninger, kritisk compliance	Lav (avhenger av bruk)
Provisioned Throughput (PTU)	Fast timepris per PTU	Velges ved deployment	Forutsigbart høyvolum, latens-SLA	Høy (fast kostnad uavhengig av bruk)
Batch API	50% rabatt på Global Standard	Global	Ikke-sanntidsoppgaver (24t behandlingstid)	Moderat (avhenger av bruk)

PTU-gjennomstrømming per modell (bekreftet, offisiell dokumentasjon):

Modell	Input TPM per PTU	Latens-SLA (p50)	Min PTU (Global)	Min PTU (Regional)
`gpt-5`	4 750	99% > 50 TPS	15	50
`gpt-5-mini`	23 750	99% > 80 TPS	15	25
`gpt-4.1`	3 000	99% > 80 TPS	15	50
`gpt-4.1-mini`	14 900	99% > 90 TPS	15	25
`gpt-4.1-nano`	59 400	99% > 100 TPS	15	25
`o4-mini`	5 400	99% > 90 TPS	15	25

Confidence: Høy (direkte fra offisiell PTU-dokumentasjon)

5. Sammenligningstabeller

5a. Pris- og kapabilitetssammenligning

Modell	Input (per 1M)	Output (per 1M)	Konfidensgrad	Kontekst	Resonneringsevne	Latens
`gpt-4o-mini`	~$0.15	~$0.60	Høy	128K	Lav	Lavest
`gpt-4.1-nano`	~$0.10	~$0.40	Moderat	1M (128K PTU)	Lav	Lavest
`gpt-4.1-mini`	$0.40	$1.60	Høy	1M (128K PTU)	Lav–Moderat	Lav
`gpt-4o`	~$2.50	~$10.00	Høy	128K	Moderat	Moderat
`gpt-4.1`	$2.00	$8.00	Høy	1M (128K PTU)	Moderat	Lav–Moderat
`gpt-5-nano`	~$0.10–0.30	~$0.40–1.20	Lav (estimert)	400K	Moderat (resonnering)	Lav
`gpt-5-mini`	~$1.50–3.00	~$6.00–12.00	Lav (estimert)	400K	Høy (resonnering)	Moderat
`gpt-5`	~$10–15	~$40–60	Lav (estimert)	400K	Svært høy (resonnering)	Høy

5b. Relativ kostnad per 1 000 forespørsler (200 input + 100 output tokens)

Modell	Kostnad (USD)	Kostnad (NOK, ~10.5 kurs)	Relativt vs. GPT-4.1
`gpt-4.1-nano`	$0.06	~0.63 NOK	95% billigere
`gpt-4.1-mini`	$0.24	~2.52 NOK	80% billigere
`gpt-4.1`	$1.20	~12.60 NOK	Referanse
`gpt-5-mini` (estimert midtpunkt)	~$0.90–1.80	~9–19 NOK	~50% dyrere (estimert)
`gpt-5` (estimert midtpunkt)	~$6–9	~63–95 NOK	~7x dyrere (estimert)

Confidence: Høy for gpt-4.1-serien. Lav for gpt-5-serien (estimerte priser).

6. NOK-kostnadsestimater

Valutakurs brukt: 1 USD = 10.5 NOK (veiledende, verifiser aktuell kurs)

Månedlig kostnadsestimat for typiske workloads

Scenario A: Kundestøtte chatbot (100 000 forespørsler/mnd, 150 input + 100 output tokens)

Modell	USD/mnd	NOK/mnd	Anbefaling
`gpt-4.1-nano`	~$5.50	~58 NOK	Enkel FAQ, høyt volum
`gpt-4.1-mini`	~$22	~231 NOK	Standard chatbot
`gpt-4.1`	~$110	~1 155 NOK	Kompleks kundesupport
`gpt-5-mini` (est.)	~$70–140	~735–1 470 NOK	Kun om resonnering er kritisk

Scenario B: Dokumentanalysepipeline (10 000 dokumenter/mnd, 2 000 input + 500 output tokens)

Modell	USD/mnd	NOK/mnd	Anbefaling
`gpt-4.1-mini`	~$88	~924 NOK	Standardanalyse
`gpt-4.1`	~$440	~4 620 NOK	Juridisk/finansiell analyse
`gpt-5` (est.)	~$2 750–4 100	~28 875–43 050 NOK	Kun om deep reasoning er nødvendig

Scenario C: Batch-prosessering (50% rabatt, 500 000 forespørsler/mnd, 200 input + 50 output tokens)

Modell	USD/mnd (batch)	NOK/mnd	Merknad
`gpt-4.1-nano`	~$7.00	~74 NOK	Klassifisering, tagging
`gpt-4.1-mini`	~$28	~294 NOK	Sammendrag, analyse
`gpt-4.1`	~$140	~1 470 NOK	Kompleks batch

Confidence: Moderat (beregnet fra bekreftede GPT-4.1-priser. NOK-konvertering varierer med valutakurs).

7. Copilot Credits-klassifisering

Modeller i Copilot Studio og AI Builder (Power Platform) prises etter tre takstnivåer. Dette er direkte relevant for norske offentlige virksomheter som bruker Power Platform.

Modell	Takst-nivå	Copilot Credits	Power Platform Credits
`gpt-4.1-mini`	Basic	Laveste forbruk	Laveste forbruk
`gpt-4.1`	Standard	Moderat forbruk	Moderat forbruk
`gpt-5-chat` (preview)	Standard	Moderat forbruk	Moderat forbruk
`gpt-5-reasoning` (preview)	Premium	Høyeste forbruk	Høyeste forbruk
`o3`	Premium	Høyeste forbruk	Høyeste forbruk

Viktige implikasjoner:

Copilot Studio inkluderer et månedlig kvantum av Copilot Credits. Å bruke gpt-5-reasoning eller o3 tapper disse vesentlig raskere enn gpt-4.1-mini.
Standard-rate (gpt-4.1 og gpt-5-chat) er tilgjengelig uten ekstra tilleggslisens i de fleste planer.
Premium-rate (gpt-5-reasoning, o3) kan kreve pay-as-you-go-overskudd ved høyt volum.
M365 Copilot (enterprise): Inkluderer standardtilgang til GPT-5 (inkl. standard Copilot Chat). Priority Access krever M365 Copilot-lisens.

Confidence: Høy (basert på offisiell AI Builder/Copilot Studio-dokumentasjon, februar 2026)

8. GPT-5 Reasoning-nivåer og kostnad

GPT-5 introducerer fire justerbare tenkningsnivåer. Kostnad og latens skalerer med tenkningsdybde.

Resonneringsnivå	Beskrivelse	Latens	Relativ kostnad	Bruksområde
Minimal	Svært få interne resonneringstokens	Raskest	Lavest	Bulk-operasjoner, enkle transformasjoner
Low	Let resonnering, rask vurdering	Rask	Lav	Triage, korte svar, enkle redigeringer
Medium (default)	Balansert dybde vs. hastighet	Moderat	Middels	Innholdsdrafting, moderat koding, RAG Q&A
High	Dyp, flertrinns "think-through"	Tregest	Høyest	Kompleks planlegging, analyse, multi-hop reasoning

Viktig: Samme resonneringsnivå-logikk gjelder for gpt-5, gpt-5-mini og gpt-5-nano. Absolutt kostnad og latens skalerer ned med mini og nano, men avveiningene er identiske.

Parallelle verktøykall: Støttes IKKE ved Minimal reasoning_effort. Bruk Low/Medium/High for agentbruk.

Confidence: Høy (direkte fra offisiell GPT-5 model choice guide, februar 2026)

9. Optimaliseringsstrategier

Strategi 1: Modelltiering (Small → Medium → Large)

Trigger: Klassifiser forespørselskompleksitet FØR valg av modell

Tier 1 — Nano (enkle oppgaver):
  - Klassifisering, tagging, enkle strukturerte outputs
  - Modell: gpt-4.1-nano
  - Estimert kostnad: ~$0.10–0.40/1M tokens

Tier 2 — Mini (standard oppgaver):
  - Chatbots, drafting, RAG Q&A, oppsummering
  - Modell: gpt-4.1-mini
  - Estimert kostnad: ~$0.40–1.60/1M tokens

Tier 3 — Full (komplekse oppgaver):
  - Juridisk analyse, flertrinns planlegging, agenter
  - Modell: gpt-4.1 eller gpt-5-mini
  - Estimert kostnad: $2–8/1M tokens (gpt-4.1)

Besparelsespotensial: 60–80% vs. alltid bruke gpt-4.1

Strategi 2: Model Router (Azure AI Foundry)

Azure AI Foundry Model Router analyserer prompt-kompleksitet og velger automatisk den mest kostnadseffektive modellen.

Potensiell besparelse: Opptil 60% vs. å alltid bruke GPT-5-familien (dokumentert av Microsoft)
Implementering: Deploy Model Router i Azure AI Foundry, konfigurer underliggende modeller
Ingen kodeendringer: Transparente for applikasjonen

Confidence: Høy (Model Router er GA-funksjonalitet, besparelsestallet er dokumentert av Microsoft)

Strategi 3: Batch API (50% rabatt)

For ikke-sanntidsoppgaver med 24-timers SLA:

Nattlig rapportgenerering og sammendrag
Innholdsmoderering
Masseopplastings-analyse
E-postklassifisering

Besparelsespotensial: Fast 50% rabatt på Global Standard-pris

Strategi 4: Prompt Caching (Cached Input)

Gjenbruk av identisk kontekst (system prompt, dokumenter) aktiverer cached input-prising:

gpt-4.1: cached input ~$0.50/1M (75% rabatt vs. full input)
Spesielt effektivt for RAG-løsninger med fast system prompt
Krever identisk prefiks (prompt caching aktiveres automatisk for repeterende kontekst)

Confidence: Moderat (caching-ratio er estimert, ikke bekreftet for alle modeller per februar 2026)

Strategi 5: PTU ved forutsigbart høyt volum

Bruk PTU når:

Volum er forutsigbart (>70% utnyttelse)
Latens-SLA er kritisk
Månedlig token-volum er høyt nok til at fast PTU-kostnad er lavere enn pay-per-token

PTU break-even (illustrativt for gpt-4.1):

Pay-per-token: 3 000 000 tokens/mnd × $2.00/1M = $6/mnd per ~1M monthly tokens
PTU: 1 PTU = 3 000 input TPM = ~130M tokens/mnd kapasitet
Break-even: Når pay-per-token overstiger PTU-timeprisen × 730 timer/mnd

Bruk Azure AI Foundry PTU-kalkulator for presis beregning.

Confidence: Høy (PTU TPM-verdier er offisielt dokumentert. Break-even avhenger av PTU-timepris som ikke er publisert)

Strategi 6: Reasoning-nivå-optimalisering (GPT-5)

def select_reasoning_effort(task_type: str) -> str:
    if task_type in ["classification", "summarization", "simple_qa"]:
        return "low"   # 40–60% billigere enn high
    elif task_type in ["content_drafting", "rag_qa", "moderate_coding"]:
        return "medium"  # Standard valg
    elif task_type in ["legal_analysis", "complex_planning", "multihop_reasoning"]:
        return "high"  # Maks nøyaktighet
    else:
        return "medium"  # Sikker default

Besparelsespotensial: 40–60% kostnadsreduksjon vs. alltid bruke high reasoning

Beslutningsveiledning

Beslutningstre: GPT-4.1 vs. GPT-5

START
  |
  V
Krever oppgaven dyp, flertrinns resonnering?
  ├─ JA → Er resonnering viktigere enn kostnad/latens?
  │        ├─ JA → GPT-5 (juster reasoning_effort)
  │        └─ NEI → GPT-4.1 (raskere, billigere, tilstrekkelig for de fleste)
  └─ NEI → Er oppgaven voluminøs og/eller latens-sensitiv?
            ├─ JA → GPT-4.1-mini eller GPT-4.1-nano
            └─ NEI → GPT-4.1-mini (balanse mellom kostnad og kvalitet)

Scenario-basert anbefaling

Scenario	Anbefalt modell	Kostnadsnivå (NOK/mnd, 100K forespørsler)
Enkel FAQ-bot	gpt-4.1-nano	~58 NOK
Kundestøtte chatbot	gpt-4.1-mini + Model Router	~231 NOK
Juridisk dokumentanalyse	gpt-4.1 eller gpt-5 (high)	~1 155–8 000+ NOK
Kode-assistent	gpt-5-mini (medium reasoning)	Estimert ~700–1 500 NOK
Nattlig rapport (batch)	gpt-4.1-mini (batch)	~116 NOK (50% rabatt)
Enterprise Copilot (Copilot Studio)	gpt-4.1 (Standard Credits)	Innenfor inkluderte Credits
RAG Q&A (norsk offentlig sektor)	gpt-4.1-mini + caching	~116–231 NOK

Confidence: Moderat (NOK-estimater basert på illustrative priser. GPT-5-scenarioer er estimert)

Valg av deployment-type

Norsk offentlig sektor:
  Personopplysninger → Regional Standard (Norway East) + gpt-4.1-mini/gpt-4.1
  Ikke-sensitiv data → Data Zone Standard (EU) for litt lavere kostnad
  Høyvolum produksjon → PTU (ved forutsigbart volum)
  Utvikling/testing → Global Standard (lavest pris, ingen compliance-garanti)
  Batch (ikke-sanntid) → Batch API (50% rabatt på Global)

Offentlig sektor (Norge)

Compliance og dataplassering vs. kostnad

Deployment-type	Garantert dataplassering	Estimert kostnadsnivå	Anbefaling
Norway East Regional	Ja (Norway East)	Høyest (~10–20% over Global)	Personopplysninger (GDPR)
EU Data Zone	EU-region (ikke spesifikt Norway)	Moderat (~5–10% over Global)	Ikke-sensitive data, EU GDPR
Global Standard	Ingen garanti	Lavest	Kun ikke-sensitiv utvikling/test

Anbefaling for offentlig sektor:

All behandling av personopplysninger: Regional Standard — Norway East
Ikke-sensitiv AI-bruk i produksjon: Data Zone Standard (EU) for moderat kostnadssparing
Testing og utvikling: Global Standard
Høyvolum stabile workloads: Vurder PTU i Norway East for latens-SLA + forutsigbar kostnad

TCO-estimat for offentlig AI-prosjekt med GPT-4.1

Kostnadselement	Estimat (50K forespørsler/mnd)	Optimalisering
gpt-4.1-mini inferens (Norway East)	~1 300–2 600 NOK/mnd	Bytt til Data Zone hvis compliance tillater
gpt-4.1 for komplekse forespørsler (10%)	~1 200 NOK/mnd	Model Router automatiserer valget
Azure AI Search (RAG)	3 000–10 000 NOK/mnd	Optimaliser indeks og chunking
Azure Monitor/logging	1 000–3 000 NOK/mnd	Sett sampling-rate
Estimert total	~6 000–16 000 NOK/mnd

Confidence: Lav–Moderat (estimater er generelle. Varierer med volum, latens, og faktisk PTU-prising)

Integrasjon med Microsoft-stakken

Azure AI Foundry: Model Catalog og Router

Alle GPT-4.1- og GPT-5-modeller tilgjengelig i Azure AI Foundry
Model Router automatiserer modellvalg — opptil 60% kostnadssparing (dokumentert)
Foundry PTU-kalkulator: ai.azure.com/resource/calculator

Copilot Studio

Default modell: gpt-4.1-mini (Basic rate — laveste Copilot Credits-forbruk)
Brukeren kan manuelt velge gpt-4.1 (Standard) eller gpt-5-reasoning (Premium) per prompt
Copilot Credits-kvantum inkludert i lisenspakke; overskudd faktureres via pay-as-you-go

AI Builder (Power Platform)

Default modell: gpt-4.1-mini (Basic rate prompt builder credits)
Modeller tilgjengelig: gpt-4.1-mini (Basic), gpt-4.1 (Standard), gpt-5-chat (Standard), gpt-5-reasoning (Premium), gpt-5.2-variants (experimental)
Prompt builder credits forbrukes per kall; inkludert i premium Power Platform-planer (500 credits/bruker/mnd)

Azure Cost Management

Grupper kostnader etter Meter for per-modell kostnadssporing
Sett budsjetter med alerts ved 50%, 75%, 90%
Tag-strategi: model, deployment-type, project, cost-center

Kostnad og lisensiering

Lisensmodeller og AI-kostnadsdekning

Produkt	Lisensmodell	GPT-4.1-mini	GPT-4.1	GPT-5
Azure OpenAI	Pay-per-token / PTU	Betalt separat	Betalt separat	Betalt separat
Copilot Studio	Per bruker/mnd	Basic Credits (inkludert)	Standard Credits (inkludert til volum-limit)	Premium Credits (tillegg ved høyt volum)
Power Platform (premium)	Per bruker/mnd	Basic prompt builder credits	Standard credits	Premium credits (ekstra)
M365 Copilot	Per bruker/mnd (~360 USD/bruker)	Inkludert	Inkludert	Standard-tilgang inkludert

GPT-5 tilgjengelighets- og registreringsstatus

Modell	Tilgjengelighet	Registrering
`gpt-5`	GA (begrenset)	Krever godkjenning (aka.ms/oai/gpt5access)
`gpt-5-mini`	GA	Ikke nødvendig
`gpt-5-nano`	GA	Ikke nødvendig
`gpt-5-chat`	Preview (2 versjoner)	Ikke nødvendig
`gpt-5-codex`	GA (begrenset)	Krever godkjenning
`gpt-5-pro`	GA (begrenset)	Kun MCA-E/Default-abonnementer

For arkitekten (Cosmo)

Når bruke denne referansen

Triggers:

Bruker spør om priser på GPT-4.1 eller GPT-5
Bruker vil vite forskjellen mellom GPT-4.1-nano, mini og full
Budsjettering av Azure OpenAI-kostnader (NOK)
Valg mellom GPT-4.1 og GPT-5 for et gitt use case
Copilot Credits-planlegging i Copilot Studio eller AI Builder

Rådgivningsprosess

1. Bekreft bruksbehovet:

Latenskrav (sanntid < 200ms? Batch OK?)
Resonneringsbehov (enkel klassifisering vs. juridisk analyse)
Volum (forespørsler/mnd, tokens/forespørsel)
Compliance (Norway East, EU Data Zone, Global?)
Platform (Azure OpenAI direkte, Copilot Studio, AI Builder)

2. Velg modell med beslutningstreet:

Bruk treet i "Beslutningsveiledning"
Default: Start med gpt-4.1-mini. Oppgrader kun ved bevist behov.

3. Estimer kostnad:

Bekreftede priser: gpt-4.1-serien
Estimerte priser: gpt-5-serien (marker alltid som estimat)
Konverter til NOK (10.5 NOK/USD veiledende)
Inkluder deployment-type-premie for Norway East

4. Valider med offisiell kilde:

Alltid linke til Azure OpenAI Pricing
For PTU: Azure AI Foundry Calculator

Confidence-markers i rådgivning

Situasjon	Marker
GPT-4.1-priser	"Bekreftet $2.00/$8.00 per 1M tokens (input/output)"
GPT-5-priser	"Estimert ~$10–15/$40–60 per 1M tokens — verifiser på prisside"
NOK-konvertering	"Indikativt ved kurs 10.5 NOK/USD — verifiser aktuell kurs"
Copilot Credits	"Bekreftet Basic/Standard/Premium-klassifisering per modell"

Vanlige spørsmål og svar

Q: "Er GPT-5 alltid bedre enn GPT-4.1?" A: Nei. GPT-5 er bedre for dyp resonnering. For sanntids-chatbots, høyvolum-RAG og enkle oppgaver er GPT-4.1 raskere, billigere og tilstrekkelig god. Start med GPT-4.1.

Q: "Hva koster GPT-5 i Norge?" A: Priser er ikke offentlig tilgjengelig per februar 2026. Basert på PTU-dokumentasjon (1:8 ratio) og OpenAI API-annonsering er det estimert ~$10–15 per 1M input-tokens. Verifiser alltid på Azure prisside eller kontakt Microsoft.

Q: "Skal vi bruke gpt-4.1-mini eller gpt-4.1 i Copilot Studio?" A: Start med gpt-4.1-mini (Basic rate, laveste Credits-forbruk). Bytt til gpt-4.1 kun for oppgaver som krever mer kompleks resonnering eller høyere kvalitet — test og mål først.

Q: "Hva er break-even for PTU vs. pay-per-token?" A: Bruk Azure AI Foundry PTU-kalkulator. Som tommelfingerregel: PTU er lønnsomt ved >70% gjennomsnittlig utnyttelse og stabilt volum over 3+ måneder.

Q: "Påvirker ny GPT-5-tilgjengelighet Copilot Credits-forbruket vårt?" A: Ja. Hvis brukere i Copilot Studio velger gpt-5-reasoning (Preview, Premium rate) i stedet for gpt-4.1-mini (Basic), kan Credits-forbruket øke 5–10x. Overvåk forbruk via Power Platform admin center og sett budsjetter.

Vanlige fallgruver

Fallgruve	Konsekvens	Hvordan unngå
Bruke GPT-5 for enkle chatbot-svar	5–20x høyere kostnad enn nødvendig	Start alltid med GPT-4.1-mini. Oppgrader kun ved bevist behov
Ikke skille mellom Global og Regional prising	10–20% budsjett-avvik	Inkluder alltid deployment-type-premie i estimater for norsk sektor
Oppgi GPT-5-priser som bekreftet	Budsjett-overskridelse eller undervurdering	Marker alltid GPT-5-priser som estimert
Glemme Batch API-rabatt for natt-jobber	2x høyere kostnad enn nødvendig	Vurder Batch API for alle ikke-sanntids workloads
Ikke monitorere Copilot Credits-forbruk	Uventet faktura ved GPT-5/o3-bruk	Sett Credits-budsjetter i Power Platform admin center

Kilder og verifisering

Primærkilder (Microsoft Learn, bekreftet februar 2026)

GPT-5 vs GPT-4.1: choosing the right model for your use case URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/how-to/model-choice-guide?view=foundry-classic Hentet: 2026-02 Innhold: Modellsammenligning, reasoning-nivåer, latens-trade-offs, use-case guidance
Foundry Models sold directly by Azure — GPT-4.1 og GPT-5-serien URL: https://learn.microsoft.com/azure/ai-foundry/foundry-models/concepts/models-sold-directly-by-azure?view=foundry-classic Hentet: 2026-02 Innhold: Kontekstvindu, max output tokens, treningsdata, versjonsoversikt, tilgjengelighetskrav
Provisioned throughput unit (PTU) costs and billing URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/provisioned-throughput-onboarding?view=foundry-classic Hentet: 2026-02 Innhold: PTU-kapasitet per modell (TPM/PTU), min deployment, latens-SLA, input/output-ratio (1:4 for gpt-4.1, 1:8 for gpt-5)
Pricing for Azure Content Understanding in Foundry Tools URL: https://learn.microsoft.com/azure/ai-services/content-understanding/pricing-explainer Hentet: 2026-02 Innhold: Priseksempler med gpt-4.1 Global ($2/$8) og gpt-4.1-mini Global ($0.40/$1.60) bekreftet
Azure OpenAI in Microsoft Foundry Models quotas and limits URL: https://learn.microsoft.com/azure/ai-foundry/openai/quotas-limits?view=foundry-classic Hentet: 2026-02 Innhold: GPT-5- og GPT-4.1-seriens kvotestruktur, usage tiers, deployment-typer
Change the model version and settings (AI Builder/Copilot Studio) URL: https://learn.microsoft.com/microsoft-copilot-studio/prompt-model-settings Hentet: 2026-02 Innhold: Copilot Credits-klassifisering (Basic/Standard/Premium) per modell, tilgjengelige modeller
Cost management for fine-tuning URL: https://learn.microsoft.com/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic Hentet: 2026-02 Innhold: Fine-tuning kostnad, hosting $1.70/time (o4-mini eksempel)
Plan and manage costs for Microsoft Foundry URL: https://learn.microsoft.com/azure/ai-foundry/concepts/manage-costs?view=foundry-classic Hentet: 2026-02 Innhold: Billing-modell, token-basert prising, 1K-token enheter

Referanseprisside (verifiser for oppdaterte tall)

Azure OpenAI Pricing Page URL: https://azure.microsoft.com/pricing/details/cognitive-services/openai-service/ Note: Dynamisk side (krever JavaScript). Sjekk manuelt for eksakte GPT-5-priser når de publiseres.
Azure AI Foundry PTU Calculator URL: https://ai.azure.com/resource/calculator Note: Beregn PTU break-even for spesifikke workloads

Verifiseringsstatus

Påstand	Kilde	Confidence
gpt-4.1 Global: $2.00 input, $8.00 output per 1M	Kilde 4 (Content Understanding eksempel)	Høy
gpt-4.1-mini Global: $0.40 input, $1.60 output per 1M	Kilde 4 (Content Understanding eksempel)	Høy
gpt-5: 1 output token = 8 input tokens (PTU-ratio)	Kilde 3 (PTU-dokumentasjon)	Høy
gpt-4.1: 1 output token = 4 input tokens (PTU-ratio)	Kilde 3 (PTU-dokumentasjon)	Høy
gpt-4.1 PTU: 3 000 TPM/PTU	Kilde 3	Høy
gpt-5 PTU: 4 750 TPM/PTU	Kilde 3	Høy
gpt-4.1-mini Copilot: Basic rate	Kilde 6	Høy
gpt-4.1 Copilot: Standard rate	Kilde 6	Høy
gpt-5-reasoning Copilot: Premium rate	Kilde 6	Høy
Batch API: 50% rabatt	Kilde 1/Azure prisside	Høy
GPT-5 absolutte tokenpriser	Ikke bekreftet (Azure prisside $-)	Lav
gpt-4.1-nano prising	Ikke direkte bekreftet, interpolert	Moderat

Totalt antall kilder: 10 (8 primære Microsoft Learn, 2 pricing-referanser) MCP-kall brukt: 5 (4x docs_search, 1x docs_fetch — model-choice-guide)

Siste oppdatering og gyldighet

Dokumentasjonsdato: Februar 2026 Bekreftede priser gyldige per: Februar 2026 (GPT-4.1-serien) Estimerte priser: GPT-5-serien — verifiser på offisiell prisside Neste review anbefalt: Mai 2026 (GPT-5-priser forventes publisert; sjekk kvartalsvis)

Dokumenteier: Cosmo Skyberg, Microsoft AI Solution Architect Godkjent for: Offentlig sektor Norge, Enterprise Azure-kunder Versjon: 1.0

28 KiB Raw Blame History Unescape Escape