# Windows AI and AI PC Capabilities **Last updated:** 2026-02 **Status:** GA **Category:** Hybrid Cloud & Edge AI --- ## Introduksjon Windows AI-plattformen representerer Microsofts satsing pa lokal AI-inferens direkte pa klientenheter. Med Windows ML (Machine Learning), ONNX Runtime integrert i OS, og Neural Processing Units (NPU) i Copilot+ PC-er, kan AI-modeller kjores lokalt med full datakontroll, ingen nettverkslatens, og forutsigbar ytelse. For norsk offentlig sektor er Windows AI relevant for klientbaserte AI-funksjoner som dokumentklassifisering, oppsummering, og informasjonsuttrekking — alt uten at data forlater enheten. Ansatte kan bruke AI-stoettede verktoy for daglige oppgaver uten bekymring for at sensitive data sendes til skytjenester. Phi-4 Mini, innebygd i Microsoft Edge som lokal SLM, demonstrerer denne tilnaermingen. Windows ML er den anbefalte veien for a deploye ONNX-modeller pa Windows, med automatisk Execution Provider-discovery som velger beste tilgjengelige akselerator — NPU, GPU eller CPU — uten at utviklere trenger a kode for spesifikk hardware. --- ## Kjernekomponenter | Komponent | Formal | Teknologi | |-----------|--------|-----------| | Windows ML | ONNX Runtime integrert i Windows | Windows App SDK | | ONNX Runtime | Inferensmotor for AI-modeller | Open source | | DirectML | GPU/NPU-akselerasjon (legacy) | Windows | | Execution Providers | Hardware-spesifikke akseleratorer | QNN, OpenVINO, DML | | Phi-4 Mini | Innebygd SLM i Microsoft Edge | Lokal inferens | | AI Dev Gallery | Eksempler og modellkatalog | Open source | | Foundry Local | Klare-til-bruk AI-modeller | Microsoft | | Windows AI APIs | Innebygde AI-funksjoner | Windows SDK | --- ## Windows ML og ONNX Runtime ### Hvordan Windows ML fungerer Windows ML inkluderer en kopi av ONNX Runtime og muliggjor dynamisk nedlasting av leverandorspesifikke Execution Providers (EP): ``` [ONNX-modell] → [Windows ML] → [EP Discovery] → [Inferens] ↓ ┌─────────────┼─────────────┐ ↓ ↓ ↓ [Qualcomm QNN] [Intel OpenVINO] [DirectML] (Snapdragon NPU) (Intel NPU) (GPU/CPU) ``` ### Kodeeksempel: Windows ML-inferens i C# ```csharp // Windows ML-inferens med automatisk EP-discovery using Microsoft.ML.OnnxRuntime; public class WindowsMLService { private InferenceSession _session; public async Task InitializeAsync(string modelPath) { try { var options = new SessionOptions(); // Windows ML velger automatisk beste EP: // 1. NPU (Qualcomm QNN / Intel OpenVINO) - lavest energibruk // 2. GPU (DirectML) - hoeyest ytelse // 3. CPU - alltid tilgjengelig fallback // EP-er lastes ned automatisk via Windows Update options.AppendExecutionProvider_WindowsML(); _session = new InferenceSession(modelPath, options); return true; } catch (Exception ex) { Console.WriteLine($"Kunne ikke initialisere modell: {ex.Message}"); return false; } } public float[] Classify(float[] input, int[] shape) { var tensor = new DenseTensor(input, shape); var inputs = new List { NamedOnnxValue.CreateFromTensor("input", tensor) }; using var results = _session.Run(inputs); return results.First().AsTensor().ToArray(); } } ``` ### Kodeeksempel: Python med Windows ML ```python # Windows ML-inferens i Python import onnxruntime as ort import numpy as np # Opprett session med Windows ML EP session_options = ort.SessionOptions() session = ort.InferenceSession( "model.onnx", sess_options=session_options, providers=["WindowsMLExecutionProvider", "CPUExecutionProvider"] ) # Kjor inferens input_data = np.random.randn(1, 3, 224, 224).astype(np.float32) result = session.run(None, {"input": input_data}) print(f"Output shape: {result[0].shape}") ``` ### Modellkompilering for optimal ytelse ```csharp // Kompiler modell for optimal EP-ytelse (forhands-optimalisering) using Microsoft.ML.OnnxRuntime; // Kompilering kan ta flere minutter — gjor dette i bakgrunnen var compileOptions = new OrtModelCompilationOptions(sessionOptions); compileOptions.SetInputModelPath(modelPath); compileOptions.SetOutputModelPath(compiledModelPath); // Kompiler modellen (optimal for enhetens hardware) await Task.Run(() => compileOptions.CompileModel()); // Bruk kompilert modell for raskere inferens var session = new InferenceSession(compiledModelPath, sessionOptions); ``` --- ## Neural Processing Unit (NPU) ### Hva er en NPU? En Neural Processing Unit er en dedikert AI-brikke designet spesifikt for a utfore AI-oppgaver som moenstergjenkjenning, klassifisering og naturlig sprakbehandling. I motsetning til CPU (generelle beregninger) og GPU (parallellprosessering for grafikk), er NPU-er optimalisert for nevrale nettverksoperasjoner med lavt energiforbruk. ### NPU-landskap i Copilot+ PC-er | Leverandoer | Chip | TOPS | Prosess | Plattform | |-------------|------|------|---------|-----------| | Qualcomm | Snapdragon X Elite | 45 TOPS | 4nm | ARM64 | | Qualcomm | Snapdragon X Plus | 45 TOPS | 4nm | ARM64 | | Intel | Core Ultra 200V | 48 TOPS | Intel 4 | x64 | | AMD | Ryzen AI 300 | 50 TOPS | 4nm | x64 | ### NPU vs GPU vs CPU for AI | Aspekt | NPU | GPU | CPU | |--------|-----|-----|-----| | Energiforbruk | Lavest | Hoeyest | Medium | | AI-ytelse | Hoey (spesialisert) | Hoeyest (generell) | Lavest | | Tilgjengelighet | Nye PC-er | Diskret/integrert | Alle | | Modellstoette | INT4/INT8 | FP16/FP32 | Alle formater | | Best for | Alltid-pa AI | Tunge oppgaver | Fallback | ### Tilgang til NPU via Windows ML ```csharp // Automatisk NPU-bruk via Windows ML // Ingen eksplisitt NPU-koding nodvendig — Windows ML velger beste EP // For avansert kontroll: Sjekk tilgjengelig hardware public void CheckAICapabilities() { var session = new InferenceSession("model.onnx"); var providers = session.GetAvailableProviders(); foreach (var provider in providers) { Console.WriteLine($"Tilgjengelig EP: {provider}"); // Eksempel output: // QNNExecutionProvider (Qualcomm NPU) // OpenVINOExecutionProvider (Intel NPU) // DmlExecutionProvider (GPU) // CPUExecutionProvider (CPU) } } ``` --- ## Copilot+ PC Specifications ### Minimumskrav for Copilot+ PC | Krav | Spesifikasjon | |------|---------------| | NPU | Minimum 40 TOPS | | RAM | 16 GB eller mer | | Lagring | 256 GB SSD eller mer | | OS | Windows 11 24H2 eller nyere | ### Windows AI APIs (innebygde funksjoner) | API | Funksjon | Krav | Status | |-----|----------|------|--------| | OCR | Tekstgjenkjenning i bilder | Copilot+ PC | GA | | Image Description | Bildebeskrivelese med AI | Copilot+ PC | GA | | Text Summarization | Oppsummering av tekst | Copilot+ PC | GA | | Object Erase | Fjern objekter fra bilder | Copilot+ PC | GA | | Image Segmentation | Segmentering av bilder | Copilot+ PC | GA | | Phi Silica | Innebygd SLM i Windows | Copilot+ PC | GA | ### Bruk av Windows AI APIs ```csharp // Windows AI API: Tekstoppsummering using Windows.AI; public async Task SummarizeText(string text) { var summarizer = await TextSummarizer.CreateAsync(); var result = await summarizer.SummarizeAsync(text, new SummarizerOptions { MaxSentences = 3, Language = "no" // Norsk stoette }); return result.Summary; } ``` --- ## Local LLM Inference on Device ### Phi-4 Mini i Microsoft Edge Microsoft Edge inkluderer Phi-4 Mini som lokal SLM, tilgjengelig via Web AI API-er: ```javascript // Prompt API i Microsoft Edge (Phi-4 Mini lokal inferens) // Ingen nettverkskall — alt skjer pa enheten async function localAIClassification(text) { // Sjekk tilgjengelighet const availability = await ai.languageModel.capabilities(); if (availability.available === 'no') { console.log('Lokal AI ikke tilgjengelig pa denne enheten'); return null; } // Opprett session med system-prompt const session = await ai.languageModel.create({ systemPrompt: `Du er en dokumentklassifiserer for norsk offentlig sektor. Klassifiser dokumenter i en av disse kategoriene: - Vedtak - Klage - Henvendelse - Intern notat - Hoeringssvar Svar KUN med kategorinavnet.` }); // Kjor lokal inferens const result = await session.prompt( `Klassifiser dette dokumentet: "${text.substring(0, 500)}"` ); session.destroy(); return result.trim(); } ``` ```javascript // Writing Assistance API: Oppsummering i Edge async function summarizeDocument(text) { const summarizer = await ai.summarizer.create({ type: 'key-points', length: 'short', format: 'markdown' }); const summary = await summarizer.summarize(text); summarizer.destroy(); return summary; } ``` ### Foundry Local for rikere modeller ```bash # Installer Foundry Local for lokale AI-modeller # Gir tilgang til storre modeller enn de innebygde # List tilgjengelige modeller foundry model list # Last ned Phi-3.5 for lokal bruk foundry model download phi-3.5-mini # Start inferens-server foundry model serve phi-3.5-mini --port 11434 # Bruk via OpenAI-kompatibelt API curl http://localhost:11434/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "phi-3.5-mini", "messages": [ {"role": "system", "content": "Du er en hjelpsom assistent for norsk offentlig sektor."}, {"role": "user", "content": "Oppsummer folgende utredning..."} ] }' ``` --- ## Norsk offentlig sektor ### Brukstilfeller for Windows AI i offentlig sektor | Brukstilfelle | Windows AI-losning | Fordel | |---------------|-------------------|--------| | E-post-triage | Phi-4 Mini (Edge Prompt API) | Klassifiser innkommende post uten sky | | Dokumentoppsummering | Windows AI Summarizer API | Rask oversikt over lange dokumenter | | Skjema-lesing | Windows AI OCR | Digitalisering av papirskjemaer | | Intern Q&A | Foundry Local + Phi-3.5 | Svar basert pa lokale dokumenter | | Referat-skriving | Edge Writing Assistance | Utkast til moetereferater | ### Sikkerhetshensyn - Alle data forblir pa enheten — ingen nettverkskall for AI-inferens - Phi-4 Mini-modellen er innebygd i Edge, ikke nedlastet fra sky per session - Windows ML-modeller lagres lokalt og krever ingen sky-autentisering - IT-administratorer kan kontrollere AI-API-tilgjengelighet via Group Policy --- ## Beslutningsrammeverk | Scenario | Anbefaling | Begrunnelse | |----------|------------|-------------| | Enkel tekst-AI pa klient | Edge Prompt API (Phi-4 Mini) | Innebygd, ingen oppsett | | Oppsummering/skriving | Edge Writing Assistance APIs | Spesialisert, hoey kvalitet | | Custom ONNX-modell | Windows ML med automatisk EP | Best hardware-utnyttelse | | Storre SLM lokalt | Foundry Local | OpenAI-kompatibelt API | | Enterprise-utrulling | Windows ML + Intune-administrasjon | Sentralisert styring | | NPU-optimalisert | Copilot+ PC med Windows ML | Best ytelse/watt | --- ## For Cosmo - **Windows ML er den anbefalte veien for lokal AI pa Windows** — det erstatter DirectML og gir automatisk hardware-deteksjon og EP-nedlasting, noe som forenkler deployment dramatisk - **Copilot+ PC-er med NPU muliggjor always-on AI** med lavt energiforbruk — anbefal dette for klientbaserte AI-oppgaver som dokumentklassifisering og oppsummering - **Edge Prompt API (Phi-4 Mini) er den laveste terskelen for lokal AI** — utviklere kan bruke JavaScript-API-er for a integrere AI uten modellnedlasting eller kompleks oppsett - **For norsk offentlig sektor: Lokal AI pa klientenheter eliminerer behovet for a sende sensitive data til sky** — dette forenkler DPIA og Schrems II-compliance for enklere AI-brukstilfeller - **Modellkompilering er viktig for produksjonsytelse** — kompiler ONNX-modeller for target-hardware for a oppna opptil 2-3x forbedring i inferenshastighet etter forste kjoring