# Kubernetes-Based AI at the Edge (AKS Edge) **Last updated:** 2026-02 **Status:** GA **Category:** Hybrid Cloud & Edge AI --- ## Introduksjon AKS Edge Essentials er Microsofts lettvekts Kubernetes-distribusjon for edge-scenarier, designet for a kjore containeriserte arbeidsbelastninger pa PC-klasse hardware. I motsetning til AKS i skyen eller AKS pa Azure Local, er AKS Edge Essentials optimalisert for statiske, forhands-definerte konfigurasjoner pa enheter med begrenset kapasitet — fra industrielle PC-er til gateway-enheter. For AI-arbeidsbelastninger pa edge muliggjor AKS Edge Essentials deployment av ML-modeller, inferensservere, og AI-pipelines som Kubernetes-pods med GPU-akselerasjon (via GPU-PV). Tilkoblet Azure Arc gir sentralisert administrasjon, GitOps-basert deployment, og integrasjon med Azure ML, Azure Monitor og Azure Policy. For norsk offentlig sektor er AKS Edge Essentials relevant for distribuert AI pa lokale stasjoner (veisensorer, helseutstyr, energimalere) der Kubernetes-basert orkestrering gir standardisert deployment og oppdatering av AI-modeller pa tvers av geografisk spredte enheter. --- ## Kjernekomponenter | Komponent | Formal | Teknologi | |-----------|--------|-----------| | AKS Edge Essentials | Lettvekts Kubernetes pa edge | K8s/K3s | | CBL-Mariner Linux VM | Managed Linux VM for containere | Microsoft Mariner | | Azure Arc | Sentralisert administrasjon fra sky | Kubernetes management | | GitOps (Flux) | Deklarativ applikasjons-deployment | Git-basert CD | | GPU-PV | GPU-deling mellom host og VM | Paravirtualisering | | KAITO | AI-modell deployment operator | Kubernetes operator | | Helm | Pakkehandtering for Kubernetes | Chart-basert | --- ## AKS Edge Essentials Deployment ### Systemkrav | Komponent | Minimum | Anbefalt for AI | |-----------|---------|-----------------| | OS | Windows 10/11 IoT Enterprise | Windows 11 IoT Enterprise | | CPU | 4 kjerner | 8+ kjerner | | RAM | 4 GB (K3s) / 8 GB (K8s) | 16+ GB for AI-workloads | | Disk | 40 GB | 100+ GB SSD | | GPU | Ikke pakrevd | NVIDIA T4/A2 for inferens | | Nettverk | 1 Gbps | 10 Gbps for modell-nedlasting | ### Installasjon og klynge-oppsett ```powershell # Steg 1: Installer AKS Edge Essentials # Last ned MSI fra Microsoft Start-BitsTransfer -Source "https://aka.ms/aks-edge/k8s-msi" ` -Destination "AksEdge-K8s.msi" msiexec /i AksEdge-K8s.msi /passive # Steg 2: Importer PowerShell-moduler Import-Module AksEdge # Steg 3: Generer konfigurasjonsfil New-AksEdgeConfig -DeploymentType SingleMachineCluster ` -NodeType Linux ` -outFile .\aksedge-config.json ``` ```json // aksedge-config.json — Konfigurert for AI-workloads { "SchemaVersion": "1.14", "Version": "1.0", "DeploymentType": "SingleMachineCluster", "Init": { "ServiceIPRangeSize": 10 }, "Network": { "NetworkPlugin": "flannel", "InternetDisabled": false }, "User": { "AcceptEula": true, "AcceptOptionalTelemetry": false }, "Machines": [ { "LinuxNode": { "CpuCount": 8, "MemoryInMB": 12288, "DataSizeInGB": 40, "Mtu": 1500 } } ] } ``` ```powershell # Steg 4: Valider og deploy klynge Test-AksEdgeNetworkParameters -JsonConfigFilePath .\aksedge-config.json New-AksEdgeDeployment -JsonConfigFilePath .\aksedge-config.json # Steg 5: Verifiser deployment kubectl get nodes -o wide kubectl get pods --all-namespaces -o wide ``` ### Tilkobling til Azure Arc ```powershell # Koble AKS Edge Essentials til Azure Arc $arcParams = @{ ClusterName = "edge-ai-station-01" ResourceGroupName = "rg-edge-ai-norway" Location = "norwayeast" SubscriptionId = "" TenantId = "" } # Installer Arc-agenter pa klyngen Install-AksEdgeArc @arcParams # Verifiser Arc-tilkobling kubectl get pods -n azure-arc az connectedk8s show --name edge-ai-station-01 --resource-group rg-edge-ai-norway ``` --- ## Container Orchestration at Edge ### AI-inferens deployment med Kubernetes ```yaml # ONNX Runtime inferensserver pa AKS Edge apiVersion: apps/v1 kind: Deployment metadata: name: onnx-inference-server namespace: ai-workloads spec: replicas: 1 selector: matchLabels: app: onnx-inference template: metadata: labels: app: onnx-inference spec: containers: - name: inference image: mcr.microsoft.com/onnxruntime/server:latest args: - "--model_path" - "/models/anomaly_detector.onnx" - "--http_port" - "8001" ports: - containerPort: 8001 name: http resources: requests: memory: "512Mi" cpu: "500m" limits: memory: "2Gi" cpu: "2" volumeMounts: - name: model-storage mountPath: /models livenessProbe: httpGet: path: /health port: 8001 initialDelaySeconds: 30 periodSeconds: 10 readinessProbe: httpGet: path: /ready port: 8001 initialDelaySeconds: 10 periodSeconds: 5 volumes: - name: model-storage persistentVolumeClaim: claimName: ai-models-pvc --- apiVersion: v1 kind: Service metadata: name: onnx-inference-svc namespace: ai-workloads spec: selector: app: onnx-inference ports: - port: 8001 targetPort: 8001 type: ClusterIP ``` ### GitOps-basert modelloppdatering med Flux ```yaml # Flux Kustomization for AI-modell deployment apiVersion: kustomize.toolkit.fluxcd.io/v1 kind: Kustomization metadata: name: ai-models namespace: flux-system spec: interval: 5m path: ./edge-ai/models prune: true sourceRef: kind: GitRepository name: edge-ai-config healthChecks: - apiVersion: apps/v1 kind: Deployment name: onnx-inference-server namespace: ai-workloads timeout: 10m --- # Git-repository som kilde for konfigurasjon apiVersion: source.toolkit.fluxcd.io/v1 kind: GitRepository metadata: name: edge-ai-config namespace: flux-system spec: interval: 1m url: https://dev.azure.com/org/project/_git/edge-ai-config branch: main secretRef: name: git-credentials ``` --- ## Multi-Node Edge Clusters ### Skalerbar klynge pa tvers av maskiner ```powershell # Steg 1: Generer multi-node konfigurasjon New-AksEdgeConfig -DeploymentType ScalableCluster ` -NodeType Linux ` -outFile .\multinode-config.json # Steg 2: Deploy primaer node New-AksEdgeDeployment -JsonConfigFilePath .\multinode-config.json # Steg 3: Hent join-token for ekstra noder $token = Get-AksEdgeNodeJoinToken # Steg 4: Pa sekundaer maskin — join klyngen New-AksEdgeScaleConfig -ScaleType AddNode ` -NodeType Linux ` -LinuxNodeIp "192.168.1.102" ` -outFile .\scale-config.json Add-AksEdgeNode -JsonConfigFilePath .\scale-config.json ``` ### Multi-node arkitektur for AI ``` ┌─────────────────────────────────────┐ │ Edge AI Cluster │ │ │ │ ┌───────────┐ ┌───────────┐ │ │ │ Node 1 │ │ Node 2 │ │ │ │ (Control │ │ (Worker) │ │ │ │ + Worker) │ │ │ │ │ │ │ │ - AI │ │ │ │ - API │ │ inferens│ │ │ │ server │ │ - GPU │ │ │ │ - etcd │ │ workload│ │ │ │ - Scheduler│ │ │ │ │ └───────────┘ └───────────┘ │ │ ↕ ↕ │ │ [Flannel/Calico networking] │ │ │ │ ┌───────────┐ │ │ │ Node 3 │ Azure Arc ←→ Sky │ │ │ (Worker) │ │ │ │ │ │ │ │ - Data │ │ │ │ pipeline│ │ │ │ - Storage │ │ │ └───────────┘ │ └─────────────────────────────────────┘ ``` --- ## Service Mesh for Edge ### Lettvekts service mesh pa edge For AI-arbeidsbelastninger pa edge med flere mikrotjenester (inferens, datainntak, API-gateway) kan en lettvekts service mesh gi observabilitet og trafikkstyring: ```yaml # Envoy-basert sidecar for AI-inferens (lettvekts alternativ) apiVersion: apps/v1 kind: Deployment metadata: name: ai-inference-with-proxy namespace: ai-workloads spec: template: spec: containers: # AI-inferens container - name: inference image: myregistry/anomaly-model:v2 ports: - containerPort: 8080 # Envoy sidecar for observabilitet - name: envoy-proxy image: envoyproxy/envoy:v1.28-latest ports: - containerPort: 9901 # Admin - containerPort: 10000 # Ingress volumeMounts: - name: envoy-config mountPath: /etc/envoy resources: requests: memory: "64Mi" cpu: "50m" limits: memory: "128Mi" cpu: "100m" volumes: - name: envoy-config configMap: name: envoy-edge-config ``` ### Canary deployment for modellversjoner ```yaml # Canary deployment: Gradvis utrulling av ny AI-modell apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: ai-inference-canary annotations: nginx.ingress.kubernetes.io/canary: "true" nginx.ingress.kubernetes.io/canary-weight: "20" # 20% til ny modell spec: rules: - host: inference.edge.local http: paths: - path: /predict pathType: Prefix backend: service: name: inference-v2 # Ny modellversjon port: number: 8080 ``` --- ## Norsk offentlig sektor ### Distribusjonsstrategi for norske edge-stasjoner | Stasjon | Antall | Hardware | AKS Edge-konfig | AI-workload | |---------|--------|----------|-----------------|-------------| | Veisensorer | ~200 | Industrial PC | Single-node K3s | Trafikk-analyse | | Tunnelverkaking | ~50 | Rack-server | Multi-node K8s | Brann/ventilasjon | | Ferjekaier | ~30 | Rugged PC | Single-node K3s | Bildetelling | | Ladestajoner | ~500 | IoT gateway | K3s minimal | Energi-prediksjon | ### Sikkerhets- og administrasjonskrav - Azure Arc for sentralisert forvaltning fra Norway East - GitOps for sporbar og audit-bar deployment - Network policies for nettverkssegmentering - Pod security policies/standards for container-isolasjon - KMS-plugin for kryptering av secrets i etcd --- ## Beslutningsrammeverk | Scenario | Anbefaling | Begrunnelse | |----------|------------|-------------| | Enkelt-enhet AI | AKS Edge Essentials single-node (K3s) | Lavest ressursbruk | | Multi-workload edge | AKS Edge Essentials single-node (K8s) | Full K8s-kompatibilitet | | Redundant edge-klynge | AKS Edge multi-node (K8s) | Hoy tilgjengelighet | | GPU-akselerert AI | AKS Edge + GPU-PV + NVIDIA plugin | Container-basert GPU-inferens | | Skalerbar fleet-management | AKS Edge + Azure Arc + GitOps | Sentralisert administrasjon | | Windows + Linux workloads | AKS Edge med bade Linux og Windows VM | Interop-scenarier | --- ## For Cosmo - **AKS Edge Essentials er den foretrukne loesningen for container-basert AI pa edge** — det gir Kubernetes-standarder pa PC-klasse hardware med minimal fotavtrykk (4 GB RAM for K3s) - **Azure Arc + GitOps gir sentralisert forvaltning** — anbefal dette for organisasjoner med mange edge-stasjoner som trenger sporbar, automatisert deployment av AI-modeller - **K3s vs K8s: Velg K3s for enkle AI-scenarier** med 1-3 containere, og K8s nar du trenger full Kubernetes-funksjonalitet som network policies og Pod security standards - **GPU-PV muliggjor delt GPU-tilgang** mellom Windows-host og Linux VM — bruk dette for edge-servere med NVIDIA GPU som kjorer bade tradisjonelle Windows-applikasjoner og AI-containere - **For norsk offentlig sektor: AKS Edge + Arc + GitOps gir en standardisert plattform** for AI-deployment pa tvers av etater og lokasjoner — definer felles Helm charts og Flux-konfigurasjoner for a sikre konsistent og revisjonsvennlig deployment