Kjell Tore Guttormsen ff6a50d14f docs(architect): weekly KB update — 106 files refreshed (2026-04)

Updates across all 5 skills: ms-ai-advisor, ms-ai-engineering,
ms-ai-governance, ms-ai-security, ms-ai-infrastructure.

Key changes:
- Language Services (Custom Text Classification, Text Analytics, QnA):
  retirement warning 2029-03-31, migration guides to Foundry/GPT-4o
- Agentic Retrieval: 50M free reasoning tokens/month (Public Preview)
- Computer Use: Claude Sonnet 4.5 (preview) + OpenAI CUA models
- Agent Registry: Risks column (M365 E7), user-shared/org-published types
- Declarative agents: schema v1.5 → v1.6, Store validation requirements
- MLflow 3: 13 built-in LLM judges, production monitoring, Genie Code
- AG-UI HITL: ApprovalRequiredAIFunction (C#) + @tool(approval_mode) (Python)
- Entra ID Ignite 2025: Agent ID Admin/Developer RBAC roles, Conditional Access
- Security Copilot: 400 SCU/month per 1000 M365 E5 licenses, auto-provisioned
- Fast Transcription API: phrase lists, 14-language multi-lingual transcription
- Azure Monitor Workbooks: Bicep support, RBAC specifics
- Power Platform Copilot: data residency (Norway/Europe → EU DB, Bing → USA)
- RAG security-rbac: 4-approach table (GA + 3 preview access control methods)
- IaC MLOps: Well-Architected OE:05 principles, Bicep/Terraform patterns
- Translator: image file batch translation Preview (JPEG/PNG/BMP/WebP)

All 106 files: Last updated 2026-04 | Verified: MCP 2026-04

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

2026-04-10 09:13:24 +02:00

11 KiB

Raw Blame History

Semantic Ranker and Reranking Models

Last updated: 2026-04 | Verified: MCP 2026-04 Status: GA (core), Preview (query rewrite, prerelease models) Category: RAG Architecture & Semantic Search

Introduksjon

Semantic Ranker er en premium-funksjon i Azure AI Search som bruker Microsofts språkforståelsesmodeller (opprinnelig fra Bing) til å forbedre søkerelevans gjennom L2 (Level 2) reranking. Den opererer oppå de initielle BM25- eller RRF-rangerte resultatene, og rerangerer de topp 50 basert på dyp semantisk forståelse av innholdet.

Semantic Ranker er ikke et generativt AI-system — den ekstraherer eksisterende tekst fra dokumenter. Den produserer semantiske captions (relevante passasjer), semantiske answers (direkte svar på spørsmål), og en @search.rerankerScore fra 0.0 til 4.0 som indikerer semantisk relevans. Dette gjør den ideell for kunnskapsbaser, dokumentportaler og RAG-scenarioer der høy relevans er kritisk.

Funksjonen er GA for kjernefunksjonalitet, med preview-features som query rewrite (utvider spørsmål til opptil 10 varianter) og mulighet for å opt-in til prerelease-modeller.

Kjernekomponenter

Trestegs-prosessen

Input og summarisering
- Tar topp 50 resultater fra initial ranking (BM25 eller RRF)
- Assembler opptil 2000 tokens per dokument fra konfigurerte felt
- Token-allokering: title (128), keywords (128), content (resten)
- Fra november 2024: summary strings opptil 2048 tokens (tidligere 256)
Scoring
- Evaluerer semantisk relevans med språkmodeller
- Tildeler @search.rerankerScore (0.0–4.0 skala)
Output-generering
- Returnerer re-scorede resultater i synkende rekkefølge
- Ekstraherer verbatim captions og answers
- Gir både plain text og highlighted versjoner

Reranker Score-skala

Score	Betydning
4.0	Svært relevant, komplett svar
3.0	Relevant men mangler noen detaljer
2.0	Noe relevant, delvis svar
1.0	Relatert men minimalt svar
0.0	Irrelevant

Tommelregel: Bruk score 3.0+ som høy-konfidensresultater i RAG-systemer.

Semantic Configuration

{
  "semantic": {
    "defaultConfiguration": "my-semantic-config",
    "configurations": [
      {
        "name": "my-semantic-config",
        "prioritizedFields": {
          "titleField": { "fieldName": "Title" },
          "prioritizedContentFields": [
            { "fieldName": "Description" },
            { "fieldName": "Content" }
          ],
          "prioritizedKeywordsFields": [
            { "fieldName": "Tags" },
            { "fieldName": "Category" }
          ]
        }
      }
    ]
  }
}

Feltkrav:

Må være searchable og retrievable
Må være strings (Edm.String eller Collection(Edm.String))
Title: maks 25 ord anbefalt
Content: lengre, deskriptiv tekst (prioritert rekkefølge)
Keywords: tagger, kategorier (prioritert rekkefølge)

Reranking-tilnærminger

1. Azure AI Search Semantic Ranker (innebygd)

Egenskap	Detalj
Type	Proprietary Microsoft-modell (fra Bing)
Integrasjon	Innebygd i Azure AI Search
Kapasitet	~10 samtidige queries per replika
Aktivering	`queryType=semantic` i spørring
Multilingual	Ja

results = search_client.search(
    query_type='semantic',
    semantic_configuration_name='my-semantic-config',
    search_text="historic hotel walk to restaurants",
    select='HotelName,Description',
    query_caption='extractive',
    query_answer='extractive'
)

for result in results:
    print(f"Reranker Score: {result['@search.reranker_score']}")
    captions = result["@search.captions"]
    if captions:
        print(f"Caption: {captions[0].highlights}")

2. Cross-Encoder Reranking (custom)

For scenarier der du trenger full kontroll over reranking-logikk:

from sentence_transformers import CrossEncoder

model = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-v2')
pairs = [(query, doc["content"]) for doc in initial_results]
scores = model.predict(pairs)

# Re-sort basert på cross-encoder scores
reranked = sorted(
    zip(initial_results, scores),
    key=lambda x: x[1],
    reverse=True
)

Fordeler: Full kontroll, open-source modeller, kan fintunes for domene Ulemper: Ekstra infrastruktur, høyere latency, vedlikeholdskostnad

3. LLM-basert reranking

Bruk en LLM for å vurdere og rangere søkeresultater:

Fordeler: Fleksibel, kontekstuell forståelse Ulemper: Høy token-kostnad, uforutsigbar latency

4. List-wise Ranking (RRF)

Automatisk i hybrid queries — Reciprocal Rank Fusion kombinerer rankings fra multiple queries uten eksplisitt reranking-steg.

Arkitekturmønstre

Mønster 1: Semantic Ranking for RAG

Flyt: Query → Hybrid search → RRF (L1) → Semantic Ranker (L2, topp 50) → Topp-k kontekst → LLM

Fordeler:

Best mulig relevans for RAG-kontekst
Semantiske captions gir bedre kontekst enn hele dokumenter
Reduserer hallusinering gjennom høy-kvalitets grounding

Ulemper:

Ekstra latency (~50–200ms)
Krever S1-tier
Kun topp 50 rerankes

Mønster 2: Multi-layer Ranking

Flyt: Query → BM25+Vector → RRF (L1) → Semantic Ranker (L2) → Custom reranker (L3)

Brukes når standard semantic ranking ikke er tilstrekkelig for domenet, f.eks. medisinsk, juridisk, eller teknisk dokumentasjon.

Mønster 3: Agentic Retrieval med L3

Flyt: Query → LLM query planning → Subqueries → Parallel retrieval → Semantic ranking → LLM-assistert L3 ranking

Preview-funksjon (2025) som integrerer iterativ søk med semantic ranking.

Beslutningsveiledning

Når bruke semantic ranking

Scenario	Semantic Ranker?	Begrunnelse
Enterprise kunnskapsbase	Ja	Høy relevans for varierte spørsmål
RAG-grounding	Ja	Bedre kontekst = mindre hallusinering
E-commerce produktsøk	Vurder	Kan hjelpe for beskrivende søk, men ikke for SKU-oppslag
Logg-analyse	Nei	Strukturert data, ikke deskriptiv tekst
Høy-volum API (>10K qps)	Vurder	Kapasitetsbegrensning per replika
Utvikling/testing	Ja (gratis tier)	1000 requests/mnd gratis

Vanlige feil

Glemme å sette k=50 for vector queries — Semantic ranker jobber med topp 50 fra L1
Feil felt i semantic configuration — Korte, kodelignende felt gir dårlige resultater
Forvente generative svar — Semantic ranker ekstraherer verbatim, den genererer ikke
Ignorere @search.rerankerScore — Bruk den for filtrering og konfidensgrenseverdier

Røde flagg

CapacityOverloaded feil → For mange samtidige queries per replika
Lave reranker scores (<1.0) på relevante dokumenter → Sjekk semantic configuration feltvalg
Uventede answers → Sjekk at content-felt er tilstrekkelig deskriptive

Integrasjon med Microsoft-stakken

Tjeneste	Integrasjon
Azure OpenAI	RAG med semantic-ranked kontekst for bedre svar
Azure AI Foundry	Evaluering av semantic ranking-kvalitet via built-in evaluators
Copilot Studio	Automatisk bruk av semantic ranking i grounding
Azure Cosmos DB	Semantic Reranker (separat produkt, lignende konsept)
Databricks	Vector Search med reranking-integrasjon

Offentlig sektor (Norge)

Relevans

Semantic ranker er multilingual — fungerer med norsk tekst uten ekstra konfigurasjon
Ideell for offentlige kunnskapsbaser der brukere stiller spørsmål i naturlig språk
Captions og answers kan brukes direkte i brukergrensesnitt for raskere saksbehandling

Tilgjengelighet

Tilgjengelig i Norway East og Norway West regioner
All prosessering skjer i valgt region (datasuverenitet)
Ingen data sendes ut av regionen for reranking

Compliance

GDPR-kompatibel
Schrems II-kompatibel (EU Data Boundary)
Ingen tredjepartsleverandører involvert i reranking-prosessen

Kostnad og lisensiering

Prismodell

Plan	Detaljer
Gratis	1000 semantic ranker-requests/måned, alle tier (inkl. Free)
Standard	Pay-as-you-go etter gratis kvote, per 1000 requests

Faktureringsregler

Belastes: queryType=semantic OG søkestreng er ikke tom
Belastes IKKE: search=* (tom query), selv med queryType=semantic
Overgang fra gratis til betalt skjer sømløst (ingen varsling)

Kostnadsoptimering

Bruk gratis tier for utvikling og testing
Vurder om alle queries trenger semantic ranking, eller kun de med lav BM25-relevans
Batch queries med lignende emner for bedre cache-utnyttelse

For arkitekten (Cosmo)

Spørsmål å stille kunden

Hvilken type innhold skal søkes — deskriptivt, strukturert, eller blandet?
Stiller brukerne naturlige spørsmål eller bruker de nøkkelord?
Hva er akseptabel latency for søkeresultater?
Hvor mange samtidige søk forventes?
Er multilingual support nødvendig?
Finnes det et budsjett for semantic ranking utover gratis tier?
Har dere allerede S1-tier, eller krever dette en oppgradering?

Fallgruver

Semantic ranker er IKKE en erstatning for god indeksdesign — dårlige felt gir dårlige resultater
Summary string-lengden (2048 tokens) betyr at svært lange dokumenter kan miste kontekst
Semantiske answers returneres kun når modellen er 70% konfident — ikke forvent svar på alle queries

Anbefalinger per modenhetsnivå

Nivå	Anbefaling
Starter	Aktiver semantic ranker med default config, bruk gratis tier
Intermediær	Optimer semantic configuration-felt, implementer score-basert filtrering
Avansert	Kombinér med custom cross-encoder, A/B-test reranking-strategier, opt-in til prerelease-modeller

Kilder og verifisering

Verified (MCP-research)

Baseline (modellkunnskap)

Cross-encoder-eksempler basert på Sentence Transformers-dokumentasjon
Offentlig sektor-anbefalinger basert på norsk kontekst

Semantic Ranker i Hybrid Search (oppdatert 2026-04)

Semantic ranker (L2 reranking) fungerer optimalt i hybrid search-kontekst:

Aksepterer opp til 50 resultater fra RRF-merger som input
Bruker maskinlesningsforståelse (MRC) for å re-ranke basert på semantisk relevans
@search.rerankerScore erstatter @search.score som primær rankingmetrikk
Valgfritt: captions (ekstraktiv) og answers (ekstraktiv) fra verbatim tekst

Konfigurasjon:

{
  "queryType": "semantic",
  "semanticConfiguration": "min-konfig",
  "captions": "extractive",
  "answers": "extractive"
}

Viktig: Sett k=50 i vectorQueries — semantic ranker trenger tilstrekkelig input. Pre-filtre som er for strenge kan redusere antall input-dokumenter og svekke reranking-kvaliteten.

11 KiB Raw Blame History Unescape Escape