Updates across all 5 skills: ms-ai-advisor, ms-ai-engineering, ms-ai-governance, ms-ai-security, ms-ai-infrastructure. Key changes: - Language Services (Custom Text Classification, Text Analytics, QnA): retirement warning 2029-03-31, migration guides to Foundry/GPT-4o - Agentic Retrieval: 50M free reasoning tokens/month (Public Preview) - Computer Use: Claude Sonnet 4.5 (preview) + OpenAI CUA models - Agent Registry: Risks column (M365 E7), user-shared/org-published types - Declarative agents: schema v1.5 → v1.6, Store validation requirements - MLflow 3: 13 built-in LLM judges, production monitoring, Genie Code - AG-UI HITL: ApprovalRequiredAIFunction (C#) + @tool(approval_mode) (Python) - Entra ID Ignite 2025: Agent ID Admin/Developer RBAC roles, Conditional Access - Security Copilot: 400 SCU/month per 1000 M365 E5 licenses, auto-provisioned - Fast Transcription API: phrase lists, 14-language multi-lingual transcription - Azure Monitor Workbooks: Bicep support, RBAC specifics - Power Platform Copilot: data residency (Norway/Europe → EU DB, Bing → USA) - RAG security-rbac: 4-approach table (GA + 3 preview access control methods) - IaC MLOps: Well-Architected OE:05 principles, Bicep/Terraform patterns - Translator: image file batch translation Preview (JPEG/PNG/BMP/WebP) All 106 files: Last updated 2026-04 | Verified: MCP 2026-04 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
11 KiB
Semantic Ranker and Reranking Models
Last updated: 2026-04 | Verified: MCP 2026-04 Status: GA (core), Preview (query rewrite, prerelease models) Category: RAG Architecture & Semantic Search
Introduksjon
Semantic Ranker er en premium-funksjon i Azure AI Search som bruker Microsofts språkforståelsesmodeller (opprinnelig fra Bing) til å forbedre søkerelevans gjennom L2 (Level 2) reranking. Den opererer oppå de initielle BM25- eller RRF-rangerte resultatene, og rerangerer de topp 50 basert på dyp semantisk forståelse av innholdet.
Semantic Ranker er ikke et generativt AI-system — den ekstraherer eksisterende tekst fra dokumenter. Den produserer semantiske captions (relevante passasjer), semantiske answers (direkte svar på spørsmål), og en @search.rerankerScore fra 0.0 til 4.0 som indikerer semantisk relevans. Dette gjør den ideell for kunnskapsbaser, dokumentportaler og RAG-scenarioer der høy relevans er kritisk.
Funksjonen er GA for kjernefunksjonalitet, med preview-features som query rewrite (utvider spørsmål til opptil 10 varianter) og mulighet for å opt-in til prerelease-modeller.
Kjernekomponenter
Trestegs-prosessen
-
Input og summarisering
- Tar topp 50 resultater fra initial ranking (BM25 eller RRF)
- Assembler opptil 2000 tokens per dokument fra konfigurerte felt
- Token-allokering: title (128), keywords (128), content (resten)
- Fra november 2024: summary strings opptil 2048 tokens (tidligere 256)
-
Scoring
- Evaluerer semantisk relevans med språkmodeller
- Tildeler
@search.rerankerScore(0.0–4.0 skala)
-
Output-generering
- Returnerer re-scorede resultater i synkende rekkefølge
- Ekstraherer verbatim captions og answers
- Gir både plain text og highlighted versjoner
Reranker Score-skala
| Score | Betydning |
|---|---|
| 4.0 | Svært relevant, komplett svar |
| 3.0 | Relevant men mangler noen detaljer |
| 2.0 | Noe relevant, delvis svar |
| 1.0 | Relatert men minimalt svar |
| 0.0 | Irrelevant |
Tommelregel: Bruk score 3.0+ som høy-konfidensresultater i RAG-systemer.
Semantic Configuration
{
"semantic": {
"defaultConfiguration": "my-semantic-config",
"configurations": [
{
"name": "my-semantic-config",
"prioritizedFields": {
"titleField": { "fieldName": "Title" },
"prioritizedContentFields": [
{ "fieldName": "Description" },
{ "fieldName": "Content" }
],
"prioritizedKeywordsFields": [
{ "fieldName": "Tags" },
{ "fieldName": "Category" }
]
}
}
]
}
}
Feltkrav:
- Må være
searchableogretrievable - Må være strings (
Edm.StringellerCollection(Edm.String)) - Title: maks 25 ord anbefalt
- Content: lengre, deskriptiv tekst (prioritert rekkefølge)
- Keywords: tagger, kategorier (prioritert rekkefølge)
Reranking-tilnærminger
1. Azure AI Search Semantic Ranker (innebygd)
| Egenskap | Detalj |
|---|---|
| Type | Proprietary Microsoft-modell (fra Bing) |
| Integrasjon | Innebygd i Azure AI Search |
| Kapasitet | ~10 samtidige queries per replika |
| Aktivering | queryType=semantic i spørring |
| Multilingual | Ja |
results = search_client.search(
query_type='semantic',
semantic_configuration_name='my-semantic-config',
search_text="historic hotel walk to restaurants",
select='HotelName,Description',
query_caption='extractive',
query_answer='extractive'
)
for result in results:
print(f"Reranker Score: {result['@search.reranker_score']}")
captions = result["@search.captions"]
if captions:
print(f"Caption: {captions[0].highlights}")
2. Cross-Encoder Reranking (custom)
For scenarier der du trenger full kontroll over reranking-logikk:
from sentence_transformers import CrossEncoder
model = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-v2')
pairs = [(query, doc["content"]) for doc in initial_results]
scores = model.predict(pairs)
# Re-sort basert på cross-encoder scores
reranked = sorted(
zip(initial_results, scores),
key=lambda x: x[1],
reverse=True
)
Fordeler: Full kontroll, open-source modeller, kan fintunes for domene Ulemper: Ekstra infrastruktur, høyere latency, vedlikeholdskostnad
3. LLM-basert reranking
Bruk en LLM for å vurdere og rangere søkeresultater:
Fordeler: Fleksibel, kontekstuell forståelse Ulemper: Høy token-kostnad, uforutsigbar latency
4. List-wise Ranking (RRF)
Automatisk i hybrid queries — Reciprocal Rank Fusion kombinerer rankings fra multiple queries uten eksplisitt reranking-steg.
Arkitekturmønstre
Mønster 1: Semantic Ranking for RAG
Flyt: Query → Hybrid search → RRF (L1) → Semantic Ranker (L2, topp 50) → Topp-k kontekst → LLM
Fordeler:
- Best mulig relevans for RAG-kontekst
- Semantiske captions gir bedre kontekst enn hele dokumenter
- Reduserer hallusinering gjennom høy-kvalitets grounding
Ulemper:
- Ekstra latency (~50–200ms)
- Krever S1-tier
- Kun topp 50 rerankes
Mønster 2: Multi-layer Ranking
Flyt: Query → BM25+Vector → RRF (L1) → Semantic Ranker (L2) → Custom reranker (L3)
Brukes når standard semantic ranking ikke er tilstrekkelig for domenet, f.eks. medisinsk, juridisk, eller teknisk dokumentasjon.
Mønster 3: Agentic Retrieval med L3
Flyt: Query → LLM query planning → Subqueries → Parallel retrieval → Semantic ranking → LLM-assistert L3 ranking
Preview-funksjon (2025) som integrerer iterativ søk med semantic ranking.
Beslutningsveiledning
Når bruke semantic ranking
| Scenario | Semantic Ranker? | Begrunnelse |
|---|---|---|
| Enterprise kunnskapsbase | Ja | Høy relevans for varierte spørsmål |
| RAG-grounding | Ja | Bedre kontekst = mindre hallusinering |
| E-commerce produktsøk | Vurder | Kan hjelpe for beskrivende søk, men ikke for SKU-oppslag |
| Logg-analyse | Nei | Strukturert data, ikke deskriptiv tekst |
| Høy-volum API (>10K qps) | Vurder | Kapasitetsbegrensning per replika |
| Utvikling/testing | Ja (gratis tier) | 1000 requests/mnd gratis |
Vanlige feil
- Glemme å sette
k=50for vector queries — Semantic ranker jobber med topp 50 fra L1 - Feil felt i semantic configuration — Korte, kodelignende felt gir dårlige resultater
- Forvente generative svar — Semantic ranker ekstraherer verbatim, den genererer ikke
- Ignorere
@search.rerankerScore— Bruk den for filtrering og konfidensgrenseverdier
Røde flagg
CapacityOverloadedfeil → For mange samtidige queries per replika- Lave reranker scores (<1.0) på relevante dokumenter → Sjekk semantic configuration feltvalg
- Uventede answers → Sjekk at content-felt er tilstrekkelig deskriptive
Integrasjon med Microsoft-stakken
| Tjeneste | Integrasjon |
|---|---|
| Azure OpenAI | RAG med semantic-ranked kontekst for bedre svar |
| Azure AI Foundry | Evaluering av semantic ranking-kvalitet via built-in evaluators |
| Copilot Studio | Automatisk bruk av semantic ranking i grounding |
| Azure Cosmos DB | Semantic Reranker (separat produkt, lignende konsept) |
| Databricks | Vector Search med reranking-integrasjon |
Offentlig sektor (Norge)
Relevans
- Semantic ranker er multilingual — fungerer med norsk tekst uten ekstra konfigurasjon
- Ideell for offentlige kunnskapsbaser der brukere stiller spørsmål i naturlig språk
- Captions og answers kan brukes direkte i brukergrensesnitt for raskere saksbehandling
Tilgjengelighet
- Tilgjengelig i Norway East og Norway West regioner
- All prosessering skjer i valgt region (datasuverenitet)
- Ingen data sendes ut av regionen for reranking
Compliance
- GDPR-kompatibel
- Schrems II-kompatibel (EU Data Boundary)
- Ingen tredjepartsleverandører involvert i reranking-prosessen
Kostnad og lisensiering
Prismodell
| Plan | Detaljer |
|---|---|
| Gratis | 1000 semantic ranker-requests/måned, alle tier (inkl. Free) |
| Standard | Pay-as-you-go etter gratis kvote, per 1000 requests |
Faktureringsregler
- Belastes:
queryType=semanticOG søkestreng er ikke tom - Belastes IKKE:
search=*(tom query), selv medqueryType=semantic - Overgang fra gratis til betalt skjer sømløst (ingen varsling)
Kostnadsoptimering
- Bruk gratis tier for utvikling og testing
- Vurder om alle queries trenger semantic ranking, eller kun de med lav BM25-relevans
- Batch queries med lignende emner for bedre cache-utnyttelse
For arkitekten (Cosmo)
Spørsmål å stille kunden
- Hvilken type innhold skal søkes — deskriptivt, strukturert, eller blandet?
- Stiller brukerne naturlige spørsmål eller bruker de nøkkelord?
- Hva er akseptabel latency for søkeresultater?
- Hvor mange samtidige søk forventes?
- Er multilingual support nødvendig?
- Finnes det et budsjett for semantic ranking utover gratis tier?
- Har dere allerede S1-tier, eller krever dette en oppgradering?
Fallgruver
- Semantic ranker er IKKE en erstatning for god indeksdesign — dårlige felt gir dårlige resultater
- Summary string-lengden (2048 tokens) betyr at svært lange dokumenter kan miste kontekst
- Semantiske answers returneres kun når modellen er 70% konfident — ikke forvent svar på alle queries
Anbefalinger per modenhetsnivå
| Nivå | Anbefaling |
|---|---|
| Starter | Aktiver semantic ranker med default config, bruk gratis tier |
| Intermediær | Optimer semantic configuration-felt, implementer score-basert filtrering |
| Avansert | Kombinér med custom cross-encoder, A/B-test reranking-strategier, opt-in til prerelease-modeller |
Kilder og verifisering
Verified (MCP-research)
- Semantic ranking in Azure AI Search
- Configure semantic ranker
- Add semantic ranking to queries
- Enable or disable semantic ranker
- Relevance in Azure AI Search
- Hybrid search overview
Baseline (modellkunnskap)
- Cross-encoder-eksempler basert på Sentence Transformers-dokumentasjon
- Offentlig sektor-anbefalinger basert på norsk kontekst
Semantic Ranker i Hybrid Search (oppdatert 2026-04)
Semantic ranker (L2 reranking) fungerer optimalt i hybrid search-kontekst:
- Aksepterer opp til 50 resultater fra RRF-merger som input
- Bruker maskinlesningsforståelse (MRC) for å re-ranke basert på semantisk relevans
@search.rerankerScoreerstatter@search.scoresom primær rankingmetrikk- Valgfritt:
captions(ekstraktiv) oganswers(ekstraktiv) fra verbatim tekst
Konfigurasjon:
{
"queryType": "semantic",
"semanticConfiguration": "min-konfig",
"captions": "extractive",
"answers": "extractive"
}
Viktig: Sett k=50 i vectorQueries — semantic ranker trenger tilstrekkelig input. Pre-filtre som er for strenge kan redusere antall input-dokumenter og svekke reranking-kvaliteten.