Initial addition of ms-ai-architect plugin to the open-source marketplace. Private content excluded: orchestrator/ (Linear tooling), docs/utredning/ (client investigation), generated test reports and PDF export script. skill-gen tooling moved from orchestrator/ to scripts/skill-gen/. Security scan: WARNING (risk 20/100) — no secrets, no injection found. False positive fixed: added gitleaks:allow to Python variable reference in output-validation-grounding-verification.md line 109. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
11 KiB
Hierarchical RAG Patterns — Multi-nivå retrieval
Last updated: 2026-02 Status: GA (index projections), Preview (agentic retrieval) Category: RAG Architecture & Semantic Search
Introduksjon
Hierarchical RAG organiserer kunnskap i multi-nivå strukturer i stedet for flat chunk-indeksering. Ved å etablere relasjoner mellom parent-dokumenter, seksjoner og chunks muliggjøres en «zoom inn/ut»-mekanisme der søk starter bredt (dokumentnivå) og driller ned til relevante segmenter.
Azure AI Search implementerer hierarkisk RAG gjennom index projections som håndterer one-to-many relasjoner mellom kildedokumenter og chunks. Document Intelligence Layout skill bevarer dokumentstruktur (headings, avsnitt) som muliggjør hierarkisk navigasjon.
Forskning (2025-2026) viser at hierarkisk retrieval gir 47% høyere Hit@1 og opptil 250x reduksjon i token-kostnad sammenlignet med flat retrieval, fordi søkeområdet reduseres gjennom coarse-to-fine filtrering.
Kjernekomponenter
Parent-child relasjoner i Azure AI Search
Azure AI Search tilbyr tre arkitekturmønstre for parent-child indeksering:
| Mønster | Beskrivelse | Brukstilfelle |
|---|---|---|
| Single index, repeating parent fields | Parent-metadata repeteres per chunk | Standard RAG, enkel query-logikk (anbefalt) |
| Single index, mixed document shapes | Parents og chunks co-eksisterer | Fulldokument-søk + chunk-søk i én indeks |
| Separate parent-child indexes | Dedikert parent-index + child-index | Enterprise med strikt separasjon, compliance |
Index projection-konfigurasjon
{
"indexProjections": {
"selectors": [
{
"targetIndexName": "my_consolidated_index",
"parentKeyFieldName": "parent_id",
"sourceContext": "/document/pages/*",
"mappings": [
{ "name": "chunk", "source": "/document/pages/*" },
{ "name": "chunk_vector", "source": "/document/pages/*/chunk_vector" },
{ "name": "title", "source": "/document/title" }
]
}
],
"parameters": {
"projectionMode": "skipIndexingParentDocuments"
}
}
}
Nøkkelparametere:
| Parameter | Verdier | Beskrivelse |
|---|---|---|
projectionMode |
skipIndexingParentDocuments / includeIndexingParentDocuments |
Kun chunks eller begge |
parentKeyFieldName |
parent_id, text_parent_id |
Felt som kobler chunk → parent |
sourceContext |
/document/pages/* |
Enrichment path for granularitet |
Automatisk chunk-ID generering
Azure AI Search genererer chunk-IDer basert på parent-ID:
- Parent:
aa1b22c33 - Chunk 1:
aa1b22c33_pages_0 - Chunk 2:
aa1b22c33_pages_1
Hash-komponenten endres ved parent-oppdatering → sikrer change tracking.
Arkitekturmønstre
Mønster 1: Single index med parent-metadata (anbefalt)
Arkitektur: Data source → Indexer → Document Layout → Text Split → Embedding → Index projections (parent fields repeteres per chunk)
Index-schema:
{
"fields": [
{ "name": "chunk_id", "type": "Edm.String", "key": true },
{ "name": "parent_id", "type": "Edm.String", "filterable": true },
{ "name": "chunk", "type": "Edm.String", "searchable": true },
{ "name": "chunk_vector", "type": "Collection(Edm.Single)" },
{ "name": "title", "type": "Edm.String", "filterable": true },
{ "name": "section_heading", "type": "Edm.String", "filterable": true },
{ "name": "page_number", "type": "Edm.Int32", "filterable": true }
]
}
Fordeler:
- Enklest å implementere og vedlikeholde
- Én query gir chunks med full parent-kontekst
- Metadata-filtrering (tittel, seksjon) for hierarkisk drill-down
Anbefalt for: 80% av RAG-løsninger, spesielt ved enkel dokumentstruktur.
Mønster 2: Multi-resolution retrieval med lookup-queries
Arkitektur: Child index (chunks) + Parent index (summaries/metadata) → Vector search på child → Lookup til parent
Implementering:
# Steg 1: Hent relevante chunks
child_results = child_client.search(
vector_queries=[VectorQuery(vector=query_embedding, k=5)],
select=["chunk_id", "parent_id", "chunk"]
)
# Steg 2: Lookup parent-dokumenter
parent_ids = {r["parent_id"] for r in child_results}
parent_docs = parent_client.search(
filter=f"parent_id in ({','.join(parent_ids)})",
select=["parent_id", "title", "summary"]
)
# Steg 3: Assembler kontekst
context = []
for chunk in child_results:
parent = next(p for p in parent_docs if p["parent_id"] == chunk["parent_id"])
context.append({
"chunk": chunk["chunk"],
"source": parent["title"],
"summary": parent["summary"]
})
Fordeler:
- «Zoom ut» fra chunk til fullt dokument
- Parent-summary gir LLM bedre kontekstuell forståelse
- Sporbarhet for citation og audit
Anbefalt for: Enterprise RAG med krav til kildehenvisning og compliance.
Mønster 3: Retrieval cascade (Summary → Section → Chunk)
Arkitektur: Tre indeksnivåer med progressiv filtrering:
Nivå 1: Document summaries → Velg relevante dokumenter (top-10)
Nivå 2: Section headings → Velg relevante seksjoner (top-20)
Nivå 3: Chunks → Hent detaljerte segmenter (top-5)
Fordeler:
- Drastisk reduksjon av søkerom (10-100x)
- Minimerer «lost in the middle»-problemet
- Opptil 250x reduksjon i token-kostnad
Ulemper:
- Tre separate søkeoperasjoner (økt latency)
- Kompleks indeksstruktur
- Krever generering av summaries per dokument/seksjon
Anbefalt for: Store dokumentsamlinger (>100K docs) der flat søk gir dårlig precision.
Beslutningsveiledning
Beslutningstabell
| Scenario | Volum | Anbefalt mønster |
|---|---|---|
| Standard RAG | <50K docs | Mønster 1 (single index, parent fields) |
| Krav til citation/sporbarhet | Alle | Mønster 2 (lookup queries) |
| Stort volum, lav precision | >100K docs | Mønster 3 (retrieval cascade) |
| Compliance/audit | Alle | Mønster 2 med dataDeletionDetectionPolicy |
Vanlige feil
| Feil | Konsekvens | Løsning |
|---|---|---|
| Ingen parent-child mapping | Kan ikke spore chunk → kildedokument | Bruk index projections med parentKeyFieldName |
Ignorerer dataDeletionDetectionPolicy |
GDPR right to erasure brytes | Konfigurer cascade deletion på data source |
| Flat index for >100K docs | Dårlig precision, høy token-kostnad | Vurder retrieval cascade |
| Manglende metadata (section, page) | Ingen mulighet for hierarkisk filtrering | Legg til section_heading og page_number |
Integrasjon med Microsoft-stakken
| Tjeneste | Integrasjonspunkt |
|---|---|
| Azure AI Search | Index projections, parent-child mapping, lookup queries |
| Azure AI Document Intelligence | Document Layout skill med markdownHeaderDepth: "h3" |
| Azure Content Understanding | Semantisk chunking med kryssende sider |
| Azure OpenAI | Summary-generering for retrieval cascade |
| Semantic Kernel | TextSearchProvider med namespace-filtrering |
| Azure Cosmos DB | Alternativ parent-child storage med hierarkisk query |
Document Layout skill for hierarkisk chunking
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"inputs": [{"name": "file_data", "source": "/document/file_data"}],
"outputs": [{"name": "markdown_document", "targetName": "markdownDocument"}]
}
Output: Markdown med # H1, ## H2, ### H3 som bevarer hierarkisk dokumentstruktur.
Offentlig sektor (Norge)
Dataplassering
- Azure AI Search: Norway East — hierarkisk indeks forblir i Norge
- Document Intelligence: West Europe — dokument-parsing i EU
Relevante vurderinger
| Krav | Implikasjon |
|---|---|
| Forvaltningsloven | Chunks må spores til kildedokument — krev parent-child mapping |
| GDPR Art. 17 | Sletting av kildedokument MÅ kaskadere til alle chunks |
| AI Act | Hierarkisk sporbarhet støtter forklarbarhetskrav |
| Arkivloven | Parent-index bevarer dokumentkontekst for arkivformål |
Kostnad og lisensiering
Kostnadskomponenter
| Komponent | Kostnad | Notat |
|---|---|---|
| Index projections | Inkludert i AI Search | Ingen ekstra kostnad |
| Document Layout skill | ~$0.01-0.05/side | Document Intelligence-prising |
| Summary-generering (cascade) | GPT-4o per dokument | ~$0.01-0.05/dokument |
| Ekstra indekslagring (parent-felter) | Per GB | ~20-30% økning ved repeterte felter |
Optimaliseringstips
- Bruk
projectionMode: skipIndexingParentDocumentsfor å unngå dobbelt lagring - Generer summaries off-peak for å minimere compute-kostnad
- Sett
stored: falsepå vektorfelt for å spare lagringsplassn
For arkitekten (Cosmo)
Spørsmål å stille kunden
- "Trenger brukerne å se hvilke dokumenter et svar kommer fra?" — Hvis ja, krev parent-child mapping
- "Hvor mange dokumenter er i samlingen?" — >100K → vurder cascade
- "Er det compliance-krav til sletting (GDPR)?" — Krev cascade deletion
- "Har dokumentene tydelig struktur (headings, kapitler)?" — Bruk Document Layout skill
- "Hva er akseptabel query-latency?" — Cascade = 2-3x latency
Fallgruver
- Over-engineering for småskala: Single index med parent fields er nok for <50K docs
- Glemmer deletion policy: GDPR-brudd hvis chunks overlever parent-sletting
- Cascade uten summaries: Første nivå i cascade trenger AI-genererte summaries for å fungere
Anbefalinger per modenhetsnivå
| Modenhet | Anbefaling |
|---|---|
| Prototyp | Single index med parent_id felt. Ingen cascade. |
| Pilot | Index projections med parent fields + Document Layout. |
| Produksjon | Mønster 2 (lookup queries) + cascade deletion policy. |
| Enterprise | Retrieval cascade + AI-summaries + automated quality evaluation. |
Kilder og verifisering
| Kilde | Konfidens | URL |
|---|---|---|
| Define index projections (Azure AI Search) | Verified | learn.microsoft.com |
| Chunk and vectorize by document layout | Verified | learn.microsoft.com |
| RAG and generative AI (Azure AI Search) | Verified | learn.microsoft.com |
| Model complex data types | Verified | learn.microsoft.com |
| Hierarchical RAG research | Baseline | emergentmind.com |