Verktyg

Guide: Bygg en RAG-pipeline för svenska dokument

Steg-för-steg-genomgång av chunking, embeddings och retrieval — anpassat för svensk text.

Johan Persson3 maj 20261 min läsning

Diagram av en RAG-pipeline — Illustration · ArtificiellIntelligens.org

Retrieval-augmented generation är ett av de snabbaste sätten att få en LLM att jobba mot dina egna dokument. Men de flesta tutorials antar engelska. Här är en svensk-specifik guide.

1. Chunking

Dela inte på fasta tokenantal — använd meningsgränser. Svenska sammansatta ord blir lätt sönderhackade annars.

2. Embeddings

KB-BERT och Voyage Multilingual 3 presterar markant bättre på svensk text än de vanliga OpenAI-modellerna.

3. Reranking

En cross-encoder på topp-20 kandidater ger ofta störst kvalitetsvinst per krona.

Ämnen

#guide #RAG #embeddings

Läs också

Editorial illustration av prompttekniker

Verktyg

Guide: Skriv bättre prompter på svenska

Verktyg

Guide: Finetuna en open source-modell för under 1000 kr

Verktyg

1. Chunking

2. Embeddings

3. Reranking

Läs också

Guide: Skriv bättre prompter på svenska

Guide: Finetuna en open source-modell för under 1000 kr

Test: Bäst AI-kodassistent 2026