Accueil Documentation Louis

Mise en route

Exploitation

Comprendre

Architecture — vue d'ensemble Modèle de données

ADR 0001 — Bring Your Own Key (BYOK)ADR 0002 — Licence AGPL-3.0-or-later ADR 0003 — pgvector plutôt qu'un vector DB dédié ADR 0004 — Support MCP natif, par utilisateur

État réel des fonctionnalités FAQ Glossaire Changelog

ArchitectureDécisions (ADR)

ADR 0003 — pgvector plutôt qu'un vector DB dédié

Louis a besoin d'une recherche sémantique (RAG) sur les documents uploadés par les utilisateurs. Options :

Statut : adopté
Date : 2026
Décideur : association DataRing

Contexte

Louis a besoin d'une recherche sémantique (RAG) sur les documents uploadés par les utilisateurs. Options :

Pinecone / Weaviate / Qdrant managé — vector DB cloud dédié, excellente performance à grande échelle, dépendance externe + coût récurrent
Vector DB auto-hébergé (Weaviate, Qdrant, Milvus) — autonome mais ajoute un service à déployer / maintenir
pgvector dans Postgres existant — extension officielle Postgres, pas de service additionnel, performance correcte jusqu'à quelques millions de vecteurs

Décision

pgvector sur l'instance Postgres existante.

Conséquences

Positives

Un seul service à déployer (Postgres) au lieu de deux
Transactions cross-table : on peut joindre document_chunks aux documents dans la même query (cf. src/lib/rag/search.ts)
Backup unifié (un seul pg_dump couvre tout)
Souveraineté maximale : aucun service vectoriel externe à intégrer
Performance largement suffisante pour le volume typique d'un cabinet (10k-100k documents → < 10M chunks → query < 50ms avec un index HNSW)

Négatives

Au-delà de plusieurs dizaines de millions de chunks, pgvector commence à perdre face aux DB dédiées. Pas un sujet pour v0.1, à re-évaluer si un cabinet géant arrive
Index HNSW pgvector consomme de la RAM (mais largement absorbable sur une machine de prod 16-32 GB)

Implications

Le docker-compose.yml utilise pgvector/pgvector:pg16 (Postgres 16 avec pgvector pré-installé)
Le schéma document_chunks utilise vector(1024) (taille Mistral mistral-embed)
L'index est créé via Drizzle migrations (à venir : pour l'instant, recherche sur l'ensemble — performant jusqu'à ~100k chunks)
En v0.2 : add CREATE INDEX USING hnsw (embedding vector_cosine_ops) pour les déploiements gros volume

ADR 0002 — Licence AGPL-3.0-or-later

Choisir la licence d'un projet open-source destiné à des professionnels juridiques. Options principales :

ADR 0004 — Support MCP natif, par utilisateur

Le Model Context Protocol (MCP, Anthropic 2024) est un standard émergent pour donner aux LLMs accès à des outils / sources de données externes, de manière…

On this page

Contexte Décision Conséquences Positives Négatives Implications