Valorisation du capital informationnel : au-delà du stockage

## Participants

- Romain PETER @Rom1Peter 
- Amadou SOW @akumq 
- Gaspard BAUBY @GaspardBBY 

PR [pr_32](https://github.com/jayblanc/mbyte/pull/32)

## Implémentation Recherche Vectorielle & RAG (Typesense + vLLM)

Cette PR remplace l'ancien moteur de recherche (Lucene) par une stack moderne permettant la recherche hybride et la discussion avec les documents (RAG).

### Ce qui a été ajouté :

* **Moteur de recherche (Typesense) :** Migration du backend d'indexation. Typesense gère désormais les documents, les embeddings (vecteurs) et l'historique des conversations.
* **Inférence LLM (vLLM) :** Intégration d'un serveur vLLM (modèle Qwen2.5) pour générer les réponses contextuelles.
* **RAG (Retrieval-Augmented Generation) :** Nouveau flux de conversation où le `store` interroge Typesense, qui récupère les documents pertinents et génère une réponse via vLLM.
* **Streaming SSE :** Support des réponses en temps réel (streaming) pour une expérience utilisateur plus fluide.
* **Provisioning Dynamique :** Le `manager` injecte automatiquement les variables de configuration lors de la création des containers.

### Architecture simplifiée :

1.  **Ingestion :** Upload → Extraction (Tika) → Indexation + Embedding (Typesense).
2.  **Recherche :** Requête utilisateur → Filtrage par `store_id` (isolation) → Résultats.
3.  **Chat :** Requête → Retrieval (Typesense) → Génération (vLLM) → Réponse Streamée.

### Points d'attention :
* **Bootstrap :** Au démarrage, une réindexation complète est effectuée pour garantir la cohérence des données.
* **Tika :** Apache Tika est conservé pour l'extraction de contenu, seul le moteur d'indexation a changé.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Valorisation du capital informationnel : au-delà du stockage #24

Participants

Implémentation Recherche Vectorielle & RAG (Typesense + vLLM)

Ce qui a été ajouté :

Architecture simplifiée :

Points d'attention :

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Valorisation du capital informationnel : au-delà du stockage #24

Description

Participants

Implémentation Recherche Vectorielle & RAG (Typesense + vLLM)

Ce qui a été ajouté :

Architecture simplifiée :

Points d'attention :

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions