Analyse de documents (RAG)
Transformez vos documents en connaissances exploitables
Le RAG (Retrieval-Augmented Generation) permet à Libre Agent d'analyser et comprendre vos documents pour répondre à vos questions en se basant sur leur contenu. Vos fichiers restent sur votre machine, garantissant une confidentialité totale.
🎯 En résumé
Le RAG vous permet de :
- Poser des questions sur vos documents PDF, Word, texte
- Obtenir des résumés et analyses instantanés
- Créer une base de connaissances permanente
- Garder vos données 100% privées et locales
Première activation du RAG
Le RAG peut être activé de deux manières :
💬 Depuis le chat
Cliquez sur le bouton "+" dans la fenêtre de chat pour ajouter votre premier document.
Active automatiquement le RAG si ce n'est pas déjà fait
⚙️ Depuis les paramètres
Menu Paramètres → Option "Activer la recherche dans les documents"
Pour une activation globale permanente


🚀 Configuration initiale
Lors de la première activation, Libre Agent vous dirige automatiquement vers le téléchargement d'un modèle d'embedding spécialisé :
📊 Modèle d'embedding recommandé
Libre Agent sélectionne automatiquement le modèle optimal pour votre configuration.
- Taille : ~150 MB
- Temps de téléchargement : 1-3 minutes
💡 Conseil
Gardez le modèle recommandé sauf si vous avez des besoins spécifiques. Les modèles d'embedding sont différents des modèles de chat - ils sont spécialisés dans la compréhension et l'indexation de documents.

Deux façons d'utiliser le RAG
Une fois activé, vous avez deux approches complémentaires pour travailler avec vos documents :
📎 Documents de session
Pour une analyse ponctuelle
Comment faire :
- Cliquez sur le bouton "+" dans le chat
- Sélectionnez votre document
- Le document est analysé instantanément
- Posez vos questions dans le chat
Caractéristiques :
- ✅ Document disponible uniquement pour cette conversation
- ✅ Idéal pour analyser un document spécifique
- ✅ Pas d'encombrement de votre base permanente
- ⚠️ Document à recharger pour une nouvelle session
Cas d'usage typiques :
- Analyser un rapport ponctuel
- Résumer un article
- Extraire des infos d'une facture
- Comprendre un document technique
🗂️ Base de connaissances
Pour une référence permanente
Comment faire :
- Menu Paramètres
- Section "Gérer la base de connaissances"
- Ajoutez vos documents
- Disponibles dans toutes vos sessions
Caractéristiques :
- ✅ Documents toujours disponibles
- ✅ Indexation optimisée une seule fois
- ✅ Parfait pour la documentation récurrente
- ✅ Gestion centralisée de vos documents
Cas d'usage typiques :
- Documentation d'entreprise
- Cours et supports de formation
- Base de connaissances technique
- Archives de projets
Gérer votre base de connaissances
La base de connaissances est votre bibliothèque personnelle de documents toujours accessible :
📚 Interface de gestion
Accès : Paramètres → Gérer la base de connaissances
➕ Ajouter des documents
- Sélection par explorateur de fichiers
- Import de dossiers entiers
- Traitement en lot
📋 Visualiser vos documents
- Liste complète avec métadonnées
- Taille et date d'ajout
- Statut d'indexation
- Recherche par nom
🗑️ Supprimer des documents
- Suppression individuelle
- Sélection multiple
- Confirmation de sécurité
- Libération immédiate de l'espace

💾 Stockage et performance
- Stockage local : Tous les documents et index restent sur votre machine
- Indexation rapide : Les documents sont traités une seule fois
- Recherche instantanée : Réponses en quelques secondes même sur des milliers de pages
Contrôle par session
Même avec le RAG activé globalement, vous gardez le contrôle sur chaque conversation :
🎛️ Options de session
Au-dessus du bouton d'envoi dans le chat, vous trouvez les options de session :

💡 Quand désactiver le RAG sur une session ?
- Pour des conversations générales sans rapport avec vos documents
- Pour tester les connaissances natives du modèle
- Pour accélérer les réponses sur des sujets simples
- Quand vous voulez éviter toute confusion avec vos documents
Utilisation pratique du RAG
🎯 Exemples de questions efficaces
Pour un rapport financier
- "Quel est le chiffre d'affaires du Q3 ?"
- "Compare les marges entre 2023 et 2024"
- "Liste les principaux risques identifiés"
- "Résume les recommandations du conseil"
Pour de la documentation technique
- "Comment configurer l'authentification OAuth ?"
- "Quelles sont les dépendances requises ?"
- "Montre-moi un exemple de code pour l'API"
- "Quelle est la procédure de déploiement ?"
Pour des documents légaux
- "Quelles sont mes obligations en tant que locataire ?"
- "Résume les clauses de résiliation"
- "Y a-t-il des pénalités mentionnées ?"
- "Quelle est la durée du contrat ?"
Optimisation et bonnes pratiques
✅ Pour de meilleurs résultats
📁 Organisation des documents
- Nommez clairement vos fichiers
- Évitez les doublons
- Groupez par thématique
- Mettez à jour régulièrement
📝 Qualité des documents
- Privilégiez les PDF avec texte sélectionnable
- Évitez les scans de mauvaise qualité
- Structurez avec des titres clairs
- Utilisez des formats standards
❓ Formulation des questions
- Soyez spécifique dans vos demandes
- Mentionnez le contexte si nécessaire
- Demandez des citations si besoin
- Précisez le niveau de détail souhaité
⚡ Performance
- Limitez la base à 1000 documents actifs
- Supprimez les documents obsolètes
- Préférez les documents de moins de 50 pages
- Divisez les gros documents si possible
🔒 Rappel confidentialité
Tout reste local et privé :
- Vos documents ne quittent jamais votre ordinateur
- L'indexation se fait localement
- Aucune donnée n'est envoyée à des serveurs externes
- Vous pouvez analyser des documents sensibles en toute sécurité
Résolution de problèmes courants
❌ "Document non trouvé dans les réponses"
Solutions :
- Vérifiez que le document est bien indexé
- Reformulez votre question
- Vérifiez que le RAG est activé pour la session
🐌 "Indexation lente"
Solutions :
- Réduisez la taille des documents
- Traitez par lots plus petits
- Vérifiez l'espace disque disponible
📄 "Format non reconnu"
Solutions :
- Convertissez en PDF ou TXT
- Vérifiez que le fichier n'est pas corrompu
- Retirez la protection par mot de passe