RAG Local Demo

Este repositório foi criado nesse vídeo e rodando 100% local, com foco em arquitetura, dados e decisões de design, não apenas em frameworks.

A ideia é mostrar como uma aplicação RAG funciona de ponta a ponta:

Ingestão de documentos
Busca semântica
Uso de contexto
Geração de respostas com LLM local

A documentação de referência pode ser encontrada aqui.

🎥 Sobre o vídeo

No vídeo, a construção da aplicação segue esta ordem:

Arquitetura e componentes
Fluxo de dados
Implementação prática
Discussão dos modos de funcionamento do RAG (restrito vs híbrido)

O código aqui serve como apoio ao raciocínio arquitetural apresentado.

🏷️ Estrutura de versões (tags)

O repositório possui duas versões principais:

🔹 `initial`

Versão inicial para acompanhar o vídeo passo a passo, contendo:

Estrutura de pastas
Arquivos Python vazios ou com TODOs
Dependências definidas

👉 Ideal para quem quer construir junto.

🔹 `complete`

Versão final com a aplicação totalmente funcional, contendo:

Ingestão de documentos
Banco vetorial
API de perguntas
Exemplos de documentos

👉 Ideal como referência ou para quem quer testar direto.

📁 Estrutura do projeto

rag-local/
 ├── app/
 │   ├── main.py        # API (FastAPI)
 │   ├── ingest.py      # Ingestão e indexação
 │   └── rag.py         # Lógica de RAG
 ├── data/
 │   └── docs/          # Documentos de exemplo (PDF, txt, md)
 ├── chroma/            # Banco vetorial (gerado localmente)
 ├── requirements.txt
 └── README.md

⚠️ A pasta chroma/ não deve ser versionada. Ela é criada automaticamente ao rodar a ingestão.

⚙️ Pré-requisitos

Python 3.10+
Git
Ollama instalado e rodando localmente:

# Instruções para MAC
brew install ollama
ollama serve

Modelos instalados

ollama pull mistral
ollama pull nomic-embed-text

🤖 Modelos utilizados

LLM local: mistral
Embeddings: nomic-embed-text

Os modelos são gerenciados pelo Ollama.

🚀 Como executar

Clonar o repositório na branch initial

git clone https://github.com/ -b initial
cd rag-local-demo

Criar ambiente virtual

python3 -m venv .venv
source .venv/bin/activate

Instalar dependências

pip install -r requirements.txt

Rodar a ingestão

python app/ingest.py

Subir a API

uvicorn app.main:app --reload

Fazer uma pergunta

curl -X POST http://localhost:8000/pergunta \
  -H "Content-Type: application/json" \
  -d '{"question": "O que é arquitetura de dados?"}'

🧠 Observações importantes

O LLM não acessa dados diretamente
Todo acesso a documentos passa pelo banco vetorial
O comportamento do RAG depende das decisões arquiteturais
Frameworks são substituíveis, o raciocínio não

📌 Objetivo educacional

Este projeto não é um produto pronto, mas um exemplo didático para discutir:

Arquitetura de IA
Governança
Trade-offs de uso de LLMs
RAG em ambientes controlados

📜 Licença

Uso educacional e demonstrativo.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
app		app
data/docs		data/docs
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RAG Local Demo

🎥 Sobre o vídeo

🏷️ Estrutura de versões (tags)

🔹 `initial`

🔹 `complete`

📁 Estrutura do projeto

⚙️ Pré-requisitos

🤖 Modelos utilizados

🚀 Como executar

🧠 Observações importantes

📌 Objetivo educacional

📜 Licença

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

RAG Local Demo

🎥 Sobre o vídeo

🏷️ Estrutura de versões (tags)

🔹 initial

🔹 complete

📁 Estrutura do projeto

⚙️ Pré-requisitos

🤖 Modelos utilizados

🚀 Como executar

🧠 Observações importantes

📌 Objetivo educacional

📜 Licença

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

🔹 `initial`

🔹 `complete`

Packages