Bem-vindo ao repositório do projeto NLW 2026 Visão Computacional. Este workspace contém uma coleção de projetos e experimentos desenvolvidos durante a trilha Python de Visão Computacional da NLW 2026 da Rocketseat, focando em Deep Learning, Reconhecimento de Gestos em tempo real e técnicas avançadas de Visão Computacional.
Este monorepo está dividido em três módulos principais, um para cada aula:
Uma implementação moderna da clássica arquitetura LeNet-5 utilizando PyTorch para classificação de dígitos manuscritos.
- Tecnologias principais: PyTorch, Jupyter, Matplotlib.
- Destaques: Camadas CNN customizadas, visualização de mapas de características (feature maps), análise de erros no dataset MNIST.
A "sala de máquinas" onde os modelos de gestos são treinados, junto com notebooks exploratórios para modelos SOTA (State of the Art).
- Tecnologias principais: Scikit-Learn, MediaPipe, YOLO, CLIPSeg, Gemini Vision.
- Destaques: Pipeline de coleta de dados customizado, scripts de treinamento de modelo e experimentação com detecção de objetos e segmentação.
⚠️ Requisito: Necessário baixar modelos do MediaPipe (veja o README do módulo).
Uma aplicação web de alta performance construída com FastHTML e MediaPipe para reconhecimento de gestos faciais/mãos em tempo real via WebSockets.
- Tecnologias principais: FastHTML, OpenCV, MediaPipe, Scikit-Learn.
- Destaques: Processamento de vídeo de baixa latência, interface interativa, monitoramento de FPS em tempo real.
⚠️ Requisito: Necessário baixar modelos do MediaPipe (veja o README do módulo).
- Linguagem:
- Gerenciador de Pacotes:
- Frameworks: FastHTML, PyTorch, MediaPipe, OpenCV, Scikit-Learn.
- AI/ML: YOLO-S, CLIPSeg, Google Gemini API.
Certifique-se de ter o uv instalado. Ele é utilizado em todos os módulos para um gerenciamento de dependências rápido e confiável.
-
Clone o repositório:
git clone <repository-url> cd computer-vision
-
Explore os Módulos: Cada subpasta possui seu próprio
pyproject.tomle ambiente. Navegue até um módulo específico para começar:cd computer_vision_app uv sync
Este projeto foi desenvolvido para fins educacionais durante o NLW 2026 da Rocketseat.