Skip to content

alexandrecpedro/computer-vision

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🚀 NLW 2026 — Trilha Python: Visão Computacional

Bem-vindo ao repositório do projeto NLW 2026 Visão Computacional. Este workspace contém uma coleção de projetos e experimentos desenvolvidos durante a trilha Python de Visão Computacional da NLW 2026 da Rocketseat, focando em Deep Learning, Reconhecimento de Gestos em tempo real e técnicas avançadas de Visão Computacional.


📂 Estrutura do Projeto

Este monorepo está dividido em três módulos principais, um para cada aula:

Uma implementação moderna da clássica arquitetura LeNet-5 utilizando PyTorch para classificação de dígitos manuscritos.

  • Tecnologias principais: PyTorch, Jupyter, Matplotlib.
  • Destaques: Camadas CNN customizadas, visualização de mapas de características (feature maps), análise de erros no dataset MNIST.

A "sala de máquinas" onde os modelos de gestos são treinados, junto com notebooks exploratórios para modelos SOTA (State of the Art).

  • Tecnologias principais: Scikit-Learn, MediaPipe, YOLO, CLIPSeg, Gemini Vision.
  • Destaques: Pipeline de coleta de dados customizado, scripts de treinamento de modelo e experimentação com detecção de objetos e segmentação.
  • ⚠️ Requisito: Necessário baixar modelos do MediaPipe (veja o README do módulo).

Uma aplicação web de alta performance construída com FastHTML e MediaPipe para reconhecimento de gestos faciais/mãos em tempo real via WebSockets.

  • Tecnologias principais: FastHTML, OpenCV, MediaPipe, Scikit-Learn.
  • Destaques: Processamento de vídeo de baixa latência, interface interativa, monitoramento de FPS em tempo real.
  • ⚠️ Requisito: Necessário baixar modelos do MediaPipe (veja o README do módulo).

🛠️ Stack Tecnológica Global

  • Linguagem: Python
  • Gerenciador de Pacotes: uv
  • Frameworks: FastHTML, PyTorch, MediaPipe, OpenCV, Scikit-Learn.
  • AI/ML: YOLO-S, CLIPSeg, Google Gemini API.

🚀 Como Começar

Pré-requisitos

Certifique-se de ter o uv instalado. Ele é utilizado em todos os módulos para um gerenciamento de dependências rápido e confiável.

Instalação

  1. Clone o repositório:

    git clone <repository-url>
    cd computer-vision
  2. Explore os Módulos: Cada subpasta possui seu próprio pyproject.toml e ambiente. Navegue até um módulo específico para começar:

    cd computer_vision_app
    uv sync

📄 Licença

Este projeto foi desenvolvido para fins educacionais durante o NLW 2026 da Rocketseat.

About

Coleção de projetos e experimentos desenvolvidos durante a trilha Python de Visão Computacional da NLW 2026 da Rocketseat, focando em Deep Learning, Reconhecimento de Gestos em tempo real e técnicas avançadas de Visão Computacional

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors