Este projeto tem como objetivo realizar uma análise exploratória de dados (EDA) utilizando o clássico dataset do Titanic, disponibilizado pela plataforma Kaggle no desafio Titanic: Machine Learning from Disaster.
Através de visualizações, estatísticas e investigações sobre os dados, buscamos entender os principais fatores que podem ter influenciado a sobrevivência dos passageiros.
- Dataset: Titanic - Kaggle
- Link: https://www.kaggle.com/competitions/titanic/data
- 🐍 Python (Google Colab)
- 📊 Pandas – manipulação de dados
- 📉 Seaborn – visualizações estatísticas
- 📈 Matplotlib – criação de gráficos
- 🔎 Técnicas de análise exploratória (EDA)
- Compreender a estrutura do dataset
- Tratar valores ausentes e inconsistentes
- Analisar distribuições das variáveis (sexo, idade, classe, tarifa, etc.)
- Investigar possíveis correlações com a variável alvo:
Survived - Gerar insights que possam ajudar em futuras etapas de modelagem preditiva
- Acesse o Google Colab: https://colab.research.google.com
- Importe o notebook:
Análise Exploratória.ipynb - Execute as células para visualizar os gráficos e estatísticas.
Este projeto foi desenvolvido com fins de estudo, como parte da minha jornada de aprendizado em análise de dados. Os insights gerados são preliminares e não substituem análises mais profundas ou modelagens supervisionadas.
Joab Almeida
Este projeto está disponível para fins educacionais.