Este repositório contém um notebook em Python com um fluxo completo para construção de um modelo de regressão utilizando bibliotecas populares de ciência de dados. O objetivo é demonstrar, de forma prática, como carregar dados, explorá-los, aplicar técnicas de visualização e treinar um modelo preditivo.
O notebook está dividido nas seguintes etapas principais:
-
Importação da base de dados
- Leitura dos dados a partir de arquivo.
- Conversão em
pandas.DataFrame.
-
Análise exploratória dos dados (EDA)
- Visualização com
seaborn.pairplot, gráficos de dispersão e histogramas. - Análise da distribuição e correlação das variáveis.
- Visualização com
-
Preparação dos dados
- Separação em variáveis independentes (
X) e dependente (y). - Ajustes para adequação ao modelo.
- Separação em variáveis independentes (
-
Construção do modelo de regressão
- Criação do modelo de Regressão Linear.
- Ajuste aos dados de treino.
-
Avaliação do modelo
- Interpretação dos coeficientes.
- Métricas de desempenho (ex.: R², erro médio).
- Clone este repositório:
git clone https://github.com/seu-usuario/seu-repositorio.git
- Acesse a pasta do projeto:
cd seu-repositorio - Crie e ative um ambiente virtual (opcional, mas recomendado).
- Instale as dependências:
pip install -r requirements.txt
- Abra o notebook:
jupyter notebook "Criando um modelo de Regressão.ipynb"
- Gráficos que ajudam a entender a relação entre as variáveis.
- Um modelo de regressão ajustado e avaliado com métricas quantitativas.
- Base para evolução para modelos mais complexos.