-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathUpload_files
More file actions
185 lines (127 loc) · 4.67 KB
/
Upload_files
File metadata and controls
185 lines (127 loc) · 4.67 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
<div align="center">
# 📊 **Repositorio de Bases de Datos – ECV 2024 & IPM Colombia**
<img src="https://raw.githubusercontent.com/github/explore/main/topics/r/r.png" width="90">
<br>
**Procesamiento de Microdatos – Ingeniería de Datos – Ciencia Social Cuantitativa**
[]()
[]()
[]()
[]()
</div>
---
## 📚 **Tabla de Contenidos**
- [Acerca del Proyecto](#-acerca-del-proyecto)
- [Estructura del Repositorio](#-estructura-del-repositorio)
- [Componentes del Proceso](#-componentes-del-proceso)
- [Requisitos del Entorno](#-requisitos-del-entorno)
- [Cómo Reproducir los Resultados](#-cómo-reproducir-los-resultados)
- [Figuras Incluidas](#-figuras-incluidas)
- [Licencia y Uso de Datos](#-licencia-y-uso-de-datos)
- [Autor](#-autor)
---
## 🧩 **Acerca del Proyecto**
Este repositorio contiene la **infraestructura completa** utilizada para la construcción de bases derivadas de la **Encuesta de Calidad de Vida (ECV 2024)** y el cálculo del **Índice de Pobreza Multidimensional (IPM)** para Colombia.
El repositorio forma parte del proyecto académico:
### 📝
**“Medición multidimensional de la pobreza en Colombia y análisis complementario mediante técnicas de Machine Learning”**
que combina:
- Ingeniería de datos
- Estadística social
- Procesamiento de microdatos
- Machine Learning
- Visualización avanzada
---
## 📁 **Estructura del Repositorio**
```text
Repositorio_Bases_De_Datos/
│
├── 01_Scripts/ # Construcción y limpieza
│ ├── Limpieza_de_datos.R
│ ├── Construcción_Base_ECV_Personas.R
│ └── Contrucción_base_IPM_Nivel_hogar.R
│
├── 02_Datos_Procesados/ # Outputs derivados
│ ├── hogares_ML.csv
│ └── base_final.csv
│
├── 03_Figuras/ # Gráficos en alta calidad
│ ├── mapas, indicadores, pirámide poblacional...
│
└── README.md
⚙️ Componentes del Proceso
🔹 1. Limpieza inicial y estandarización
Unificación de módulos
Ajuste de tipos
Depuración de inconsistencias
🔹 2. Construcción de la base a nivel persona
Derivación de variables
Cálculo de privaciones
Estructura AF
🔹 3. Base a nivel hogar
Agregación
Consolidación de privaciones
Identificación del estado de pobreza
🔹 4. Preparación para Machine Learning
Base hogares_ML.csv
Variables demográficas, educativas, habitacionales
Dataset completamente limpio
🔹 5. Generación de figuras
Mapas
Indicadores descriptivos
Gráficos comparativos
Pirámides poblacionales
🧠 Requisitos del Entorno
Lenguaje: R ≥ 4.2
Paquetes requeridos:
r
Copiar código
library(tidyverse)
library(readr)
library(dplyr)
library(stringr)
Scripts incluyen dependencias completas.
🔁 Cómo Reproducir los Resultados
1️⃣ Descargar microdatos (DANE)
👉 https://microdatos.dane.gov.co/
2️⃣ Guardar los módulos originales
Personas
Hogares
Viviendas (si aplica)
3️⃣ Ejecutar los scripts en el siguiente orden:
text
Copiar código
01 - Limpieza_de_datos.R
02 - Construcción_Base_ECV_Personas.R
03 - Contrucción_base_IPM_Nivel_hogar.R
4️⃣ Resultados generados automáticamente:
base_final.csv
hogares_ML.csv
🖼️ Figuras Incluidas
Las figuras del repositorio presentan:
🗺️ Mapas IPM por departamento
📊 Indicadores de privaciones
🏘️ Condiciones habitacionales
📚 Educación
👷 Empleo
👥 Pirámide poblacional
Todas en alta resolución, exportadas para uso en tesis y artículos.
📜 Licencia y Uso de Datos
Los scripts y figuras son de libre uso bajo estándares académicos.
Los microdatos originales del DANE NO están incluidos, y deben descargarse desde su portal oficial.
El repositorio respeta la política de protección de microdatos.
👤 Autor
Jhoan Sebastián Meza García
Estudiante de Economía – Universidad Nacional de Colombia
Investigación en pobreza, análisis socioeconómico y machine learning
📌 GitHub: https://github.com/jmeza-data
Si este repositorio te fue útil, ¡considera dejar una estrella ⭐!
yaml
Copiar código
----
# ⭐ ¿Quieres una versión con colores corporativos, encabezados con banner y logos del DANE + UNAL?
Puedo hacerte un README aún más llamativo con:
🎨 Paleta institucional
📌 Banner superior moderno
📎 Iconos SVG personalizados
📦 Sección de instaladores
📘 Documentación extendida estilo PDF