Skip to content

Commit f4e1af3

Browse files
committed
Tarea terminada
1 parent e16e0c2 commit f4e1af3

2 files changed

Lines changed: 1302 additions & 2 deletions

File tree

Tarea_1.Rmd

Lines changed: 10 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -167,7 +167,15 @@ sort(colSums(data_tf[2:113]))[0:10]
167167

168168

169169
```{r}
170-
# RESPUESTA
170+
# RESPUESTA: Definimos nuestro criterio de participación en base al total de la suma de los conceptos discutidos por asamblea, lo que sería básicamente un conteo de frecuencias.
171+
172+
sum_rows = rowSums(data_tf[2:113])
173+
localities = data_tf$localidad
174+
aux_df = data.frame(localidad = localities, total = sum_rows)
175+
sorted_df <- aux_df[order(-aux_df$total),]
176+
head(sorted_df, 10)
177+
178+
171179
```
172180

173181
5. Ejecute el siguiente código que permitirá agregar una nueva columna a nuestro dataframe que solo tendrá el nombre de la región.
@@ -243,7 +251,7 @@ ggplot(topSantiago) + # asociamos un data frame a ggplot
243251
6. De la pregunta anterior, ¿considera que es razonable usar el conteo de frecuencias para determinar las regiones que tuvieron mayor participación en el proceso? ¿Por qué? Sugiera y solamente comente una forma distinta de hacerlo.
244252

245253
```{r}
246-
# RESPUESTA
254+
# RESPUESTA: No es razonable para determinar la participación a nivel nacional, dado que distintas regiones tienen distintos tamaños de población. Por lo que regiones con menos participación pero más habitantes podrían dominar el conteo de frecuencias. Una alternativa mejor sería normalizar dicho conteo de frecuencias dividiendo por el total de población de cada región. De ese modo se podría evaluar por porcentajes de población, permitiéndole representación a las regiones con menor población.
247255
```
248256

249257
## Ejercicios

0 commit comments

Comments
 (0)