🏠↩︎ De vuelta a la página principal del curso


Inicio

🚀 Objetivo de la unidad

Que el estudiante se familiarice con un flujo efectivo de análisis exploratorio de datos, y pueda explorar conjuntos de datos y subconjuntos de estas mediante la creación de tablas resumen, cálculo de estadísticas y visualizaciones de los mismos.


🇷 ⬇ Descargar projecto de R de la práctica


❗Los conjuntos de datos a utilizar en la práctica son extensos y requieren de disponibilidad de memoria en nuestro equipo de cómputo. Mantenga su ambiente libre de variables que ya no va a utilizar activamente. Recuerde que es posible eliminar variables desde nuestro ambiente desde la ventana de Environment de RStudio o con la función rm() de forma programática.


5.1. Cargando paquetes para análisis de datos

library(data.table)
library(ggplot2)


5.2. Cargando conjuntos de datos

Para la práctica utilizaremos los siguientes conjuntos de datos:

  • El archivo conjunto_de_datos_iter_09CSV20.csv contiene los microdatos a nivel localidad (ITER) de la Ciudad de México del Censo de Población y Vivienda 2020 del INEGI en formato csv. Este archivo está disponible para su descarga aquí (Archivos para descarga > Principales resultados por localidad (ITER) > Bases de datos > Ciudad de México > CSV ⬇).

    La “descripción de la base de datos” está disponible para su descarga en la misma página (Archivos para descarga > Principales resultados por localidad (ITER) > Documentación de la base de datos > Descripción de la base de datos).

# censo_iter <- fread("../data/iter_09_2020_csv/ITER_09CSV20.csv")


  • El archivo gastoshogar.csv contiene los microdatos de gastos en los hogares de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2020 (Nueva serie) del INEGI](https://www.inegi.org.mx/programas/enigh/nc/2020/) en formato csv. Este archivo está disponible para su descarga aquí (Archivos para descarga > Gastos en los hogares (gastoshogar.*) > CSV ⬇).

    El “desciptor de archivos (FD)” está disponible para su descarga en la misma página (Archivos para descarga > Descriptor de archivos (FD)).

# enigh_gastohogar <- fread("../data/enigh2020_ns_gastoshogar_csv/gastoshogar.csv")


  • El archivo ENOEN_COE1T122.csv contiene los microdatos del Cuestionario de Ocupación y Empleo (Básico) Parte I del primer trimestre del 2022 de la Encuesta Nacional de Ocupación y Empleo (ENOE) (población de 15 años y más de edad) del INEGI en formato csv. Este archivo está disponible para su descarga aquí (Archivos para descarga > Base de datos > I Trimestre (ENOE_N) > CSV ⬇).

    El “desciptor de archivos (FD)” está disponible para su descarga en la misma página (Archivos para descarga > Documentos sobre la base de datos > Descriptor de archivos (FD) > Trimestres: a partir del III de 2021 (ENOE_N)).

# enoe <- fread("../data/enoe_n_2022_trim1_csv/ENOEN_COE1T122.csv")


  • El archivo ENPOL2021_SOC.csv contiene los microdatos de la Sección I del cuestionario de la Encuesta Nacional de Población Privada de la Libertad (ENPOL) 2021 del INEGI en formato csv. Este archivo está disponible para su descarga aquí (Archivos para descarga > Base de datos > CSV ⬇).

    El “desciptor de archivos (FD)” está disponible para su descarga en la misma página (Archivos para descarga > Descriptor de archivos (FD)).

# enpol <- fread("../data/bd_enpol_2021_csv/ENPOL2021_SOC.csv")