Esta función aplica imputación de ingresos mensuales (ingocup
) para personas ocupadas en la ENOE
utilizando modelos de imputación múltiple con el paquete mice
. Se utiliza el logaritmo del ingreso
como variable objetivo y se imputan los valores faltantes en función de variables donantes como edad,
escolaridad, ocupación, horas trabajadas, entre otras.
Un data frame con personas ocupadas (clase2 == 1
) y variables de ingreso (ingocup
),
variables donantes y metadatos de identificación.
Vector con nombres de variables que se utilizarán como predictores para la imputación.
Vector con nombres de variables identificadoras (por defecto: folio3
, trim
, anio
).
Método de imputación utilizado por mice
(por defecto: "pmm"
).
Semilla aleatoria para reproducibilidad.
Lógico. Si TRUE
, se muestra un gráfico comparando la distribución del ingreso original vs imputado.
Año del trimestre, si data
no contiene esta variable.
Trimestre del año (1–4), si data
no contiene esta variable.
Un data frame con las variables:
Ingreso mensual imputado
Logaritmo del ingreso imputado
Indicador binario de si el ingreso fue imputado (1 = sí)
La imputación se realiza por bloques según sexo y entidad federativa. Si no existen las variables folio3
,
anio
o trim
, se generan automáticamente con funciones auxiliares (crear_folios()
y procesar_vars_sociodemo()
).
La imputación de ingresos se realiza únicamente para personas ocupadas (clase2 == 1
)
con datos válidos de edad, y en caso de estar disponible, también de años de escolaridad (anios_es
).
La variable a imputar es el logaritmo natural del ingreso mensual (log_ingocup_imp
), y la imputación
se realiza utilizando el método especificado (por defecto "pmm"
, predictive mean matching) a través del paquete mice
.
Las imputaciones se hacen de forma separada por bloques definidos por el sexo (sex
) y la entidad federativa (ent
),
para capturar mejor las heterogeneidades contextuales.
Las variables utilizadas como predictoras ("donantes") incluyen, si están presentes:
edad
: Edad en años.
anios_es
: Años aprobados de escolaridad.
c_ocu11c
: 11 grandes grupos ocupacionales.
pos_ocu
: Posición en la ocupación.
rama_est2
: Rama de actividad.
ing7c
: Indicador de percepción de ingresos.
ent
: Clave de entidad federativa.
hrsocup
: Horas trabajadas a la semana.
t_loc
: Tamaño de localidad.
Solo se consideran aquellas variables donantes que están disponibles en el conjunto de datos.
Other procesamiento_enoe:
armoniza_sinco()
,
crear_folios()
,
ipc_enoe()
,
procesar_tiempo()
,
procesar_variables_enoe()
,
procesar_vars_hogar()
,
procesar_vars_laborales()
,
procesar_vars_sociodemo()