Agrupamiento con Inteligencia Artificial e Indices de Desarrollo Humano

Agrupamiento con Inteligencia Artificial e Indices de Desarrollo Humano

Contribuir a la búsqueda de soluciones a los retos sociales y ambientales del mundo es una de las aplicaciones más importantes de la Inteligencia Artificial (IA) y del aprendizaje de máquina (ML). Da un sentido humanista al esfuerzo tecnológico, amplía la perspectiva más allá de la búsqueda de las utilidades y mejora la imagen ante la opinión pública. Por eso las principales empresas y centros de investigación han implementado numerosos proyectos para apoyar la labor de instituciones y gobiernos.

Hace unos meses el despacho McKinsey publicó un estudio, el cual concluye que el uso de la IA y la ciencia de datos tiene un gran impacto potencial en áreas como educación, salud, condiciones de vida, igualdad de oportunidades, sustentabilidad ambiental y seguridad laboral. Esto sobre todo para asegurar que el apoyo de las políticas públicas llegue a las personas que más lo requieren.

A fin de ejemplificar cómo las técnicas de ML pueden ser utilizadas para generar información que sirva de base para discutir la formulación de políticas públicas, hicimos un rápido ejercicio de análisis de los datos del Informe de Desarrollo Humano Municipal 2015, publicado por el Programa de las Naciones Unidas para el Desarrollo.

cq5damweb699470jpeg

El documento presenta el Índice de Desarrollo Humano (IDH) de 2,457 municipios y alcaldías de México. El IDH tiene tres componentes, valuados en una escala de 0 a 1:

  • Educación, medida con los años de escolaridad y los años de escolaridad esperada
  • Salud, medida con la esperanza de vida al nacer
  • Ingreso, medido con el producto interno bruto por persona

El informe reporta que el IDH 2015 promedio de los municipios es 0.759, superior al promedio de 0.737 obtenido en 2010. La distribución de municipios es:

Nivel de Desarrollo Humano

Municipios

Muy alto (IDH de 0.8 o más)

102

Alto (IDH entre 0.7 y 0.799)

796

Medio (IDH entre (0.55 y 0.699)

1,417

Bajo (IDH menor a 0.55)

142

Total

2,457

Agrupar los municipios con este criterio para tratar de enfocar las políticas públicas para impulsar el desarrollo parece un poco al azar, pues la selección de los rangos es un tanto subjetiva (¿por qué 0.55 y no 0.50?), además de que no considera los componentes individuales. Un análisis detallado de los resultados y la situación de cada municipio identificará factores comunes, pero requiere tiempo y recursos. ¿Qué resultados obtendríamos si aplicamos técnicas de ML para analizar la similitud entre los componentes del IDH de los municipios?

Para averiguarlo aplicamos algunas de las principales técnicas de agrupamiento con ML a los puntos definidos por los componentes de educación, salud e ingreso del IDH de cada municipio (consulta nuestro artículo sobre agrupamiento para conocer cómo funcionan estas técnicas).

Las gráficas de abajo muestran los puntos con la agrupación original (nivel de desarrollo humano), así como el resultado de las cinco técnicas de agrupamiento utilizadas. En cada caso se presenta el valor del llamado índice silueta, que tiene un valor máximo de uno. Este índice mide qué tan bien agrupados están los puntos con base en la relación entre la distancia de cada punto a los demás de su grupo y la distancia a los puntos del grupo más cercano. El mejor resultado fue el de la técnica K-medias, que arrojó un índice silueta de 0.2550.

Agrupamiento_IDHpng

Para encontrar una representación que explique mejor la variabilidad de los datos, y reduzca el número de variables a manejar, existe una técnica que se llama Análisis de Componentes Principales (PCA). Aplicada a nuestro caso en estudio, el PCA arrojó unos nuevos ejes llamados componentes. La gráfica siguiente muestra el agrupamiento original con los ejes resultado del PCA, el primero (C1) explica 85.9% de las variaciones, el segundo (C2) 8.5% y el tercero (C3) 5.6%.


Agrupamiento_IDH_ejes_KPCApng

Existe una variante de esta técnica que arroja buenos resultados en algunas condiciones y que se llama Análisis de Componentes Principales con Kernel (KPCA). Esta variante fue la que arrojó mejores resultados en nuestro caso.

Como los dos primeros componentes explican la mayor parte de las variaciones, volvimos a aplicar las técnicas de agrupamiento, pero ahora a los puntos definidos sólo por el valor de los dos componentes principales. Además de permitir una representación más clara en dos dimensiones, el ejercicio dio un mejor resultado, la técnica k-medias obtuvo nuevamente el mayor índice silueta con 0.3471, valor superior al 0.2550 obtenido sin hacer la transformación KPCA.

Agrupamiento_IDH_KPCApng

El cuadro de abajo muestra el número de municipios, la población en millones (de acuerdo con la encuesta intercensal de 2015 del INEGI), así como el valor promedio de los componentes del IDH para los nueve grupos identificados por el agrupamiento K-medias con transformación KPCA.

Agrupacion_IDH_indicespng

De esta agrupación llaman la atención tres puntos:

  • Los municipios del grupo 9 son los que muestran el menor nivel de desarrollo en todos los componentes.
  • En el grupo 3 hay municipios con ingreso también bajo, pero con índices de salud y educación superiores al grupo 9. ¿Por qué esa diferencia no se refleja en el ingreso? El grupo 6 tiene niveles de salud y educación similares al grupo 3, pero tiene un ingreso superior.
  • Los municipios del grupo 8 tienen un alto nivel en ingreso y muy alto en salud, pero no así en educación, ¿qué significa esto en términos de equidad?

En la siguiente tabla se muestra la distribución de los grupos por entidad federativa. Los municipios del grupo 9 están mayoritariamente en Oaxaca, Veracruz, Chiapas y Guerrero. Los municipios del grupo 3 están principalmente en Oaxaca y Chiapas, por lo que un análisis de estos dos estados puede ser ilustrativo. Finalmente, los municipios del grupo 8 están en Jalisco, Sonora, Nuevo León, Coahuila y Yucatán.

Agrupacion_IDH_por_estadopng  

Seguramente especialistas en la materia de desarrollo podrán dar respuestas a algunas de estas preguntas, así como obtener otras conclusiones útiles para apoyar la discusión de programas para atender zonas o condiciones específicas. Lo importante de este ejercicio es que muestra cómo las herramientas de IA y ML pueden representar una oportunidad para que dependencias de gobierno como la Secretaría de Bienestar, u organizaciones como la ONU, tengan acceso, de manera relativamente sencilla, a mejores elementos de información para realizar su actividad.

Las empresas e instituciones que se dedican al desarrollo de herramientas de inteligencia artificial y aprendizaje de máquina tienen la responsabilidad de utilizar también su tecnología para el bien común, hasta hoy muestran disposición para ello con avanzadas aplicaciones de reconocimiento de imágenes y facial, procesamiento de lenguaje natural y análisis de datos, para servicios médicos, financieros o de agricultura, así como estudios ambientales. Vale la pena explorar las oportunidades de colaboración en beneficio de toda la sociedad.

¿Te gustó este artículo? Lee otros artículos de nuestro blog IF Inteligencia Futura aquí.


Visita nuestras secciones