Agrupamiento con Inteligencia Artificial e Indices de Desarrollo Humano
Contribuir a la búsqueda de soluciones a los retos sociales y ambientales del mundo es una de las aplicaciones más importantes de la Inteligencia Artificial (IA) y del aprendizaje de máquina (ML). Da un sentido humanista al esfuerzo tecnológico, amplía la perspectiva más allá de la búsqueda de las utilidades y mejora la imagen ante la opinión pública. Por eso las principales empresas y centros de investigación han implementado numerosos proyectos para apoyar la labor de instituciones y gobiernos.
Hace unos meses el despacho McKinsey publicó un estudio, el cual concluye que el uso de la IA y la ciencia de datos tiene un gran impacto potencial en áreas como educación, salud, condiciones de vida, igualdad de oportunidades, sustentabilidad ambiental y seguridad laboral. Esto sobre todo para asegurar que el apoyo de las políticas públicas llegue a las personas que más lo requieren.
A fin de ejemplificar cómo las técnicas de ML pueden ser utilizadas para generar información que sirva de base para discutir la formulación de políticas públicas, hicimos un rápido ejercicio de análisis de los datos del Informe de Desarrollo Humano Municipal 2015, publicado por el Programa de las Naciones Unidas para el Desarrollo.
El documento presenta el Índice de Desarrollo Humano (IDH) de 2,457 municipios y alcaldías de México. El IDH tiene tres componentes, valuados en una escala de 0 a 1:
- Educación, medida con los años de escolaridad y los años de escolaridad esperada
- Salud, medida con la esperanza de vida al nacer
- Ingreso, medido con el producto interno bruto por persona
El informe reporta que el IDH 2015 promedio de los municipios es 0.759, superior al promedio de 0.737 obtenido en 2010. La distribución de municipios es:
Nivel de Desarrollo Humano |
Municipios |
Muy alto (IDH de 0.8 o más) |
102 |
Alto (IDH entre 0.7 y 0.799) |
796 |
Medio (IDH entre (0.55 y 0.699) |
1,417 |
Bajo (IDH menor a 0.55) |
142 |
Total |
2,457 |
Para encontrar una representación que explique mejor la variabilidad de los datos, y reduzca el número de variables a manejar, existe una técnica que se llama Análisis de Componentes Principales (PCA). Aplicada a nuestro caso en estudio, el PCA arrojó unos nuevos ejes llamados componentes. La gráfica siguiente muestra el agrupamiento original con los ejes resultado del PCA, el primero (C1) explica 85.9% de las variaciones, el segundo (C2) 8.5% y el tercero (C3) 5.6%.
Existe una variante de esta técnica que arroja buenos resultados en algunas condiciones y que se llama Análisis de Componentes Principales con Kernel (KPCA). Esta variante fue la que arrojó mejores resultados en nuestro caso.
Como los dos primeros componentes explican la mayor parte de las variaciones, volvimos a aplicar las técnicas de agrupamiento, pero ahora a los puntos definidos sólo por el valor de los dos componentes principales. Además de permitir una representación más clara en dos dimensiones, el ejercicio dio un mejor resultado, la técnica k-medias obtuvo nuevamente el mayor índice silueta con 0.3471, valor superior al 0.2550 obtenido sin hacer la transformación KPCA.
El cuadro de abajo muestra el número de municipios, la población en millones (de acuerdo con la encuesta intercensal de 2015 del INEGI), así como el valor promedio de los componentes del IDH para los nueve grupos identificados por el agrupamiento K-medias con transformación KPCA.
De esta agrupación llaman la atención tres puntos:
- Los municipios del grupo 9 son los que muestran el menor nivel de desarrollo en todos los componentes.
- En el grupo 3 hay municipios con ingreso también bajo, pero con índices de salud y educación superiores al grupo 9. ¿Por qué esa diferencia no se refleja en el ingreso? El grupo 6 tiene niveles de salud y educación similares al grupo 3, pero tiene un ingreso superior.
- Los municipios del grupo 8 tienen un alto nivel en ingreso y muy alto en salud, pero no así en educación, ¿qué significa esto en términos de equidad?
En la siguiente tabla se muestra la distribución de los grupos por entidad federativa. Los municipios del grupo 9 están mayoritariamente en Oaxaca, Veracruz, Chiapas y Guerrero. Los municipios del grupo 3 están principalmente en Oaxaca y Chiapas, por lo que un análisis de estos dos estados puede ser ilustrativo. Finalmente, los municipios del grupo 8 están en Jalisco, Sonora, Nuevo León, Coahuila y Yucatán.
Seguramente especialistas en la materia de desarrollo podrán dar respuestas a algunas de estas preguntas, así como obtener otras conclusiones útiles para apoyar la discusión de programas para atender zonas o condiciones específicas. Lo importante de este ejercicio es que muestra cómo las herramientas de IA y ML pueden representar una oportunidad para que dependencias de gobierno como la Secretaría de Bienestar, u organizaciones como la ONU, tengan acceso, de manera relativamente sencilla, a mejores elementos de información para realizar su actividad.
Las empresas e instituciones que se dedican al desarrollo de herramientas de inteligencia artificial y aprendizaje de máquina tienen la responsabilidad de utilizar también su tecnología para el bien común, hasta hoy muestran disposición para ello con avanzadas aplicaciones de reconocimiento de imágenes y facial, procesamiento de lenguaje natural y análisis de datos, para servicios médicos, financieros o de agricultura, así como estudios ambientales. Vale la pena explorar las oportunidades de colaboración en beneficio de toda la sociedad.
¿Te gustó este artículo? Lee otros artículos de nuestro blog IF Inteligencia Futura aquí.