Decisiones automatizadas con Inteligencia Artificial, una cuestion de clasificacion.
Cada decisión que tomamos en nuestras vidas requiere hacer un pronóstico del futuro, el cual nos sirve para escoger la alternativa que parece ser la adecuada para el o los escenarios más probables. De esta forma, una joven tratará de predecir si el novio que le propone matrimonio será un buen esposo antes de responder, un banco otorgará un crédito basado en su pronóstico de si la persona que lo solicita pagará su deuda, y una empresa lanzará un nuevo producto si cree que tendrá una buena aceptación entre sus clientes.
Cuando una decisión es poco frecuente dedicamos una cantidad importante de tiempo a obtener información para hacer un pronóstico, pues no hay mucha experiencia previa. En cambio, cuando una decisión se repite continuamente, con el tiempo establecemos criterios que facilitan la decisión, a partir del resultado de experiencias anteriores. En una organización estos criterios son convertidos en reglas de negocio que deben seguir los encargados de tomar estas decisiones.
Las reglas de negocio generalmente relacionan ciertas circunstancias con un resultado. Por ejemplo, la experiencia de un banco puede indicar que históricamente los clientes con un empleo estable y ahorros pagan sus deudas, por lo que la regla establecerá que podrá autorizarse un crédito si el solicitante tiene empleo estable y ahorros, porque es muy probable que lo pague.
La automatización de este tipo de
decisiones repetitivas es una de las áreas de la Inteligencia Artificial (IA) con mayor
crecimiento hoy en día y su desarrollo es motivo de debate, tanto por el tipo
de decisiones que comienzan a ser automatizadas (con un alto impacto en la vida de
las personas y en áreas consideradas de trabajo intelectual), como porque su
utilización revela aspectos del proceso de decisión que no se analizan mucho cuando
la decisión es tomada por una persona (lee nuestro artículo sobre el tema aquí).
Predecir un resultado a partir de
ciertas circunstancias cae en el campo de los problemas de clasificación del aprendizaje
de máquina (ML por sus siglas en inglés), rama de la IA que estudia las
técnicas para descubrir patrones y relaciones en los datos.
Si buscamos saber si un cliente pagará un crédito con base en su historial, si un novio resultará un buen esposo, o predecir si un producto tendrá éxito en el mercado, lo que queremos es asignar la etiqueta de una categoría a cada caso. En el primero queremos saber si los atributos del solicitante de un crédito corresponden a la categoría de cliente pagador o no pagador, en el segundo si el novio será de la categoría esposo bueno o malo, y en el tercero si la respuesta es de la categoría sí o no.
En estos ejemplos las categorías en que puede clasificarse un caso son sólo dos (pagador o no pagador, bueno o malo, sí o no), las cuales son representadas por 0 y 1 o por un número entre 0 y 1 que indica la probabilidad de que sea una categoría u otra. No obstante, las técnicas de clasificación pueden utilizarse para asignar una de varias categorías.
Para asignar una etiqueta las técnicas de clasificación utilizan fórmulas matemáticas y algoritmos para hacer un proceso que en situaciones simples hacemos fácilmente de manera visual con ayuda de gráficas, en las que representamos el valor de los atributos o características de cada uno de los ejemplos, así como la categoría a la que pertenece cada ejemplo.
Las gráficas de abajo representan tres conjuntos ficticios de clientes de un banco. Cada punto es un cliente y la ubicación del punto depende del valor de dos atributos, ingreso anual en el eje horizontal y saldo de ahorros en el eje vertical. El color de cada punto representa la categoría, naranja si pagó su crédito, azul si no lo pagó y verde si lo pagó con retraso.
En estas gráficas se distinguen claramente las regiones creadas por las categorías, por lo que podemos trazar líneas como fronteras entre ellas. Para determinar si puede esperarse que una persona pagará su crédito, se identifica la categoría a la que pertenece la zona en que cae el punto definido por su ingreso anual y el saldo de sus ahorros.
A partir de los valores de los atributos y la etiqueta de categoría de un gran conjunto de ejemplos, las técnicas de clasificación de ML calculan las fórmulas de las líneas-frontera o los criterios para asignar el valor de la categoría a casos nuevos, asumiendo que la semejanza de atributos implica que les corresponde la misma categoría.
A continuación, describimos brevemente las principales técnicas de clasificación que existen, las cuáles, si bien pueden aplicarse a cualquier número de atributos y categorías, tienen desempeños diferentes dependiendo del tipo de problema y el grado de complejidad.
Regresión logística. Encuentra la fórmula de la línea-frontera que, para cada punto, maximiza la probabilidad de que la categoría sea la que se asignó en la etiqueta. Funciona para cualquier número de atributos en problemas de dos categorías que pueden ser separadas por una línea recta.
Imagen publicada originalmente aquí
Máquinas de soporte vectorial. Encuentra la fórmula de la línea-frontera óptima, la de mayor distancia entre ella y los puntos más cercanos, a fin de reducir los errores de clasificación. Al igual que la regresión logística, aplica en casos de dos categorías que pueden ser separadas por una línea recta.
Imagen publicada originalmente aquí
Clasificador Bayesiano. Técnica probabilística basada en el teorema de Bayes de probabilidad condicional. Encuentra las fronteras que maximizan la probabilidad de que la categoría de un punto sea la que se etiquetó, dada la probabilidad de que el punto sea el analizado. Muy utilizada en diversas áreas, su efectividad depende del cumplimiento de los supuestos del modelo.
Imagen publicada originalmente aquí
Árboles de decisión. Técnica que genera líneas-frontera rectas para cada uno de los atributos, conforme a un criterio que mide qué tanto se separan los puntos. Estas líneas y sus intersecciones forman las regiones que se ajustan a las categorías etiquetadas. Se llaman árboles de decisión porque las fronteras pueden ser utilizadas como preguntas para decidir la categoría de un punto.
Imagen publicada originalmente aquí
K-vecinos. Esta técnica asigna a cada punto la etiqueta de la categoría a la que pertenecen la mayoría de su k vecinos más cercanos, las líneas-frontera resultantes son curvas. Es aplicable para cualquier número de categorías y de atributos, así como varias líneas-frontera.
Imagen publicada originalmente aquí
Redes neuronales artificiales. Es la más moderna de las técnicas de clasificación, utiliza redes de cientos o miles de clasificadores lineales llamados neuronas, con los cuales realiza la clasificación de problemas muy complejos (lee nuestro artículo sobre cómo funcionan aquí).
Existen diversas herramientas para incrementar la exactitud y superar las restricciones de estas técnicas de clasificación, tales como usar varios clasificadores y combinar sus resultados, transformar los datos para que sean linealmente separables y, por supuesto, nuevos tipos de redes neuronales, por ello esta es una de las áreas más interesantes y amplias de la IA.
¿Te gustó este artículo? Lee otros artículos de nuestro blog IF Inteligencia Futura aquí.