Aprendizaje de Maquina: Inteligencia Artificial del siglo XXI

Aprendizaje de Maquina: Inteligencia Artificial del siglo XXI

Decidí estudiar los avances recientes de la Inteligencia Artificial (IA) por tres razones:

  1. La IA pasó del laboratorio a las empresas y organizaciones. Computadoras poderosas, datos abundantes y extendidas redes de comunicación favorecieron una explosión de aplicaciones que ya forman parte de nuestra vida cotidiana.
  2. Es un campo que provoca sentimientos encontrados. Esperamos avances a la altura de la visión de ciencia ficción que nos dibuja la imaginación, pero cuando se hacen realidad nos invaden visiones apocalípticas de dominación robótica.
  3. No es la primera vez que hay grandes expectativas. Desde que recuerdo, la opinión de los expertos es que en 20 años se tendrá una inteligencia artificial general, que iguale o supere al ser humano en todos los campos. Eso decían en los 80s y eso dicen hoy.

Para averiguar por mí mismo qué tanto avanzaron las cosas me inscribí en un par de cursos, uno de IA en general y otro de aprendizaje de máquina (ML por sus siglas en inglés), la rama de la IA que estudia las técnicas para descubrir patrones y relaciones en los datos que sirven para hacer predicciones o tomar decisiones. Descubrí que esta rama es la que está detrás de los extraordinarios avances de esta década.

Los esfuerzos de tomar cursos avanzados de un tema técnico, en plataformas y con lenguajes de programación que no existían cuando dejé de hacer sistemas muy al principio de mi carrera, fueron superados por mi asombro ante el poder de las herramientas del ML.

programmingjpg

Uno de los ejercicios del curso fue desarrollar un programa que, a partir de los textos de 50 mil comentarios de espectadores a películas, cada uno etiquetado como positivo o negativo, predijera el carácter positivo o negativo de otros 50 mil comentarios sin etiquetar. El ejercicio se calificaría con el porcentaje de aciertos.

Mi entusiasmo fue enorme al ver que los datos estaban en Internet, que existían las herramientas para recopilarlos y que luego de cierto esfuerzo pude hacer un programa que hizo el ejercicio en poco más de una hora. Todo sin costo, desde mi casa y con una computadora portátil. Fue entonces cuando la magnitud de estos avances quedó clara para mí, una empresa podría analizar cientos de miles o millones de comentarios en minutos y tener una imagen en tiempo real de la opinión del público sobre una película, sin leer un solo comentario.

Al darme cuenta de que, si se tienen los datos, el ML puede aplicarse fácilmente en cualquier actividad en donde se analicen datos estructurados para sacar una conclusión, me asombró la magnitud del impacto que tendrán estas herramientas para la economía, la actividad gubernamental y nuestra vida diaria. De eso se trata esto, por eso las noticias frecuentes, la fiebre por desarrollar aplicaciones y los temores por las implicaciones de su utilización.

Y es que los algoritmos de ML llevan a cabo algo que lo seres humanos hacemos continuamente para tratar de darle sentido a la información que recibimos del entorno y así tomar decisiones. A lo largo de nuestra vida el cerebro aprende a intentar rellenar automáticamente los huecos de la información que recibimos y a encontrar patrones que puedan utilizarse para sacar conclusiones.

Por ejemplo, si estudiamos las figuras de abajo no tardaremos mucho tiempo en rellenar los huecos y tener una imagen completa. Este proceso se llama inferencia, sacamos conclusiones a partir de la información que tenemos.

Inferenciasjpg

 Perros y gatos por macrovector_official

Nuestra capacidad de inferencia es poderosa pero limitada, entre más grande es el número de datos a manejar y más complejos los patrones a detectar nos cuesta más trabajo, hasta que llega un punto en que ya no podemos hacerlas.

En contraste, las técnicas y algoritmos de ML de la actualidad pueden realizar inferencias sobre cantidades ilimitadas de datos a velocidades increíbles, sólo limitada por la capacidad de los equipos de cómputo, por lo que son capaces de encontrar patrones que los seres humanos simplemente no podemos descubrir o, en el mejor de los casos, tardaríamos demasiado en hacerlo.

Estas técnicas, casi todas desarrolladas por los investigadores en los 80s y 90s durante el llamado invierno de la IA, evolucionaron y fueron llevadas a la práctica en este siglo gracias a la disponibilidad de computadoras, datos y redes, dando lugar a una primavera de la IA con el potencial de cambiar la historia de la humanidad. (Lee nuestro artículo con la historia de este campo)

A continuación, describimos brevemente los tipos de ML y las técnicas que pueden utilizarse en cada tipo, de acuerdo con la naturaleza del problema a resolver:

Aprendizaje Supervisado. A partir de datos seleccionados (atributos) de una gran cantidad de ejemplos, cada uno etiquetado con una categoría o valor, se encuentran parámetros para predecir el valor o categoría. Se divide en dos tipos:

  • Regresión – Cuando la categoría a predecir es un número (como en la figura B). Técnicas: regresión lineal, regresión de cresta, regresión bayesiana.
  • Clasificación – Cuando la categoría a predecir no es numérica (como en la figura C). Técnicas: regresión logística, máquinas de soporte vectorial, clasificador Bayesiano, árboles de decisión, k-vecinos y redes neuronales artificiales. (lee nuestro artículo sobre redes profundas)

Aprendizaje No Supervisado. Sólo a partir de los atributos de los ejemplos, sin etiquetar con una categoría o valor, se encuentran patrones para agrupar los ejemplos, evaluar el grado de similitud entre ellos y hacer predicciones (como en la figura A, o la C sin los perros y gatos). Técnicas: Agrupamiento, Reglas de Asociación, Matriz de factorización, Modelos secuenciales.

Aprendizaje Reforzado. Es una combinación de los dos anteriores. Se busca lograr un objetivo con una secuencia de pasos, en los cuales existen varias acciones alternativas. Al inicio de cada paso se evalúan las alternativas, se elige una y se observa qué tanto nos acercó o alejó del objetivo. La alternativa usada se clasifica entonces de acuerdo con su contribución al objetivo y esta información es utilizada en los siguientes pasos. Es un proceso de prueba y error.

Un ejemplo muy simple se muestra en la figura de abajo. Se tiene el objetivo de ir del punto A al B y en cada paso se puede ir arriba o abajo. En el paso 1, como no hay información, se escoge al azar ir arriba. Luego de avanzar se ve que nos acercamos al punto B, por lo que ir arriba se clasifica como positivo. En los siguientes tres pasos se escoge ir arriba porque es mejor que ir abajo, que no tiene clasificación. Sin embargo, luego del paso 4 se ve que nos alejamos del punto B, por lo que ir arriba es ahora clasificado como negativo y se escoge ir abajo. Luego del paso 5 se ve que nos acercamos, por lo que ir abajo se clasifica como positivo. En los siguientes pasos nos seguimos acercando, por lo que las clasificaciones no cambian (arriba negativo y abajo positivo) y se sigue escogiendo ir hacia abajo hasta llegar al punto B.

Blog-08 ARpng

Los algoritmos de ML han logrado superar el desempeño que puede alcanzar un ser humano en muchas actividades que involucran el análisis de datos y hacen posibles inferencias que antes no era factible o práctico realizar. Esto permite el desarrollo de nuevos productos y servicios que ayudarán a mejorar la vida de las personas, pero también promueve la automatización de actividades que antes se pensaba no podía realizar una máquina.

El aprendizaje de máquina es la inteligencia artificial del siglo XXI, que empieza a tener un impacto disruptivo en muchas sectores y actividades. Gobiernos y sociedad civil debemos tomar las medidas para que los beneficios de la aplicación de estas tecnologías superen los efectos negativos. En ese esfuerzo, estar informado es el primer paso. 

¿Te gustó este artículo? Lee otros artículos de nuestro blog IF Inteligencia Futura aquí

Visita nuestras secciones