Machine Learning (Aprendizaje automático): Definición y tipos


Definición


Fíjense en este hombre que está de pie. Se trata de Arthur Lee Samuel que junto a su compañero está jugando a una partida de damas contra una computadora. Estamos en los años 50, dónde este tipo de juegos estaban diseñados con movimientos fijos aleatorios a distintas jugadas del oponente, es decir, todos los movimientos estaban programados.
Esta partida era especial, Arthur había creado este juego y lo había hecho de tal forma que el ordenador aprendía de sus errores. Era el primer juego capaz de aprender con la experiencia.
En un momento dado, por la impresora, salió el siguiente mensaje. 

Habían perdido la partida, pero habían ganado la batalla al aprendizaje automático, o por lo menos, la habían empezado. Habían creado una máquina que aprendía por sí sola.
Por eso, no nos debe de extrañar, que fuera el propio Arthur, quien definiera en 1956, lo que era Maching Learning: "Es el campo de Estudio que da a los computadores la habilidad para aprender sin haber sido explícitamente programada."
Aunque ha habido muchas deficiones sobre el aprendizaje automático, una de las más referenciadas es la que dio Tom Mitchell en 1997: "Es un programa de computador que aprende de la Experiencia E, respecto a alguna tarea T y con medida de rendimiento P, si el desempeño sobre la tarea T, medido por P, mejora con la experiencia E."

Como se puede observar nos dice prácticamente lo mismo que Arthur Lee Samuel aunque de una manera mucho más formal. La base es la misma, programas que aprenden con la experiencia.


Aplicaciones

Este tipo de aprendizaje se encuentra en muchos contextos desde:
  • Diagnóstico Médico.
  • Procesamiento del Lenguaje Natural.
  • Análisis de imágenes.
  • Finanzas y banca.
  • Juegos.
  • Robótica.
  • ....
Pasando por la minería de datos y el Big Data, ya que estas técnicas de aprendizaje automático nos proporcionan una herramienta fundamental para la extracción de información de grandes conjuntos de datos.

Tipos de aprendizaje

Los datos que queremos aprender o analizar, los podemos tener etiquetados o no, es decir, podemos conocer a que clase pertenecen o desconocer ese dato. Por ejemplo, si tenemos una base de datos de pacientes de los que se han realizado ciertas pruebas, tenerlo etiquetado sería conocer si el paciente padece cierta enfermedad o por el contrario está sano. Esto nos lleva a hablar de aprendizaje supervisado si están etiquetados. Cuando no lo están aprendizaje no supervisado y semisupervisado, cuando sólo hay unos cuantos etiquetados.

  1. Aprendizaje supervisado. En el aprendizaje supervisado al conocer tanto los datos de entrada como los resultados deseados, nos permite que la salida proporcionada por la máquina de aprendizaje pueda ser comparada con la salida deseada. Y aquí hay ya muchas estrategias. Una de las más comunes es utilizar ese error producido para ajustar el aprendizaje. Este tipo de aprendizaje se suele utilizar tanto para clasificación como para regresión.

2.      Aprendizaje no supervisado. Todo el proceso de modelado se lleva a cabo por un conjunto de ejemplos formado tan sólo por las entradas al sistema, sin tener información sobre las categorías de esos ejemplos. El sistema de aprender por sí solo sin ningún tipo de conocimiento que le permita testear el aprendizaje. Por lo tanto, el objetivo principal del aprendizaje no supervisado suele ser encontrar patrones que permitan separar y clasificar los datos de diferentes grupos en función de sus atributos, para poder etiquetar las nuevas entradas. Estas técnicas de acoplamiento se conocen con el nombre de clustering.

3.      Aprendizaje semisupervisado. Caso mixto, es decir, tenemos muestras etiquetadas y otras que no lo están. En este caso, hay varias estrategias que podríamos seguir, por ejemplo, crear una máquina de aprendizaje supervisada que permita predecir las muestras que no lo están y luego volver a entrenar nuevamente de manera supervisada con todas las muestras.


Otra estrategia sería utilizar los datos sin etiquetar para agrupar por categorías y luego aplicar un aprendizaje supervisado con las muestras etiquetadas de cada categoría, es decir, utilizar el aprendizaje no supervisado para mejorar el modelo supervisado.



Bibliografía

  • Inteligencia artificial. Un enfoque moderno. 2ed (2004). Peter Norvig y Stuart J. Russell. Pearson.
  • Inteligencia artificial: métodos, técnicas y aplicaciones (2008). Palma Méndez, José Tomás y Marín Morales, Roque. McGraw-Hill España.

Comentarios