Machine Learning: Métodos

Métodos de Maching Learning

Dentro de los métodos de aprendizaje automático presentaré los más significativos.

Redes Neuronales


Uno de los métodos más usados son las redes neuronales artificiales. Estos son un paradigma de aprendizaje y procesamiento automático basados en sistemas bioinspirados. 

Son modelos bastante simplificados de las redes neuronales que forman el cerebro e intentan de la misma forma. La forma más común de utilizarla es mediante el aprendizaje supervisado como tanto para clasificación como para regresión.
Un tipo especial de redes neuronales son las máquinas de vectores soportes. Éstas permite construir un hiperplano o conjunto de hiperplanos en un espacio de dimensionalidad muy alta. 

Permiten a partir de un conjunto de datos difícil de clasificar, utilizar una función de transformación, de tal manera, que aumentamos la dimensión, con lo que nos será más fácil clasificarla. En este ejemplo, pasamos un modelo de dos a tres dimensiones, y esto nos permite encontrar un hiperplano que clasifique el conjunto de datos de una forma más eficiente.

Los mapas autoorganizados son un tipo de redes neuronales utilizadas en el aprendizaje no supervisado, que a partir de un proceso iterativo de comparación con un conjunto de datos crea un modelo que puede servir para agruparlos por criterio de similitud. Esto es un claro ejemplo de como un mismo sistema  de aprendizaje (redes neuronales) puede utilizarse con aprendizaje tanto supervisado como no supervisado.


Modelos lineales

Muchos algoritmos de aprendizaje automático hacen uso de la linealidad . Los algoritmos de clasificación lineal suponen que las clases pueden estar separadas mediante una línea recta, aunque pueden se utilizados para algunos problemas. En otros disminuye la decisión, aun así pueden se empleados como primeras pruebas, ya que son algoritmos sencillos y fáciles de entrenar.

Árboles de Decisión

A veces no interesa disponer sólo de un modelo predictivo si no que sea tanto inteligible al usuario. En este caso tanto los árboles dedecisión como las reglas cumplen perfectamente ese propósito.
Un árbol de cesión e un árbol donde cada nodo representa una condición o es sobre algún atrbibuto, y cada rama que parte de ese nodo corresponde a un posible valor de ese atributo, y donde las hojas representan las clases.
Hay varios algoritmos que implementan los árboles de decisión y se distinguen en la forma en que generan las distintas particiones y las elecciones de la mejor partición.

Reglas

Las reglas proporcionan una de las representaciones más expresivas y legibles. Por ejemplo: son conjunto de pares IF....THEN.
Siguen una estrategia de generar reglas de una en una, eliminando cada vez los ejemplos cubiertos por las nuevas reglas.
Las reglas pueden ser fácilmente extraíbles a partir de un árbol de decisiones. Sin embargo, se diferencian de los árbobles, en que el árbol las reglas son excluyentes entre sí, ya que provienen de condiciones diferentes; y en el árbol, cada nuevo ejemplo es clasificado en una única clase, cosa que no ocurre con las reglas.

Reglas bayesianas

El aprendizaje bayesiano se utiliza para representar un conjunto de variables aleatorias y sus dependencias condicionales. Como su nombre indica está basado en el teorema de Bayes mediante un grafo denominado red bayesiana, se representan estas dependencias condicionales.
Entre otros muchos usos: detección de spam, fraude, etc. Este tipo de sistemas es muy utilizado en temas médicos, ya que mediante una red bayesiana  se puede representar fácilmente las relaciones probabilísticas entre enfermedades y síntomas.

Clustering

Un algoritmo de agrupamiento o clustering, es un procedimiento de  agrupación de una serie de vectores de acuerdo a un criterio. Estos criterios son por lo general distancia o similitud, cercanía se decide en términos de una determinada función de distancia como la euclídea, aunque existen otras más robustas que permiten extenderla a variables discretas.
En algunos contextos como en la minería de datos, se les considera una técnica de aprendizaje no supervisado, puesto que buscan encontrar relaciones entre variables, sin tener en cuenta la variable objetivo.

Aprendizaje por vecindad

 En el aprendizaje por vecindad, a partir de una muestra decidiremos a que clase pertencen, dependiendo de las muestras más cercanas a ella.
Estos métodos tienen la ventaja de no tener que realizar un aprendizaje ya que nos fijamos en las muestras vecinas.



Comentarios