ESTRUCTURA DE LOS MODELOS DE ANN

1. Modelo de la Unidad de Procesamiento Elemental.



McCulloch and Pitts en 1943 [MP43] concibieron un modelo abstracto y simple de una neurona
artificial, este es el elemento básico de procesamiento en una red neuronal artificial.
Su esquema es el siguiente:

Picture1.jpg


El modelo está compuesto por un vector de pesos Picture10.jpg equivalente a las conexiones sinápticas en una neurona real, w0 es el umbral de acción o activación, el vector x es la entrada y el escalar y la salida de la unidad. La actividad consiste en generar una única salida y a partir de la aplicación de la función de activación γ a la suma ponderada entre el vector de entrada Picture4.jpg y el vector de pesos Picture5.jpg más un sesgo w0, obteniéndose la siguiente expresión:


Picture6.jpg

donde γ es una función no-lineal. La función propuesta por McCulloch-Pitts posee una salida binaria ±1 conocida como la función de todo o nada que equivale a la función signo dada por:

Picture7.jpg


Otra función con salida binaria es la función escalón unitario descrita por:


Picture8.jpg


Cuando se consideran neuronas con respuestas de procesamiento gradual, entonces se pueden
usar funciones de activación de forma lineal γ(z)=z o de forma sigmoidal como la función logística Picture9.jpg o la tangente hiperbólica γ (z)=tanh(z).


2. Redes Neuronales Artificiales.


Una red neuronal artificial (ANN) es un esquema de computación distribuida inspirada en la
estructura del sistema nervioso de los seres humanos. La arquitectura de una red neuronal es formada conectando múltiples procesadores elementales, siendo éste un sistema adaptivo que pose un algoritmo para ajustar sus pesos (parámetros libres) para alcanzar los requerimientos de desempeño del problema basado en muestras representativas.

Por lo tanto podemos señalar que una ANN es un sistema de computación distribuida
caracterizada por:

  • Un conjunto de unidades elementales, cada una de las cuales posee bajas capacidades de
procesamiento.

  • Una densa estructura interconectada usando enlaces ponderados.

  • Parámetros libres que deben ser ajustados para satisfacer los requerimientos de
desempeño.

  • Un alto grado de paralelismo.

Es importante señalar que la propiedad más importantes de las redes neuronales artificiales es su capacidad de aprender a partir de un conjunto de patrones de entrenamientos, es decir, es capaz de encontrar un modelo que ajuste los datos. El proceso de aprendizaje también conocido como entrenamiento de la red puede ser supervisado o no supervisado.

El aprendizaje supervisado consiste en entrenar la red a partir de un conjunto de datos o patrones de entrenamiento compuesto por patrones de entrada y salida. El objetivo del algoritmo de aprendizaje es ajustar los pesos de la red w de manera tal que la salida generada por la ANN sea lo más cercanamente posible a la verdadera salida dada una cierta entrada. Es decir, la red neuronal trata de encontrar un modelo al procesos desconocido que generó la salida y. Este aprendizaje se llama supervisado pues se conoce el patrón de salida el cual hace el papel de supervisor de la red.

En cambio en el aprendizaje no supervisado se presenta sólo un conjunto de patrones a la ANN, y el objetivo del algoritmo de aprendizaje es ajustar los pesos de la red de manera tal que la red encuentre alguna estructura o configuración presente en los datos.