El objetivo final es de etiquetar un patrón X utilizando el siguiente conjunto de funciones discriminantes:
donde no se supone nada acerca de la forma funcional de P(X |El cálculo de las probabilidades a priori es relativamente sencillo: basta con utilizar las frecuencias relativas de cada clase en el conjunto de prototipos o, simplemente, no considerarlas, asumiendo que todas son iguales.
El cálculo de la densidad de probabilidad es más complejo, y puede abordarse desde un punto de vista geométrico. En definitiva, trataremos de responder a la pregunta:
¿De qué forma puede utilizarse la información proporcionada por el conjunto de prototipos para inferir, a partir de él, el valor de la función de densidad de probabilidad mediante una interpretación geométrica?
Si fijamos un volumen v en P y consideramos varias regiones en este espacio, resulta evidente que
Estas dos afirmaciones pueden contrastarse en la figura 1, donde mostramos la función de densidad de probabilidad asociada a la clase sana utilizada en el ejemplo 5.2 del capítulo 1. Se muestra, además, cada uno de los prototipos de esta clase. En este ejemplo en el que los patrones son unidimensionales, las regiones se reducen a segmentos y los volúmenes a longitudes.
De manera informal se podría decir que dado un conjunto de patrones, hay una alta probabilidad de encontrar un patrón en una región densamente poblada y baja en regiones poco pobladas en las que las observaciones están más dispersas. Con este planteamiento simple estudiaremos a continuación dos aproximaciones muy diferentes para la estimación de la función de densidad: los estimadores de Parzen y la estimación basada en los vecinos más cercanos.