La distribución de registros para las distintas etiquetas de la variable clase, tiene un efecto notable sobre la eficacia del clasificador aprendido, degradándose ésta si la distribución no está balanceada, es decir, hay muchos ejemplos para una clase y muy pocos para otra.
En este proyecto se pretende hacer un estudio detallado de la influencia de este problema en los clasificadores probabilísticos basados en redes Bayesianas, así como implementar alguna modificación que ayude a mejorar su rendimiento en estos casos.
El estudio se realizará usando el API de minería de datos Weka (java).