Hoy día a través de redes sociales se evaluan todo tipo de productos por parte de los usuarios, obteniéndose valiosa información para el resto de usuarios con respecto a los productos evaluados.
Paginas como IMBD, donde los usarios, de forma anonima evalúan la calidad de las películas que ven, nos ofrecen información valiosa a la hora de predecir si una determinada película es de calidad o no lo es y de alguna forma una medida de calidad.
Este problema puede encuadrarse en un problema de clasificación binaria, esto es, esta determinada película es de calidad o no la es. Estando muy relacionada con los sistemas de recomendación, no es el mismo problema debido a que nosotros no conocemos el perfil de los usuarios que valoran los productos, tan solo tenemos una distribución de votos anónimos, de su
valoración de calidad de algunos productos. Por tanto, no podemos conocer nada al respecto de los usuarios valoradores.
Incluso si conociéramos el identificador del anotador/usuario de cada producto, existen situaciones en donde no es posible obtener información son respecto a sus posibles características como usuario, tan solo una distribución de los votos que ha realizado en cada uno de los productos.
En la literatura de aprendizaje automatico, y mas concretamente del aprendizaje supervisado, donde encajaría este problema de clasificación, hay un problema a la hora de abordarlo con procedimientos estándares, y es que no tenemos la valoración definitiva de cada producto, esto es, nadie nos da el valor de su etiqueta, es de calidad o no lo es. En este caso, además, en este tipo de problemas existe una gran subjetividad en la valoración, es decir, para un experto/usuario un prodcuto puede ser de calidad y para otro experto/usurario puede que no lo sea, es por ello, que se recurre a cuanto mas anotadores/usuarios mejor para obtener información sobre la posible calidad de cada producto.
Este tipo de problemas donde el valor de la etiqueta para cada objeto no se conoce de forma directa, se les conoce en la literatura especifica de aprendizaje automatico, como problemas debilmente supervisados.
Se han plantado hasta ahora muchos problemas debilmente supervisados, pero ninguno encaja con el descrito previamente, existen algunos relacionados con el planteado pero no son el mismo tipo de problema.
El principal objetivo de esta trabajo fin de grado es plantear el problema descrito como un problema de clasificación binario debilmente supervisado y establecer algunos algoritmos para su solución, así como su validación empirica con caso de prueba.