Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2017-18   2019-20



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2018-19

Predicción del precio de una vivienda mediante un proceso de ciencia de datos


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

A partir de la crisis del mercado inmobiliario de hace una década se demostró la necesidad de contar con tasaciones / estimaciones del valor del precio de una vivienda lo mas preciso posible y obtenido de forma objetiva. En este sentido la predicción automática de dicho valor a partir de los datos recogidos en la ficha del a vivienda y posiblemente aumentados con datos demográficos del área geográfica en que se encuentra podría ser una solución ideal.  Los procesos de ciencia de datos han demostrado su utilidad para resolver este tipo de tareas.

En este proyecto se trabajará con una base de datos disponible (como una competición en la página Kaggle.com), denominada "House Prices" y que describe el proceso de venta de propiedades inmobiliaris individuales en la localiad de Ames (Iowa), entre los años 2006 y 2010.

El objetivo de este trabajo fin de grado no es obviamente ganar dicha competición, si no  realizar un proceso de ciencia de datos  sobre dicha base de datos, guiada por la metodología CRISP-DM.  El objetivo principal, consiste en la predicción de precios para las viviendas de la competición de Kaggle "House Prices", de manera que se pueda hacer una estimación fiable de las viviendas proporcionadas en el conjunto de test pertinente. Este objetivo principal se subdivide en los siguientes objetivos parciales:

▪ Realizar un proceso de aprendizaje y selección de variables sobre el conjunto de datos de entrenamiento, permitiendo así comprender el significado de estas y poder prescindir, si es necesario, de aquellas más redundantes.
▪ Definir la estrategia más adecuada mediante la cual estimar el error que se comete a la hora de predecir un precio para una vivienda. Este error debe ser evaluado de manera individual y en conjunto de todas las viviendas(acumulativo).
▪ Basándose en el proceso de aprendizaje seguido y teniendo en cuenta las conclusiones obtenidas del mismo, se podrá realizar una tarea de web scrapping con el objetivo de generar un dataset inmobiliario de la ciudad de Albacete.

 

 


Metodología y Competencias

Metodología:

  1. Revisar el contexto del problema y la literatura disponible.
  2. Objetivos de negocio y ciencia de datos.
  3. Realizar un análisis exploratorio de los datos existentes. Estudiar la posibilidad de completar dichos datos mediante procesos de web-scrapping.
  4. Sobre la partición de datos de entrenamiento diseñar procesos de minería de datos centrados en:
    1. Preprocesamiento de datos (selección de variables, construcción de variables, discretización, etc.)
    2. Identificación de los algoritmos de minería de datos que mejor encajen en el problema objetivo. Aplicar realizando selección de modelos en función de los parámetros.
    3. Validación de los modelos obtenidos.
    4. Iterar refinando los pasos anteriores hasta determinar uno o varios modelos exitosos.
  5. Documentar todo el proceso anterior para que sea repetible.
  6. Estimar la bondad de los modelos finales (seleccionados) sobre el conjunto de datos de test reservado a tal efecto.
  7. Estudiar el cumplimiento de los objetivos del modelo de negocio en función de los objetivos de la tearea de minería de datos.
  8. Redactar la memoria.

Competencias:

Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:

  • Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.

  • Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas
    inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas
    que utilicen dichas técnicas en cualquier ámbito de aplicación.

  • Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una
    forma computable para la resolución de problemas mediante un sistema informático en
    cualquier ámbito de aplicación, particularmente los relacionados con aspectos de
    computación, percepción y actuación en ambientes entornos inteligentes.

  • Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e
    implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción
    automática de información y conocimiento a partir de grandes volúmenes de dato.

 

 

 


Medios a utilizar

Ordenadores personales, compiladores y entornos de programación. Todo disponible en la ESIIAB.

 


Bibliografía

Libros y manuales de aprendizaje automático, relativos al dominio de problema y ciencia/minería de datos. Libros y manuales de lenguajes de programación y librerías específicas de aprendizaje automático. Todo disponible en la ESIIAB y/o en internet.

 


Tutor


GAMEZ MARTIN, JOSE ANTONIO
 

Alumno


ZORNOZA MARTÍNEZ, ALEJANDRO
 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2018-19
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página