|
Trabajo Fin de Grado 2015-16 | Utilización de una araña de rastreo de red para el descubrimiento de servicios específicos |
EspecialidadesIng. de Computadores
Tutor
CAMINERO HERRÁEZ, Mª BLANCA GARRIDO DEL SOLO, ANTONIO
Descripción y Objetivos
La multitud de servicios e información especifica ofertados a través de redes en ocasiones presentan dificultades para ser encontrados y utilizados por los usuarios. Un claro ejemplo de este tipo son los servicios de mapas en Infraestructuras de Datos Espaciales (IDEs). Con el fin de salvar esas dificultades y conseguir un uso generalizado de la información geográfica, se propone crear un sistema capaz de rastrear estos servicios OGC y ser catalogados en un repositorio para permitir consultas ordenables por criterios conceptuales y geográficos.
Para ello se desarrollará un sistema software basado en un rastreador Web a través de la red, operando de forma automática en el descubrimiento de servicios OGC disponibles en la red a nivel mundial, satisfaciendo la necesidad de inventariar y explotar datos para la extracción de información de servidores y servicios delimitada a un ámbito geográfico, así como el control de disponibilidad y calidad de los servicios o nodos de la red.
Esto permitirá generar una fuente de datos para ser explotada de forma semejante a un buscador Web y analizar su impacto en la red, así como en su ubicación e interconexión con otros servicios de red. Proporcionando como resultado fuentes de servicios para ser utilizados por otras aplicaciones. De esta manera, no solamente se genera un repositorio central de servicios y de descubrimiento de servicios en la red de internet, sino también una herramienta de verificación, de control de calidad de servicios, rastreo de servicios específicos en la red y la oportunidad de generar nuevas líneas de negocio en el desarrollo de sistemas basados en información espacial.
Por tanto, en este TFG se propone la creación de un crawler orientado al rastreo de servicios específicos, empleando para ellos los servicios definidos por OGC por sus características en la red de internet.
OBJETIVOS:
- Estudiar los principales problemas en el descubrimiento de este tipo de sistemas en una red; patrones más frecuentes, causas, ubicación, etc.
- Estudiar el soporte software utilizado para el rastreo de red a nivel web. Analizar los diferentes crawlers.
- Diseñar e implementar un crawler que permita al usuario buscar recursos en la red basados en la especificación de los servicios
- Diseñar y e implementar mejoras en el software del rastreador para mejorar la eficiencia de rastreo basada en calidad de los datos y mejora en los tiempos de computación en la red.
- Mejorar el rastreador en red mediante mutithreading con el objetivo de optimizar la recuperación de información en redes.
- Generar una fuente de datos obtenidos de la red para análisis de big data en trabajos futuros
Metodología y Competencias
Para la implementación del sistema se utilizará una metodología incremental, en varias fases:
- Fase 1: Estudio de los diferentes servicios OGC ofrecidos en la red.
- Fase 2: Determinación de los crawler o arañas web de soporte software (librerías a usar). Desarrollo de una aplicación que permita el rastreo de este tipo de servicios
- Fase 3: Definición de varios tipos de servicios OGC (WMS, WFS, etc.) e incorporación al sistema
- Fase 4: Definición e implementación de un sistema de términos de frecuencia acumulada para la eficiencia de servicios específicos en la red.
- Fase 5: Desarrollo de multihilos en este tipo de sistemas de rastreo
- Fase 6: Prueba y evaluación del sistema
OBSERVACIONES: Para realizar este TFG es necesario tener conocimientos de programación y conocimientos de la especificación OGC,
Medios a utilizar
- Ordenador personal y software de desarrollo
Bibliografía
- Lopez-Pellicer, Francisco J.; Florcyk, Aneta J.; Béjar, Rubén; Nogueras-Iso, Javier; Zarazaga-Soria, F. Javier; Muro-Medrano; Pedro R., State of Play: Spain and Portugal , SDI services’ state of play in autumn 2010 (http://iaaa.cps.unizar.es/curriculum/09-Otras-Publicaciones-Congresos/cong_2010_JIIDE_State.pdf)
- Wenwen Lia*, Chaowei Yanga and Chongjun Yangb, An active crawler for discovering geospatial Web services and their distribution pattern – A case study of OGC Web Map Service (http://www.tandfonline.com/doi/abs/10.1080/13658810903514172#.Vg54FHrtlBc)
- Francisco J. Lopez-Pellicer1, Rubén Béjar1, Aneta J. Florczyk, Pedro R. Muro-Medrano, F. Javier Zarazaga-Soria, A review of the implementation of OGC Web Services across Europe (http://ijsdir.jrc.ec.europa.eu/index.php/ijsdir/article/view/233/299)
- Christopher Olston and Marc Najork, Web Crawling , Foundations and Trends⃝R in Information Retrieval, Vol. 4, No. 3 (2010) 175–246, c 2010 C. Olston and M. Najork DOI: 10.1561/1500000017
Asignación
El Trabajo Fin de Grado ha sido a asignado a Don/Doña DAVID CIFUENTES JIMENEZ
|
|