Guía docente de Tratamiento Inteligente de Datos (M50/56/2/3)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 12/07/2022

Máster

Máster Universitario en Ingeniería Informática

Módulo

Tecnologías Informáticas 1

Rama

Ingeniería y Arquitectura

Centro en el que se imparte la docencia

E.T.S. de Ingenierías Informática y de Telecomunicación

Centro Responsable del título

International School for Postgraduate Studies

Semestre

Primero

Créditos

4

Tipo

Obligatorio

Tipo de enseñanza

Presencial

Profesorado

  • Gabriel Navarro Garulo

Tutorías

Gabriel Navarro Garulo

Email
  • Tutorías 1º semestre
    • Viernes 9:00 a 15:00 (D21 Etsiit)
    • Viernes 9:00 a 15:00 (Nd Etsiit)
  • Tutorías 2º semestre
    • Viernes 9:00 a 15:00 (D21 Etsiit)
    • Viernes 9:00 a 15:00 (D16 Etsiit)

Breve descripción de contenidos (Según memoria de verificación del Máster)

Fundamentos de Estadística para Data Mining, Modelos de Aprendizaje, Procesamiento y Reducción de Datos, Imprecisión e Incertidumbre en Minería de Datos, Agrupamiento (clustering), Técnicas de Clasificación, Asociaciones de atributos, reglas de asociación y dependencias funcionales, Aplicaciones relevantes: análisis de soluciones y problemas abiertos, Nuevas tendencias en Minería de Datos.

Prerrequisitos y/o Recomendaciones

Tener  superadas todas las asignaturas del grado de Ingeniería Informática o conocimientos equivalentes.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Resultados de aprendizaje (Objetivos)

  • Analizar y categorizar adecuadamente algoritmos y modelos de aprendizaje existentes. Adquirir el bagaje suficiente para proponer métodos alternativos adecuados a situaciones específicas no descritas anteriormente.
  • Aplicar los métodos básicos para la limpieza de datos necesaria, previa a cualquier análisis estadístico o destinado al aprendizaje automático.
  • Conocer los desarrollos más importantes de Minería de Datos.
  • Conocer las nuevas tendencias en Minería de Datos

Programa de contenidos Teóricos y Prácticos

Teórico

  • Tema 1Introducción al Tratamiento Inteligentes de Datos (IDA). Motivación histórica. IDA, KDD y Minería de Datos. Fases de KDD. Aplicaciones.
  • Tema 2. Preparación de Datos. Tipos de datos. Limpieza y visualización. Transformación. Reducción.
  • Tema 3. Clasificación.  Introducción. Fases del problema de clasificación. Métodos Bayesianos. Método del vecino más cercano. Árboles de decisión. Clasificación con reglas. Problemas de clasificación basados en Lógica Difusa. Validación de resultados
  • Tema 4. Agrupamiento (Clustering). Introducción. Tipos de datos y distancias. Clustering jerárquico. Clustering basado en representantes. Clustering basado en densidad. Otros modelos de agrupamiento. Validación de agrupamientos.
  • Tema 5. Regresión. Introducción. Relaciones funcionales entre atributos. Análisis de regresión: ideas básicas. La regresión lineal. La regresión multivariante. La regresión logística.
  • Tema 6. Asociación de atributos. Reglas de asociación: definición, mecanismos de cálculo. Medidas de bondad de las reglas de regresión. Introducción a las reglas de asociación difusas.
  • Tema 7. Series Temporales. Concepto de serie temporal. Modelos clásicos. Modelos AR.
  • Tema 8. Minería de textos. Introducción de la Minería de Textos. Preprocesamiento de datos textuales. Análisis de semántica latente. Clustering y asociación  en Minería de Textos. Problemas especiales en Minería de Textos: detección de entidades, detección de sucesos.

Práctico

Seminarios/Talleres:

  • Introducción a las herramientas de Minería de Datos.
  • Presentación de casos prácticos de IDA por parte de grupos de alumnos.

Prácticas de Laboratorio:

  • Práctica 1. Resolución de casos de preprocesamiento de datos 
  • Práctica 2. Resolución de casos de agrupamiento de datos 
  • Practica 3. Resolución casos de clasificación 
  • Práctica 4. Resolución de casos de asociación 
  • Práctica 5. Resolución de casos de minería de textos 
  • Practica 6. Resolución de casos de series temporales  

Bibliografía

Bibliografía fundamental

  • J. H. Orallo, M. J. Ramírez Quintana and C. Ferri Ramírez, Introducción a la Minería de Datos, Pearson, 2004.
  • P-N. Tan, M. Steinbach, A. Karpatne and V. Kumar, Introduction to Data Mining, 2nd Edition, Addison Wesley, 2019.
  • C. Aggarwal, Data Mining: The textbook, Springer, 2015.
  • G. Bakos, KNIME Essential, PACK, 2015.
  • W. N. Venables, D.M. Smith and the R development core team, An introduction to R, 2nd Edition, Network Theory Ltd., 2009. 
  • Y. Zhao, R and Data Mining: Examples and Case Studies, Academic Press, 2012.

Bibliografía complementaria

  • M. J. Zaki and W. Meira Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014.
  • F. Provost and T. Fawcett, Data Science for Business, O’Reilly,  2013.

Enlaces recomendados

  • www.kaggle.com
  • www.kdnuggets.com

Metodología docente

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Se utilizarán alguna o algunas de las siguientes técnicas de evaluación:

  • Para la parte teórica, se realizarán pruebas y exámenes de los contenidos impartidos en teoría, y los alumnos deberán entregar y presentar trabajos (individuales o en grupo) relacionados con los contenidos de la asignatura. Para estos últimos, se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados.
  • Para la parte práctica, se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo), y se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados o, en su caso, las entrevistas personales con los alumnos. Se podrá tener en cuenta la asistencia a los seminarios.

La calificación global corresponderá a la puntuación ponderada de los diferentes aspectos y actividades que integran el sistema de evaluación. Por tanto, el resultado de la evaluación será una calificación numérica obtenida mediante la suma ponderada de las calificaciones correspondientes a una parte teórica y una parte práctica. El peso de la evaluación de cada actividad formativa, se ajustará a lo siguiente:

Parte Teórica: Exámenes, sesiones de evaluación, entregas de actividades y trabajos, discusión de resultados, presentación de trabajos. 50% de la calificación final.

Parte Práctica: Entrega de ejercicios de prácticas, desarrollo de casos prácticos, presentación de casos prácticos, discusión de resultados. 50% de la calificación final.

Para aprobar la asignatura es necesario tener una calificación numérica superior o igual a 5 (sobre 10). No obstante, además del requisito anterior, se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5,  al no haber superado la asignatura la calificación final será de 4.

El sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R. D 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional.

Evaluación Extraordinaria

La evaluación en la convocatoria extraordinaria consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.

Evaluación única final

La evaluación única final consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.

Información adicional