Guía docente de Tratamiento Inteligente de Datos (M50/56/2/3)

Curso 2023/2024
Fecha de aprobación por la Comisión Académica 28/06/2023

Máster

Máster Universitario en Ingeniería Informática

Módulo

Tecnologías Informáticas 1

Rama

Ingeniería y Arquitectura

Centro Responsable del título

International School for Postgraduate Studies

Semestre

Primero

Créditos

4

Tipo

Obligatorio

Tipo de enseñanza

Presencial

Profesorado

  • Fernando Berzal Galiano
  • Alfonso Gijón Gijón
  • Gabriel Navarro Garulo

Tutorías

Fernando Berzal Galiano

Email
  • Tutorías 1º semestre
    • Miércoles 18:00 a 20:00 (D17 Etsiit)
    • Miércoles 15:00 a 16:00 (D17 Etsiit)
    • Jueves 15:00 a 16:00 (D17 Etsiit)
    • Jueves 18:00 a 20:00 (D17 Etsiit)
  • Tutorías 2º semestre
    • Jueves 15:30 a 17:30 (D17 Etsiit)
    • Jueves 19:30 a 20:30 (D17 Etsiit)
    • Viernes 17:30 a 20:30 (D17 Etsiit)

Alfonso Gijón Gijón

Email
Tutorías 2º semestre
  • Viernes 10:00 a 13:00 (Db2- Citic)

Gabriel Navarro Garulo

Email
Segundo semestre
  • Martes 12:30 a 14:30 (Desp. 16 Etsiit)
  • Miércoles 13:30 a 14:30 (Desp. 16 Etsiit)
  • Miércoles 9:30 a 12:30 (Desp. 16 Etsiit)

Breve descripción de contenidos (Según memoria de verificación del Máster)

Fundamentos de Estadística para Data Mining, Modelos de Aprendizaje, Procesamiento y Reducción de Datos, Imprecisión e Incertidumbre en Minería de Datos, Agrupamiento (clustering), Técnicas de Clasificación, Asociaciones de atributos, reglas de asociación y dependencias funcionales, Aplicaciones relevantes: análisis de soluciones y problemas abiertos, Nuevas tendencias en Minería de Datos.

Prerrequisitos y/o Recomendaciones

Tener  superadas todas las asignaturas del grado de Ingeniería Informática o conocimientos equivalentes.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Resultados de aprendizaje (Objetivos)

  • Analizar y categorizar adecuadamente algoritmos y modelos de aprendizaje existentes. Adquirir el bagaje suficiente para proponer métodos alternativos adecuados a situaciones específicas no descritas anteriormente.
  • Aplicar los métodos básicos para la limpieza de datos necesaria, previa a cualquier análisis estadístico o destinado al aprendizaje automático.
  • Conocer los desarrollos más importantes de Minería de Datos.
  • Conocer las nuevas tendencias en Minería de Datos

Programa de contenidos Teóricos y Prácticos

Teórico

  • Tema 1. Tratamiento Inteligentes de Datos (IDA). 
  • Tema 2. Preprocesamiento de datos. 
  • Tema 3. Asociación 
  • Tema 4. Agrupamiento (Clustering). 
  • Tema 5. Regresión
  • Tema 6. Clasificación. 
  • Tema 7. Detección de anomalías. 
  • Tema 8. Series Temporales.
  • Tema 9. Minería de textos y minería web
  • Tema 10. Minería de grafos y redes

Práctico

Seminarios/Talleres:

  • Introducción a las herramientas de Minería de Datos.
  • Presentación de casos prácticos de IDA por parte de grupos de alumnos.

Prácticas de Laboratorio:

  • Práctica 1. Resolución de casos de preprocesamiento de datos 
  • Práctica 2. Resolución de casos de agrupamiento de datos 
  • Practica 3. Resolución casos de clasificación 
  • Práctica 4. Resolución de casos de asociación 
  • Práctica 5. Resolución de casos de minería de textos 
  • Practica 6. Resolución de casos de series temporales  

Bibliografía

Bibliografía fundamental

  • Pang-Ning Tan, Michael Steinbach, Vipin Kumar & Anuj Karpatne: “Introduction to Data Mining”, 2nd edition, Addison Wesley, 2018. ISBN 0133128903.
  • Jiawei Han, Jian Pei & Hanghang Tong: “Data Mining: Concepts and Techniques”, 4th edition, Morgan Kaufmann, 2022. ISBN 0128117605.
  • Jure Leskovec, Anand Rajaraman & Jeffrey David Ullman: “Mining of Massive Datasets”, 3rd edition, Cambridge University Press, 2020. ISBN 1108476341.
  • Charu C. Aggarwal: “Data Mining: The Textbook”, Springer, 2015. ISBN 3319141414.

Bibliografía complementaria

  • Mohammed J. Zaki & Wagner Meira Jr.: “Data Mining and Analysis: Fundamental Concepts and Algorithms”, 2nd edition, Cambridge University Press, 2020. ISBN 1108473989.
  • Steven S. Skiena: “The Data Science Design Manual”, Springer, 2017. ISBN 3319554433.
  • Foster Provost & Tom Fawcett: “Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking”, O’Reilly,  2013. ISBN 1449361323.
  • Andriy Burkov: “Machine Learning Engineering”, True Positive, 2020. ISBN 1777005469.
  • José Hernández Orallo, María José Ramírez Quintana & César Ferri Ramírez: “Introducción a la Minería de Datos”, Pearson, 2004. ISBN 8420540919.
  • Ian H. Witten, Eibe Frank, Mark A. Hall & Christopher J. Pal: “Data Mining: Practical Machine Learning Tools and Techniques”, 4th edition, Morgan Kaufmann, 2016. ISBN 0128042915.
  • Peter Flach: “Machine Learning: The Art and Science of Algorithms that Make Sense of Data”, Cambridge University Press, 2012. ISBN 1107422221.
  • John D. Kelleher, Brian Mac Namee & Aoife D'Arcy: “Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies”, 2nd edition, MIT Press, 2020. ISBN 0262044692.
  • Chris J. Lloyd: “Data-Driven Business Decisions”, Wiley, 2011. ISBN 0470619600.
  • Marc Peter Deisenroth. A. Aldo Faisal & Cheng Soon Ong: “Mathematics for Machine Learning”, Cambridge University Press, 2020. ISBN 110845514X.
  • Jeff M. Phillips: “Mathematical Foundations for Data Analysis”, Springer, 2021. ISBN 3030623408.
  • Steven L. Brunton & J. Nathan Kutz: “Data-Driven Science and Engineering: Machine Learning, Dynamical Systems, and Control”, 2nd edition, Cambridge University Press, 2022. ISBN 1009098489.
  • Michael R. Berthold, Christian Borgelt, Frank Hoppner & Frank Klawonn: “Guide to Intelligent Data Analysis: How to Intelligently Make Sense of Real Data”, Springer, 2010. ISBN 1848822596.
  • Philipp K. Janert: “Data Analysis with Open Source Tools”, O'Reilly Media, 1st edition, 2010. ISBN 0596802358.
  • ChengXiang Zhai & Sean Massung: “Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining”, ACM Books, 2016. ISBN 1970001194.
  • Charu C. Aggarwal: “Machine Learning for Text”, 2nd edition, Springer, 2022. ISBN 3030966224.
  • Bing Liu: “Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data”, 2nd edition, Springer, 2011. ISBN 3642194591.
  • Charu C. Aggarwal & Jiawei Han (editors): “Frequent Pattern Mining”, Springer, 2014. ISBN 3319078208.
  • Charu C. Aggarwal & Chandan K. Reddy (editors): “Data Clustering: Algorithms and Applications”, CRC Press, 2013. ISBN 1466558210.
  • Charu C. Aggarwal (editor): “Data Classification: Algorithms and Applications”, CRC Press, 2014. ISBN 1466586745.
  • Charu C. Aggarwal: “Outlier Analysis”, 2nd edition, Springer, 2022. ISBN 3319475770.
  • Charu C. Aggarwal: “Recommender Systems: The Textbook”, Springer, 2016. ISBN 3319296574.

Enlaces recomendados

  • www.kaggle.com
  • www.kdnuggets.com

Metodología docente

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Se utilizarán alguna o algunas de las siguientes técnicas de evaluación:

  • Para la parte teórica, se realizarán pruebas y exámenes de los contenidos impartidos en teoría, y los alumnos deberán entregar y presentar trabajos (individuales o en grupo) relacionados con los contenidos de la asignatura. Para estos últimos, se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados.
  • Para la parte práctica, se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo), y se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados o, en su caso, las entrevistas personales con los alumnos. Se podrá tener en cuenta la asistencia a los seminarios.

La calificación global corresponderá a la puntuación ponderada de los diferentes aspectos y actividades que integran el sistema de evaluación. Por tanto, el resultado de la evaluación será una calificación numérica obtenida mediante la suma ponderada de las calificaciones correspondientes a una parte teórica y una parte práctica. El peso de la evaluación de cada actividad formativa, se ajustará a lo siguiente:

Parte Teórica: Exámenes, sesiones de evaluación, entregas de actividades y trabajos, discusión de resultados, presentación de trabajos. 50% de la calificación final.

Parte Práctica: Entrega de ejercicios de prácticas, desarrollo de casos prácticos, presentación de casos prácticos, discusión de resultados. 50% de la calificación final.

Para aprobar la asignatura es necesario tener una calificación numérica superior o igual a 5 (sobre 10). No obstante, además del requisito anterior, se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5,  al no haber superado la asignatura la calificación final será de 4.

El sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R. D 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional.

Evaluación Extraordinaria

La evaluación en la convocatoria extraordinaria consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.

Evaluación única final

La evaluación única final consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.

Información adicional