2.- Módulos de Especializacion

 Inicio / Módulos / 2.- Módulos de Especialización

* Elegir uno de los tres bloques M04, M05 ó M06


  • ECTS

    12 Créditos

  • Periodo

    Enero - Abril

M05 - Ingeniería de Datos

Objetivo

Esta materia tiene como objetivo proporcionar al estudiante un contacto directo con las tecnologías, principalmente de ingeniería informática, que permiten el despliegue de las herramientas de análisis de datos y el desarrollo e implementación de nuevas soluciones.

Asignaturas del módulo

M05-01 - Sistemas de computación para datos masivos / Computing systems for Big Data

M05-02 - Herramientas en la nube para la Ciencia de Datos / Cloud for Data Science

M05-03 - Desarrollo de proyectos / Project development (OpenProject, github)

Contenido

1. Arquitectura de una e-Infraestructura.


2. Computación HPC y HTC: servidores, clusters, supercomputadores.


3. Gestión clásica de un cluster de computación. Sistemas de colas. Benchmarking. Monitorización.


4. Redes de interconexión de sistemas.


5. Sistemas de almacenamiento.


6. Transmisión de datos en Internet.


7. Computación distribuida.


8. Computación en paralelo. Introducción a MPI.


9. Principios de gestión como servicio: introducción a FitSM.


10. Virtualización de sistemas. Hipervisores.


11. Uso de Contenedores y Docker.


12. Entorno Cloud: principios básicos


13. Infraestructura como Servicio (IaaS), estándares (OCCI), gestión básica con OpenStack.


14. Acceso a recursos comerciales: Amazon, Azure, BlueMix, Google Cloud.


15. Composición de Servicios y Platform as a Service (PaaS). Herramientas básicas.


16. Software as a Service (SaaS). Ejemplos de aplicaciones. Acceso a R y Python en modo SaaS.


17. Almacenamiento en entorno Cloud: el estándar CDMI y de-facto S3. Ejemplos de integración de datos locales (CEPH) y distribuidos (OneData).


18. Plataformas SaaS para Big Data.


19. Introducción a la metodología de proyectos.


20. Diseño de Casos de Estudio.


21. Desarrollo de software. Metodología Agil.


22. Control de versiones. Github.


23. Despliegue de software en entornos distribuidos.


24. Gestión global del proyecto.


25. Aplicación de FitSM en el desarrollo de proyectos


26. Servicio a terceros: SLA (Service Level Agrement) y CRM (Customer Relationship Management)



    Master en Data Science



csic
Consejo Superior
Investigaciones Científicas



uc
Universidad de Cantabria