Master en Ingeniería de Datos (Online)

Convocatoria
2024
Periodo lectivo
Fecha de inicio: Marzo | Octubre
Duración

12 meses (450 h. + proyecto)

Modalidad
Online
Precio

12.000€ (incluye alojamiento y desayuno en hotel y almuerzo en EOI)

 

Consulta aquí DESCUENTOS Y BONIFICACIONES (hasta 40%)

 

VER FOLLETO

 

Solicitar información

PRESENTACIÓN

Todas las empresas están viviendo un ciclo de digitalización jamás visto hasta la fecha. Y eso implica la generación de una enorme cantidad de datos a los que hay que sacar valor. Pero desde los sistemas, webs y aplicaciones empresariales, hasta el reporting y la generación de algoritmos de inteligencia de artificial, hay un largo y duro camino, que marca la diferencia entre tomar buenas o malas decisiones, o que los algoritmos saquen conclusiones adecuadas que poder extrapolar las conductas de los clientes.

Dicho camino es el de la transformación y la adecuación del dato para los diferentes casos de uso. Y dicha adecuación necesita de muchas tecnologías, muy dependientes del caso de negocio a lograr. Todas estas tareas recaen bajo la responsabilidad del Data Engineer.

El objetivo de este máster es conocer todas las herramientas más habituales, tener un nivel alto en los lenguajes de programación necesarios para hacer ingeniería del dato, y ser capaces de implantar todos estos desarrollos en las arquitecturas adecuadas con los ciclos de implantación de software profesional que utilizan las grandes empresas, garantizando calidad, robustez y trazabilidad.

Dirigido a

CONTENIDOS

BLOQUE 1. ARQUITECTURA

INTRODUCCIÓN A LOS SISTEMAS INFORMACIONALES

  • Presentación del master
  • Evolución desde los sistemas operacionales a los sistemas informacionales.
  • Tipos de sistemas informacionales
  • Perfiles profesionales
  • Dataflow, desde la creación hasta el caso de negocio
  • Data driven company, como sacar valor al dato

VIRTUALIZACION

  • Orígenes de la virtualización. Tipos y ventajas
  • Máquinas virtuales.
  • Contenedores, kubernetes y soluciones comerciales
  • Virtualización orientada al cómputo paralelo. Ejemplos comerciales
  • Virtualización orientada a los servicios

ARQUITECTURA Y CLOUD

  • Piezas tecnológicas que soportan el Dataflow
  • Diseños generales: Batch, lambda, kappa, etc
  • Alternativas OnPrem, open source, comerciales
  • Cloud stack: AWS, GCS, Azure

PROCESAMIENTO DISTRIBUIDO

  • Conceptos de computación distribuida, cuellos de botella, hash
  • Conceptos básicos hadoop y distribuciones
  • HDFS, MapReduce, yarn
  • Futuro de hadoop, arquitectura Cloudera y roadmap

ALMACENAMIENTO Y COMPUTO ESCALABLE

  • Tipos de bases de datos: mapa según tecnología, tipo de almacenamiento y acceso
  • BBDD SQL: Árbol, hash… Soluciones comerciales y open
  • BBDD NoSQL: HBase, Mongo, SolR, Neo4J, etc. Soluciones cloud native
BLOQUE 2. INGENIERÍA DEL DATO

MODELO ENTIDAD RELACIÓN Y SQL BÁSICO

  • Modelo relacional.
  • Modelo Físico y lógico. Paso a tablas
  • SQL básico: SELECT, joins, agregaciones, subconsultas y operadores lógicos
  • Creación de tablas básico

SQL AVANZADO

  • Lenguaje de definición de datos
  • Lenguaje de manipulación avanzado: Funciones ventana, índices, estadísticas, hints, macros y scripting
  • Lenguaje de control de datos: Permisos y administración de objetos

PYTHON Y PRINCIPIOS DE PROGRAMACIÓN

  • Estructuras básicas de programación
  • Framework de desarrollo
  • Principios de Python
  • Tipos y Estructuras de datos
  • Bloques y estructuras de control
  • Funciones y programación estructurada
  • E/S y gestión de archivos
  • Módulo y paquetes

PYSPARK

  • Spark Shell
  • RDDs
  • Dataframes
  • Pandas, Koala
  • Spark SQL
  • Plan de ejecución y UI

KAFKA Y SPARK STREAMING

  • Definición de bus: Kafka / Confluent
  • Mensajes, Topics y el Log de Mensajes
  • Productores, Consumidores y Brokers
  • Conectores
  • Streams
  • Particiones
  • Kafka Streams
  • Windowed Stream Processing

DESARROLLO PROCESOS ETL

  • Extracción: Replica, batch, microbatch, streaming, webscraping
  • Transformación y carga: Procresos de carga way.
  • Transformaciones básicas (SQL y Python)
  • Utilización de herramientas comerciales ETL
  • Monitorización, alarmado, control de flujo, calidad

PROCESOS PARA EXPLOTACION DE DATOS

  • Estrella y Copo de nieve
  • Cubos y OLAP
  • Desnormalizacion
  • Cálculo de KPIs complejos

SPARK ORIENTADO A IA

  • Frameworks: Notebooks
  • Muestreo, anonimización y filtrado
  • Estructuras tipo customer view
  • Normalización y discretización de variables
  • Funciones analíticas: MLlib & Others
  • Puesta en producción de un modelo analítico tipo batch

CAPTURA DE LOGS Y MONITORIZACION

  • Arquitectura ELK
  • Logstash
  • ElasticSearch
  • Kibana
  • Monitorizacion, alarmado y acceso al dato ElasticSearch

APIFICACION

  • Concepto de API
  • Tipos y securización: Rest, SOAP, apigateway, etc.
  • API y virtualización
  • Desarrollo de API para DataService
  • Desarrollo de API para modelo analítico
  • Desarrollo de API en bases de datos de búsqueda
BLOQUE 3. GOBIERNO E IMPLANTACIÓN

CICD / MLOps

  • Conceptos básicos de entornos de desarrollo (Desarrollo, integración, producción, repositorio, etc)
  • Ciclo CICD para desarrollos
  • Concepto de MLOps. Diferencias con CICD
  • Implantación Ciclo MLOps
  • Jenkins: Recetas
  • Planificación de procesos.
  • Ejemplo aplicación e2e

GESTION Y GOBIERNO DEL DATO

  • Data governance y data management
  • Metadata
  • Calidad, linaje, auditoria3

FASE PROYECTO

El proyecto consiste en la realización de un trabajo de aplicación práctico en grupo y tiene una duración estimada de 200 horas. Los tutores del proyecto son profesores especialistas en los temas a desarrollar en cada proyecto.

Claustro
Alberto
Turégano

Asesor de compañías en proceso de transformación digital – Líderes y Digitales

Perfil en LinkedIN

Alberto
Oikawa

Director Técnico del Máster en Big Data & Business Analytics - CTO Hispatec Analytics  

Perfil en LinkedIN

Jordi
Conesa

Profesor - Universitat Oberta de Catalunya

Perfil en LinkedIN

Ignacio
Charfolé

Head of Big Data Architecture and Delivery

Perfil en LinkedIN

manuel gomez montero.jpeg
Manuel
Gómez

Arquitecto Big Data - Telefónica

Perfil en LinkedIN

Carlos
Sacristán

Principal Data Architect - Bip Spain

Perfil en LinkedIN

jose novo.jpeg
Jose
Novo

Data scientist & data analytics - O2 España

Perfil en LinkedIN

Rafael
Zambrano

Head of Applied Science - Openbank

Perfil en LinkedIN

mario renau.jpeg
Mario
Renau

Senior Staff Data Engineer - Alstom

Perfil en LinkedIN

Daniel
Burrueco

Business Intelligence & Machine Learning Consultant

Perfil en LinkedIN

Ver más profesores

¿Cómo solicitar admisión?

Si deseas solicitar la admisión en el programa, completa el formulario de admisión y envíalo junto con tu CV o enlace a tu perfil de LinkedIn actualizado. Nos pondremos en contacto contigo para informarte de los siguientes pasos.

Solicita admisión

Puedes consultar aquí información detallada del proceso de admisión y matriculación en nuestros programas.

#eoiteayuda: Bonificaciones y Descuentos

EOI, como Fundación Pública comprometida con la formación y el talento ofrece, a través del programa #eoiteayuda, un amplio abanico de descuentos y bonificaciones con el fin de facilitar el acceso a la formación, al mayor número posible de candidatos. Estas bonificaciones pueden llegar a cubrir el 40% del precio total del curso.

Convocatoria de becas y descuentos disponibles: Más información