Master en Ingeniería de Datos (Online)

Convocatoria

2025

Periodo lectivo

Fecha de inicio: Oct

Duración

12 meses (450 h. + proyecto)

Modalidad

Online

Precio

12.000€ (incluye alojamiento y desayuno en hotel y almuerzo en EOI)

Consulta aquí DESCUENTOS Y BONIFICACIONES (hasta 40%)

VER FOLLETO

Solicitar información

Descargar folleto

PRESENTACIÓN

Todas las empresas están viviendo un ciclo de digitalización jamás visto hasta la fecha. Y eso implica la generación de una enorme cantidad de datos a los que hay que sacar valor. Pero desde los sistemas, webs y aplicaciones empresariales, hasta el reporting y la generación de algoritmos de inteligencia de artificial, hay un largo y duro camino, que marca la diferencia entre tomar buenas o malas decisiones, o que los algoritmos saquen conclusiones adecuadas que poder extrapolar las conductas de los clientes.

Dicho camino es el de la transformación y la adecuación del dato para los diferentes casos de uso. Y dicha adecuación necesita de muchas tecnologías, muy dependientes del caso de negocio a lograr. Todas estas tareas recaen bajo la responsabilidad del Data Engineer.

El objetivo de este máster es conocer todas las herramientas más habituales, tener un nivel alto en los lenguajes de programación necesarios para hacer ingeniería del dato, y ser capaces de implantar todos estos desarrollos en las arquitecturas adecuadas con los ciclos de implantación de software profesional que utilizan las grandes empresas, garantizando calidad, robustez y trazabilidad.

Dirigido a

Titulados superiores en Telecomunicaciones, Informática, Física, Matemáticas, ... Para otras titulaciones se valora conocimiento y experiencia previos en programación de alto nivel, estadística, lenguaje SQL, ...

Ingenieros de datos con experiencia, que vengan de entornos relacionales tipo SQL, y que necesitan adaptar sus conocimientos a las nuevas tecnologías. Ecosistemas tecnológicos y lenguajes

Ingenieros con poca experiencia laboral, que necesitan especializarse en el mundo de los datos, o tener conocimientos para ser más empleables.

CONTENIDOS

BLOQUE 1. ARQUITECTURA

INTRODUCCIÓN A LOS SISTEMAS INFORMACIONALES

Presentación del master
Evolución desde los sistemas operacionales a los sistemas informacionales.
Tipos de sistemas informacionales
Perfiles profesionales
Dataflow, desde la creación hasta el caso de negocio
Data driven company, como sacar valor al dato

VIRTUALIZACION

Orígenes de la virtualización. Tipos y ventajas
Máquinas virtuales.
Contenedores, kubernetes y soluciones comerciales
Virtualización orientada al cómputo paralelo. Ejemplos comerciales
Virtualización orientada a los servicios

ARQUITECTURA Y CLOUD

Piezas tecnológicas que soportan el Dataflow
Diseños generales: Batch, lambda, kappa, etc
Alternativas OnPrem, open source, comerciales
Cloud stack: AWS, GCS, Azure

PROCESAMIENTO DISTRIBUIDO

Conceptos de computación distribuida, cuellos de botella, hash
Conceptos básicos hadoop y distribuciones
HDFS, MapReduce, yarn
Futuro de hadoop, arquitectura Cloudera y roadmap

ALMACENAMIENTO Y COMPUTO ESCALABLE

Tipos de bases de datos: mapa según tecnología, tipo de almacenamiento y acceso
BBDD SQL: Árbol, hash… Soluciones comerciales y open
BBDD NoSQL: HBase, Mongo, SolR, Neo4J, etc. Soluciones cloud native

BLOQUE 2. INGENIERÍA DEL DATO

MODELO ENTIDAD RELACIÓN Y SQL BÁSICO

Modelo relacional.
Modelo Físico y lógico. Paso a tablas
SQL básico: SELECT, joins, agregaciones, subconsultas y operadores lógicos
Creación de tablas básico

SQL AVANZADO

Lenguaje de definición de datos
Lenguaje de manipulación avanzado: Funciones ventana, índices, estadísticas, hints, macros y scripting
Lenguaje de control de datos: Permisos y administración de objetos

PYTHON Y PRINCIPIOS DE PROGRAMACIÓN

Estructuras básicas de programación
Framework de desarrollo
Principios de Python
Tipos y Estructuras de datos
Bloques y estructuras de control
Funciones y programación estructurada
E/S y gestión de archivos
Módulo y paquetes

PYSPARK

Spark Shell
RDDs
Dataframes
Pandas, Koala
Spark SQL
Plan de ejecución y UI

KAFKA Y SPARK STREAMING

Definición de bus: Kafka / Confluent
Mensajes, Topics y el Log de Mensajes
Productores, Consumidores y Brokers
Conectores
Streams
Particiones
Kafka Streams
Windowed Stream Processing

DESARROLLO PROCESOS ETL

Extracción: Replica, batch, microbatch, streaming, webscraping
Transformación y carga: Procresos de carga way.
Transformaciones básicas (SQL y Python)
Utilización de herramientas comerciales ETL
Monitorización, alarmado, control de flujo, calidad

PROCESOS PARA EXPLOTACION DE DATOS

Estrella y Copo de nieve
Cubos y OLAP
Desnormalizacion
Cálculo de KPIs complejos

SPARK ORIENTADO A IA

Frameworks: Notebooks
Muestreo, anonimización y filtrado
Estructuras tipo customer view
Normalización y discretización de variables
Funciones analíticas: MLlib & Others
Puesta en producción de un modelo analítico tipo batch

CAPTURA DE LOGS Y MONITORIZACION

Arquitectura ELK
Logstash
ElasticSearch
Kibana
Monitorizacion, alarmado y acceso al dato ElasticSearch

APIFICACION

Concepto de API
Tipos y securización: Rest, SOAP, apigateway, etc.
API y virtualización
Desarrollo de API para DataService
Desarrollo de API para modelo analítico
Desarrollo de API en bases de datos de búsqueda

BLOQUE 3. GOBIERNO E IMPLANTACIÓN

CICD / MLOps

Conceptos básicos de entornos de desarrollo (Desarrollo, integración, producción, repositorio, etc)
Ciclo CICD para desarrollos
Concepto de MLOps. Diferencias con CICD
Implantación Ciclo MLOps
Jenkins: Recetas
Planificación de procesos.
Ejemplo aplicación e2e

GESTION Y GOBIERNO DEL DATO

Data governance y data management
Metadata
Calidad, linaje, auditoria3

FASE PROYECTO

El proyecto consiste en la realización de un trabajo de aplicación práctico en grupo y tiene una duración estimada de 200 horas. Los tutores del proyecto son profesores especialistas en los temas a desarrollar en cada proyecto.

Claustro

Alberto

Turégano

Asesor de compañías en proceso de transformación digital – Líderes y Digitales

Perfil en LinkedIN

Alberto

Oikawa

Director Técnico del Máster en Big Data & Business Analytics - CTO Hispatec Analytics

Perfil en LinkedIN

Jordi

Conesa

Profesor - Universitat Oberta de Catalunya

Perfil en LinkedIN

Ignacio

Charfolé

Head of Big Data Architecture and Delivery - Telefónica

Perfil en LinkedIN

Manuel

Gómez

Responsable Arquitectura e Integración BI y Big Data - Telefónica

Perfil en LinkedIN

Carlos

Sacristán

Principal Data Architect - Bip Spain

Perfil en LinkedIN

Jose

Novo

Data scientist & data analytics - O2 España

Perfil en LinkedIN

Rafael

Zambrano

Head of Applied Science - Openbank

Perfil en LinkedIN

Mario

Renau

Lead Data Engineer - Alstom

Perfil en LinkedIN

Daniel

Burrueco

Business Intelligence & Machine Learning Consultant

Perfil en LinkedIN

Ver más profesores

¿Cómo solicitar admisión?

Si deseas solicitar la admisión en el programa, completa el formulario de admisión y envíalo junto con tu CV o enlace a tu perfil de LinkedIn actualizado. Nos pondremos en contacto contigo para informarte de los siguientes pasos.

Solicita admisión

Puedes consultar aquí información detallada del proceso de admisión y matriculación en nuestros programas.

#eoiteayuda: Bonificaciones y Descuentos

EOI, como Fundación Pública comprometida con la formación y el talento ofrece, a través del programa #eoiteayuda, un amplio abanico de descuentos y bonificaciones con el fin de facilitar el acceso a la formación, al mayor número posible de candidatos. Estas bonificaciones pueden llegar a cubrir el 40% del precio total del curso.

Convocatoria de becas y descuentos disponibles: Más información