La sesión del miércoles 23 de noviembre se cancela por motivos de fuerza mayor.
Tendremos la última sesion el juevees 24 de noviembre de 20:00 a 22:00 horas en el mismo enlace de Meet. Esta sería nuestra última sesión.
Mil disculpas por el inconveniente.
Tendremos la última sesion el juevees 24 de noviembre de 20:00 a 22:00 horas en el mismo enlace de Meet. Esta sería nuestra última sesión.
Mil disculpas por el inconveniente.
Duración.
16 horas .
Del lunes 7 de noviembre al jueves 17 de noviembre.
De 20:00 a 22:00 horas (tiempo de la CDMX).
Sesiones diarias de lunes a jueves.
Requisitos del participante.
Experiencia en programación orientada a objetos en cualquier lenguaje .
Conocimientos básicos de Python.
Requisitos de equipo .
Procesador a 64 bit con virtualización habilitada desde el BIOS.
8 GB RAM.
Windows, Mac OS X o alguna distribución de GNU/Linux.
5 GB disponibles de almacenamiento.
Temario.
Introducción al ciclo de vida de los datos
Big Data y el ecosistema de Apache Hadoop
Arquitectura de Apache Spark
Uso del shell de PySpark
RDD
Introducción a Dataframes
Operaciones con archivos y fuentes de datos
Analítica básica
Introducción a Datasets
Operaciones con SparkSQL
Datalakes
Streaming de datos
Introducción a Machine Learning
Recursos en línea y cómputo en la nube
Material incluido.
Máquina virtual basada en Virtualbox
Apuntes en línea de libre acceso.
Sesiones en vivo.
Acceso exclusivo a las grabaciones de las sesiones.
Diplomas.
Se otorgará un diploma de asistencia a quienes hayan acudido al menos al 80% de las sesiones.