24 horas .
Sesiones : 23 de febrero hasta el jueves 12 de marzo.
Horario: Lunes a jueves de 18:30 a 20:30 horas CST.
El curso, que inicia el próximo 23 de febrero, está estructurado de manera progresiva a través de 12 sesiones de dos horas cada una:
Fundamentos Numéricos: Cubre el ecosistema de SciPy y computación vectorial con NumPy.
Pandas Moderno: Se enfoca en la optimización de memoria con el backend PyArrow y la gestión eficiente de tipos de datos.
Analítica Avanzada: Incluye técnicas críticas como Windowing, ETL y gestión de calidad de datos.
Ingeniería de Alto Rendimiento: Introduce herramientas de vanguardia para Big Data como Polars y computación distribuida con Dask.
Producto y Visualización: Concluye con la creación de aplicaciones interactivas mediante Streamlit y visualización estadística con Seaborn.
Conocimientos básicos de Python o de algún lenguaje de programación orientado a objetos.
Acceso estable a Internet.
Una cuenta personal de GitHub: El material del taller se ejecutará directamente desde entornos de Codespaces.
El proyecto SciPy y el ecosistema de datos.
Conceptos básicos de NumPy (Arreglos y Vectores).
Gestión de memoria y tipos de datos en NumPy.
Generación de datos sintéticos y aleatorios.
Aritmética vectorizada (Broadcasting).
Manipulación y transformación de arreglos.
Análisis numérico y estadístico básico.
Álgebra lineal aplicada a datos.
Introducción a Pandas y el backend PyArrow.
Tipos de datos y optimización.
Operaciones estructurales en DataFrames.
Índices jerárquicos y optimización de búsquedas.
Relaciones entre datos: Uniones y Concatenaciones.
Merge avanzado y comparativas de rendimiento.
Módulo 3: ETL y Analítica Avanzada
Filtrado complejo y consultas (query, filter).
Transformaciones personalizadas (apply, map).
Técnicas de Ventana (Windowing): Rolling, Expanding y Shift.
Gestión de calidad de datos.
Estrategias de imputación y manejo de nulos.
Transformación y limpieza de strings/objetos.
Agregaciones avanzadas: groupby, crosstab y pivot_table.
I/O Eficiente: Formato Parquet vs CSV.
Introducción a Polars: El futuro de los DataFrames rápidos.
Computación Distribuida con Dask: Procesamiento Out-of-Core.
Visualización rápida con Pandas.
La gramática de gráficos: Matplotlib.
Personalización de elementos gráficos.
Tipos de gráficos fundamentales.
Visualización estadística con Seaborn.
Objetos y temas en Seaborn.
Data Apps interactivas con Streamlit.
Notebooks ejecutables con el contenido completo del curso.
Sesiones en vivo.
Acceso exclusivo a las grabaciones de las sesiones.
Se otorgará un diploma de asistencia a quienes hayan acudido al menos al 80% de las sesiones.
El costo del taller es de $499.96 pesos M.N. (I.V.A. Incluído)
Por favor llene el formulario de registro una vez que haya realizado el pago.
Una veaz verificado, se le enviará una invitación via correo electrónico mensaje con los detalles del taller.
El asistente podrá pedir un reembolso completo hasta 24 horas antes del taller.
El asistente será reembolsado al 100% en caso de que el taller sea cancelado.
No se dará de alta al taller a menos que haya completado el formulario de registro exitosamente y el pago haya sido verificado.
En caso de dudas o comentarios pueden enviar un correo con sus datos y comprobante de pago a contacto@pythonista.io