Recolecta, organiza, limpia y visualiza datos usando herramientas básicas y Python.
Abarca conceptos fundamentales para entender y trabajar con datos. Incluye la recolección, organización y limpieza de datos, así como la utilización de herramientas básicas para la visualización de datos, como gráficos y tablas a través del lenguaje de programación Python.
¿Por qué?
- Tratar conceptos fundamentales sobre el análisis de datos.
- Reconocer las aplicaciones de software esenciales más utilizadas en el mercado para el modelado de datos o el análisis predictivo.
- Realizar carga y administración de datos: estructurados y no estructurados en una herramienta de análisis estadístico como Python.
- Efectuar el pre-procesamiento y limpieza de datos a través de un análisis descriptivo de datos.
Temas:
Introducción al análisis de datos y herramientas básicas, Estructuras de datos y Manejo de librerías
- Fundamentos del análisis de datos.
- Instalación y configuración de Python.
- Primeros pasos en Python.
- Datos primitivos
- Datos compuestos: listas, tuplas, conjuntos, diccionarios y JSON.
- Numpy
- Pandas
- Exploración inicial de datos.
- Calidad de los datos
- Técnicas de limpieza de datos.
- Distribuciones de probabilidad, Normal
- Medidas de tendencia central
- Varianza
- Normalidad
- Curtosis
- Percentiles
- Manejo de valores faltantes y datos atípicos.
- Transformación de datos.
- Técnicas de análisis descriptivo.
- Matplotlib
- Visualización de datos básicos.
- Identificación de patrones y tendencias.
- Interpretación de gráficos
- Manejo de archivos (persistencia)
- Carga de dataset
- Exploración y manipulación de datos
- Estadísticas básicas e intermedias
- Análisis e interpretación
Aprende sobre regresión, correlación, modelos predictivos, análisis de series temporales y el uso de bases de datos y SQL
Profundiza en técnicas más avanzadas y herramientas sofisticadas. Incluye la exploración de métodos de análisis estadístico más complejos, como la regresión y la correlación, así como la introducción a modelos predictivos y análisis de series temporales, además el uso de bases de datos y SQL para la consulta y gestión de datos.
¿Por qué?
- Utilizarás el lenguaje de consulta estructurada (SQL), aplicando los fundamentos y estructura de una base de datos.
- Aplicarás los comandos, cláusulas, sentencias y funciones en SQL para la gestión de datos.
- Emplearás subconsultas, consultas multitabla, funciones integradas, variables, Operadores e instrucciones de control de flujos en SQL.
- Manejarás los conceptos básicos de process mining y de sus tres ramas principales.
- Diseñarás un dashboard básico para el monitoreo y visualización de los datos con los lenguajes y tecnologías más utilizados en el mercado.
Introducción a Bases de Datos y SQL, Consultas SQL Básicas y Manejo de Datos en Python (pandas)
- Conceptos básicos de bases de datos
- Instalación y configuración de MySQL/PostgreSQL
- Creación de bases de datos y tablas
- Consultas básicas (SELECT, FROM, WHERE)
- Uso de operadores en consultas SQL
- Comandos básicos (INSERT, UPDATE, DELETE)
- JOINs (INNER JOIN, LEFT JOIN, RIGHT JOIN)
- Agrupamiento y funciones agregadas (GROUP BY, HAVING, COUNT, SUM, AVG)
- Introducción a pandas
- Carga y manipulación de datos
- Operaciones básicas en pandas (selección, filtrado, agrupamiento)
- Integración de pandas con SQL
Consultas SQL Avanzadas, Introducción al Process Mining y Diseño de Dashboards Básicos
- Subconsultas (nested queries)
- Funciones avanzadas (CASE, COALESCE, NULLIF)
- Operadores avanzados y filtros
- Manejo de transacciones y control de errores
- Conceptos básicos de process mining
- Las tres ramas principales de process mining: discovery, conformance, enhancement
- Aplicaciones de process mining en la industria
- Introducción a herramientas de visualización (Streamlit, Google Looker)
- Diseño y creación de dashboards básicos
- Integración de datos en dashboards
- Mejores prácticas para la visualización de datos
Optimización Avanzada en SQL, Aplicación de Modelos Analíticos en Python, Diseño y Desarrollo de Dashboards Estratégicos y Presentación y Evaluación del Proyecto Final
- Técnicas de optimización de consultas (Índices, Análisis de Consultas)
- Full-Text Search y búsqueda avanzada
- Stored Procedures y parámetros de Output
- Cursores y operaciones Pivot y Unpivot
- Manejo de transacciones y bloqueo de tablas
- Estadística avanzada y técnicas de modelado
- Introducción a machine learning (algoritmos básicos)
- Aplicación de modelos predictivos y de clasificación
- Integración de modelos analíticos con bases de datos
- Diseño de dashboards para diferentes niveles (estratégico, táctico, operativo)
- Integración de datos y creación de visualizaciones avanzadas
- Mejores prácticas para la presentación de datos
- Herramientas avanzadas para dashboards (Streamlit, Google Looker)
Realiza análisis predictivo, optimización, validación de modelos y manipulación avanzada de datos.
Se centra en técnicas de análisis y modelado altamente sofisticadas y especializadas. Se profundiza en el análisis predictivo avanzado, optimización de modelos, y validación cruzada para garantizar la precisión y la generalización de los modelos. Además, se exploran técnicas avanzadas de manipulación y visualización de datos, y el uso de herramientas.
¿Por qué?
- Manejarás de herramientas avanzadas del lenguaje de consulta estructurada (SQL): sentencias avanzadas, filtros, búsquedas, Full-Text Search, Stored
- Procedures dinámicos, Cursores, Operadores Pivot y unpivot, lockeo de tablas, índices, paginado de consultas y consultas distribuidas.
- Aplicacarás modelos analíticos en Python para el análisis de datos.
- Diseñarás dashboards estratégicos, tácticos y operativos con las tecnologías más utilizadas en el mercado.(Streamlit y Google Looker)
Sentencias Avanzadas de SQL, Herramientas Avanzadas de SQL y Operadores Avanzados en SQL
- Sentencias avanzadas de actualización y replicación.
- Filtros y búsquedas avanzadas.
- KPI’s
- Prototipado de diseño
- Full-Text Search.
- Stored Procedures dinámicos y parámetros de Output.
- Cursores.
- Triggers
- Optimización de rendimiento.
- Operadores Pivot y unpivot.
- Lockeo de tablas.
- Índices.
Consultas Optimizadas en SQL, Modelos Predictivos en Python y Evaluación y Validación de Modelos
- Paginado de consultas.
- Consultas distribuidas.
- Introducción a modelos predictivos en Python (scikit-learn, TensorFlow).
- Casos prácticos de implementación de modelos en Python.
- Técnicas de evaluación y validación de modelos.
- Comparación de modelos.
Diseño de Dashboards Estratégicos, Diseño de Dashboards Tácticos y Operativos, Integración de Herramientas y Tecnologías y Proyecto Final
- Principios de diseño de dashboards estratégicos.
- Integración de datos provenientes de SQL y modelos analíticos.
- Herramientas avanzadas de visualización: Streamlit, Google Looker.
- Principios de diseño de dashboards tácticos y operativos.
- Creación de dashboards personalizados según necesidades tácticas y operativas.
- Uso de APIs para la integración de datos en tiempo real.
- Automatización de flujos de trabajo analíticos.
- Automatización de tareas analíticas con scripts en Python
- Análisis predictivo y prescriptivo
- Optimización y tuning de modelos
- Diseño y desarrollo de pipelines de datos
No hay comentarios.:
Publicar un comentario