Buscar este blog

miércoles, 18 de septiembre de 2024

Estructura Curricular para Análisis de Datos - Básico

 


Básico:
Recolecta, organiza, limpia y visualiza datos usando herramientas básicas y Python.
Abarca conceptos fundamentales para entender y trabajar con datos. Incluye la recolección, organización y limpieza de datos, así como la utilización de herramientas básicas para la visualización de datos, como gráficos y tablas a través del lenguaje de programación Python. 

¿Por qué?
  • Tratar conceptos fundamentales sobre el análisis de datos.
  • Reconocer las aplicaciones de software esenciales más utilizadas en el mercado para el modelado de datos o el análisis predictivo.
  • Realizar carga y administración de datos: estructurados y no estructurados en una herramienta de análisis estadístico como Python.
  • Efectuar el pre-procesamiento y limpieza de datos a través de un análisis descriptivo de datos.
Temas:

Introducción al análisis de datos y herramientas básicas, Estructuras de datos y Manejo de librerías
  • Fundamentos del análisis de datos.
  • Instalación y configuración de Python.
  • Primeros pasos en Python.
  • Datos primitivos
  • Datos compuestos: listas, tuplas, conjuntos, diccionarios y JSON.
  • Numpy
  • Pandas

Manipulación de datos y estadística simple, Estadística descriptiva básica y Estadística descriptiva intermedia
  • Exploración inicial de datos.
  • Calidad de los datos
  • Técnicas de limpieza de datos.
  • Distribuciones de probabilidad, Normal
  • Medidas de tendencia central
  • Varianza
  • Normalidad
  • Curtosis
  • Percentiles
  • Manejo de valores faltantes y datos atípicos.
Análisis descriptivo de datos, Analítica avanzada, Ejercicios prácticos de manipulación de datos (a seleccionar) y Desarrollo del proyecto transversal
  • Transformación de datos.
  • Técnicas de análisis descriptivo.
  • Matplotlib
  • Visualización de datos básicos.
  • Identificación de patrones y tendencias.
  • Interpretación de gráficos
  • Manejo de archivos (persistencia)
  • Carga de dataset
  • Exploración y manipulación de datos
  • Estadísticas básicas e intermedias
  • Análisis e interpretación



Intermedio
Aprende sobre regresión, correlación, modelos predictivos, análisis de series temporales y el uso de bases de datos y SQL
Profundiza en técnicas más avanzadas y herramientas sofisticadas. Incluye la exploración de métodos de análisis estadístico más complejos, como la regresión y la correlación, así como la introducción a modelos predictivos y análisis de series temporales, además el uso de bases de datos y SQL para la consulta y gestión de datos.

¿Por qué?
  • Utilizarás el lenguaje de consulta estructurada (SQL), aplicando los fundamentos y estructura de una base de datos.
  • Aplicarás los comandos, cláusulas, sentencias y funciones en SQL para la gestión de datos.
  • Emplearás subconsultas, consultas multitabla, funciones integradas, variables, Operadores e instrucciones de control de flujos en SQL.
  • Manejarás los conceptos básicos de process mining y de sus tres ramas principales.
  • Diseñarás un dashboard básico para el monitoreo y visualización de los datos con los lenguajes y tecnologías más utilizados en el mercado.
Temas:

Introducción a Bases de Datos y SQL, Consultas SQL Básicas y Manejo de Datos en Python (pandas)
  • Conceptos básicos de bases de datos
  • Instalación y configuración de MySQL/PostgreSQL
  • Creación de bases de datos y tablas
  • Consultas básicas (SELECT, FROM, WHERE)
  • Uso de operadores en consultas SQL
  • Comandos básicos (INSERT, UPDATE, DELETE)
  • JOINs (INNER JOIN, LEFT JOIN, RIGHT JOIN)
  • Agrupamiento y funciones agregadas (GROUP BY, HAVING, COUNT, SUM, AVG)
  • Introducción a pandas
  • Carga y manipulación de datos
  • Operaciones básicas en pandas (selección, filtrado, agrupamiento)
  • Integración de pandas con SQL
Consultas SQL Avanzadas, Introducción al Process Mining y Diseño de Dashboards Básicos
  • Subconsultas (nested queries)
  • Funciones avanzadas (CASE, COALESCE, NULLIF)
  • Operadores avanzados y filtros
  • Manejo de transacciones y control de errores
  • Conceptos básicos de process mining
  • Las tres ramas principales de process mining: discovery, conformance, enhancement
  • Aplicaciones de process mining en la industria
  • Introducción a herramientas de visualización (Streamlit, Google Looker)
  • Diseño y creación de dashboards básicos
  • Integración de datos en dashboards
  • Mejores prácticas para la visualización de datos

Optimización Avanzada en SQL, Aplicación de Modelos Analíticos en Python, Diseño y Desarrollo de Dashboards Estratégicos y Presentación y Evaluación del Proyecto Final
  • Técnicas de optimización de consultas (Índices, Análisis de Consultas)
  • Full-Text Search y búsqueda avanzada
  • Stored Procedures y parámetros de Output
  • Cursores y operaciones Pivot y Unpivot
  • Manejo de transacciones y bloqueo de tablas
  • Estadística avanzada y técnicas de modelado
  • Introducción a machine learning (algoritmos básicos)
  • Aplicación de modelos predictivos y de clasificación
  • Integración de modelos analíticos con bases de datos
  • Diseño de dashboards para diferentes niveles (estratégico, táctico, operativo)
  • Integración de datos y creación de visualizaciones avanzadas
  • Mejores prácticas para la presentación de datos
  • Herramientas avanzadas para dashboards (Streamlit, Google Looker)





Avanzado
Realiza análisis predictivo, optimización, validación de modelos y manipulación avanzada de datos.

Se centra en técnicas de análisis y modelado altamente sofisticadas y especializadas. Se profundiza en el análisis predictivo avanzado, optimización de modelos, y validación cruzada para garantizar la precisión y la generalización de los modelos. Además, se exploran técnicas avanzadas de manipulación y visualización de datos, y el uso de herramientas.

¿Por qué?

  • Manejarás de herramientas avanzadas del lenguaje de consulta estructurada (SQL): sentencias avanzadas, filtros, búsquedas, Full-Text Search, Stored
  • Procedures dinámicos, Cursores, Operadores Pivot y unpivot, lockeo de tablas, índices, paginado de consultas y consultas distribuidas.
  • Aplicacarás modelos analíticos en Python para el análisis de datos.
  • Diseñarás dashboards estratégicos, tácticos y operativos con las tecnologías más utilizadas en el mercado.(Streamlit y Google Looker)
Temas:

Sentencias Avanzadas de SQL, Herramientas Avanzadas de SQL y Operadores Avanzados en SQL
  • Sentencias avanzadas de actualización y replicación.
  • Filtros y búsquedas avanzadas.
  • KPI’s
  • Prototipado de diseño
  • Full-Text Search.
  • Stored Procedures dinámicos y parámetros de Output.
  • Cursores.
  • Triggers
  • Optimización de rendimiento.
  • Operadores Pivot y unpivot.
  • Lockeo de tablas.
  • Índices.
Consultas Optimizadas en SQL, Modelos Predictivos en Python y Evaluación y Validación de Modelos
  • Paginado de consultas.
  • Consultas distribuidas.
  • Introducción a modelos predictivos en Python (scikit-learn, TensorFlow).
  • Casos prácticos de implementación de modelos en Python.
  • Técnicas de evaluación y validación de modelos.
  • Comparación de modelos.

Diseño de Dashboards Estratégicos, Diseño de Dashboards Tácticos y Operativos, Integración de Herramientas y Tecnologías y Proyecto Final
  • Principios de diseño de dashboards estratégicos.
  • Integración de datos provenientes de SQL y modelos analíticos.
  • Herramientas avanzadas de visualización: Streamlit, Google Looker.
  • Principios de diseño de dashboards tácticos y operativos.
  • Creación de dashboards personalizados según necesidades tácticas y operativas.
  • Uso de APIs para la integración de datos en tiempo real.
  • Automatización de flujos de trabajo analíticos.
  • Automatización de tareas analíticas con scripts en Python
  • Análisis predictivo y prescriptivo
  • Optimización y tuning de modelos
  • Diseño y desarrollo de pipelines de datos









No hay comentarios.:

Publicar un comentario

publicidad