Buscar este blog

martes, 24 de septiembre de 2024

Cuestionario Conocimiento en Analítica de Datos

 ¿Cuál es el sistema operativo más comúnmente utilizado en computadores personales?

a.       Windows

b.       Linux

c.       macOS

d.       DOS

Python es un lenguaje de programación de alto nivel.

a.       Verdadero

b.       Falso

¿Cuál de los siguientes es un navegador web?

a.       Google Chrome

b.       Adobe Photoshop

c.       Visual Studio

d.       Microsoft Word

Un "byte" es igual a cuántos bits?

a.       4

b.       32

c.       16

d.       8

¿Cuál es la salida del siguiente código en Python: `print(2 + 3 * 4)`?

a.       9

b.       14

c.       12

d.       20



R es un lenguaje de programación utilizado principalmente para análisis estadístico.

a.       Verdadero

b.       Falso

 

¿Cuál de los siguientes es un tipo de dato no estructurado?

a.       Imagen

b.       Hoja de cálculo

c.       Archivo CSV

d.       Tabla en SQL

En SQL, la instrucción `SELECT * FROM table_name` se utiliza para:

a.       Eliminar datos de la tabla

b.       Seleccionar todas las columnas de la tabla

c.       Insertar datos en la tabla

d.       Actualizar datos en la tabla

¿Cuál es el resultado de la operación lógica `True and False` en Python?

a.       None

b.       0

c.       True

d.       False

¿Qué significa "HTML"?

a.       HyperText Markup Language

b.       Hyperlinking Text Management Language

c.       HyperTool Markup Language

d.       HyperText Management Language

 

El siguiente código en Python `a = [1, 2, 3]; print(a[1])` imprimirá:

a.       2

b.       Error

c.       3

d.       1

¿Cuál es la función de la instrucción `GROUP BY` en SQL?

a.       Agrupar resultados basados en una o más columnas

b.       Ordenar los resultados de una consulta

c.       Unir dos o más tablas

d.       Seleccionar todas las filas de una tabla


En estadística, la "media" es lo mismo que:

a.       El valor más común en un conjunto de datos

b.       El valor medio en un conjunto de datos ordenados

c.       La suma de todos los valores dividida por el número de valores

d.       La diferencia entre el valor más alto y el más bajo

 

Una "tabla" en una base de datos relacional consiste en:

a.       Un archivo único

b.       Un conjunto de columnas y filas

c.       Un documento de texto

d.       Un gráfico visual

 

En Python, la función `len()` se utiliza para:

a.       Contar el número de elementos en una lista

b.       Calcular la longitud de una cadena de texto

c.       Ambos

 

¿Cuál de los siguientes no es un tipo de gráfico comúnmente utilizado en análisis de datos?

a.       Diagrama de dispersión

b.       Gráfico de barras

c.       Mapa de calor

d.       Gráfico de audio

 

Un dataframe en Python es un:

a.       Tipo de dato en listas

b.       Objeto bidimensional en pandas para manejar datos

c.       Tipo de estructura de datos en numpy

d.       Variable no mutable

 

El método de "regresión" en análisis de datos se utiliza para:

a.       Reducir el tamaño del dataset

b.       Limpiar los datos

c.       Clasificar datos

d.       Identificar relaciones entre variables

 

En Python, ¿qué librería se utiliza comúnmente para el análisis estadístico?

a.       Numpy

b.       Matplotlib

c.       Pandas

d.       Statsmodels

 

La técnica de "preprocesamiento de datos" incluye:

a.       Eliminar valores nulos

b.       Normalizar los datos

c.       Corregir formatos incorrectos

d.       Todas las anteriores

 

¿Qué significa el acrónimo "SQL"?

a.       Simple Query Language

b.       Sequential Query Language

c.       Structured Query Language

d.       Standard Query Language

 

En machine learning, "overfitting" se refiere a:

a.       Un modelo que tiene muchos datos de prueba

b.       Un modelo que no se ajusta bien a los datos de entrenamiento

c.       Un modelo que generaliza bien

d.       Un modelo que se ajusta demasiado a los datos de entrenamiento

 

La diferencia entre "supervised learning" y "unsupervised learning" es:

a.       Supervised learning no requiere etiquetas en los datos de entrenamiento

b.       Unsupervised learning utiliza etiquetas en los datos de entrenamiento

c.       Supervised learning utiliza etiquetas en los datos de entrenamiento

d.       Ambos no utilizan etiquetas en los datos de entrenamiento

 

 

En Python, el paquete "scikit-learn" se utiliza principalmente para:

a.       Visualización de datos

b.       Análisis de datos

c.       Manipulación de datos

d.       Machine learning

 

El método "K-Means" es una técnica de:

a.       Clustering

b.       Reducción de dimensionalidad

c.       Regresión

d.       Clasificación

 

En SQL, ¿qué significa una "subconsulta correlacionada"?

a.       Una consulta donde la subconsulta interna depende de los resultados de la consulta externa.

b.       Una consulta que incluye múltiples JOINs para combinar varias tablas.

c.       Una consulta que se ejecuta automáticamente cada vez que se accede a una tabla.

d.       Una consulta que utiliza subconsultas múltiples para filtrar datos específicos.

 

En análisis de datos, ¿cuál es el propósito principal de "EDA" (Exploratory Data Analysis)?

a.       Transformar los datos en un formato estructurado para su análisis.

b.       Realizar inferencias y predicciones basadas en los datos.

c.       Comparar diferentes modelos de machine learning para seleccionar el más adecuado.

d.       Descubrir patrones, tendencias y relaciones en los datos.

 

En machine learning, ¿qué diferencia principal existe entre un "modelo de regresión logística" y un "modelo de regresión lineal"?

a.       La regresión lineal se ajusta mejor a conjuntos de datos pequeños, mientras que la regresión logística es más adecuada para grandes conjuntos de datos.

b.       La regresión lineal es un tipo de regresión no paramétrica, mientras que la regresión logística es paramétrica.

c.       La regresión logística es adecuada para predecir variables categóricas, mientras que la regresión lineal es para variables continuas.

d.       La regresión logística utiliza funciones sigmoides para estimar probabilidades, mientras que la regresión lineal utiliza funciones polinómicas.

 

En SQL, la cláusula JOIN se utiliza para unir filas de dos o más tablas. Sin embargo, existen diferentes tipos de JOIN. ¿Cuál de las siguientes opciones describe correctamente el funcionamiento de un LEFT JOIN y cómo se diferencia de un INNER JOIN?

a.       Un LEFT JOIN retorna todas las filas de la tabla de la izquierda y las filas coincidentes de la tabla de la derecha. Si no hay coincidencia, el resultado es NULL en la tabla de la derecha. Un INNER JOIN retorna solo las filas donde hay coincidencia en ambas tablas.

b.       Un LEFT JOIN retorna todas las filas de ambas tablas, independientemente de si hay coincidencia o no. Un INNER JOIN retorna solo las filas donde hay coincidencia en ambas tablas.

c.       Un LEFT JOIN retorna solo las filas de la tabla de la izquierda. Un INNER JOIN retorna solo las filas de la tabla de la derecha.

d.       Un LEFT JOIN retorna solo las filas coincidentes en ambas tablas. Un INNER JOIN retorna todas las filas de la tabla de la izquierda y las filas coincidentes de la tabla de la derecha.

 

En el contexto de redes neuronales profundas, ¿qué es el "gradiente de retropropagación" y cuál es su importancia en el entrenamiento del modelo?

a.       Es el proceso de normalización de los datos de entrada para asegurar que todos los valores se encuentren dentro de un rango específico, mejorando la estabilidad del entrenamiento.

b.       Es el método de particionamiento de los datos en conjuntos de entrenamiento y prueba para evaluar la precisión del modelo, asegurando que no haya sobreajuste.

c.       Es la técnica utilizada para seleccionar las características más relevantes del conjunto de datos, reduciendo la dimensionalidad y mejorando la eficiencia del modelo.

d.       Es el algoritmo utilizado para ajustar los pesos de las conexiones neuronales basado en el error calculado en la capa de salida, permitiendo que el modelo aprenda de los datos de entrenamiento





No hay comentarios.:

Publicar un comentario

publicidad