Quiz about Hadoop

Question 1

¿Qué datos controla el particionador?

Accepted Answer

claves intermedias

Answer

claves finales

Answer

valores finales

Answer

valores intermedios

Question 2

¿Qué palabras clave se utilizan en Hive para implementar funciones de ventana SQL?

Accepted Answer

OVER, RANK

Answer

UNION DISTINCT, RANK

Answer

OVER, EXCEPT

Answer

UNION DISTINCT, RANK

Question 3

En lugar de agregar una clasificación secundaria a un trabajo Reduce lento, ¿cuál es la mejor práctica en Hadoop para realizar una optimización?

Accepted Answer

Agregar un shuffle particionado al trabajo de Reduce.

Answer

Agregar un shuffle particionado al trabajo de Map.

Answer

Dividir el trabajo de Reduce en múltiples trabajos de Reduce encadenados.

Answer

Dividir el trabajo de Reduce en múltiples trabajos de Map encadenados.

Question 4

Hadoop Auth aplica la autenticación en recursos protegidos. Una vez establecida la autenticación, ¿qué tipo de cookie de autenticación se establece?

Accepted Answer

HTTP firmada

Answer

HTTP encriptada

Answer

HTTP no firmada

Answer

HTTP comprimida

Question 5

¿En qué lenguaje se pueden escribir trabajos de MapReduce?

Accepted Answer

Java o Python

Answer

Solo SQL

Answer

SQL o Java

Answer

Python o SQL

Question 6

Para realizar una agregación local de las salidas intermedias, ¿qué objeto pueden especificar opcionalmente los usuarios de MapReduce?

Accepted Answer

Combiner

Answer

Reducer

Answer

Mapper

Answer

Contador

Question 7

Para verificar el estado de un trabajo, busque el valor `___` en `___`.

Accepted Answer

COMPLETADO; stdout

Answer

COMPLETADO; syslog

Answer

HECHO; syslog

Answer

HECHO; stdout

Question 8

¿Qué línea de código implementa un método Reducer en MapReduce 2.0?

Accepted Answer

public void reduce(Text key, Iterator<IntWritable> values, Context context){…}

Answer

public static void reduce(Text key, IntWritable[] values, Context context){…}

Answer

public static void reduce(Text key, Iterator<IntWritable> values, Context context){…}

Answer

public void reduce(Text key, IntWritable[] values, Context context){…}

Question 9

Para obtener el número total de registros de entrada mapeados en una tarea de trabajo de mapa, ¿qué contador debes revisar?

Accepted Answer

Contador de tarea (NO ESTOY SEGURO)

Answer

Contador de formato de entrada de archivo

Answer

Contador de sistema de archivos

Answer

Contador de trabajo

Question 10

¿Qué capacidades CAP admite Hadoop Core?

Accepted Answer

A, P

Answer

C, A

Answer

C, P

Answer

C, A, P

Question 11

¿Cuáles son las fases principales de un Reducer?

Accepted Answer

shuffle, ordenar y reducir

Answer

combinar, mapear y reducir

Answer

reducir, ordenar y combinar

Answer

mapear, ordenar y combinar

Question 12

Para configurar un flujo de trabajo de Hadoop con sincronización de datos entre trabajos que procesan tareas tanto en disco como en memoria, usa el servicio `___`, que es `___`.

Accepted Answer

Zookeeper; software de código abierto

Answer

Oozie; software comercial

Answer

Oozie; software de código abierto

Answer

Zookeeper; software comercial

Question 13

¿Qué tipo de nodos múltiples deberías usar para alta disponibilidad?

Accepted Answer

de nombre

Answer

de datos

Answer

de memoria

Answer

trabajador

Question 14

¿Qué tipos de unidades admite DataNode?

Accepted Answer

intercambiables en caliente

Answer

intercambiables en frío

Answer

intercambiables en tibio

Answer

no intercambiables

Question 15

¿Qué método se utiliza para implementar trabajos de Spark?

Accepted Answer

en la memoria de todos los trabajadores

Answer

en el disco de todos los trabajadores

Answer

en el disco del nodo maestro

Answer

en la memoria del nodo maestro

Question 16

En un trabajo de MapReduce, ¿dónde se ejecuta la función map()?

Accepted Answer

en los nodos de datos del clúster (NO ESTOY SEGURO)

Answer

en los nodos reductores del clúster

Answer

en el nodo maestro del clúster

Answer

en cada nodo del clúster

Question 17

Para hacer referencia a un archivo maestro para búsquedas durante el Mapeo, ¿qué tipo de caché se debe usar?

Accepted Answer

caché distribuida

Answer

caché local

Answer

caché particionada

Answer

caché de clúster

Question 18

¿"Saltar registros incorrectos" proporciona una opción donde se pueden omitir ciertos registros de entrada incorrectos al procesar qué tipo de datos?

Accepted Answer

entradas de mapa

Answer

entradas de caché

Answer

entradas de reductor

Answer

valores intermedios

Question 19

¿Qué comando importa datos a Hadoop desde una base de datos MySQL?

Accepted Answer

sqoop import --connect jdbc:mysql://mysql.example.com/sqoop --username sqoop --password sqoop --warehouse-dir user/hue/oozie/deployments/sqoop

Answer

spark import --connect jdbc:mysql://mysql.example.com/spark --username spark --warehouse-dir user/hue/oozie/deployments/spark

Answer

sqoop import --connect jdbc:mysql://mysql.example.com/sqoop --username sqoop --warehouse-dir user/hue/oozie/deployments/sqoop

Answer

spark import --connect jdbc:mysql://mysql.example.com/spark --username spark --password spark --warehouse-dir user/hue/oozie/deployments/spark

Question 20

¿En qué forma se presenta la salida del Reductor?

Accepted Answer

comprimida (NO ESTOY SEGURO)

Answer

ordenada

Answer

no ordenada

Answer

cifrada

Q1. ¿Qué datos controla el particionador?

Q2. ¿Qué palabras clave se utilizan en Hive para implementar funciones de ventana SQL?

Q3. En lugar de agregar una clasificación secundaria a un trabajo Reduce lento, ¿cuál es la mejor práctica en Hadoop para realizar una optimización?

Q4. Hadoop Auth aplica la autenticación en recursos protegidos. Una vez establecida la autenticación, ¿qué tipo de cookie de autenticación se establece?

Q5. ¿En qué lenguaje se pueden escribir trabajos de MapReduce?

Q6. Para realizar una agregación local de las salidas intermedias, ¿qué objeto pueden especificar opcionalmente los usuarios de MapReduce?

Q7. Para verificar el estado de un trabajo, busque el valor `_` en `_`.

Q8. ¿Qué línea de código implementa un método Reducer en MapReduce 2.0?

Q9. Para obtener el número total de registros de entrada mapeados en una tarea de trabajo de mapa, ¿qué contador debes revisar?

Q10. ¿Qué capacidades CAP admite Hadoop Core?

Q11. ¿Cuáles son las fases principales de un Reducer?

Q12. Para configurar un flujo de trabajo de Hadoop con sincronización de datos entre trabajos que procesan tareas tanto en disco como en memoria, usa el servicio `_`, que es `_`.

Q13. ¿Qué tipo de nodos múltiples deberías usar para alta disponibilidad?

Q14. ¿Qué tipos de unidades admite DataNode?

Q15. ¿Qué método se utiliza para implementar trabajos de Spark?

Q16. En un trabajo de MapReduce, ¿dónde se ejecuta la función map()?

Q17. Para hacer referencia a un archivo maestro para búsquedas durante el Mapeo, ¿qué tipo de caché se debe usar?

Q18. ¿"Saltar registros incorrectos" proporciona una opción donde se pueden omitir ciertos registros de entrada incorrectos al procesar qué tipo de datos?

Q19. ¿Qué comando importa datos a Hadoop desde una base de datos MySQL?

Q20. ¿En qué forma se presenta la salida del Reductor?