Quiz about Hadoop

Question 1

Il partizionatore controlla la suddivisione di quali dati?

Accepted Answer

chiavi intermedie

Answer

chiavi finali

Answer

valori finali

Answer

valori intermedi

Question 2

Le funzioni di finestra SQL sono implementate in Hive utilizzando quali parole chiave?

Accepted Answer

OVER, RANK

Answer

UNION DISTINCT, RANK

Answer

OVER, EXCEPT

Answer

UNION DISTINCT, RANK

Question 3

Piuttosto che aggiungere un ordinamento secondario a un job di riduzione lento, qual è la pratica migliore di Hadoop per ottimizzare?

Accepted Answer

Aggiungi un shuffle partizionato al job di Reduce.

Answer

Aggiungi un shuffle partizionato al job di Map.

Answer

Suddividi il job di Reduce in più job di Reduce concatenati.

Answer

Suddividi il job di Reduce in più job di Map concatenati.

Question 4

Hadoop Auth impone l'autenticazione su risorse protette. Una volta stabilita l'autenticazione, imposta quale tipo di cookie di autenticazione?

Accepted Answer

HTTP firmato

Answer

HTTP criptato

Answer

HTTP non firmato

Answer

HTTP compresso

Question 5

I job di MapReduce possono essere scritti in quale linguaggio?

Accepted Answer

Java o Python

Answer

Solo SQL

Answer

SQL o Java

Answer

Python o SQL

Question 6

Per eseguire l'aggregazione locale degli output intermedi, gli utenti di MapReduce possono specificare facoltativamente quale oggetto?

Accepted Answer

Combiner

Answer

Reducer

Answer

Mapper

Answer

Contatore

Question 7

Per verificare lo stato del job, cerca il valore `___` nel `___`.

Accepted Answer

COMPLETATO; stdout

Answer

COMPLETATO; syslog

Answer

FINITO; syslog

Answer

FINITO; stdout

Question 8

Quale riga di codice implementa un metodo Reducer in MapReduce 2.0?

Accepted Answer

public void reduce(Text key, Iterator<IntWritable> values, Context context){…}

Answer

public static void reduce(Text key, IntWritable[] values, Context context){…}

Answer

public static void reduce(Text key, Iterator<IntWritable> values, Context context){…}

Answer

public void reduce(Text key, IntWritable[] values, Context context){…}

Question 9

Per ottenere il numero totale di record di input mappati in un task di job di mappa, è necessario controllare il valore di quale contatore?

Accepted Answer

Contatore Task (NON SICURO)

Answer

Contatore FileInputFormat

Answer

Contatore FileSystem

Answer

Contatore Job

Question 10

Hadoop Core supporta quali capacità CAP?

Accepted Answer

A, P

Answer

C, A

Answer

C, P

Answer

C, A, P

Question 11

Quali sono le fasi principali di un Reducer?

Accepted Answer

shuffle, ordina e riduci

Answer

combina, mappa e riduci

Answer

riduci, ordina e combina

Answer

mappa, ordina e combina

Question 12

Per configurare il flusso di lavoro Hadoop con sincronizzazione dei dati tra job che elaborano task sia su disco che in memoria, utilizzare il servizio `___`, che è `___`.

Accepted Answer

Zookeeper; software open source

Answer

Oozie; software commerciale

Answer

Oozie; software open source

Answer

Zookeeper; software commerciale

Question 13

Per l'alta disponibilità, che tipo di nodi multipli dovresti usare?

Accepted Answer

nome

Answer

dati

Answer

memoria

Answer

lavoratore

Question 14

DataNode supporta quali tipi di unità?

Accepted Answer

hot swappable

Answer

cold swappable

Answer

warm swappable

Answer

non swappable

Question 15

Quale metodo viene utilizzato per implementare i job Spark?

Accepted Answer

in memoria di tutti i lavoratori

Answer

su disco di tutti i lavoratori

Answer

su disco del nodo master

Answer

in memoria del nodo master

Question 16

In un job di MapReduce, dove viene eseguita la funzione map()?

Accepted Answer

sui nodi dati del cluster (NON SICURO)

Answer

sui nodi riduttori del cluster

Answer

sul nodo master del cluster

Answer

su ogni nodo del cluster

Question 17

Per fare riferimento a un file master per ricerche durante il Mapping, quale tipo di cache dovrebbe essere utilizzato?

Accepted Answer

cache distribuita

Answer

cache locale

Answer

cache partizionata

Answer

cache del cluster

Question 18

Skip bad records fornisce un'opzione in cui un certo insieme di record di input non validi può essere saltato durante l'elaborazione di quale tipo di dati?

Accepted Answer

input della mappa

Answer

input della cache

Answer

input del riduttore

Answer

valori intermedi

Question 19

Quale comando importa dati in Hadoop da un database MySQL?

Accepted Answer

importazione sqoop --connect jdbc:mysql://mysql.example.com/sqoop --username sqoop --password sqoop --warehouse-dir user/hue/oozie/deployments/sqoop

Answer

importazione spark --connect jdbc:mysql://mysql.example.com/spark --username spark --warehouse-dir user/hue/oozie/deployments/spark

Answer

importazione sqoop --connect jdbc:mysql://mysql.example.com/sqoop --username sqoop --warehouse-dir user/hue/oozie/deployments/sqoop

Answer

importazione spark --connect jdbc:mysql://mysql.example.com/spark --username spark --password spark --warehouse-dir user/hue/oozie/deployments/spark

Question 20

In che forma viene presentato l'output del Reducer?

Accepted Answer

compresso (NON SICURO)

Answer

ordinato

Answer

non ordinato

Answer

criptato

Q1. Il partizionatore controlla la suddivisione di quali dati?

Q2. Le funzioni di finestra SQL sono implementate in Hive utilizzando quali parole chiave?

Q3. Piuttosto che aggiungere un ordinamento secondario a un job di riduzione lento, qual è la pratica migliore di Hadoop per ottimizzare?

Q4. Hadoop Auth impone l'autenticazione su risorse protette. Una volta stabilita l'autenticazione, imposta quale tipo di cookie di autenticazione?

Q5. I job di MapReduce possono essere scritti in quale linguaggio?

Q6. Per eseguire l'aggregazione locale degli output intermedi, gli utenti di MapReduce possono specificare facoltativamente quale oggetto?

Q7. Per verificare lo stato del job, cerca il valore `_` nel `_`.

Q8. Quale riga di codice implementa un metodo Reducer in MapReduce 2.0?

Q9. Per ottenere il numero totale di record di input mappati in un task di job di mappa, è necessario controllare il valore di quale contatore?

Q10. Hadoop Core supporta quali capacità CAP?

Q11. Quali sono le fasi principali di un Reducer?

Q12. Per configurare il flusso di lavoro Hadoop con sincronizzazione dei dati tra job che elaborano task sia su disco che in memoria, utilizzare il servizio `_`, che è `_`.

Q13. Per l'alta disponibilità, che tipo di nodi multipli dovresti usare?

Q14. DataNode supporta quali tipi di unità?

Q15. Quale metodo viene utilizzato per implementare i job Spark?

Q16. In un job di MapReduce, dove viene eseguita la funzione map()?

Q17. Per fare riferimento a un file master per ricerche durante il Mapping, quale tipo di cache dovrebbe essere utilizzato?

Q18. Skip bad records fornisce un'opzione in cui un certo insieme di record di input non validi può essere saltato durante l'elaborazione di quale tipo di dati?

Q19. Quale comando importa dati in Hadoop da un database MySQL?

Q20. In che forma viene presentato l'output del Reducer?