Quiz about Hadoop

Question 1

Der Partitioner steuert die Aufteilung welcher Daten?

Accepted Answer

Zwischenschlüssel

Answer

endgültige Schlüssel

Answer

endgültige Werte

Answer

Zwischenwerte

Question 2

SQL Windowing-Funktionen werden in Hive unter Verwendung welcher Schlüsselwörter implementiert?

Accepted Answer

OVER, RANK

Answer

UNION DISTINCT, RANK

Answer

OVER, EXCEPT

Answer

UNION DISTINCT, RANK

Question 3

Anstatt einer langsamen Reduce-Job eine Secondary Sort hinzuzufügen, ist es die beste Praxis von Hadoop, welche Optimierung durchzuführen?

Accepted Answer

Fügen Sie dem Reduce-Job ein partitioniertes Shuffle hinzu.

Answer

Fügen Sie dem Map-Job ein partitioniertes Shuffle hinzu.

Answer

Teilen Sie den Reduce-Job in mehrere verkettete Reduce-Jobs auf.

Answer

Teilen Sie den Reduce-Job in mehrere verkettete Map-Jobs auf.

Question 4

Hadoop Auth erzwingt die Authentifizierung für geschützte Ressourcen. Sobald die Authentifizierung hergestellt wurde, setzt es welche Art von authentifizierendem Cookie?

Accepted Answer

signiertes HTTP

Answer

verschlüsseltes HTTP

Answer

nicht signiertes HTTP

Answer

komprimiertes HTTP

Question 5

MapReduce-Jobs können in welcher Sprache geschrieben werden?

Accepted Answer

Java oder Python

Answer

nur SQL

Answer

SQL oder Java

Answer

Python oder SQL

Question 6

Um die lokale Aggregation der Zwischenausgaben durchzuführen, können MapReduce-Benutzer optional welches Objekt angeben?

Accepted Answer

Combiner

Answer

Reducer

Answer

Mapper

Answer

Zähler

Question 7

Um den Status eines Jobs zu überprüfen, suchen Sie nach dem Wert `___` im `___`.

Accepted Answer

ERFOLGREICH; Standardausgabe

Answer

ERFOLGREICH; Syslog

Answer

FERTIG; Syslog

Answer

FERTIG; Standardausgabe

Question 8

Welche Codezeile implementiert eine Reducer-Methode in MapReduce 2.0?

Accepted Answer

public void reduce(Text key, Iterator<IntWritable> values, Context context){…}

Answer

public static void reduce(Text key, IntWritable[] values, Context context){…}

Answer

public static void reduce(Text key, Iterator<IntWritable> values, Context context){…}

Answer

public void reduce(Text key, IntWritable[] values, Context context){…}

Question 9

Um die Gesamtzahl der zugeordneten Eingabedatensätze in einer Map-Job-Aufgabe zu erhalten, sollten Sie den Wert welches Zählers überprüfen?

Accepted Answer

TaskCounter (NICHT SICHER)

Answer

FileInputFormatCounter

Answer

FileSystemCounter

Answer

JobCounter

Question 10

Welche CAP-Fähigkeiten unterstützt Hadoop Core?

Accepted Answer

A, P

Answer

C, A

Answer

C, P

Answer

C, A, P

Question 11

Was sind die primären Phasen eines Reducers?

Accepted Answer

Shuffle, Sortieren und Reduzieren

Answer

Kombinieren, Zuordnen und Reduzieren

Answer

Reduzieren, Sortieren und Kombinieren

Answer

Zuordnen, Sortieren und Kombinieren

Question 12

Um einen Hadoop-Workflow mit Synchronisierung von Daten zwischen Jobs einzurichten, die Aufgaben sowohl auf der Festplatte als auch im Speicher verarbeiten, verwenden Sie den `___`-Dienst, der `___` ist.

Accepted Answer

Zookeeper; Open-Source

Answer

Oozie; Open-Source

Answer

Oozie; kommerzielle Software

Answer

Zookeeper; kommerzielle Software

Question 13

Für hohe Verfügbarkeit sollten Sie welche Art von mehreren Knoten verwenden?

Accepted Answer

Namen

Answer

Daten

Answer

Speicher

Answer

Arbeiter

Question 14

Welche Art von Laufwerken unterstützt DataNode?

Accepted Answer

Hot-Swap-fähig

Answer

Cold-Swap-fähig

Answer

Warm-Swap-fähig

Answer

Nicht-Swap-fähig

Question 15

Welche Methode wird verwendet, um Spark-Jobs zu implementieren?

Accepted Answer

Im Speicher aller Arbeiter

Answer

Auf der Festplatte aller Arbeiter

Answer

Auf der Festplatte des Masterknotens

Answer

Im Speicher des Masterknotens

Question 16

Wo wird die map() -Funktion in einem MapReduce-Job ausgeführt?

Accepted Answer

Auf den Datennodes des Clusters (NICHT SICHER)

Answer

Auf den Reducer-Knoten des Clusters

Answer

Auf dem Masterknoten des Clusters

Answer

Auf jedem Knoten des Clusters

Question 17

Um eine Masterdatei für Lookups während der Zuordnung zu referenzieren, welche Art von Cache sollte verwendet werden?

Accepted Answer

Verteilter Cache

Answer

Lokaler Cache

Answer

Partitionierter Cache

Answer

Cluster-Cache

Question 18

Skip Bad Records bietet eine Option, bei der eine bestimmte Menge von schlechten Eingabedatensätzen übersprungen werden kann, wenn welche Art von Daten verarbeitet werden?

Accepted Answer

Mapeingaben

Answer

Zwischenspeichereingaben

Answer

Reduzierereingaben

Answer

Zwischenwerte

Question 19

Welches Befehl importiert Daten nach Hadoop aus einer MySQL-Datenbank?

Accepted Answer

Sqoop-Import --connect jdbc:mysql://mysql.example.com/sqoop --username sqoop --password sqoop --warehouse-dir user/hue/oozie/deployments/sqoop

Answer

Spark-Import --connect jdbc:mysql://mysql.example.com/spark --username spark --warehouse-dir user/hue/oozie/deployments/spark

Answer

Sqoop-Import --connect jdbc:mysql://mysql.example.com/sqoop --username sqoop --warehouse-dir user/hue/oozie/deployments/sqoop

Answer

Spark-Import --connect jdbc:mysql://mysql.example.com/spark --username spark --password spark --warehouse-dir user/hue/oozie/deployments/spark

Question 20

In welcher Form wird die Ausgabe des Reducers präsentiert?

Accepted Answer

Komprimiert (NICHT SICHER)

Answer

Nicht sortiert

Answer

Verschlüsselt

Q1. Der Partitioner steuert die Aufteilung welcher Daten?

Q2. SQL Windowing-Funktionen werden in Hive unter Verwendung welcher Schlüsselwörter implementiert?

Q3. Anstatt einer langsamen Reduce-Job eine Secondary Sort hinzuzufügen, ist es die beste Praxis von Hadoop, welche Optimierung durchzuführen?

Q4. Hadoop Auth erzwingt die Authentifizierung für geschützte Ressourcen. Sobald die Authentifizierung hergestellt wurde, setzt es welche Art von authentifizierendem Cookie?

Q5. MapReduce-Jobs können in welcher Sprache geschrieben werden?

Q6. Um die lokale Aggregation der Zwischenausgaben durchzuführen, können MapReduce-Benutzer optional welches Objekt angeben?

Q7. Um den Status eines Jobs zu überprüfen, suchen Sie nach dem Wert `_` im `_`.

Q8. Welche Codezeile implementiert eine Reducer-Methode in MapReduce 2.0?

Q9. Um die Gesamtzahl der zugeordneten Eingabedatensätze in einer Map-Job-Aufgabe zu erhalten, sollten Sie den Wert welches Zählers überprüfen?

Q10. Welche CAP-Fähigkeiten unterstützt Hadoop Core?

Q11. Was sind die primären Phasen eines Reducers?

Q12. Um einen Hadoop-Workflow mit Synchronisierung von Daten zwischen Jobs einzurichten, die Aufgaben sowohl auf der Festplatte als auch im Speicher verarbeiten, verwenden Sie den `_`-Dienst, der `_` ist.

Q13. Für hohe Verfügbarkeit sollten Sie welche Art von mehreren Knoten verwenden?

Q14. Welche Art von Laufwerken unterstützt DataNode?

Q15. Welche Methode wird verwendet, um Spark-Jobs zu implementieren?

Q16. Wo wird die map() -Funktion in einem MapReduce-Job ausgeführt?

Q17. Um eine Masterdatei für Lookups während der Zuordnung zu referenzieren, welche Art von Cache sollte verwendet werden?

Q18. Skip Bad Records bietet eine Option, bei der eine bestimmte Menge von schlechten Eingabedatensätzen übersprungen werden kann, wenn welche Art von Daten verarbeitet werden?

Q19. Welches Befehl importiert Daten nach Hadoop aus einer MySQL-Datenbank?

Q20. In welcher Form wird die Ausgabe des Reducers präsentiert?