Câu 1. Partitioner điều khiển việc phân vùng của dữ liệu nào?
các khóa cuối cùng
các giá trị cuối cùng
các khóa trung gian
các giá trị trung gian
Câu 2. Các hàm cửa sổ SQL được triển khai trong Hive bằng từ khóa nào?
UNION DISTINCT, RANK
OVER, RANK
OVER, EXCEPT
UNION DISTINCT, RANK
Câu 3. Thay vì thêm một phân loại phụ vào một công việc Reduce chậm, điều tối ưu của Hadoop là thực hiện điều gì?
Thêm một sắp xếp phân vùng vào công việc Map.
Thêm một sắp xếp phân vùng vào công việc Reduce.
Chia nhỏ công việc Reduce thành nhiều công việc Reduce được liên kết.
Chia nhỏ công việc Reduce thành nhiều công việc Map được liên kết.
Câu 4. Hadoop Auth thực hiện xác thực trên các tài nguyên được bảo vệ. Khi xác thực đã được thiết lập, nó đặt loại cookie xác thực nào?
HTTP được mã hóa
HTTP không ký
HTTP nén
HTTP ký
Câu 5. Công việc MapReduce có thể được viết bằng ngôn ngữ nào?
Java hoặc Python
Chỉ SQL
SQL hoặc Java
Python hoặc SQL
Câu 6. Để thực hiện tổng hợp cục bộ của các đầu ra trung gian, người dùng MapReduce có thể tùy chọn chỉ định đối tượng nào?
Reducer
Combiner
Mapper
Counter
Câu 7. Để xác minh trạng thái công việc, tìm giá trị ___ trong ___.
SUCCEEDED; syslog
SUCCEEDED; stdout
DONE; syslog
DONE; stdout
Câu 8. Dòng mã nào thực hiện một phương thức Reducer trong MapReduce 2.0?
public void reduce(Text key, Iterator<IntWritable> values, Context context){…}
public static void reduce(Text key, IntWritable[] values, Context context){…}
public static void reduce(Text key, Iterator<IntWritable> values, Context context){…}
public void reduce(Text key, IntWritable[] values, Context context){…}
Câu 9. Để lấy tổng số bản ghi đầu vào được ánh xạ trong một tác vụ map, bạn nên xem lại giá trị của bộ đếm nào?
FileInputFormatCounter
FileSystemCounter
JobCounter
TaskCounter (KHÔNG CHẮC CHẮN)
Câu 10. Hadoop Core hỗ trợ những khả năng CAP nào?
A, P
C, A
C, P
C, A, P
Câu 11. Các giai đoạn chính của một Reducer là gì?
kết hợp, ánh xạ và giảm
shuffle, sắp xếp và giảm
giảm, sắp xếp và kết hợp
ánh xạ, sắp xếp và kết hợp
Câu 12. Để thiết lập luồng công việc Hadoop với đồng bộ hóa dữ liệu giữa các công việc xử lý nhiệm vụ cả trên đĩa và trong bộ nhớ, sử dụng dịch vụ ___, là ___.
Oozie; phần mềm thương mại
Oozie; phần mềm nguồn mở
Zookeeper; phần mềm thương mại
Zookeeper; mã nguồn mở
Câu 13. Đối với tính sẵn có cao, bạn nên sử dụng loại nút nào?
dữ liệu
tên
bộ nhớ
công nhân
Câu 14. DataNode hỗ trợ loại ổ đĩa nào?
có thể thay đổi nóng
có thể thay đổi lạnh
có thể thay đổi ấm
không thể thay đổi
Câu 15. Phương thức nào được sử dụng để triển khai các công việc Spark?
trên đĩa của tất cả các công nhân
trên đĩa của nút chủ
trong bộ nhớ của nút chủ
trong bộ nhớ của tất cả các công nhân
Câu 16. Trong một công việc MapReduce, hàm map() chạy ở đâu?
trên các nút giảm của cụm
trên các nút dữ liệu của cụm (KHÔNG CHẮC CHẮN)
trên nút chủ của cụm
trên mọi nút của cụm
Câu 17. Để tham chiếu một tệp master để tra c
ứu trong quá trình Ánh xạ, loại cache nào nên được sử dụng?
cache phân tán
cache địa phương
cache phân vùng
cache cụm
Câu 18. Bỏ qua các bản ghi xấu cung cấp một tùy chọn nơi một tập hợp nhất định các bản ghi đầu vào xấu có thể bị bỏ qua khi xử lý loại dữ liệu nào?
đầu vào bộ nhớ cache
đầu vào giảm
các giá trị trung gian
đầu vào ánh xạ
Câu 19. Lệnh nào nhập dữ liệu vào Hadoop từ cơ sở dữ liệu MySQL?
nhập lửa --kết nối jdbc:mysql://mysql.example.com/lửa --tên người dùng lửa --thư mục kho user/hue/oozie/triển khai/lửa
nhập lửa --kết nối jdbc:mysql://mysql.example.com/lửa --tên người dùng lửa --thư mục kho user/hue/oozie/triển khai/lửa
nhập lửa --kết nối jdbc:mysql://mysql.example.com/lửa --tên người dùng lửa --mật khẩu lửa --thư mục kho user/hue/oozie/triển khai/lửa
nhập lửa --kết nối jdbc:mysql://mysql.example.com/lửa --tên người dùng lửa --mật khẩu lửa --thư mục kho user/hue/oozie/triển khai/lửa
Câu 20. Đầu ra của Reducer được trình bày dưới dạng gì?