
Map Reduce
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Map ReduceMAP REDUCE GVHD: TS. Hồ Bảo Quốc Nhóm học viên thực hiện:• Dương Hữu Thành – 1212035• Phạm Ngọc Vân Anh – 1212001• Nguyễn Thanh Tòng – 1212039Nội dung• Giới thiệu Map Reduce• Ví dụ cụ thể• Kiến trúc và cách thức hoạt động• Khả năng chịu lỗi (Fault Tolerance)Giới thiệu về Map ReduceMap Reduce• Là một mô hình lập trình được đề xuất trong các ngôn ngữ lập trình hàm như Lisp, ML.• Một trong những tính năng nổi bật của các ngôn ngữ lập trình hàm là các higher-order function.• Higher-order function là dạng function mà chấp nhận một function khác như là tham số của nó.Map Reduce (cont.)• 2 higher-oder function được dùng nhiều trong Lisp là map and fold.• Map và fold thường được dùng kết hợp với nhauMap Reduce (cont.)map và fold trong Lisp• (map square ‘(1 2 3 4)) ▫ (1 4 9 16)• (reduce + ‘(1 4 9 16)) ▫ 30Map Reduce (cont.)Map và reduce do Goole đề xuất• map(key, val) ▫ Tạo ra new-key / new-val pairs• reduce(key, vals) ▫ Tạo ra kết quả cuối cùng ▫ Với key/vals là giá trị tạo ra bởi map function.Map Reduce (cont.)VÍ DỤ CỤ THỂĐếm số lần xuất hiện của mỗi từ trongtập các documentsĐếm số lần xuất hiện của mỗi từ trongtập các documents (cont.)KIẾN TRÚC VÀ CÁCH THỨCHOẠT ĐỘNGKết hợp giữ Map/Reduce và GFS• Cách worker lấy dữ liệu để xử lý? ▫ Dữ liệu cần truy xuất lớn. ▫ Không đủ memory để load tất cả dữ liệu• Giải pháp: ▫ Don’t move data to workers… Move workers to the data! ▫ Worker sẽ được khởi động trên các chunk server đã có sẵn dữ liệu.FAULT TOLERANCEWorker Failure• Master định kỳ ping worker để phát hiện failure.• Nếu một task nào đó thất bại, master chọn một worker khác để thực hiện lại task.Master Failure• Tất cả các map/reduce task sẽ thất bại• Giải pháp: ▫ Đặt các checkpoint để có thể khởi động lại tại các checkpoint đó.Tài liệu tham khảo• Data-Intensive Text Processing with MapReduce - Jimmy Lin The iSchool University of Maryland.• MapReduce: Simplified Data Processing on Large Clusters - Jeffrey Dean and Sanjay Ghemawat Google IncQ&A
Tìm kiếm theo từ khóa liên quan:
Bài giảng Map Reduce tài liệu Map Reduce Tin học cơ sở Bài giảng tin học văn phòng Tin học căn bản Bài giảng tin họcTài liệu có liên quan:
-
Bài giảng Tin học lớp 11 bài 1: Giới thiệu ngôn ngữ lập trình C#
15 trang 259 0 0 -
Xử lý tình trạng máy tính khởi động/tắt chậm
4 trang 250 0 0 -
Sửa lỗi các chức năng quan trọng của Win với ReEnable 2.0 Portable Edition
5 trang 235 0 0 -
Giới thiệu tổng quan về SharePoint 2007
41 trang 207 0 0 -
Giáo Trình tin học căn bản - ĐH Marketing
166 trang 203 0 0 -
TÀI LIỆU HƯỚNG DẪN SỬ DỤNG PHẦN MỀM KHAI BÁO HẢI QUAN ĐIỆN TỬ phần 1
18 trang 188 0 0 -
Memory-RAM - Một số thuật ngữ và kỹ thuật tin học
5 trang 159 0 0 -
Tài liệu ôn thi công chức - Môn Tin học
9 trang 159 0 0 -
Tiến trình trong Linux và các hàm trong C
14 trang 150 0 0 -
Giáo trình nhập môn lập trình - Phần 22
48 trang 143 0 0 -
HƯỚNG DẪN CÀI ĐẶT MÁY ẢO(VMware-workstation)
23 trang 132 0 0 -
Giới thiệu chung Microsoft Project
80 trang 123 0 0 -
Bài giảng Tin học lớp 11 bài 6: Phép toán, biểu thức, câu lệnh gán
9 trang 112 0 0 -
22 trang 109 0 0
-
Bài giảng học với MẠNG MÁY TÍNH
107 trang 97 0 0 -
Phần mềm quản lý điểm bằng Access
22 trang 91 0 0 -
Giáo trình về kiến trúc máy tính
171 trang 75 0 0 -
MÔN TIN HỌC CĂN BẢN - BUỔI THỰC HÀNH 4
7 trang 67 0 0 -
Đề thi môn thẩm định giá bất động sản
2 trang 65 0 0 -
Windows MultiPoint Server 2011 - Giải pháp nhiều người dùng chung một máy tính
3 trang 65 0 0