Tầm quan trọng của học máy trong phân tích dữ liệu lớn
Số trang: 6
Loại file: pdf
Dung lượng: 1.04 MB
Lượt xem: 57
Lượt tải: 0
Xem trước 1 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Cuộc cách mạng công nghiệp 4.0 hiện nay đã dẫn tới sự bùng nổ dữ liệu trên toàn thế giới và tạo ra rất nhiều kho dữ liệu lớn (Big Data). Bài viết Tầm quan trọng của học máy trong phân tích dữ liệu lớn trình bày về các vấn đề cơ bản của Học máy và tầm quan trọng của nó trong phân tích dữ liệu lớn.
Nội dung trích xuất từ tài liệu:
Tầm quan trọng của học máy trong phân tích dữ liệu lớn Đặc san Nghiên cứu Chính sách và Phát triển Số 01/2022 Trường Nguyễ� n & Dương Đỗ� (2022). Tầ� m quan trọng của học máy trong Đặc san Nghiên cứu phân tí�ch dữ liệu lớn. Đặc san Nghiên cứu Chính sách và Phát triển, Chí�nh sách 1(2022), 147-152. và Phát triể� n Bài báo khoa học Học viện Chí�nh sách Tầm quan trọng của học máy và Phát triể� n, 2022 trong phân tích dữ liệu lớn CSR, 2022 Nguyễn Hữu Xuân Trường (TS.) Đỗ Thế Dương (ThS.) Học viện Chính sách và Phát triển. Tóm tắt. Cuộc cách mạng công nghiệp 4.0 hiện nay đã dẫ� n tới sự bùng 15 tháng 12, 2021 nổ� dữ liệu trên toàn thế� giới và tạo ra rấ� t nhiề� u kho dữ liệu lớn (Big Ngày nhận bài: Data). Ẩ� n chứa trong khố� i dữ liệu lớn này là những thông tin vô cùng 25 tháng 12, 2021 Bản sửa lần 1: có í�ch nhưng thật không dễ� dàng để� trí�ch xuấ� t được. Một nhiệm vụ 30 tháng 12, 2021 Ngày duyệt bài: tưởng như bấ� t khả thi khi những tập dữ liệu lớn này không thể� xử lý được với những công cụ truyề� n thố� ng, nhưng thật là may mắ� n khi Mã số� : ĐS140122 chúng ta đã có chì�a khóa để� giải quyế� t hiệu quả cho vấ� n đề� này, đó chí�nh là Học máy (Machine Learning) - một lĩ�nh vực của trí� tuệ nhân tạo (AI) đang phát triể� n mạnh trong giai đoạn hiện nay. Trong bài viế� t này, chúng tôi sẽ trì�nh bày về� các vấ� n đề� cơ bản của Học máy và tầ� m quan trọng của nó trong phân tí�ch dữ liệu lớn. Từ khoá: học máy, trí tuệ nhân tạo, dữ liệu lớn, phân tích dữ liệu. Abstract. Big data was produced as a result of the fourth industrial revolution, which resulted in an explosion of data worldwide. There is incredibly relevant information hidden within this extensive data, but extracting it is not easy. A seemingly insurmountable task when enormous data cannot be processed using typical data processing techniques, but fortunately, Machine Learning, a subfield of artificial intelligence that is rapidly evolving, holds the key to solving this challenge efficiently. This paper will go through the fundamentals of machine learning and how it applies to big data analytics. Keywords: machine learning, artificial intelligence, big data, data analysis. 147 Tầm quan trọng của học máy trong Nguyễn Hữu Xuân Trường & Đỗ Thế Dương phân tích dữ liệu lớn 1. Giới thiệu về Học máy và Dữ liệu lớn để� thực hiện một nhiệm vụ cụ thể� không cầ� n sử dụng các hướng dẫ� n rõ ràng, thay Vào thời điể� m năm 2018, ước tí�nh mỗ� i vào đó là dựa vào các mẫ� u và suy luận. ngày chúng ta tạo ra khoảng 2,5 tỷ Byte dữ Các thuật toán học máy xây dựng một mô liệu và theo thố� ng kê thì� dữ liệu sinh ra trong hì�nh toán học dựa trên dữ liệu mẫ� u được khoảng hai năm liên tiế� p xấ� p xỉ� bằ� ng dữ liệu gọi là “dữ liệu huấ� n luyện”, để� đưa ra dự được sinh từ tấ� t cả các năm trước cộng lại. đoán hoặc quyế� t định mà không phải lập Thêm vào đó, chi phí� cho việc tạo ra và lưu trì�nh cụ thể� để� thực hiện nhiệm vụ (Phạm trữ dữ liệu ngày một rẻ hơn, qua thời gian Ngọc Thọ, 2019). thu thập đã có rấ� t nhiề� u kho dữ liệu lớn được tạo ra. Dữ liệu lớn có thể� hiể� u là một Có thể� lấ� y ví� dụ đơn giản về� việc học tập dữ liệu có kí�ch thước rấ� t lớn và phức tạp dựa trên dữ liệu mẫ� u như sau: mà các ứng dụng xử lý dữ liệu truyề� n thố� ng X = {2, 3, 5, 6} và tương ứng không xử lý được, tuy nhiên nế� u trí�ch xuấ� t Y = {3, 5, 9, 11} thành công thì� dữ liệu lớn sẽ mang lại nhiề� u Câu hỏi đặt ra là với X = 4 thì� Y = ? thông tin rấ� t quý giá cho chúng ta (Đặng Thị Hằ� ng, 2019). Vấ� n đề� trên giố� ng như một câu hỏi về� IQ, và với khả năng suy luận của con người Trước đây chúng ta sử dụng dữ liệu chủ thì� cũng không quá khó khăn để� dự đoán là yế� u mang tí�nh lưu trữ thông tin, hầ� u như với X = 4 thì� Y = 7 (suy luận từ dữ liệu thì� chúng ta đã bỏ quên những tri thức vô cùng đoán rằ� ng liên hệ giữa Y và X theo hàm Y có í�ch được chứa trong các kho dữ liệu lớn. = 2X - 1). Tuy nhiên để ...
Nội dung trích xuất từ tài liệu:
Tầm quan trọng của học máy trong phân tích dữ liệu lớn Đặc san Nghiên cứu Chính sách và Phát triển Số 01/2022 Trường Nguyễ� n & Dương Đỗ� (2022). Tầ� m quan trọng của học máy trong Đặc san Nghiên cứu phân tí�ch dữ liệu lớn. Đặc san Nghiên cứu Chính sách và Phát triển, Chí�nh sách 1(2022), 147-152. và Phát triể� n Bài báo khoa học Học viện Chí�nh sách Tầm quan trọng của học máy và Phát triể� n, 2022 trong phân tích dữ liệu lớn CSR, 2022 Nguyễn Hữu Xuân Trường (TS.) Đỗ Thế Dương (ThS.) Học viện Chính sách và Phát triển. Tóm tắt. Cuộc cách mạng công nghiệp 4.0 hiện nay đã dẫ� n tới sự bùng 15 tháng 12, 2021 nổ� dữ liệu trên toàn thế� giới và tạo ra rấ� t nhiề� u kho dữ liệu lớn (Big Ngày nhận bài: Data). Ẩ� n chứa trong khố� i dữ liệu lớn này là những thông tin vô cùng 25 tháng 12, 2021 Bản sửa lần 1: có í�ch nhưng thật không dễ� dàng để� trí�ch xuấ� t được. Một nhiệm vụ 30 tháng 12, 2021 Ngày duyệt bài: tưởng như bấ� t khả thi khi những tập dữ liệu lớn này không thể� xử lý được với những công cụ truyề� n thố� ng, nhưng thật là may mắ� n khi Mã số� : ĐS140122 chúng ta đã có chì�a khóa để� giải quyế� t hiệu quả cho vấ� n đề� này, đó chí�nh là Học máy (Machine Learning) - một lĩ�nh vực của trí� tuệ nhân tạo (AI) đang phát triể� n mạnh trong giai đoạn hiện nay. Trong bài viế� t này, chúng tôi sẽ trì�nh bày về� các vấ� n đề� cơ bản của Học máy và tầ� m quan trọng của nó trong phân tí�ch dữ liệu lớn. Từ khoá: học máy, trí tuệ nhân tạo, dữ liệu lớn, phân tích dữ liệu. Abstract. Big data was produced as a result of the fourth industrial revolution, which resulted in an explosion of data worldwide. There is incredibly relevant information hidden within this extensive data, but extracting it is not easy. A seemingly insurmountable task when enormous data cannot be processed using typical data processing techniques, but fortunately, Machine Learning, a subfield of artificial intelligence that is rapidly evolving, holds the key to solving this challenge efficiently. This paper will go through the fundamentals of machine learning and how it applies to big data analytics. Keywords: machine learning, artificial intelligence, big data, data analysis. 147 Tầm quan trọng của học máy trong Nguyễn Hữu Xuân Trường & Đỗ Thế Dương phân tích dữ liệu lớn 1. Giới thiệu về Học máy và Dữ liệu lớn để� thực hiện một nhiệm vụ cụ thể� không cầ� n sử dụng các hướng dẫ� n rõ ràng, thay Vào thời điể� m năm 2018, ước tí�nh mỗ� i vào đó là dựa vào các mẫ� u và suy luận. ngày chúng ta tạo ra khoảng 2,5 tỷ Byte dữ Các thuật toán học máy xây dựng một mô liệu và theo thố� ng kê thì� dữ liệu sinh ra trong hì�nh toán học dựa trên dữ liệu mẫ� u được khoảng hai năm liên tiế� p xấ� p xỉ� bằ� ng dữ liệu gọi là “dữ liệu huấ� n luyện”, để� đưa ra dự được sinh từ tấ� t cả các năm trước cộng lại. đoán hoặc quyế� t định mà không phải lập Thêm vào đó, chi phí� cho việc tạo ra và lưu trì�nh cụ thể� để� thực hiện nhiệm vụ (Phạm trữ dữ liệu ngày một rẻ hơn, qua thời gian Ngọc Thọ, 2019). thu thập đã có rấ� t nhiề� u kho dữ liệu lớn được tạo ra. Dữ liệu lớn có thể� hiể� u là một Có thể� lấ� y ví� dụ đơn giản về� việc học tập dữ liệu có kí�ch thước rấ� t lớn và phức tạp dựa trên dữ liệu mẫ� u như sau: mà các ứng dụng xử lý dữ liệu truyề� n thố� ng X = {2, 3, 5, 6} và tương ứng không xử lý được, tuy nhiên nế� u trí�ch xuấ� t Y = {3, 5, 9, 11} thành công thì� dữ liệu lớn sẽ mang lại nhiề� u Câu hỏi đặt ra là với X = 4 thì� Y = ? thông tin rấ� t quý giá cho chúng ta (Đặng Thị Hằ� ng, 2019). Vấ� n đề� trên giố� ng như một câu hỏi về� IQ, và với khả năng suy luận của con người Trước đây chúng ta sử dụng dữ liệu chủ thì� cũng không quá khó khăn để� dự đoán là yế� u mang tí�nh lưu trữ thông tin, hầ� u như với X = 4 thì� Y = 7 (suy luận từ dữ liệu thì� chúng ta đã bỏ quên những tri thức vô cùng đoán rằ� ng liên hệ giữa Y và X theo hàm Y có í�ch được chứa trong các kho dữ liệu lớn. = 2X - 1). Tuy nhiên để ...
Tìm kiếm theo từ khóa liên quan:
Trí tuệ nhân tạo Dữ liệu lớn Cách mạng công nghiệp 4.0 Ứng dụng IoT Ứng dụng học máyTài liệu có liên quan:
-
Đề cương chi tiết học phần Trí tuệ nhân tạo
12 trang 482 0 0 -
Chuyển đổi số trong bối cảnh cách mạng công nghiệp 4.0 - Kỷ yếu hội thảo khoa học quốc tế: Phần 2
471 trang 461 1 0 -
Phát triển công nghệ thông tin theo Nghị quyết đại hội XIII của Đảng
7 trang 346 0 0 -
Đào tạo kiến trúc sư trong bối cảnh cách mạng công nghiệp 4.0
5 trang 299 0 0 -
7 trang 286 0 0
-
7 trang 282 0 0
-
Các yếu tố ảnh hưởng đến sự phát triển kỹ năng mềm của sinh viên: Nghiên cứu tại tỉnh Bình Dương
13 trang 261 0 0 -
Một vài khía cạnh của phân tích dữ liệu lớn trong kinh tế
10 trang 238 0 0 -
Mỹ thuật ứng dụng và công tác đào tạo tiếp cận từ học liệu mở
4 trang 230 0 0 -
Nghiên cứu các nhân tố tác động đến ý định trở thành Freelancer của giới trẻ Hà Nội
12 trang 225 2 0