Danh mục tài liệu

Bài giảng Xác suất thống kê: Chương 4.1 - Mẫu ngẫu nhiên và phân phối mẫu

Số trang: 71      Loại file: pdf      Dung lượng: 565.89 KB      Lượt xem: 12      Lượt tải: 0    
Xem trước 8 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng "Xác suất thống kê: Chương 4.1 - Mẫu ngẫu nhiên và phân phối mẫu" trình bày các nội dung chính sau đây: Tổng thể và mẫu; Biểu diễn dữ liệu; Các đặc trưng mẫu; Khái niệm mẫu ngẫu nhiên; Một số thống kê thông dụng;... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Xác suất thống kê: Chương 4.1 - Mẫu ngẫu nhiên và phân phối mẫu VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC School of Applied Mathematics and Informatics Chương 4 THỐNG KÊ VÀ ƯỚC LƯỢNG THAM SỐ BỘ MÔN TOÁN ỨNG DỤNG(1) VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC ĐẠI HỌC BÁCH KHOA HÀ NỘI SAMI.HUST – 2023(1) Phòng BIS.201–D3.5Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 1/71 SAMI.HUST – 2023 1 / 71GIỚI THIỆU CHƯƠNG 4Chương này trình bày về bài toán ước lượng tham số của tổng thể. Nội dung bao gồm: Mẫu ngẫu nhiên, thống kê và phân phối mẫu. Ước lượng điểm cho tham số, một số tiêu chuẩn lựa chọn hàm ước lượng. Khoảng tin cậy cho kỳ vọng, phương sai, tỷ lệ; xác định kích thước mẫu. Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 2/71 SAMI.HUST – 2023 2 / 714.1. MẪU NGẪU NHIÊN VÀ PHÂN PHỐI MẪU1 4.1.1 Tổng thể và mẫu 4.1.1.1. Tổng thể và mẫu 4.1.1.2 Biểu diễn dữ liệu 4.1.1.3 Các đặc trưng mẫu2 4.1.2 Mẫu ngẫu nhiên 4.1.2.1 Khái niệm mẫu ngẫu nhiên 4.1.2.2 Một số thống kê thông dụng3 4.1.3 Phân phối mẫu 4.1.3.1 Phân phối mẫu của trung bình mẫu và Định lý giới hạn trung tâm 4.1.3.2 Phân phối mẫu của một số thống kê khác4 Bài tập Mục 4.1 Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 3/71 SAMI.HUST – 2023 3 / 71Tổng thểKhái niệm 1Khi nghiên cứu các vấn đề tự nhiên, kinh tế, xã hội và nhiều lĩnh vực khác thường dẫn đến khảo sát một haynhiều dấu hiệu (định tính hoặc định lượng) trên nhiều phần tử. Tập hợp tất cả các phần tử này gọi là tổngthể hay đám đông. Số phần tử trong tổng thể có thể là hữu hạn hoặc vô hạn. Cần chú ý rằng ta không nghiên cứu trực tiếp các phần tử của tổng thể mà chỉ nghiên cứu dấu hiệu nào đó của nó. Ký hiệu N là số phần tử của tổng thể; X là dấu hiệu cần nghiên cứu. Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 4/71 SAMI.HUST – 2023 4 / 71Tổng thểVí dụ 1(a) Muốn điều tra thu nhập bình quân của các hộ gia đình ở Hà Nội thì Tổng thể cần nghiên cứu là toàn bộ các hộ gia đình ở Hà Nội; Dấu hiệu nghiên cứu là thu nhập của từng hộ gia đình (dấu hiệu định lượng).(b) Một doanh nghiệp muốn nghiên cứu các khách hàng của mình. Tổng thể là toàn bộ các khách hàng của doanh nghiệp. Dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp; Dấu hiệu định lượng là số lượng sản phẩm mà khách hàng mua của doanh nghiệp. Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 5/71 SAMI.HUST – 2023 5 / 71Tổng thểVí dụ 2Một nhà máy sản xuất 5.000.000 sản phẩm. Ta muốn đánh giá tỷ lệ phế phẩm trong các sản phẩm của nhàmáy. Tổng thể cần nghiên cứu là 5.000.000 sản phẩm của nhà máy. Dấu hiệu nghiên cứu là một sản phẩm có phải là phế phẩm hay không. Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 6/71 SAMI.HUST – 2023 6 / 71Tổng thể Một số lý do không thể khảo sát toàn bộ tổng thể Do quy mô của tổng thể cần nghiên cứu quá lớn nên việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều kinh phí và thời gian. Trong nhiều trường hợp không thể biết được toàn bộ các phần tử của tổng thể cần nghiên cứu. Có thể trong quá trình điều tra sẽ phá hủy đối tượng nghiên cứu. . . Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 7/71 SAMI.HUST – 2023 7 / 71Tập mẫu Thay vì khảo sát tổng thể, ta chỉ cần chọn ra một tập nhỏ để khảo sát và đưa ra quyết định. Việc chọn ra từ tổng thể một tập hợp con nào đó được gọi là phép lấy mẫu. Tập hợp con được chọn được gọi là tập mẫu. Số phần tử trong tập mẫu được gọi là kích thước mẫu hoặc cỡ mẫu, ký hiệu là n. Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 8/71 SAMI.HUST – 2023 8 / 71Tập mẫuVí dụ 3Với số liệu trong Ví dụ 2, ta không có đủ thời gian và tiền bạc để xem xét toàn bộ 5.000.000 sản phẩm. Ta chọn ra một mẫu gồm 500 sản phẩm để kiểm tra và phát hiện có 20 sản phẩm mắc lỗi. Tỷ lệ phế phẩm trong mẫu kiểm tra này là 20/500 = 0, 04 = 4%. Từ đó, ta nhận định tỷ lệ phế phẩm của nhà máy này khoảng 4%.Ví dụ 4Ta muốn đánh giá số giờ trong một ngày mà một kỹ sư các ngành kỹ thuật sử dụng điện thoại. Vì số kỹ sưcác ngành kỹ thuật rất lớn, nên ta không thể điều tra trên tất cả các kỹ sư được. Ta chọn ngẫu nhiên một mẫu gồm n = 50 kỹ sư để khảo sát và tìm được số giờ trung bình dùng điện thoại của 50 kỹ sư này, chẳng hạn, là 2,7 giờ. Con số 2,7 giờ cho ta một thông tin về việc sử dụng điện thoại của các kỹ sư các ngành kỹ thuật. Viện Toán ứng dụng và Tin học (HUST) MI2020-CHƯƠNG 4 – MỤC 4.1 9/71 SAMI.HUST – 2023 9 / 71Một số kỹ thuật chọn mẫu cơ bảnVí dụ 5Để điều tra mức thu nhập trung bình của sinh viên tốt nghiệp đại học mới ra trường, nếu mẫu được chọntrong số các sinh viên tốt nghiệp ngành Công nghệ thông tin thì rõ ràng mức lương trung bình trong mẫukhông phản ánh trung thực mức lương trung bình của sinh viên mới ra trường nói chung. Vấn đề chọn mẫu Các kết luận suy diễn từ mẫu có đáng tin cậy chỉ đạt được nếu mẫu được chọn phản ánh trung thực, thực sự đại diện cho tổng thể. Do đó, vấn đề chọn mẫu là một vấn đề rất quan trọng của thống kê. Các kỹ thuật chọn mẫu đúng đắn sẽ giúp ta đảm bảo được tính đại diện trung thực cho tổng thể. Để trả lời cho câu hỏi “làm sao chọ ...