Danh mục tài liệu

Giáo trình Xác suất thống kê: Phần 2 - PGS.TS Nguyễn Thị Dung

Số trang: 63      Loại file: pdf      Dung lượng: 381.48 KB      Lượt xem: 36      Lượt tải: 0    
Xem trước 7 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Tiếp nội dung phần 1, Giáo trình Xác suất thống kê: Phần 2 cung cấp cho người đọc những kiến thức như: Ước lượng tham số; Kiểm định giả thuyết thống kê; Tương quan và hồi quy. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Giáo trình Xác suất thống kê: Phần 2 - PGS.TS Nguyễn Thị Dung Chương 4 Ước lượng tham số Ước lượng tham số là một trong những bài toán cơ bản của thống kê toán học. Khi nghiên cứu một dấu hiệu đặc trưng dưới dạng các đặc tính định lượng (chẳng hạn như chiều cao, cân nặng, độ dài, . . . ) của tổng thể thông qua biến ngẫu nhiên X, nếu xác định được quy luật phân phối xác suất của X thì việc đưa ra các đánh giá cũng như các dự báo về sự biến động của tổng thể liên quan đến đặc tính này sẽ chính xác và khách quan. Tuy nhiên không phải lúc nào chúng ta cũng xác định được quy luật phân phối xác suất của X. Trong một số trường hợp, bằng phương pháp phân tích lý thuyết ta có thể biết được dạng toán học của hàm phân phối hoặc hàm mật độ của X. Tuy nhiên, các tham số đặc trưng của nó như kỳ vọng, phương sai, hoặc tỷ lệ . . . (gọi chung là tham số θ) lại chưa biết nên ta cần phải xác định θ. Việc tính chính xác θ là khó có thể thực hiện được mà ta chỉ có thể tính gần đúng. Việc tính gần đúng tham số đặc trưng θ thông qua mẫu cụ thể đã có gọi là ước lượng tham số (estimate for parameters). Chương này sẽ trình bày bài toán ước lượng tham số cho kỳ vọng toán và tỷ lệ. Mục 4.1 sẽ giới thiệu phương pháp ước lượng điểm làm cơ sở quan trọng cho việc giải quyết bài toán ước lượng bằng khoảng tin cậy được trình bày trong Mục 4.2. Nội dung của chương được tham khảo chủ yếu từ các tài liệu [2], [6]-[8], [10] và [12]. 4.1. Phương pháp ước lượng điểm Bài toán. Xét biến ngẫu nhiên X của một tổng thể mà ta đã biết quy luật phân phối xác suất nhưng chưa biết tham số đặc trưng θ của X. Hãy ước lượng θ với độ tin cậy cho trước 1 − α. Phương pháp chung. Từ tổng thể cần nghiên cứu rút ra một mẫu ngẫu nhiên kích thước n và dựa vào mẫu đó mà xây dựng một thống kê G dùng để ước lượng θ. Phương pháp ước lượng điểm (point estimation) chủ trương dùng một giá trị để thay thế cho tham số θ chưa biết về tổng thể, vì bản thân θ là một số xác định. Thông thường giá trị được chọn là một thống kê G nào đó của mẫu ngẫu nhiên. Có nhiều cách chọn thống kê G khác nhau tạo nên những phương pháp ước lượng điểm khác nhau. 97 98 Chương 4: Ước lượng tham số Giả sử cần ước lượng tham số θ của biến ngẫu nhiên X. Đối với phương pháp ước lượng điểm ta có thể tiến hành theo các bước như sau: • Bước 1. Từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1 ,X2 , . . . ,Xn ). • Bước 2. Lập thống kê G = f (X1 ,X2 , . . . ,Xn ) được gọi là hàm ước lượng của θ. Thông thường chọn thống kê mẫu tương ứng với tham số θ cần ước lượng, chẳng hạn, để ước lượng kì vọng toán E(X) của biến ngẫu nhiên X thì người ta thường chọn thống kê là trung bình mẫu X, để ước lượng phương sai V (X), chọn thống kê là phương sai điều chỉnh mẫu S ′2 . • Bước 3. Xác định mẫu cụ thể và tính được giá trị g = f (x1 ,x2 , . . . , xn ) của thống kê G trên mẫu cụ thể đó. Từ đó suy ra ước lượng của θ là giá trị g vừa tính được. Chất lượng của ước lượng không thể đánh giá qua một giá trị cụ thể của G vì như vậy chỉ có cách so sánh trực tiếp g và θ mà θ lại chưa biết. Do đó chỉ có thể đánh giá chất lượng của ước lượng thông qua bản thân thống kê G = f (X1 ,X2 , . . . ,Xn ). Rõ ràng là có vô số cách chọn hàm f , tức là có vô số thống kê G có thể dùng làm ước lượng của θ nên cần đưa ra một tiêu chuẩn để đánh giá chất lượng thống kê G, từ đó lựa chọn được thống kê “xấp xỉ một cách tốt nhất” tham số ước lượng. Có 3 tiêu chuẩn cơ bản để chọn thống kê như sau. Định nghĩa 4.1.1. Thống kê G của mẫu được gọi là (i) ước lượng không chệch của tham số θ của biến ngẫu nhiên X nếu E(G) = θ. Ngược lại, nếu E(G) ̸= θ thì G được gọi là ước lượng chệch của θ. (ii) ước lượng hiệu quả của tham số θ của biến ngẫu nhiên X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng một mẫu. (iii) ước lượng vững của tham số θ của biến ngẫu nhiên X nếu G hội tụ theo xác suất đến θ khi n → ∞, tức là với mọi ε dương bé tùy ý ta luôn có lim P (|G − x→∞ θ| < ε) = 1. Chú ý 4.1.2. (i) G là ước lượng không chệch của tham số θ không có nghĩa là mọi giá trị của G đều trùng khít với θ mà chỉ có nghĩa là trung bình các giá trị của thống kê G bằng θ. Từng giá trị của G có thể sai lệch rất lớn so với θ. (ii) Trung bình mẫu X là ước lượng không chệch của kỳ vọng của biến ngẫu nhiên X, nghĩa là E(X) = E(X). Trung bình mẫu X cũng là ước lượng hiệu quả (vững) của E(X). (iii) Tần suất mẫu f là ước lượng không chệch của xác suất P của biến ngẫu nhiên X, nghĩa là E(f ) = P . Tần suất mẫu f là ước lượng hiệu quả (vững) của xác suất P . (iv) Phương sai điều chỉnh mẫu S ′2 là ước lượng không chệch của phương sai V (X) của biến ngẫu nhiên X, tức là E(S ′2 ) = V (X). Phương sai điều chỉnh mẫu S ′2 cũng là ước lượng hiệu quả (vững) của phương sai V (X). Ví dụ 4.1.3 Giả sử một lô hàng của một nhà máy đã được đóng thùng, mỗi thùng 50 sản phẩm. Kiểm tra ngẫu nhiên số phế phẩm trong 50 thùng hàng ta thu được kết quả như sau: 4.1 Phương pháp ước lượng điểm 99 Số phế phẩm X 0 1 2 3 4 5 6 7 8 9 10 Số thùng (ni ) 0 2 3 7 20 6 4 7 2 1 1 (i) Hãy ước lượng cho số phế phẩm trung bình trong mỗi thùng. (ii) Hãy ước lượng cho tỷ lệ phế phẩm của lô hàng đó. (iii) Tìm ước lượng không chệch cho phương sai của số phế phẩm ở mỗi thùng. Giải. (i) Gọi X là biến ngẫu nhiên chỉ số phế phẩm ở mỗi thùng. Đây là bài toán ước lượng điểm cho kỳ vọng của tổng thể. Ta sẽ dùng trung bình mẫu để ước lượng số phế phẩm trung bình trong mỗi thùng. ni xi n i xi ni x2 ...