Đặc trưng thống kê và hồi quy với dữ liệu khoảng
Số trang: 5
Loại file: pdf
Dung lượng: 349.91 KB
Lượt xem: 79
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết trình bày một số đặc trưng thống kê và áp dụng trong phân tích tương quan và hồi quy trên các biến ngẫu nhiên nhận giá trị khoảng. Để hiểu rõ hơn, mời các bạn tham khảo chi tiết nội dung bài viết này.
Nội dung trích xuất từ tài liệu:
Đặc trưng thống kê và hồi quy với dữ liệu khoảng KỶ YẾU HỘI THẢO KHOA HỌC ĐỔI MỚI GIẢNG DẠY MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNG CHO SINH VIÊN KHỐI NGÀNH KINH TẾ, QUẢN TRỊ KINH DOANH VÀ CÁC VẤN ĐỀ LIÊN QUAN 21. ĐẶC TRƯNG THỐNG KÊ VÀ HỒI QUY VỚI DỮ LIỆU KHOẢNG ThS. Nguyễn Văn Phong* Tóm tắt Bài viết trình bày một số đặc trưng thống kê và áp dụng trong phân tích tương quan và hồiquy trên các biến ngẫu nhiên nhận giá trị khoảng có dạng . Từ khóa: Dữ liệu khoảng, đặc trưng thống kê, hồi quy với dữ liệu khoảng 1. Giới thiệu Hiện nay, trong phân tích dữ liệu, chúng ta thường đối diện với các dữ liệu không chínhxác (dữ liệu nhiễu), điều này xảy ra bởi nhiều nguyên nhân khác nhau như: đo lường, quátrình tính toán, các phương pháp ước lượng dữ liệu… Do đó, việc nghiên cứu trên các loạidữ liệu mà giá trị của chúng cho phép giao động trên một khoảng được đề cập trong nhiều tàiliệu và cũng được các tác giả quan tâm, nghiên cứu áp dụng trong nhiều lĩnh vực khác nhau.Chẳng hạn như khi nghiên cứu về giá cổ phiếu trên thị trường chứng khoán, chúng ta nghiêncứu dựa trên giá mở cửa và giá đóng cửa của cổ phiếu đó; hay nghiên cứu về sự thay đổinhiệt độ của một khu vực trong phạm vi thời gian; hay các dữ liệu liên quan đến nhịp tim vàhuyết áp… Các loại dữ liệu này thường được biểu diễn dưới dạng và trongđó là biến ngẫu nhiên có phân phối xác xuất. Việc nghiên cứu trên các loại dữ liệu này giúpchúng ta có thể kiểm soát được sai số trong các bài toán được chặc chẽ hơn và tránh gây rahiện tượng mất thông tin. Chẳng hạn như nghiên cứu về nhiệt độ hàng ngày tại một khu vựcnếu dữ liệu được đo đạc theo phạm vi biến động của nó trong cả ngày, chắc chắn sẽ cung cấpnhiều thông tin hơn đối với trường hợp trong đó một giá trị được đo đạc đơn lẻ. Những lý dotrên đã thúc đẩy sự phát triển của các phương pháp phân tích thống kê mới để xử lý các biếncó giá trị theo khoảng. Đối với dữ liệu khoảng có dạng , chúng ta cũng đã xây dựngcác bài toán liên quan đến ước lượng, kiểm định cho các tham số như trung bình , phươngsai và tỷ lệ , bằng cách xét điểm đại diện (điểm giữa: ) trên từngkhoảng của dữ liệu.* Bộ môn Toán - Thống kê, Khoa Kinh tế - Luật, Trường Đại học Tài chính - Marketing 173KỶ YẾU HỘI THẢO KHOA HỌCĐỔI MỚI GIẢNG DẠY MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNGCHO SINH VIÊN KHỐI NGÀNH KINH TẾ, QUẢN TRỊ KINH DOANH VÀ CÁC VẤN ĐỀ LIÊN QUAN Bằng cách tiếp cận tương tự, nhưng thay vì chỉ xét trên một giá trị duy nhất của dữ liệu,trong bài viết này sẽ trình bày một vài kết quả liên quan đến các đặc trưng thống kê, cũngnhư áp dụng trong phân tích tương quan và hồi quy đối với dữ liệu khoảng có dạng 2. Một số kết quả Trong phần này, để trình bày các kết quả liên quan đến các đặc trưng thống kê cũngnhư trong phân tích tương quan và hồi quy, chúng ta xét biến ngẫu nhiên có giá trịkhoảng có dạng: . Khi đó, các đặt trưng thống kê như: trung bình, phương sai và độ lệch chuẩn được xácđịnh như sau: i) Trung bình: ii) Độ lệch từ một điểm đến trung bình: và iii) Phương sai: Để xác định phương sai trên dữ liệu khoảng, trước tiên với biến ngẫu nhiên , với trung bình , ta có: Khi đó, với , iv) Hiệp phương sai và hệ số tương quan: Với , ta có: Xét Đặt , ta có:174 KỶ YẾU HỘI THẢO KHOA HỌC ĐỔI MỚI GIẢNG DẠY MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNG CHO SINH VIÊN KHỐI NGÀNH KINH TẾ, QUẢN TRỊ KINH DOANH VÀ CÁC VẤN ĐỀ LIÊN QUAN Trong đó: Hệ số tương quan giữa và được xác định như sau: Trong đó: v) Hồi quy đơn với dữ liệu khoảng Giả sử với lần lượt là biến độclập và phụ thuộc: Hình 1. Mô tả quan hệ giữa hai dữ liệu khoảng Khi đó, mô hình hồi quy ước lượng của phụ thuộc vào có dạng: Trong đó: ...
Nội dung trích xuất từ tài liệu:
Đặc trưng thống kê và hồi quy với dữ liệu khoảng KỶ YẾU HỘI THẢO KHOA HỌC ĐỔI MỚI GIẢNG DẠY MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNG CHO SINH VIÊN KHỐI NGÀNH KINH TẾ, QUẢN TRỊ KINH DOANH VÀ CÁC VẤN ĐỀ LIÊN QUAN 21. ĐẶC TRƯNG THỐNG KÊ VÀ HỒI QUY VỚI DỮ LIỆU KHOẢNG ThS. Nguyễn Văn Phong* Tóm tắt Bài viết trình bày một số đặc trưng thống kê và áp dụng trong phân tích tương quan và hồiquy trên các biến ngẫu nhiên nhận giá trị khoảng có dạng . Từ khóa: Dữ liệu khoảng, đặc trưng thống kê, hồi quy với dữ liệu khoảng 1. Giới thiệu Hiện nay, trong phân tích dữ liệu, chúng ta thường đối diện với các dữ liệu không chínhxác (dữ liệu nhiễu), điều này xảy ra bởi nhiều nguyên nhân khác nhau như: đo lường, quátrình tính toán, các phương pháp ước lượng dữ liệu… Do đó, việc nghiên cứu trên các loạidữ liệu mà giá trị của chúng cho phép giao động trên một khoảng được đề cập trong nhiều tàiliệu và cũng được các tác giả quan tâm, nghiên cứu áp dụng trong nhiều lĩnh vực khác nhau.Chẳng hạn như khi nghiên cứu về giá cổ phiếu trên thị trường chứng khoán, chúng ta nghiêncứu dựa trên giá mở cửa và giá đóng cửa của cổ phiếu đó; hay nghiên cứu về sự thay đổinhiệt độ của một khu vực trong phạm vi thời gian; hay các dữ liệu liên quan đến nhịp tim vàhuyết áp… Các loại dữ liệu này thường được biểu diễn dưới dạng và trongđó là biến ngẫu nhiên có phân phối xác xuất. Việc nghiên cứu trên các loại dữ liệu này giúpchúng ta có thể kiểm soát được sai số trong các bài toán được chặc chẽ hơn và tránh gây rahiện tượng mất thông tin. Chẳng hạn như nghiên cứu về nhiệt độ hàng ngày tại một khu vựcnếu dữ liệu được đo đạc theo phạm vi biến động của nó trong cả ngày, chắc chắn sẽ cung cấpnhiều thông tin hơn đối với trường hợp trong đó một giá trị được đo đạc đơn lẻ. Những lý dotrên đã thúc đẩy sự phát triển của các phương pháp phân tích thống kê mới để xử lý các biếncó giá trị theo khoảng. Đối với dữ liệu khoảng có dạng , chúng ta cũng đã xây dựngcác bài toán liên quan đến ước lượng, kiểm định cho các tham số như trung bình , phươngsai và tỷ lệ , bằng cách xét điểm đại diện (điểm giữa: ) trên từngkhoảng của dữ liệu.* Bộ môn Toán - Thống kê, Khoa Kinh tế - Luật, Trường Đại học Tài chính - Marketing 173KỶ YẾU HỘI THẢO KHOA HỌCĐỔI MỚI GIẢNG DẠY MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNGCHO SINH VIÊN KHỐI NGÀNH KINH TẾ, QUẢN TRỊ KINH DOANH VÀ CÁC VẤN ĐỀ LIÊN QUAN Bằng cách tiếp cận tương tự, nhưng thay vì chỉ xét trên một giá trị duy nhất của dữ liệu,trong bài viết này sẽ trình bày một vài kết quả liên quan đến các đặc trưng thống kê, cũngnhư áp dụng trong phân tích tương quan và hồi quy đối với dữ liệu khoảng có dạng 2. Một số kết quả Trong phần này, để trình bày các kết quả liên quan đến các đặc trưng thống kê cũngnhư trong phân tích tương quan và hồi quy, chúng ta xét biến ngẫu nhiên có giá trịkhoảng có dạng: . Khi đó, các đặt trưng thống kê như: trung bình, phương sai và độ lệch chuẩn được xácđịnh như sau: i) Trung bình: ii) Độ lệch từ một điểm đến trung bình: và iii) Phương sai: Để xác định phương sai trên dữ liệu khoảng, trước tiên với biến ngẫu nhiên , với trung bình , ta có: Khi đó, với , iv) Hiệp phương sai và hệ số tương quan: Với , ta có: Xét Đặt , ta có:174 KỶ YẾU HỘI THẢO KHOA HỌC ĐỔI MỚI GIẢNG DẠY MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNG CHO SINH VIÊN KHỐI NGÀNH KINH TẾ, QUẢN TRỊ KINH DOANH VÀ CÁC VẤN ĐỀ LIÊN QUAN Trong đó: Hệ số tương quan giữa và được xác định như sau: Trong đó: v) Hồi quy đơn với dữ liệu khoảng Giả sử với lần lượt là biến độclập và phụ thuộc: Hình 1. Mô tả quan hệ giữa hai dữ liệu khoảng Khi đó, mô hình hồi quy ước lượng của phụ thuộc vào có dạng: Trong đó: ...
Tìm kiếm theo từ khóa liên quan:
Đặc trưng thống kê Hồi quy với dữ liệu khoảng Lý thuyết xác suất Thống kê ứng dụng Dữ liệu khoảng Hồi quy với dữ liệu khoảngTài liệu có liên quan:
-
Bài giảng Xác suất và thống kê trong y dược - Chương 1: Khái niệm cơ bản của lý thuyết xác suất
69 trang 202 0 0 -
Giáo trình Lý thuyết xác suất và thống kê toán học - Phần 1
91 trang 120 0 0 -
Bài giảng Xác suất thống kê ứng dụng trong kinh tế xã hội: Chương 3 - ĐH Thăng Long
24 trang 105 0 0 -
Giáo trình Phương pháp thống kê trong khí hậu: Phần 1
98 trang 90 0 0 -
Bài giảng Toán cao cấp - Chương 1: Các khái niệm cơ bản của lý thuyết xác suất
16 trang 88 0 0 -
Giáo trình Thống kê toán - Đại học Sư phạm Đà Nẵng
137 trang 67 0 0 -
Bài giảng Lý thuyết xác suất và thống kê toán - Bài 5: Cơ sở lý thuyết mẫu
18 trang 61 0 0 -
Giáo trình Xác suất thống kê: Phần 1 - PGS.TS Nguyễn Thị Dung
104 trang 61 0 0 -
Thảo luận nhóm: Lý thuyết xác suất và thống kê toán
11 trang 56 0 0 -
Bài giảng Lý thuyết xác suất và thống kê toán: Bài 1 - TS. Nguyễn Mạnh Thế
28 trang 48 0 0