
Bài giảng Ứng dụng mô hình hồi quy tuyến tính: Tiên lượng
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Bài giảng Ứng dụng mô hình hồi quy tuyến tính: Tiên lượng Tuan V. NguyenSenior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame AustraliaPhân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen Nội dung• Mô hình hồi qui tuyến tính đa biến• Ứng dụng 1: đánh giá mối liên quan (association / assessment)• Ứng dụng 2: hiệu chỉnh cho yếu tố nhiễu (adjustment)• Ứng dụng 3: mô hình tiên lượng (prediction) Xây dựng mô hình tiên lượng tỉ trọng mỡ• Để đo tỉ trọng mỡ (pcfat), cần phải có máy DXA (đắt tiền)• Có thể xây dựng một mô hình tiên lượng pcfat chỉ cần dùng các yếu tố thường qui (có thể thu thập từ bệnh nhân)• Các biến thuờng qui: giới tính (gender), chiều cao (height), cân nặng (weight), tỉ trọng cơ thể (bmi), tuổi (age)• Giải pháp: mô hình hồi qui tuyến tính Xây dựng mô hình tiên lượng tỉ trọng mỡ• Bước 1: Phân tích khai thác (exploratory analysis)• Bước 2: Tìm các biến liên quan (có giá trị thống kê)• Bước 3: Chia dữ liệu thành 2 nhóm: development và validation• Bước 4: Phát triển mô hình dựa vào biến bước 2 trên nhóm development• Bước 5: Kiểm tra mô hình ở bước 5 trên nhóm validation Bước 1: Phân tích mô tả / khai thác# Các biến có thể liên quandat = ob[, c(gender, weight, height, bmi, age, pcfat)]library(GGally)ggpairs(dat) Bước 2: Dùng BMA tìm biến liên quan> head(ob) id gender height weight bmi age WBBMC wbbmd fat lean pcfat1 1 F 150 49 21.8 53 1312 0.88 17802 28600 37.32 2 M 165 52 19.1 65 1309 0.84 8381 40229 16.83 3 F 157 57 23.1 64 1230 0.84 19221 36057 34.04 4 F 156 53 21.8 56 1171 0.80 17472 33094 33.8library(BMA)yvar = ob[, (pcfat)]xvars = ob[, c(gender, height, weight, bmi, age)]bma = bicreg(xvars, yvar, strict=FALSE, OR=20)summary(bma) Dùng BMA tìm mô hình tối ưu> summary(bma)3 models were selectedBest 3 models (cumulative posterior probability = 1 ): p!=0 EV SD model 1 model 2 model 3Intercept 100.0 5.26146 4.582901 7.958e+00 -7.928e-01 8.137e+00genderM 100.0 -11.25139 0.429659 -1.144e+01 -1.143e+01 -1.081e+01height 31.4 0.01759 0.028494 . 5.598e-02 .weight 39.2 0.03102 0.042611 7.921e-02 . .bmi 100.0 1.01265 0.111625 8.942e-01 1.089e+00 1.089e+00age 100.0 0.05259 0.008048 5.497e-02 5.473e-02 4.715e-02nVar 4 4 3r2 0.697 0.696 0.695BIC -1.423e+03 -1.423e+03 -1.422e+03post prob 0.392 0.314 0.294 Diễn giải kết quả BMA: p!=0> summary(bma)3 models were selectedBest 3 models (cumulative posterior probability = 1 ): p!=0 EV SD model 1 model 2 model 3Intercept 100.0 5.26146 4.582901 7.958e+00 -7.928e-01 8.137e+00genderM 100.0 -11.25139 0.429659 -1.144e+01 -1.143e+01 -1.081e+01height 31.4 0.01759 0.028494 . 5.598e-02 .weight 39.2 0.03102 0.042611 7.921e-02 . .bmi 100.0 1.01265 0.111625 8.942e-01 1.089e+00 1.089e+00age 100.0 0.05259 0.008048 5.497e-02 5.473e-02 4.715e-02 • Dùng 5 biến cung cấp (gender, height, weight, bmi và age) BMA tìm được 3 mô hình tối ưu. • p!=0 có nghĩa là xác suất biến số có ảnh hưởng. Vd: xác suất mà height có ảnh hưởng đến pcfat là 31.4%, weight là 39.2%, và age là 100% Bước 3: Chia dữ liệu thành 2 nhómChúng ta chia dữ liệu thành 2 nhóm: development (60%) và validation(40%) Tổng số cỡ mẫu (n = 1217) Development / Training Validation / Testing (n = 1217*0.6) (n = 1217*0.4) Xây dựng mô hình tiên lượng Kiểm tra mô hình tiên lượng Bước 3: Chia dữ liệu thành 2 nhóm Tổng số cỡ mẫu (n = 1217) Development / Training Validation / Testing (n = 1217*0.6) (n = 1217*0.4)Dùng phương pháp thủ công Dùng caret, hàm createDataPartitionro ...
Tìm kiếm theo từ khóa liên quan:
Ứng dụng mô hình hồi quy tuyến tính Mô hình hồi quy tuyến tính Hồi quy tuyến tính đa biến Dùng BMA tìm mô hình tối ưu Xây dựng mô hình tuyến tínhTài liệu có liên quan:
-
Đề cương chi tiết bài giảng Xác suất thống kê
100 trang 103 0 0 -
Giáo trình Xác suất thống kê: Phần 2 - PGS.TS Nguyễn Thị Dung
63 trang 35 0 0 -
Chương 5: Mô hình hồi quy tuyến tính
38 trang 32 0 0 -
Bài giảng Kinh tế lượng: Chương 3 - Lê Anh Đức
58 trang 30 0 0 -
6 trang 30 0 0
-
BÀI ÔN TẬP- PHƯƠNG PHÁP ĐỊNH LƯỢNG
15 trang 29 0 0 -
Bài giảng phần 3 Công cụ phân tích trong nghiên cứu - PGS.TS. Đinh Phi Hổ
150 trang 27 0 0 -
Nghiên cứu các yếu tố ảnh hưởng đến giá đất trên địa bàn thị xã Đông Triều, tỉnh Quảng Ninh
9 trang 26 0 0 -
12 trang 26 0 0
-
Phương pháp định lượng trong quản lý
228 trang 26 0 0 -
Bài giảng Kinh tế lượng - ĐH Quy Nhơn
131 trang 24 0 0 -
Nhận dạng các tham số biến đổi theo thời gian của hệ thống tuyến tính không dừng
7 trang 22 0 0 -
12 trang 22 0 0
-
Bài giảng Chuẩn đoán mô hình hồi quy - Lê Việt Phú
23 trang 22 0 0 -
Bài giảng Kinh tế lượng: Chương 3 - Nguyễn Thị Nhung (ĐH Thăng Long)
147 trang 21 0 0 -
Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính
14 trang 20 0 0 -
Bài giảng Hồi quy tuyến tính đơn - Đinh Công Khải
38 trang 20 0 0 -
Bài giảng về Kinh tế lượng: Chương 1
21 trang 20 0 0 -
12 trang 19 0 0
-
Bài giảng Kinh tế lượng: Chương 1 - Nguyễn Thị Thùy Trang
61 trang 19 0 0