Danh mục tài liệu

Xây dựng thuật toán hiệu quả cho định giá bất động sản quận Long Biên và tỉnh Montreal

Số trang: 7      Loại file: pdf      Dung lượng: 716.17 KB      Lượt xem: 14      Lượt tải: 0    
Xem trước 1 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

bài viết Xây dựng thuật toán hiệu quả cho định giá bất động sản quận Long Biên và tỉnh Montreal trình bày: Định giá bất động sản thường chỉ dựa vào khoảng vài chục thuộc tính và rõ ràng mối liên hệ giữa giá bất động sản và các thuộc tính này không phải tuyến tính (Król, 2015), nên chúng tôi phải sử dụng mô hình phi tuyến,... Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Xây dựng thuật toán hiệu quả cho định giá bất động sản quận Long Biên và tỉnh Montreal Vietnam J. Agri. Sci. 2016, Vol. 14, No. 9: 1441-1447<br /> <br /> Tạp chí KH Nông nghiệp Việt Nam 2016, tập 14, số 9: 1441-1447<br /> www.vnua.edu.vn<br /> <br /> XÂY DỰNG THUẬT TOÁN HIỆU QUẢ CHO ĐỊNH GIÁ BẤT ĐỘNG SẢN<br /> QUẬN LONG BIÊN VÀ TỈNH MONTREAL<br /> Nguyễn Hoàng Huy1*, Phạm Văn Toàn2, Hoàng Thị Thanh Giang1<br /> 1<br /> <br /> Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam<br /> 2<br /> Trường đại học Bách khoa Hà Nội<br /> Email*: nhhuy@vnua.edu.vn<br /> <br /> Ngày gửi bài: 04.12.2015<br /> <br /> Ngày chấp nhận: 12.07.2016<br /> TÓM TẮT<br /> <br /> Phương pháp LASSO (Hastie et al., 2015) chỉnh hóa các hệ số hồi quy tuyến tính bằng cách thêm vào tiêu<br /> chuẩn bình phương tối tiểu một đại lượng phạt chuẩn  1 . Gần đây, phương pháp này được sử dụng phổ biến để<br /> giải quyết các bài toán hồi quy số chiều cao trong các lĩnh vực thống kê, khai phá, học máy cho dữ liệu lớn. Trong<br /> bài báo này chúng tôi áp dụng phương pháp LASSO để chỉnh hóa các hệ số hồi quy phi tuyến cho bài toán định giá<br /> bất động sản. Định giá bất động sản thường chỉ dựa vào khoảng vài chục thuộc tính và rõ ràng mối liên hệ giữa giá<br /> bất động sản và các thuộc tính này không phải tuyến tính (Król, 2015), nên chúng tôi phải sử dụng mô hình phi<br /> tuyến. Khi đó số hệ số cần xác định trong mô hình này thường rất lớn, vì vậy chúng tôi áp dụng phương pháp<br /> LASSO để chỉnh hóa các hệ số này. Tuy nhiên phương pháp LASSO áp dụng như trên lại thường khá nhạy với tham<br /> số chỉnh hóa. Do đó chúng tôi đề xuất thuật toán kết tập hồi quy phi tuyến LASSO để cộng hưởng các hàm hồi quy<br /> LASSO yếu thành hàm hồi quy mạnh, có phương sai nhỏ hơn. Thuật toán này đã được đánh giá trên các tập dữ liệu<br /> giá bất động sản thu thập tại tỉnh Montreal, Canada (Noseworthy, 2014) và quận Long Biên, Hà Nội và cho kết quả<br /> chính xác hơn các thuật toán mới nhất đã được đưa ra.<br /> Từ khóa: Giá bất động sản, hồi quy phi tuyến, hồi quy tuyến tính, phương pháp LASSO, kết tập hồi quy phi<br /> tuyến LASSO.<br /> <br /> Building an Efficient Algorithm<br /> for Long Bien District and Montreal Real Estate Pricing<br /> ABSTRACT<br /> The LASSO method regularizes linear regression coefficients by adding a  1 norm penalty to the least square<br /> criterion. Recently, this method has been used very popularly to solve high dimensional regression problems in<br /> statistics, data mining, and machine learning for big data. In this paper, we applied the LASSO method to regularize<br /> nonlinear regression coefficients for the real estate pricing problem. Real estate pricing was often based on a few<br /> dozen features, and obviously the relationship between real estate prices and their features is nonlinear. Therefore in<br /> the present study we used a nonlinear model and applied LASSO method to regularize the coefficients. Because the<br /> performance of LASSO application is sensitive with regularization parameter, we proposed an aggregation of LASSO<br /> nonlinear regression combining weak LASSO regressions to produce a robust one which has smaller variance. This<br /> algorithm was evaluated on the real estate datasets collected in Montreal province, Canada (Noseworthy, 2014) and<br /> in Long Bien district of Hanoi and more accurate results than the state of the art algorithms were obtained.<br /> Keywords: Real estate prices, linear regression, nonlinear regression, LASSO method, aggregation of LASSO<br /> nonlinear regression.<br /> <br /> 1441<br /> <br /> Xây dựng thuật toán hiệu quả cho định giá bất động sản quận Long Biên và tỉnh Montreal<br /> <br /> 1. ĐẶT VẤN ĐỀ<br /> Mỗi người chúng ta thường sẽ thực hiện<br /> giao dịch bất động sản ít nhất một lần trong đời.<br /> Số tiền dành cho mua nhà là không nhỏ, vì vậy<br /> việc người mua quan tâm không chỉ ở việc lựa<br /> chọn được một ngôi nhà ưng ý mà còn xem giá<br /> cả có hợp lý hay không. Việc đánh giá giá trị của<br /> một bất động sản dĩ nhiên không phải là một<br /> việc dễ dàng. Để đánh giá chính xác giá của một<br /> căn nhà, người ta không chỉ đòi hỏi một sự hiểu<br /> biết chuyên môn về thị trường bất động sản<br /> (một thị trường rất biến động) mà còn đòi hỏi<br /> một sự hiểu biết thật sự tường tận về bản thân<br /> các thuộc tính của bất động sản đó (Mu et al.,<br /> 2014). Những kiến thức này thường chỉ được lưu<br /> trữbởi các đại lý kinh doanh bất động sản. Nếu<br /> chúng ta có thể nắm bắt kiến thức này bằng<br /> cách thu thập dữ liệu, sử dụng các dữ liệu mở,<br /> tận dụng sự giúp sức của các thuật toán, chương<br /> trình máy tính, các kiến thức này trở nên dễ<br /> tiếp cận hơn với các người dân bình thường, giúp<br /> đưa ra quyết định mà không cần dựa vào<br /> chuyên gia vì không may vị chuyên gia đó có thể<br /> tư vấn theo chiều hướng có lợi cho họ.<br /> Ước lượng giá bất động sản là một vấn đề<br /> hết sức quan trọng trong quy hoạch các thành<br /> phố lớn tại Việt Nam. Hiện nay, ở Việt nam<br /> chúng ta chủ yếu ước lượng giá bất động sản<br /> dựa trên các phương pháp truyền thống như<br /> phương pháp so sánh trực tiếp, chiết trừ, thu<br /> nhập, thặng dư, hệ số điều chỉnh. Các phương<br /> pháp này chủ yếu nhờ sự phân tích và can thiệp<br /> của nhân viên định giá nên rất khó tránh khỏi<br /> sai lầm do chủ quan hoặc không minh bạch<br /> (Quỳn ...