Phương pháp OLS (Ordinary Least Square) do nhà toán học Đức Carl Friedrich Gauss đưa ra. Mục đích của phương pháp này là tìm giá trị của các hệ số hồi quy sao cho khoảng cách giữa giá trị thực của quan sát với giá trị được dự đoán của nó là gần nhất.
1. Đơn vị đo trong ước lượng OLS
Khi biến độc lập và (hoặc) biến phụ thuộc thay đổi đơn vị đo sẽ ảnh hưởng tới giá trị ước lượng OLS. Ví dụ: Hồi quy bằng phương pháp OLS chiều cao của con theo chiều cao của cha bằng mô hình sau:
Thu được mô hình hồi quy:
Nếu
Chiều cao của người cha chuyển từ cm sang m: tăng 100 lần
Chiều cao của người con chuyển từ cm sang m: và giảm 100 lần
Mô hình | Biến phụ thuộc | Biến độc lập | Cách giải thích |
Lin-lin | y | x | \triangle y = \beta_1 |
Lin-log | y | log(x) | \triangle y = \frac{\beta_1}{100}%\triangle |
Log-lin | log(y) | x | %\triangle y = (100.\beta_1)\triangle x |
Log-log | log(y) | log(x) |
Ví dụ 1: Xem số liệu về "wage and education"
Wage: lương được đo bằng usd/giờ vào năm 1976 tại Mỹ
Educ: số năm học tại trường
Lin-lin
Mỗi năm học tăng thêm được dự đoán làm tăng mức lương theo giờ là 0,54 USD
Log-lin
Mỗi năm học tăng thêm sẽ làm tăng lương ở một mức % cố định. Trong ví dụ trên, với mỗi năm học tăng lên sẽ làm mức lương theo giờ tăng 54%.
Ví dụ 2: Xem số liệu về giá và lượng cầu của một hàng hoá .
Price: Giá (tính theo USD)
Demand: lượng cầu (đơn vị: nghìn chiếc)
Lin-log
Cách giải thích
Khi giá hàng hoá X tăng 1% thì lượng cầu của loại hàng này giảm 0.94 ngàn chiếc.
Log-log
Cách giải thích:
Khi giá hàng hoá X tăng 1% thì lượng cầu của hàng hoá này tăng 93,4%.
2. Các bước thực hiện mô hình hồi quy
Bước 1: Chuẩn bị mô hình về mặt lý thuyết
Bước 2: Chuẩn bị số liệu
Bước 3: Ước lượng mô hình
Bước 4: Chẩn đoán lỗi
3. Thực hành
Bài toán: Đánh giá các yếu tố ảnh hưởng GRDP tại một số tỉnh thành của Việt Nam
Giả thuyết:
: Giá trị của chỉ số ICT có ảnh hưởng tích cực tới tổng thu nhập của tinh
: Số dân của tỉnh có ảnh hưởng tích cực tới tổng thu nhập của tỉnh
: Lực lượng lao động của ảnh hưởng tích cực tới tổng thu nhập của tỉnh
: Số lượng trường THPT trong tỉnh có ảnh hưởng tích cực tới tổng thu nhập
Mô hình ước lượng lý thuyết
3.1 Thực hiện mô hình hồi quy tuyến tính
- Nhập dữ liệu
1clear
2cd "/Users/nguyenkien/Library/CloudStorage/OneDrive-SharedLibraries-SciEco/Ha My Nguyen - STATA/Basic STATA/Teaching/Buổi 8"
3use cactinh.dta, clear //mo file chua data
- Chuẩn bị dữ liệu
Ở bước này, ta cần thực hiện các lệnh thống kê mô tả dữ liệu để kiểm tra các giá trị khuyết thiếu và giá trị ngoại lai
1summarize GRDP ICT POP LABOR TER
Diễn giải kết quả hồi quy:
- MSE: sai số bình phương bình quân
- RMSE: căn bậc 2 của MSE, được sử dụng như tiêu chuẩn đo chất lượng của mô hình. RMSE càng nhỏ càng tốt
- R-squared: Tỷ lệ của phương sai trong biến phụ thuộc có thể được giải thích bởi biến giải thích. Trong ví dụ này, 75.44% sự thay đổi trong GRDP có thể được giải thích bởi các biến độc lập.
- Coef.: Hệ số hồi quy, cho thấy sự thay đổi trung bình trong biến phụ thuộc liên quan đến sự gia tăng trong biến giải thích như thế nào. Trong ví dụ này:
- Hệ số hồi quy của ICT là 66920.14 cho thấy: Trong điều kiện các yếu tố khác không đổi, ICT tăng 1 đơn vị sẽ làm GDP của địa phương tăng 66,920 tỷ đồng. Tuy nhiên, do ICT là chỉ số với độ chia nhỏ nhất là 0.01 và tối đa là 1, nên kết quả hồi quy có thể được diễn giải là: Trong điều kiện các yếu tố khác không đổi, ICT tăng 0.01 đơn vị sẽ làm GDP của địa phương tăng trung bình 669 tỷ đồng
- Hệ số hồi quy của POP là 53.09 cho thấy: Trong điều kiện các yếu tố khác không đổi, dân số của địa phương tăng 1 nghìn người sẽ khiến GDP của địa phương tăng trung bình 53.1 tỷ đồng
Các hệ số hồi quy còn lại diễn giải tương tự, tuy nhiên cần chú ý đến đơn vị của biến khi diễn giải hệ số hồi quy.
Các kiểm định
- Kiểm định tính có ý nghĩa của hệ số hồi quy: Từ kết quả hồi quy, ta thấy giá trị p-value ( P>|t|) đều nhỏ hơn 0.05. Vì vậy, ta có thể kết luận rằng các hệ số hồi quy có ý nghĩa thống kê/ có mối quan hệ có ý nghĩa thống kê giữa các biến. Có 3 mức ý nghĩa phổ biến là 0.01 0.05 và 0.1
- Kiểm định độ phù hợp cả mô hình: Ta thấy Prob > F: 0.000 <0.05 => Bác bỏ giả thuyết H0. Mô hình hồi quy là phù hợp