Science for Economics.

Ước lượng OLS và các kiểm định
Cover Image for Ước lượng OLS và các kiểm định
Nguyễn Hà My
Nguyễn Hà My
Ngày viết:
STATA

Phương pháp OLS (Ordinary Least Square) do nhà toán học Đức Carl Friedrich Gauss đưa ra. Mục đích của phương pháp này là tìm giá trị của các hệ số hồi quy sao cho khoảng cách giữa giá trị thực của quan sát với giá trị được dự đoán của nó là gần nhất.

1. Đơn vị đo trong ước lượng OLS

Khi biến độc lập và (hoặc) biến phụ thuộc thay đổi đơn vị đo sẽ ảnh hưởng tới giá trị ước lượng OLS. Ví dụ: Hồi quy bằng phương pháp OLS chiều cao của con theo chiều cao của cha bằng mô hình sau:

Yi^=Bo^+B1^X1\widehat{Y_{i}} = \widehat{B_{o}} + \widehat{B_{1}}*X_{1}

Thu được mô hình hồi quy:

Chieˆˋu cao con (cm)=150+0.1Chieˆˋu cao cha (cm)+e\text{Chiều cao con (cm)} = 150 + 0.1* \text{Chiều cao cha (cm)} + e

Nếu

Chiều cao của người cha chuyển từ cm sang m: β1^\widehat{\beta_1} tăng 100 lần

Chiều cao của người con chuyển từ cm sang m: β0^\widehat{\beta_0} β1^\widehat{\beta_1} giảm 100 lần

Mô hình
Biến phụ thuộc
Biến độc lập
Cách giải thích
Lin-lin
y
x
\triangle y = \beta_1
Lin-log
y
log(x)
\triangle y = \frac{\beta_1}{100}%\triangle
Log-lin
log(y)
x
%\triangle y = (100.\beta_1)\triangle x
Log-log
log(y)
log(x)

Ví dụ 1: Xem số liệu về "wage and education"

Wage: lương được đo bằng usd/giờ vào năm 1976 tại Mỹ

Educ: số năm học tại trường

Lin-lin

wage^=0.90+0.54edu\widehat{wage} = -0.90 + 0.54\textrm{edu}

Mỗi năm học tăng thêm được dự đoán làm tăng mức lương theo giờ là 0,54 USD

Log-lin

Log(wage)^=0.90+0.54edu\widehat{Log(wage)} = -0.90 + 0.54\text{edu}

Mỗi năm học tăng thêm sẽ làm tăng lương ở một mức % cố định. Trong ví dụ trên, với mỗi năm học tăng lên sẽ làm mức lương theo giờ tăng 54%.

Ví dụ 2: Xem số liệu về giá và lượng cầu của một hàng hoá .

Price: Giá (tính theo USD)

Demand: lượng cầu (đơn vị: nghìn chiếc)

Lin-log

Cách giải thích

Khi giá hàng hoá X tăng 1% thì lượng cầu của loại hàng này giảm 0.94 ngàn chiếc.

Log-log

Cách giải thích:

Khi giá hàng hoá X tăng 1% thì lượng cầu của hàng hoá này tăng 93,4%.


2. Các bước thực hiện mô hình hồi quy

Bước 1: Chuẩn bị mô hình về mặt lý thuyết

Bước 2: Chuẩn bị số liệu

Bước 3: Ước lượng mô hình

Bước 4: Chẩn đoán lỗi

3. Thực hành

Bài toán: Đánh giá các yếu tố ảnh hưởng GRDP tại một số tỉnh thành của Việt Nam

Giả thuyết:
H1H_1: Giá trị của chỉ số ICT có ảnh hưởng tích cực tới tổng thu nhập của tinh

H2H_2: Số dân của tỉnh có ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H3H_3: Lực lượng lao động của ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H4H_4: Số lượng trường THPT trong tỉnh có ảnh hưởng tích cực tới tổng thu nhập

Mô hình ước lượng lý thuyết

GRDP^=β0^+β1^ICT+β2^POP+β3^LABOR+β4^TER\widehat{GRDP} = \widehat{\beta_0} + \widehat{\beta_1}ICT + \widehat{\beta_2}POP + \widehat{\beta_3}LABOR + \widehat{\beta_4}TER

3.1 Thực hiện mô hình hồi quy tuyến tính

  • Nhập dữ liệu
1clear 
2cd "/Users/nguyenkien/Library/CloudStorage/OneDrive-SharedLibraries-SciEco/Ha My Nguyen - STATA/Basic STATA/Teaching/Buổi 8" 
3use cactinh.dta, clear //mo file chua data 
  • Chuẩn bị dữ liệu

Ở bước này, ta cần thực hiện các lệnh thống kê mô tả dữ liệu để kiểm tra các giá trị khuyết thiếu và giá trị ngoại lai

1summarize GRDP ICT POP LABOR TER 

Diễn giải kết quả hồi quy:

  • MSE: sai số bình phương bình quân
  • RMSE: căn bậc 2 của MSE, được sử dụng như tiêu chuẩn đo chất lượng của mô hình. RMSE càng nhỏ càng tốt
  • R-squared: Tỷ lệ của phương sai trong biến phụ thuộc có thể được giải thích bởi biến giải thích. Trong ví dụ này, 75.44% sự thay đổi trong GRDP có thể được giải thích bởi các biến độc lập.
  • Coef.: Hệ số hồi quy, cho thấy sự thay đổi trung bình trong biến phụ thuộc liên quan đến sự gia tăng trong biến giải thích như thế nào. Trong ví dụ này:
  • Hệ số hồi quy của ICT là 66920.14 cho thấy: Trong điều kiện các yếu tố khác không đổi, ICT tăng 1 đơn vị sẽ làm GDP của địa phương tăng 66,920 tỷ đồng. Tuy nhiên, do ICT là chỉ số với độ chia nhỏ nhất là 0.01 và tối đa là 1, nên kết quả hồi quy có thể được diễn giải là: Trong điều kiện các yếu tố khác không đổi, ICT tăng 0.01 đơn vị sẽ làm GDP của địa phương tăng trung bình 669 tỷ đồng
  • Hệ số hồi quy của POP là 53.09 cho thấy: Trong điều kiện các yếu tố khác không đổi, dân số của địa phương tăng 1 nghìn người sẽ khiến GDP của địa phương tăng trung bình 53.1 tỷ đồng

Các hệ số hồi quy còn lại diễn giải tương tự, tuy nhiên cần chú ý đến đơn vị của biến khi diễn giải hệ số hồi quy.


Các kiểm định

  • Kiểm định tính có ý nghĩa của hệ số hồi quy: Từ kết quả hồi quy, ta thấy giá trị p-value ( P>|t|) đều nhỏ hơn 0.05. Vì vậy, ta có thể kết luận rằng các hệ số hồi quy có ý nghĩa thống kê/ có mối quan hệ có ý nghĩa thống kê giữa các biến. Có 3 mức ý nghĩa phổ biến là 0.01 0.05 và 0.1
  • Kiểm định độ phù hợp cả mô hình: Ta thấy Prob > F: 0.000 <0.05 => Bác bỏ giả thuyết H0. Mô hình hồi quy là phù hợp

Comments:


    Nội dung khác.