Thực Hành Phân Tích Mô Hình Hồi Quy Binary Logistic (Kèm Ví Dụ)

Mô hình hồi quy Binary logistic là một trong những mô hình hồi quy phổ biến được dùng để ước lượng xác suất. Tuy nhiên, không phải ai cũng hiểu và thực hành thành thạo mô hình này.

Dưới đây, chúng tôi sẽ giới thiệu cho bạn về mô hình hồi quy Binary Logistic và hướng dẫn cụ thể các bước thực hiện để bạn dễ dàng hình dung và thao tác thông qua phần mềm SPSS.

1. Giới thiệu về mô hình hồi quy Binary logistic

Mô hình hồi quy Binary logistic (gọi đơn giản là hồi quy Logistic) là  một trong những mô hình phổ biến dùng trong nghiên cứu nhằm ước lượng xác suất của một sự việc sẽ xảy ra.

Giới thiệu về mô hình hồi quy Binary Logistic

Trong cuộc sống có rất nhiều hiện tượng tự nhiên xảy ra ở đủ các lĩnh vực kinh tế – xã hội, môi trường,…mà chúng ta cần ứng dụng vào mô hình hồi quy Binary Logistic để dự đoán như:

  • Đơn hàng này có được chấp nhận hay không?
  • Người mua hàng này có thích hay không?
  • Dự án này có được chấp thuận hay không?
  • Chỉ số môi trường ở đây có sạch hay không?

Đặc trưng của mô hình hồi quy Binary logistic:

  • Được cấu tạo bởi biến phụ thuộc và biến độc lập. Biến phụ thuộc là biến số chịu ảnh hưởng của một biến số khác trong mô hình kinh tế. Ngược lại, biến độc lập là biến số tác động tới biến số khác trong mô hình. Cụ thể ở đây là tác động tới biến phụ thuộc. Trong mô hình hồi quy, chỉ cần tách biệt được hai biến này, bạn sẽ rất dễ dàng để thực hiện các bước tiếp theo.
  • Biến phụ thuộc chỉ có hai giá trị: Biến phụ thuộc chỉ có hai giá trị là 0 và 1, do đó những biến nghiên cứu có hai trạng thái “có” hoặc “không”, “sạch” hay “không sạch” như ở trên đều được mã hoá thành giá trị 0 và 1. Nó được gọi là biến nhị phân.
  • Phân tích dựa trên ứng dụng phần mềm SPSS. Mô hình hồi quy này phải được thực hiện dựa trên phần mềm SPSS mới nhất. Nếu bạn thấy khó khăn trong quá trình thao tác với phần mềm, đọc ngay bài hướng dẫn chạy phần mềm spss mà Trung tâm để link bên dưới bài viết.

Dựa trên những đặc trưng về mô hình hồi quy Binary logistic mà chúng tôi phân tích ở trên, bạn cũng phần nào giải đáp được thắc mắc “Tại sao mô hình này lại được ưa chuộng như vậy”?.

2. Ví dụ mô hình hồi quy Binary Logistic

Bạn có thể sử dụng mô hình hồi quy Binary logistic để đánh giá xem liệu dự đoán ban đầu với các sự kiện xảy ra có đúng hay không.

Dưới đây là 3 ví dụ mà Trung tâm đưa ra cho bạn dễ hình dung mô hình này.

2.1. Dự đoán thành tích bài kiểm tra

Đề bài: Dự đoán thành tích bài kiểm tra Toán dựa trên thời gian ôn tập, mức độ lo lắng, và tần suất tham gia vào bài giảng.

Biến phụ thuộc: Là “thành tích thi” được đo trên thang đo nhị phân là “đạt” hay “không đạt”

3 biến độc lập: “thời gian ôn tập”, “mức độ lo lắng khi kiểm tra” và “tham dự bài giảng”.

2.2. Phân tích việc sử dụng ma tuý

Đề bài: Phân tích việc sử dụng ma tuý dựa trên các yếu tố liên quan: tiền án hình sự, bạn bè, thu nhập, tuổi và giới tính.

Biến phụ thuộc: Là “sử dụng ma tuý” được đo trên thang đo nhị phân là “có” hoặc “không”

5 biến độc lập: “tiền án hình sự”, “bạn bè”, “thu nhập”, “tuổi” và “giới tính”.

2.3. Dự đoán tỷ lệ mắc bệnh tim

Đề bài: Dự đoán tỷ lệ mắc bệnh tim dựa trên các chỉ số cơ thể như “tuổi”, “cân nặng”, “giới tính”, “VO2max”.

Biến phụ thuộc: Tỷ lệ mắc bệnh tim được đo trên thang đo nhị phân là “có” hoặc “không”.

4 biến độc lập: “độ tuổi”, “cân nặng”, “giới tính”, “VO2max”.

Với việc phân tích 3 ví dụ cụ thể trên, bạn cũng có thể phần nào hình dung được về mô hình hồi quy Binary Logistic và các biến cấu tạo của mô hình này, để ứng dụng nó phân tích các trường hợp của bạn.

3. Lưu ý khi thiết lập các biến

Việc phân tích mô hình hồi quy Logistic thành công hay không còn phụ thuộc rất nhiều vào việc phân tích và lựa chọn các biến. Dưới đây là một vài lưu ý khi thiết lập các biến trong mô hình Logistic bằng SPSS mà chúng tôi muốn gửi đến bạn:

  • Dùng thang đo nhị phân để đo lường các biến phụ thuộc. Nếu bạn sử dụng thang đo khác, thì các biến của bạn cũng phải thay đổi. Nhưng bạn cần nhớ rằng, nếu biến của bạn không đo lường trên thang đo nhị phân mà trên thang đo khác, bạn sẽ phải thay đổi hồi quy. Ví dụ như bạn sử dụng thang đo thứ tự thì hồi quy thứ tự sẽ là lựa chọn thích hợp hơn cho trường hợp này.
  • Có thể thiết lập một hoặc nhiều biến độc lập, có thể là biến liên tục hoặc biến phân loại.
  • Các biến quan sát là độc lập và biến phụ thuộc phải có các danh mục loại trừ lẫn nhau và đầy đủ.

Những lưu ý trên cũng là những giả định của mô hình hồi quy Logistic. Bạn có thể kiểm tra những giả định này thông qua việc sử dụng phần mềm thống kê SPSS.

Trong quá trình sử dụng phần mềm SPSS, nếu bạn gặp khó khăn không thể thao tác, hay muốn tìm kiếm một đơn vị trợ giúp, hãy lựa chọn dịch vụ nhận xử lý số liệu spss của chúng tôi. Với kinh nghiệm 15 năm phân tích hơn 10.000 bài SPSS chắc chắn sẽ mang lại kết quả khiến bạn hài lòng nhất.

4. “10 bước” thực hiện mô hình hồi quy Binary logistic

“10 bước” thực hiện mô hình hồi quy Binary Logistic

Ở đây, chúng tôi sẽ lấy luôn ví dụ về trường hợp “Dự đoán tỷ lệ mắc bệnh tim dựa trên các chỉ số cơ thể” được chỉ ra ở trên để tiến hành phân tích các bước cụ thể dựa trên mô hình hồi quy Binary Logistic cho bạn đọc dễ theo dõi.

Bước 1: Nội dung chính là gì?

Trước tiên, bạn vào biểu tượng Analyze => Regression => Binary Logistic trên màn hình chính, màn hình sẽ xuất hiện hộp thoại sau:

Sau khi Click vào, bạn sẽ thấy xuất hiện hộp thoại hồi quy Logistic như hình dưới đây:

Bước 2: Sắp xếp các biến

Bạn chuyển biến phụ thuộc Heart Disease vào hộp thoại Dependent, và chuyển các biến độc lập như Age, Weight, Gender và VO2max vào hộp thoại Covariates.

Bước 3: Mở hộp thoại Logistic Regression

Tiếp đến chọn thư mục Categorical, bạn sẽ thấy hộp thoại Logistic Regression: Define Categorical Variables như bảng hiển thị bên dưới:

Bước 4: Chuyển các biến vào hộp thoại lệnh

Chuyển biến độc lập như giới tính từ hộp thoại Covariates sang hộp thoại Categorical Covariates như bảng hiển thị dưới:

Bước 5: Tick chọn các thanh trạng thái

Trong mục Change Contrast, chuyển Reference Category từ Last sang First, sau đó nhấn nút Change như hướng dẫn bên dưới:

Bước 6: Nhấn nút Continue

Nhấn nút Continue, bạn sẽ thấy quay lại hộp thoại Logistic Regression.

Bước 7: Mở hộp thoại Logistic Regression

Tiếp theo nhấn nút Option… bạn sẽ thấy hiện ra hộp thoại Logistic Regression: Options như hình dưới:

Bước 8: Chọn mục Statistics and Plots và tick các lựa chọn

Trong mục Statistics and Plots, click vào các lựa chọn Classification plots, Hosmer-Lemeshow goodness-of-fit, Casewise listing of residuals, và Outliers outside.

Tiếp đến tại mục Display, nhấn chọn At last step. Sau khi click vào các lựa chọn, màn hình của bạn sẽ hiện ra giống như bên dưới.

Bước 9: Nhấn nút Continue

Tiếp tục nhấn nút Continue, màn hình sẽ quay về hộp thoại Logistic Regression

Bước 10: Hoàn thành lệnh

Nhấn nút Ok, đến đây lệnh sẽ được thực hiện.

Với 10 bước hướng dẫn phân tích mô hình hồi quy trên đây, chúng tôi khuyên bạn nên sử dụng phần mềm SPSS 26 mới nhất để việc phân tích và thực hiện lệnh diễn ra suôn sẻ và nhanh chóng.

Trên đây là hướng dẫn chi tiết 10 bước thực hiện mô hình hồi quy Binary Logistic bằng hình ảnh để các bạn dễ dàng thao tác ngay trên chính Laptop của bạn. Giờ đây, chúng tôi tin rằng bạn đã có thể tự mình thực hành phân tích mô hình này dựa trên những ví dụ và các bước mà Trung tâm hướng dẫn.

Nếu có bất kỳ khó khăn hay vướng mắc gì về cài đặt và sử dụng phần mềm SPSS, tham khảo ngay hướng dẫn cách chạy spss toàn tập mà Trung tâm cập nhật mới nhất tại đây nhé!