로지스틱 회귀를 통한 이진 건강 결과 예측에서 샘플링 설계 무시의 영향: 말라위 인구 통계 및 건강 조사의 증거
홈페이지홈페이지 > 블로그 > 로지스틱 회귀를 통한 이진 건강 결과 예측에서 샘플링 설계 무시의 영향: 말라위 인구 통계 및 건강 조사의 증거

로지스틱 회귀를 통한 이진 건강 결과 예측에서 샘플링 설계 무시의 영향: 말라위 인구 통계 및 건강 조사의 증거

Jan 23, 2024

BMC 공중 보건 23권, 기사 번호: 1674(2023) 이 기사 인용

1 알트메트릭

측정항목 세부정보

인구의 출생률과 사망률은 모든 국가의 사회 경제적 정책 계획에 있어 매우 중요한 통계 중 하나입니다. 5세 미만 영유아 사망률은 국민 건강을 모니터링하는 지표 중 하나이기 때문에 정기적이고 정확한 추정이 필요하다. 대중이 쉽게 이용할 수 있는 국가 인구통계 및 건강 조사 데이터는 관련 통계 방법을 사용하여 아프리카 인구의 대부분의 건강 관련 질문에 답하는 수단이 되었습니다. 그러나 이러한 응용 프로그램 중 다수는 분석을 지원하는 통계 도구의 가용성에도 불구하고 추정에서 설문 조사 설계 효과를 무시하는 경향이 있습니다. 5세 미만 사망률을 예측할 때 생성되는 부정확한 정보의 양에 대해서는 알려진 바가 거의 없습니다. 본 연구에서는 전국적인 조사자료를 이용하여 말라위의 5세 미만 영유아 사망률을 예측하기 위해 비가중 및 가중 로지스틱 회귀분석 방법을 적용할 때 발생하는 편향을 추정하고 비교합니다. 편향을 결정하기 위해 2004년, 2010년, 2015~16년 말라위 인구통계 및 건강 조사 데이터를 사용했습니다. 분석은 R 소프트웨어 버전 3.6.3 및 Stata 버전 12.0에서 수행되었습니다. 5세 미만 유아 사망률을 추정하기 위해 아동, 어머니, 가구에 관한 다양한 생물적, 사회인구학적 요인을 포함하는 로지스틱 회귀 모델을 사용했습니다. 그 결과 전국 5세 미만 영유아 사망률 예측의 정확성은 모델에 가중치를 적용했는지 여부에 관계없이 전체 예측 아동 사망 확률의 클러스터 가중치에 따라 결정되는 것으로 나타났습니다. 모델에 가중치를 적용하면 다양한 고정 효과 추정치에서 작은 양수 및 음수 변화가 발생하여 가중치 적용 결과가 사망 확률에 분산되었습니다. 결과적으로 가중모형을 사용하여 얻은 전체 예측사망률과 비가중모형을 사용하여 얻은 전체 예측사망률 간에는 차이가 없었다. 이진 상태 결과에 대한 전반적인 예측 확률을 계산하는 동안 설문 조사 클러스터 가중치를 고려하는 것이 좋습니다. 이는 모집단 매개변수 예측을 목표로 하는 모델 피팅 중 가중치에 대해 걱정하지 않고 수행할 수 있습니다.

동료 검토 보고서

0~59개월 어린이의 사망률은 국가 및 글로벌 보건 목표를 모니터링하는 데 유용한 지표입니다[1, 16, 32]. 따라서 5세 미만의 총 사망자 수를 추정하려면 정책 결정을 위한 정확한 근사치를 얻기 위해 강력하고 신뢰할 수 있는 기법이 필요합니다[13, 16]. 사하라 사막 이남 아프리카 국가의 의료 시설에서는 필수 시스템에 대한 등록이 약하고 사망을 과소보고하는 비율이 높은 것으로 보고되었습니다[23, 28, 55]. 이 지역의 5세 미만 영유아 사망률 추정은 대부분 인구통계 및 건강 조사(DHS) 데이터와 같은 국가 조사에서 수집된 정보를 기반으로 합니다[21, 22, 42, 46]. 이것이 정확한 추정을 위해 표본추출 가중치와 같은 조사 설계 기반 통계 분석의 사용이 필요한 이유이다[5, 19, 20, 40, 44, 53]. 표본 가중치는 표본에 대상이 포함될 확률의 역수입니다. 이는 각 표본 단위가 나타내는 모집단의 피험자 수를 나타냅니다. 회귀 분석 중에 피험자의 가중치는 조사 데이터에 적용되는 모델의 공변량의 함수로 도입되어 불평등한 표본 포함, 무응답 및 샘플링 프레임의 과소 적용 범위를 보상합니다. [7, 11 , 36, 42, 50, 57].

그러나 사하라 이남 아프리카 지역의 5세 이하 영유아 사망률을 추정하는 데 사용되는 대부분의 회귀분석 적용에서는 조사 설계 효과가 무시되고 있으며, 이로 인해 추정치와 예측이 편향될 가능성이 있습니다[18, 41, 43, 52]. 이 문제는 사망률과 별개로 이분법적 건강 결과를 분석한 다른 연구에서도 마찬가지인 것으로 밝혀졌습니다. 예를 들어, 환자의 기타 질병 중에서 당뇨병[48], 설사[33], 주혈흡충증[14, 31], 말라리아[29]의 유무. 이러한 추세는 이진 건강 데이터에 회귀 방법을 적용할 때 설문 조사 설계의 기술적 사용을 보여주는 연구의 가용성을 반영할 수 있습니다. 이는 검토된 연구의 대부분이 인구 집단에서 어떤 방식으로든 달성될 수 있는 신체 상태 자체의 정도를 예측하기보다는 관련 건강 결과의 위험 요소를 식별하는 것을 목표로 했다는 사실 때문일 수도 있습니다 [9, 17, 54]. 설계 효과를 고려하지 않고 대규모 전국 조사를 통해 전국 5세 미만 사망률이나 기타 이진 반응 건강 데이터를 예측할 경우 발생할 수 있는 편견에 대한 문헌이 부족합니다. 따라서 본 연구에서는 설문조사 가중 및 비가중 로지스틱 회귀 분석 방법을 사용하여 5세 미만 유아 사망률을 예측할 때 연구자가 범할 수 있는 편향을 추정합니다. 5세 미만 영유아 사망률 추정의 편향은 무작위 표본을 통해 추정한 사망률과 일상적인 관찰에서 보고된 실제 사망률 사이의 불일치입니다. 두 값 사이의 차이가 0이 될 것으로 예상할 수 있으며, 이 경우 조사 데이터에 적용된 추정치는 편향되지 않은 것으로 간주됩니다[39]. 본 연구에서는 2004년, 2010년, 2015~16년 말라위의 최근 세 가지 인구통계 및 건강 조사(DHS) 데이터 세트와 해당 DHS가 보고한 공식 5세 미만 유아 사망률을 사용하여 편향을 계산했습니다. 편향 추정에서 표본 크기 효과를 설명하기 위해 각 DHS 데이터 세트의 다양한 표본 크기가 사용됩니다.