국민건강보험공단 빅데이터를 활용한 장기요양 요구 발생 고위험군 선정 방안 연구
The identification of high-risk groups for long-term care insurance: A retrospective study using national health insurance service database
Article information
Trans Abstract
Purpose
This study aimed to identify high-risk groups for Long-Term Care Insurance (LTCI) in older people not approved for LTCI and to examine the characteristics of each high-risk group.
Methods
This study was a retrospective study using the National Health Insurance Service database and included 7,724,101 older A decision- tree model was used to predict the high-risk groups for LTCI. The dependent variable was defined as LTCI eligibility. As independent variables, 78 variables consisting of personal factors, environmental factors, health status, and physical and cognitive abilities were used.
Results
The prediction model to identify high-risk groups for LTCI was developed as the decision-tree model consisting of 19 end nodes with 10 risk factors. Eleven groups were identified as high-risk groups. The results showed the model could predict about 72% of the older people at high risk for LTCI needs using the NHIS database without the assessment of LTCI eligibility.
Conclusion
The findings might be useful for the development of evidence-based preventative services and can contribute to preemptively discovering those who need preventive services in older adults.
서 론
1. 연구의 필요성
우리나라는 2020년에 1차 베이비부머의 첫 세대인 1955년생이 노인인구로 진입하기 시작하면서 인구고령화가 가속화되어 2025년에 노인인구 비율이 20%가 넘는 초고령사회가 될 것으로 전망되고 있다. 특히, 의료와 돌봄의 필요가 증가하는 75세 이상 고령인구가 2030년에는 550만명, 2040년 909만명으로 2020년 348만명 대비 2배 이상 증가할 것으로 전망된다[1]. 일반적으로 노인은 노화됨에 따라 기능적 능력의 감소를 경험하며, 이로 인한 기능장애 및 장기요양 욕구 발생은 요양시설 입소, 공식 ․ 비공식 재가 서비스의 요구를 증가시키고, 노인 본인뿐만 아니라 비공식 돌봄제공자 및 보건의료 자원에 부담을 준다[2]. 이에 따라, 건강보험과 노인장기요양보험 지속가능성에 대한 우려의 목소리와 함께 초고령사회 대비 선제적 대응방안 마련의 필요성이 대두되고 있다.
그의 일환으로 노인의 장기요양 필요 발생의 선제적 예방이 중요하게 다루어지고 있다. 세계보건기구는 초고령사회에서 보건복지 정책의 지속가능성을 확보하기 위해서는 보건복지 정책의 실행 목표를 ‘건강노화(healthy ageing)’로 설정할 것을 제안하면서[3], 이를 실현하기 위해 일차의료 중심의 만성질환 이환 예방, 조기 진단 및 관리, 내재적 수용성 및 기능적 능력 감소에 따른 장기요양 필요 예방을 위한 연속적이고 통합적인 서비스 제공체계 마련의 필요성을 강조하였다[4]. 무엇보다 노인은 평균 1.9개의 만성질환을 갖고 있으며, 54.9%가 2개 이상의 만성질환에 복합이환되어 있어[5], 내재적 수용성(intrinsic capacity)이 감소한 상태인 노쇠, 근감소증, 낙상과 같은 노인성 증후군에 취약하며, 결국에는 기능장애 상태로 이행된다[6]. 따라서 질병 치료와 더불어 3차 예방을 목표로 노쇠와 기능장애를 예방할 수 있는 서비스 제공이 이루어져야 한다. 우리나라보다 먼저 장기요양 제도를 운영하고 있는 일본의 경우, 2006년부터 개호예방등급인 요지원등급(예방등급)을 신설하여, 요개호등급(장기요양 등급)으로 상태가 악화되는 것을 예방하기 위한 기능회복훈련, 주야간보호서비스 등 다양한 예방서비스를 제공하고 있다[7]. 덴마크의 경우, 장기요양 예방의 중요성과 자조(self-help)를 강조하면서 2015년부터 만 75세가 되는 노인을 대상으로 하는 예방적 가정 방문 서비스를 도입하여, 노인의 결핍과 욕구에 맞는 서비스 연계, 독립적 생활 및 건강관리를 위한 계획과 정보를 제공하고 있다[8]. 그러나 우리나라의 경우 국가 차원에서 노인을 대상으로 보편적 서비스로 운영되고 있는 예방서비스 제공체계는 부재한 실정이다. 정부는 노인돌봄기본서비스, 노인돌봄종합서비스, 무연고독거노인장례서비스, 독거노인사랑잇기서비스 등 노인돌봄서비스를 일괄 폐지하고 장기요양 예방서비스의 역할로서 노인맞춤돌봄서비스를 2020년에 새롭게 도입하였지만[9], 여전히 저소득 ․ 취약계층을 중심으로 서비스가 제공되고 있다.
제도의 지속가능성이 국가의 당면과제로 논해지고 있는 현 상황에서 새로운 예방서비스의 마련과 도입을 검토하기에 앞서 제한된 자원 상황에서 예방서비스의 효과를 극대화시키기 위한 예방서비스 목적과 정합성 높은 대상자를 발굴하는 기준 마련이 무엇보다 중요할 것이다. 그간 장기요양 예방서비스 필요 대상자 선정과 관련한 주제로 진행된 국내 연구들을 살펴보면, 지역사회통합돌봄서비스 대상자 선정을 위한 선별 기준을 개발한 연구[10], 노인맞춤돌봄서비스를 개발하면서 서비스 필요 대상자를 선별하기 위해 선별도구를 개발한 연구[9], 장기요양 등급 판정자를 대상으로 등급판정 전 10년간의 복합만성질환 수의 궤적을 살펴봄으로써, 복합만성질환수의 변동을 활용하여 장기요양 진입 전 예방 대상자 선정을 제안한 연구가 있었다[11]. 그러나 선행연구[9,10]가 제안한 선별도구는 서비스 제공 현장(기관 또는 지자체)에서 서비스 연계가 필요한 대상자를 선별하기 위한 목적으로 개발된 도구이기 때문에 장기요양 요구(need) 발생 고위험군을 선별하는 기준과는 거리가 있다. 노인맞춤돌봄서비스 대상자 또한 여전히 저소득층, 독거노인 등과 같이 기존의 사회복지 대상자 선정기준을 그대로 따르고 있어, 보편적인 예방서비스 제공 대상자 선정에 해당 도구를 활용하는 데는 한계가 있다. 장기요양 등급판정자를 대상으로 하는 연구는 장기요양 필요를 일으키는 다양한 요인 중 복합만성질환 개수만을 활용하였다는 점에서 한계를 갖는다[11]. 단순히 노인장기요양보험 등급외자 기준을 활용하여 예방서비스 대상으로 선정할 경우, 현재와 같이 예방서비스가 충분하게 제공되지 못할 경우 재신청을 통해 장기요양 인정등급으로 진입하려는 경향이 발생할 가능성이 있다. 따라서 보편적 관점에서 장기요양 예방서비스를 제공하기 위한 대상자 발굴 기준을 마련할 필요가 있다.
2. 연구목적
본 연구는 국민건강보험공단의 건강보험, 건강검진, 노인장기요양보험 등의 정보를 활용하여 장기요양 요구 발생을 예측하는 모형을 개발하고, 이를 통해 장기요양 요구 발생 고위험군을 발굴하며, 도출된 고위험군의 특성을 고려하여 장기요양 서비스 요구를 예방하기 위한 방안을 제언하고자 한다. 본 연구의 구체적 목적은 다음과 같다.
• 2020년도 기준 만 65세 이상 노인인 연구대상자의 일반적 특성을 살펴본다.
• 장기요양 요구 발생을 예측하는 모형을 개발하고, 예측요인을 규명한다.
• 예측모형을 통해 장기요양 요구 발생 가능성이 높은 고위험군을 발굴하고, 고위험군별 특성을 살펴본다.
연구방법
Ethics statement: This study was approved by the Institutional Review Board of National Health Insurance Corporation (Yeon- 2021-HR-01-0006). Obtaining informed consent was exempted by the IRB because this study was secondary data analysis of existing data.
1. 연구설계
본 연구는 만 65세 이상 노인을 대상으로 국민건강보험공단에 집적된 국민건강정보 데이터베이스(Database, DB)를 활용하여, 장기요양 요구 발생 가능성이 높은 고위험군을 발굴하고, 예측요인을 통해 고위험군 특성을 규명하는 후향적 연구(retrospective study)이다.
2. 연구대상 및 분석자료
연구대상자는 2020년도를 기준으로 선정되었으며, 동시에 연구대상자의 사건발생 여부(종속변수)를 정의하였다. 연구대상자는 통상적으로 노인을 정의하는 연령 기준을 준용하여 2020년도 기준 만 65세 이상 고령자로 정의하였다. 단, 모든 연구대상자는 동일한 기준에서 종속변수를 관측할 수 있도록 이미 장기요양 요구가 발생되었다고 판단되는 자는 제외하였다. 즉, (1) 이미 노인장기요양보험의 수급권이 인정된 경우(장기요양 인정등급을 받은 경우), (2) 2020년도 이전부터 요양병원 입원 상태가 지속되어, 이미 돌봄 필요가 발생되었다고 판단되는 경우, (3) 목표변수를 정의하는 기간 이전에 사망한 경우에 해당되는 자는 연구대상자에서 제외하였다. 이와 더불어 필수 자격 정보(가입유형, 거주 지역, 가구원수)가 누락된 경우는 추가로 연구대상에서 제외하여, 최종 연구대상자는 총 7,724,101명이 선정되었다.
장기요양 요구 발생 고위험군의 특성을 규명하기 위해 연구대상자의 사건발생 여부가 정의되는 시점(사건이 발생하는 시점)을 기준으로 과거 3년 동안의 자격, 건강검진, 급여내역 정보를 수집하였다. 이때, 3년 동안의 정보는 1, 2, 3년 구간을 설정하고 각 구간 내의 월별 집적된 정보를 연간 정보로 요약(aggregated)하여 변환한 것을 일컫는다. 예를 들어, 2020년 5월 1일에 장기요양 필요가 발생(y=1)하였다고 정의된 경우, 장기요양 필요 발생 직전 1년 구간은 2019.5.1.~2020.4.30.이며, 직전 2년 구간은 2018.5.1.~2019.4.30., 직전 3년 구간은 2017.5.1.~2018.4.30.으로 설정되고, 각 기간 동안의 월별 정보를 요약하였다. 이에 따라 모든 연구대상자의 사건발생 시점은 2020년도 내에서 상이할지라도 자료를 관측하는 기간은 동일하게 설정되었다.
3. 분석변수
1) 종속변수
장기요양 예방이 필요한 사람을 장기요양 요구가 발생할 가능성이 높은 대상자로 정의하는 것은 합리적이다. 여기서 요구는 개인이 특정 서비스가 필요하다고 인식하는 욕구(want; felt need)와 다르게 전문가에 의해 객관적으로 평가되어 개인의 특정 서비스에 대한 필요성이 인정되는 경우를 의미한다[12]. 사회제도 내에서 욕구는 규범적 측면에서 정의될 수 있으므로[13], 장기요양 등급판정 절차라는 객관적이고 전문적인 평가기전 하에서 개인의 장기요양 욕구가 인정되는 요구 발생인 장기요양수급 인정을 종속변수로 정의하였다.
즉, 국민건강정보 중 노인장기요양보험 DB를 통해 2020년도에 장기요양 인정등급을 판정받은 경우를 사건발생(y=1)으로 정의하며, 만일 2020년 12월 31일까지 어떠한 사건(장기요양 인정등급 판정 또는 사망)도 발생하지 않은 경우 사건미발생(y=0)으로 정의하였다. 이러한 과정을 통해 연구대상자 7,724,101명 중 4.5%만이 2020년도에 장기요양 인정등급을 판정받은 것으로 관측되었다.
2) 독립변수
성공적 노화 개념모델, 노쇠 증상의 특성화 개념, 장애노인 모델을 기반으로 개발한 개념적 틀[14]에 근거하여 선행연구를 고찰하고 국민건강정보 상의 존재여부를 검토한 후, 독립변수를 선정하고 조작적 정의(범주설정 등)를 마련하였다. 그리고 이를 기준으로 국민건강정보 상에서 독립변수를 수집하였다.
이때, 개인적 요소(성별 등), 환경적 요소(거주 지역 등)와 같이 시간의 흐름에 변화가 적으며, 장기요양 요구 발생 직전의 정보가 중요한 독립변수의 경우에는 요구 발생 전 1년 구간의 정보만을 활용하였으며, 노인성질환 이환여부, 수술여부, 입원여부와 같은 건강상태를 반영하는 의료이용정보의 경우는 3년 동안의 구간을 모두 활용할 수 있도록 재범주화 또는 평균이나 합계 방식으로 독립변수를 가공하였다. 특히, 기술통계량을 확인하였을 때, 자료의 결측이 전체의 40.0% 이상인 독립변수의 경우, 비슷한 의미를 갖는 변수로 변환하거나 제외하였다. 예를 들어, 건겅검진을 통해 산출되는 정보(예: 신체계측, 생활습관, 혈액검사 등)는 제외하고 대신 건강관리를 하고 있음을 나타내는 ‘건강검진 여부’ 변수를 생성하였다.
가공된 독립변수가 실질적으로 모형 개발에 활용될 가치가 있는지를 평가하기 위하여 종속변수와의 단변량 분석을 실시하여 유의성을 검토하였고, 독립변수 간 상관성으로 인한 편의된(biased) 모형 개발을 방지하고자 분산팽창인자(Variance Inflation Factors, VIF)를 통해 다중공선성을 평가하였다. 일련의 과정을 거쳐 개인적 요소인 인구사회학적 특성 8개, 환경적 요소 중 사회적 환경 1개, 물리적 환경 8개, 건강상태 중 건강수준 9개, 건강행태 1개, 의료경험 49개, 신체적 ․ 인지적 능력 1개, 총 78개의 독립변수를 모형 개발에 활용하였다(Table 1).
4. 분석방법
장기요양 요구 발생 가능성이 높은 대상자를 발굴하기 위해서는 모형을 통해 추정되는 사후(예측)확률이 필요하다. 또한, 정책에 활용하기 위해서는 모형으로부터 도출된 결과의 해석이 가능해야 한다. 이러한 점을 고려하여, 이분형 종속변수를 예측하는데 활용되는 통계분석방법 중 분석결과에 대한 설명이 용이하여 장기요양 업무 현장에 많이 활용되고 있는 의사결정나무를 예측모형 개발을 위한 방법론으로 선정하였다. 의사결정나무모형 적합 시 이지분리를 원칙으로 엔트로피를 이용하여 독립변수를 선정하고, 향상도를 통해 과적합 여부를 판단하도록 하였다. 또한, 분석을 통해 도출된 노드규칙 정보를 기반으로 연구자의 판단과 전문가의 의견을 수렴하여 각 노드의 변경 또는 가지치기를 수행하였다.
일반적으로 예측모형 개발을 위해서는 모형 적합과 더불어 타당성 검증을 수행하여야 한다. 본 연구에서는 모형 적합과 내적 타당성 검증을 위하여, 분할표본 검증(split-sample validation)을 수행하였다. 즉, 전체 자료를 훈련 자료(60%; n=4,634,460), 검증 자료(20%; n=1,544,821), 시험 자료(20%; n=1,544,820)로 분할하여, 훈련 및 검증 자료를 통해 예측모형을 개발하고, 시험자료를 통해 예측모형의 내적 타당성 및 성능을 평가하고자 하였다. 또한, 예측모형의 실제 적용 가능성(applicability)을 확인하기 위한 외적 타당성 검증을 수행하였다. 이를 위하여, 동일한 분석자료 구축 절차에 따라, 2021년 6월 1일 기준으로 연구대상자와 결과변수를 정의한 독립된 새로운 자료를 구축하였다.
전술한 과정에서 모형의 성능을 평가하기 위하여, 판별력을 평가하는 통계량을 활용하였다. 여기서 판별력은 모형을 통해 예측된 확률이 실제 사건여부를 얼마나 잘 판별 또는 분류하는지를 나타낸 것으로, 판별력을 측정하는 통계량은 전체 예측확률을 고려하는 예측력(Area Under the Curve, AUC)과 특정 절단점(cut-point)에 근거한 분할표를 통해 산출되는 정확도, 민감도(재현율), 양성예측율(정밀도), 특이도를 이용하였다. 이때, 특정 절단점은 향후 예측모형의 활용성(장기요양 요구 발생 고위험자 발굴) 측면에서 연구자의 판단 하에 모집단의 분포(4.5%) 대비 2배 이상 확률이 높으면서 민감도의 성능이 가장 높은 기준을 적용하였다. 이는 본 연구자료의 경우 사건미발생이 전체의 약 95%를 차지하여, 일정 이상의 정확도와 특이도, 예측력을 확보할 수 있다는 특성을 가지기 때문이다.
본 연구의 모든 통계분석은 SAS (version 9.4, SAS Institute, Inc., Cary, NC, USA)와 SAS E-Miner (version 14.1, SAS Institute, Inc., Cary, NC, USA)를 이용하였다.
5. 윤리적 고려
본 연구는 저자가 소속된 기관의 생명윤리위원회로부터 심의면제 승인을 받은 후 진행하였다. 본 연구는 국민건강보험공단의 데이터베이스 원시자료 중 개인 식별이 불가능하며 대외 연구자에게 공개되는 범위에 한한 정보만을 제공받아 활용하였으며, 연구의 목적에 한해서만 사용하였다.
연구결과
1. 연구대상자의 사건발생 여부에 따른 독립변수 분포
본 연구대상자의 특성에 해당하는 독립변수의 사건발생 여부별 분포는 다음과 같다. 개인적 요소의 경우, 사건미발생 집단에 비해 사건발생 집단에서 여자(71.5%), 낮은 소득수준(0, 1분위: 24.4%)이 많고, 근로활동을 하는 비율은 5.2%p 낮았으며, 연령은 사건발생 집단이 평균 82.5세로 높게 나타났다. 사건발생 집단에서 직장가입자의 비율은 14.0%p 감소, 반면 의료급여 세대주(13.9%)와 산정특례대상자(18.9%)의 비율은 약 9.0%p 증가하였다. 또한 장애를 가진 경우가 많으며(△20.0%p), 심한 주장애등급을 갖는 비율이 8.3%p 높은 것으로 나타났다. 환경적 요소는 사건발생 집단에서 1인 가구 비율이 11.3%p 높았으며, 농어촌의 비율도 5.4%p 높게 나타났다. 사건발생 집단에 속한 대상자가 거주하는 지역의 재정자립도(45.3±17.3%)와 사회복지예산(34.0±7.2%)의 비중이 작았다. 의료기관수와 방문간호기관 수는 비교적 적었으며, 요양시설, 방문요양, 주야간보호, 복지용구기관 수는 비교적 많았으나, 평균 약 4개 미만으로 큰 차이는 발생하지 않았다. 건강상태 중 건강수준은 사건발생 집단에서 뇌졸중, 치매, 고혈압, 당뇨병에 대해 높은 이환율을 보이며, 암은 직전 1년 동안의 질환이환(9.7%), 관절염과 골절, 탈골 및 사고후유증은 직전 질환이환(54.8%; 35.2%)과 3년 내내 질환이환(35.4%; 10.5%)의 비율이 높게 나타났다. 최근 3년 동안의 연평균 다중질환(5.5±2.4개)과 연평균 찰슨동반질환지수(3.0±2.1점)도 동일하게 사건발생 집단에서 높았다(△1.5개; △1.0점). 건강행태에서 사건발생 집단의 건강검진 수검율은 미발생 집단의 절반수준인 36.2%로 나타났다. 의료경험의 의료이용 여부는 사건발생 집단에서 3년 내내 의료를 이용한 비율이 높았으며(94.9%), 의료이용일수 또한 평균 75.5일로 많았다. 고혈압, 고지혈증, 시각장애, 청각장애, 배뇨장애를 제외한 모든 수술에서 사건발생 집단의 비율이 높았으며, 시각장애, 청각장애, 배뇨장애를 제외한 모든 입원에서 역시 사건발생 집단의 비율이 높게 나타났다. 연평균 복용약물수의 경우 사건발생 집단에서 평균 5.3개로 높았고, 노쇠율도 사건발생 집단에서 8.1%로 높게 나타났다(표로 제시하지 않음).
2. 장기요양 요구 발생 예측모형 및 예측요인
훈련 자료와 검증 자료를 활용하여 의사결정나무 방법을 적용한 결과, 의사결정나무모형은 총 10개의 위험요인으로 이지 분리된 19개의 끝마디로 형성되었다. 전술한대로 본 모형의 활용을 위한 절단점 선정을 위해 1.0~33.9%까지 절단점별 성능을 분석한 결과, 모집단 분포의 2배인 9.0% 에서 특이도와 정확도가 약 92%이며 그 이후 약 1% 정도의 완만한 상승이 나타난 반면, 민감도의 경우 약 11.5%까지 약 72% 이상의 유사한 성능을 보이다 그 이후 급격히 감소하는 양상으로 나타났다. 이에 절단점을 11.5%(모집단의 사건발생 비율 대비 약 2.6배 사건발생 가능성이 높아짐을 의미)로 선택하였다.
예측모형의 성능을 살펴보면(Table 2), 88.2%의 높은 예측력을 가지며 절단점 11.5%를 적용하였을 때, 약 92%의 정확도와 특이도, 약 72%의 민감도로 좋은 성능을 보이는 것으로 나타났다. 시험 자료를 통해 내적 타당성을 검증한 결과, 오히려 예측력이 0.2%p 상승하였으며 정확도, 민감도, 양성예측율, 특이도는 모두 0.1%p 미만으로 증가하는 양상을 보여, 안정적으로 성능이 유지되는 것을 확인할 수 있었다. 향후 활용성을 고려치 않고 통계적 측면에서 최적의 절단점을 찾는 Youden 방법을 적용한 결과와 비교해보면, 민감도는 6.3%p 감소하였으나 정확도와 특이도가 약 3%p 증가하는 절충된 양상을 보여, 정책적 활용성을 고려한 11.5%의 절단점을 활용하는 것에 큰 문제가 없는 것으로 나타났다.
예측모형과 절단점이 실제 자료에 적용 가능한지 탐색하기 위하여 외적 타당성(external validation) 검증을 수행할 필요가 있다. 이를 위하여, 총 8,080,796명(2021년 6월 1일 기준)의 외적 검증 자료를 구축하였다. 이 중 장기요양 요구가 발생한 자는 총 196,868명(2.4%)으로 나타났다. 이를 토대로 의사결정나무모형을 적용한 결과(Table 3), 민감도는 약 3%p 감소가 이루어지기는 하였지만 여전히 80% 이상의 높은 예측력과 약 93%의 높은 정확도, 특이도를 보이는 것으로 나타났다. 물론 사건미발생의 비율이 더 증가하였기 때문에 결과에 영향을 미칠 수 있지만, 여전히 적정한(moderate) 수준의 민감도를 보이고 있어 실제 자료의 적용 가능성이 존재함을 확인할 수 있었다.
궁극적으로 예측모형인 의사결정나무모형에는 총 10개의 위험요인이 채택되었다(Figure 1). 노인에게 있어 장기요양 요구 발생을 야기하는 가장 영향력 있는 위험요인으로는 연령이 선정되었으며, 특히, 80세가 주요 분리 기준이 되었다. 연령과 치매 유무의 연계 조합에 따라 장기요양 요구 발생비율이 확연하게 나뉘는 것으로 나타났다. 명백한 80세 미만이며 최근 3년간 치매가 없다고 판단되는 노인(사건발생 0.8%)과 80세 이상이며 적어도 직전 1년 동안 치매가 있다고 판단되는 노인(사건발생 51.5%)을 제외한 나머지 노인에서는 건강에 관심을 갖고 지속적으로 관리가 이루어지는지 및 그러한 행위가 가능한 건강 ․ 기능상태 임을 간접적으로 나타내는 최근 3년 내 국가가 제공하는 건강검진의 수검 이력이 없는 경우, 신체 내 ․ 외부 및 정신장애인, 최근 3년 동안 입원을 한 번이라도 한 경우 장기요양 요구 발생을 야기하는 것으로 나타났다. 또한, 최근 3년 동안 골절이나 탈골, 사고 후유증으로 입원하였거나, 골절이나 녹내장/백내장이 아닌 뇌졸중과 같은 타 사유로 입원한 신체 내 ․ 외부 및 정신 장애인인 경우, 고연령 노인이면서 골절 ․ 탈골 및 사고후유증 등의 사유로 입원을 한 경험이 있거나 녹내장/백내장이 아닌 뇌졸중과 같은 타 사유로 입원을 한 경우도 장기요양 요구 발생을 높이는 위험요인이자 조건으로 나타났다. 이 외 92세 이상의 고연령이거나 입원을 할 정도의 심각한 건강문제는 없었으나 최근 3년 동안 복용한 연평균 약물수가 평균 5.8개 이상으로 많은 경우, 장기요양 요구 발생을 야기하는 것으로 나타났다.
3. 예측모형에 따른 장기요양 요구 발생 고위험군
예측모형을 통한 고위험군은 절단점 11.5%보다 높은 예측 비율을 갖는 집단으로 정의하였으며, 총 11개의 집단이 분류되었다(Table 4). 고위험군의 특성을 살펴보면, 사건발생 비율이 가장 높은 1집단(51.5%)은 고령이면서, 3년 동안 치매가 모두 있었거나 직전 1년 동안 치매가 있었던 노인이었다. 2집단(33.9%)의 경우, 연령은 상대적으로 낮으나 치매가 3년 동안 모두 있었거나 직전 1년 동안 있었으며, 최근 3년 사이에 건강검진을 한 번도 받지 않았던 노인으로 나타났다. 그 다음 3집단(26.2%)의 경우에는 치매가 없다고 간주되는 87~91세 노인 중 최근 3년 간 한 번이라도 입원한 경험이 있고, 3년 동안 골절 ․ 탈골 및 사고 후유증이 지속적으로 있었거나, 직전 1년 동안 골절 ․ 탈골 및 사고 후유증이 있는 노인이며, 4집단은 1집단에서 분류되지 않은, 고령이나 치매가 3년 동안 계속 없었거나 직전 1년 동안 없었던 노인 중에서 더욱 고령에 해당되는 92세 이상인 경우로, 장기요양 진입발생 비율이 24.1%로 나타났다. 5집단(23.1%)은 만 65~74세이면서 적어도 직전 1년 동안 치매를 앓고 있으나 최근 3년간 한번이라도 건강검진을 한 장애 노인이었으며, 6집단(21.7%)은 75~79세이면서, 3년 동안 치매가 계속 있었거나 직전 1년 동안 치매가 있었으나, 최근 3년간 한 번이라도 건강검진을 한 노인으로 나타났다. 7집단은 3집단 외 대상자 중 최근 3년간 시각장애(녹내장/백내장) 입원이 없는 대상자로 사건발생 비율이 18.8%를 나타내며, 8집단(14.8%)은 치매가 없었다고 간주되는 80~86세 노인 중 최근 3년간 한 번이라도 입원을 한 적이 있으나, 골절 ․ 탈골 및 사고 후유증과 시각장애로 인한 입원은 아닌 신체 내 ․ 외부 장애 노인이었다. 9집단(14.2%)은 4집단으로 분류되지 않은 87~91세 사이의 노인으로 최근 3년간 한 번도 입원한 적은 없으나 최근 3년 동안 연평균 약물을 5.8개 이상 복용하는 것으로 나타났다. 10집단의 경우는 앞서 언급한 5집단 외로 분류된 대상 중 최근 3년간 한 번이라도 입원을 했던 노인으로 사건발생 비율이 13.5%로 나타났고, 11집단(12.7%)은 1집단에서 분류되지 않은 노인 중 최근 3년간 입원을 한 적이 있으며, 골절 ․ 탈골 및 사고 후유증으로 인한 입원을 경험한 것으로 나타났다. 요약하면, 1, 2, 5, 6, 10집단은 기본적으로 연령과 치매에 따른 특성을 가지고 있으며, 더불어 건강검진 수검여부, 장애, 입원여부가 부수적인 세부 특성으로 나타났다. 그 외 집단은 치매가 없는 고령 노인으로 노화 또는 입원을 야기할 정도의 건강악화에 의해 연쇄적으로 발생한 기능악화의 특성을 갖는다.
논 의
본 연구는 2025년 초고령사회 진입을 앞두고 국민건강보험공단의 빅데이터를 활용하여 장기요양 예방서비스 필요 대상자 선정을 위한 기초자료를 생산하기 위하여 수행되었다. 이를 위해, 본 연구에서는 장기요양 요구 발생 가능성이 높은 고위험군을 잘 예측할 수 있는 의사결정나무모형을 개발하고자 하였으며, 절단점을 활용하여 정의된 고위험군의 위험요인에 따라 장기요양 예방서비스 제공을 위한 고위험군을 특성화하고자 하였다.
이에 본 연구에서 장기요양 요구 발생 예측모형은 10개의 위험요인에 따라 19개의 끝마디를 갖는 의사결정나무모형을 제안되었다. 본 예측모형은 약 92%의 높은 정확도와 특이도, 88.2%의 예측력을 보였고, 무엇보다 모집단 대비 미미한 사건발생 대상자 중 71.7%를 예측하는 것으로 나타났으며, 외적 검증 결과에서도 사건발생 대상자(2.4%)의 68.8%를 안정적으로 예측하였다. 이는 본 연구가 제안한 예측모형을 통해 모집단에서 굉장히 작은 비중을 차지하는 장기요양 요구 발생자의 약 69%를 예측할 수 있음을 의미한다.
본 연구는 예측모형 제시와 더불어 예측모형을 통해서 발굴된 10개의 위험요인과 기준점 11.5%를 적용하여 11개의 고위험군을 도출하였다. 고위험군의 특성을 요약하면, 노인에게 있어 장기요양 요구, 즉 장기요양 서비스 필요를 야기하는 가장 영향력 있는 예측요인은 연령과 치매유무이며, 이와 더불어 건강에 관심을 갖고 지속적으로 관리가 이루어지는지와 그러한 행위가 가능한 건강 ․ 기능상태 임을 나타내는 건강검진 수검 여부, 위중한 건강문제 발생을 의미하는 입원 여부, 노인의 기능저하(운동 ․ 관절제한)에 밀접한 영향을 미치는 관절염과 골절 ․ 탈골 및 사고 후유증 여부 및 이러한 상태의 중함을 내포하는 골절 ․ 탈골 및 사고 후유증으로 인한 입원 여부, 노인에게서 많이 발생하여 단순 입원치료를 유발하는 녹내장/백내장에 따른 입원을 제외한 건강상태 악화 및 기능저하를 유발할 수 있는 뇌졸중 ․ 파킨슨 등의 중한 질환에 따른 입원 여부, 반신마비 ․ 언어장애 ․ 운동실조 심하면 사망에까지 이르게 하는 뇌졸중 여부, 복합만성질환을 보유하고 있음을 내포하는 연평균 복용약물수, 그리고 장애 유무가 위험요인으로 작용하였다. 해당 예측요인은 기존 요양원(nursing home) 입소의 예측요인에 대한 체계적 문헌고찰[15]을 통해 도출된 요인(연령 증가, 기능과 인지의 손상, 치매, 높은 처방횟수)과도 유사하다. 이 중 치매, 건강악화(특히, 중한 상태를 의미하는 입원발생), 골절 ․ 탈골 및 사고 후유증이 가장 눈에 띄며, 불가항력적이지 않고 정책적 개입이 가능한 특성으로 꼽힌다.
최근 정부는 노인의 자립적인 지역사회 거주를 실현가능토록 지역사회통합돌봄 체계 마련[16], 재활, 재택의료, 가정간호와 같은 서비스 개발 및 활성화 사업의 추진[17,18]과 함께 일차 의료 또는 보건소 방문건강관리 사업을 활용한 노인의 노쇠 및 기능장애 발생을 예방하기 위한 다양한 방안을 모색하고 있다[19,20]. 그러나 각 사업의 서비스 대상자 선정에 공통의 기준을 활용하지 않고 별도의 기준을 활용하여 대상자 중복과 사각지대가 발생하는 등 자원이 비효율적으로 운영되고[21,22], 사업 대상자를 특정하기 어려워 사업 진행에 어려움을 겪는 등의 문제점이 지적되었다[16,23]. 향후 예방 정책 실행모형의 실효성을 담보하기 위해서는 예방 정책의 대상자를 명확히 하고 통일된 기준을 활용하며, 서비스 제공 단에 서비스 필요 대상자를 특정할 수 있는 정보가 제공되어야 한다. 이를 정의함에 있어 본 연구를 통해 마련된 예측모형 또는 고위험군을 활용할 수 있을 것이라 판단된다. 즉, 본 예측모형을 통해 향후 장기요양 서비스를 필요로 하는 기능장애 상태에 놓일 노인을 개별 단위로 확인할 수 있으며, 또한 특성화된 고위험군의 기준을 활용하여 장기요양 요구 발생 고위험 대상자의 규모를 파악할 수 있다. 무엇보다 건강한 노인에서 장기요양 노인으로의 이행을 예방하기 위해 건강검진사업, 만성질환관리사업 등 다양한 사업을 추진 중에 있는 국민건강보험공단은 국민건강정보DB를 보유하고 있어, 주기적, 체계적으로 장기요양 예방 필요 대상자를 발굴할 수 있는 환경이 조성되어 있다. 그러므로 본 예측모형의 시스템화는 공단이 추진하는 예방 사업의 정책 대상자 발굴에 기여할 수 있으며, 사회복지통합망을 통해 지자체나 보건소에 해당 대상자의 정보를 제공함으로써 장기요양 요구 발생 고위험군에게 선제적으로 예방서비스가 제공된다면 보다 건강한 노후를 지속할 수 있을 것으로 기대할 수 있다.
이와 더불어 본 연구결과는 대상자 발굴 이외에도 장기요양 요구 발생을 예방하기 위한 방안을 마련하는 근거로 활용될 수 있을 것이다. 본 연구결과에 따르면, 치매가 고위험군을 결정 짖는 중요 요인으로 나타났다. 따라서 치매가 발생하기 전 치매 발생 위험요인을 선제적으로 관리하는 것이 중요하다[24]. 선행연구결과[25] 성, 연령, 유전적 요인과 같은 선천적 결과뿐만 아니라 교육 및 환경, 사회심리적 요인(phychosocial factor), 건강 행태 요인 등의 후천적 환경이 치매에 영향을 미치는 것으로 나타났다. 특히, 치매는 심뇌혈관 및 당뇨와도 밀접한 관계가 있어, 질병 발생을 예방하는 것이 곧 치매 발병 위험을 낮출 수 있다고 알려져 있다[26]. 그러므로 정책적 개입이 가능한 흡연, 음주, 신체활동, 영양과 같은 건강행태를 개선하기 위한 실효성 있는 건강증진 프로그램을 마련하고 제공하는 것은 치매 예방의 기본적 접근법이 될 수 있을 것이다. 또한 이러한 건강증진 프로그램은 건강한 생활습관을 갖게 함으로써, 노화의 속도를 늦추고 질병에 대한 저항력을 키울 수 있게 되어, 질병이 발생하더라도 입원까지 야기할 정도의 심각한 건강악화를 예방할 수 있을 것이다. 특히, 본 연구에서 23개 질환 중 최근 3년간 한번이라도 입원한 경우에 가장 기여를 많이 한 질환은 뇌졸중, 치매, 암, 골절 ․ 탈골 및 사고 후유증으로 나타났다. 모든 질환이 건강행태와 밀접한 관련성이 있으므로 건강증진 프로그램이 예방차원의 역할에 크게 기여할 것이다.
또한, 골절 ․ 탈골 및 사고 후유증의 경우는 건강행태 개선과 더불어 노인의 골절 ․ 탈골 및 사고 후유증을 야기하는 주요 원인으로 꼽히는 낙상을 예방하는 것도 하나의 방안이 될 수 있다. 대부분 고소득 국가에서 노인의 낙상 예방은 주요 보건정책 중 하나이다[27]. 낙상 예방 중재 관련 체계적 문헌고찰에 따르면, 단순 교육으로는 낙상 예방에 효과가 없으며, 가정 내 개별운동을 시행하는 것이 효과적이라고 하였다[28,29]. 따라서 치매 예방을 위한 333체조와 같이 가정 내에서 간단하게 수행할 수 있는 체조를 개발 ․ 보급하는 것으로 낙상 예방을 도모할 수 있다. 또한 고령자 낙상사고의 72.1%가 자택에서 일어나는 만큼[30], 주거환경을 개선하는 정책도 예방 전략으로 활용 가능하다. 즉, 낙상감지 시스템이나 장착형 이동지원기기 등 주거환경 개선도 낙상 예방을 가능케 할 것이다. 이와 더불어 빠르게 발전하는 복지기술(technology welfare)을 활용한다면 노인의 낙상을 충분히 케어할 수 있을 것이다.
본 연구는 체계적이고 타당한 분석 기반을 마련하고, 만 65세 이상 전국민 데이터를 활용하여 예측모형을 개발하고 장기요양 요구 발생 고위험군을 특성화하였다는 점에 의의가 있다. 그러나 노인의 장기요양 요구를 일으키는 수많은 요인 중 행정자료에 국한된 요인만이 활용되어 잠재변인이 있을 수 있다는 한계가 있다. 이러한 한계점에도 불구하고 본 연구결과가 얼마 남지 않은 초고령사회를 대비하기 위한 건강노화 정책마련의 중요한 기초자료가 될 수 있을 것으로 기대하며, 향후 후속 연구를 통해 장기요양 요구 발생과 관련한 개인의 내재적 요인뿐만 아니라 물리적 환경 등의 더 많은 요인을 고려하고 다양한 정보원을 발굴하여 분석에 활용함으로써 장기요양 요구 발생 예측 모형을 고도화할 필요가 있겠다.
결론 및 제언
본 연구는 2020년도 기준 만 65세 이상 전체 노인을 대상으로 과거 개인적 요소, 환경적 요소, 건강상태, 신체적 ․ 인지적 능력 관련 정보를 활용하여 장기요양 요구 발생 가능성이 높은 고위험군을 발굴하고자 수행된 후향적 연구이다. 본 연구결과, 10개의 예측요인으로 이루어진 비교적 간결한 의사결정나무모형을 통해 모집단의 4.5%에 해당하는 장기요양 요구 발생자의 약 72%를 예측하는 것으로 나타났다. 내 ․ 외적 타당성을 확보한 예측모형을 통해 장기요양 요구 발생 고위험군 기준을 발굴할 수 있었고, 각 고위험군별 특성을 파악할 수 있었다. 본 연구결과는 만 65세 이상 노인 대상으로 장기요양 요구 발생이 높은 고위험 대상자를 선제적으로 발굴하는데 활용될 수 있으며, 고위험군별 특성은 장기요양 예방서비스를 마련하는 기초자료로 활용될 수 있을 것이다. 향후 초고령사회 진입에 따른 장기요양 수요 급증이 예상됨에 따라, 선제적으로 대상자를 발굴하고 장기요양 예방서비스를 제공함으로써 지역사회에서 기능적 능력을 유지하면서 보다 건강하게 노화할 수 있는 환경을 조성할 필요가 있다. 본 연구와 같이 장기요양 예방 정책뿐만 아니라 건강노화를 실현할 수 있는 사회보장정책을 마련하기 위한 노인 대상 실증적 연구 필요성을 제언한다.
Notes
Authors' contribution
Study conception and design acquisition - SMK and HE-J; Data collection - SMK and PYW; Analysis and interpretation of the data - SMK and PYW; Drafting and critical revision of the manuscript - SMK, HE-J and PYW; Final approval - SMK and HE-J.
Conflict of interest
No existing or potential conflict of interest relevant to this article was reported.
Funding
None.
Data availability
Please contact the corresponding author for data availability.
Acknowledgements
This article is rewrited based on the report titled 'an exploary study on risk factors for long-term care needs using the National Health Insurance Service database (Song MK et al., 2021)', funded by National Health Insurance Service.