Home 일반적 기초 재생산 지수 식의 이해
Post
Cancel

일반적 기초 재생산 지수 식의 이해

기초 재생산 지수(Basic reproduction number, $R_0$)는 감염병 연구에서 매우 중요한 지표 중 하나로, 감염병이 퍼질 것인지 판단하는 기준으로 쓰이는 수이다. 이 수에서 파생하여 각종 재생산 지수의 개념을 만들 수 있고, 각 상황에서 감염병의 퍼지는 정도를 알거나, 퍼질지 말지 알 수 있는 기준으로써 사용이 된다. 기초 재생산 지수는 아래와 같은 정의를 갖는다.

기초 재생산 지수란, 모든 개체가 감염될 수 있는(Susceptible) 집단에 감염력이 있는(Infectious) 개체 하나가 들어갔을 때, 그 개체가 감염력이 있는 기간 동안 감염시킬 수 있는 평균적인 수를 의미한다.

감염병의 수리 모델에서 위 지수를 식으로 나타내면 감염병에 대한 좋은 통찰을 얻을 수 있다. 예를 들어, 무작위로 접촉하고 감염되는 상황의 $R_0$는 아래와 같이 쓸 수 있는데, 이는 $R_0$가 질병의 감염성 특징들인 감염 계수, 감염 가능 기간에 비례하고, 전체 인구수에도 영향을 받는 것을 알 수 있다.

\[R_0=\beta ND\]

감염병 모델을 수리 모델로 구상했을 때, 감염의 여러 설명요소들을 추가하면서 모델이 상당히 복잡해지는 경우가 많다. 그럴 때, $R_0$ 식을 유도하여, 감염병의 특징을 명확하게 보여줄 수 있다. 그렇다면 일반적인 모델에서 수식으로 유도하는 방법은 무엇일까?

모델의 가정

증명을 시작하기 전에, 감염병 수리 모델의 가정을 몇가지 세우고 시작한다. 여기에서 다룰 모델은 에이전트 기반 모델(Agent-based model, ABM)이 아닌, DE(Differential equations)로 이루어진 감염병 모델이고, 가장 널리 사용되는, 구획 모델(Compartmental model)이다. 각 개별 개체들은 질병 상태(Disease state)와 인구를 나누는 특징에 따라 각 구획(Compartment)으로 나뉘게 되고, 질병 상태에 따라 $n$개의 질병 구획(Disease compartments), $x\in\mathbb{R}^n$, 과 $m$개의 비질병 구획(Nondisease compartments), $y\in\mathbb{R}^m$, 로 나뉜다. 이차감염으로 인해 $i$번째 질병 구획이 증가하는 속도를 $\mathscr{F}_i$, 질병의 진행, 죽음, 또는 치료로 인해 $i$번째 질병 구획이 감소하는 속도를 $\mathscr{V}_i$라고 하자. 그리고 비질병 구획이 변하는 것을 $g$라고 하면, 감염병의 수리 모델은 아래와 같이 정리할 수 있다.

\[\begin{align*} x'_i&=\mathscr{F}_i(x,y)-\mathscr{V}_i(x,y) & i =1,\cdots,n\\ y'_j&=g_j(x,y) & j =1,\cdots,m\\ \end{align*}\]

하지만, 이런 단순한 모델로는 어떤한 전개를 하기가 어렵다. 그래서, 감염병 확산의 특징들을 몇가지 반영한다.

  1. 모든 새로운 감염자들은 기존의 감염자로부터 생기는 2차감염으로만 생긴다. 다시 말해, 모델에서 고려하지 않는 대상은 갑자기 감염자로 등장하지 않는다. 이를 수식으로 적으면 아래와 같다.

    \[\forall y\geq0, \mathscr{F}_i(0,y)=0, \mathscr{V}_i(0,y)=0\text{ for }i=1,\cdots,n\]
  2. $\mathcal{F}$는 음수일 수 없다(Nonnegative). 이는 감염자의 수가 감염으로 인해 숫자가 주는 경우가 없음을 의미한다. 지극히 당연한 가정이다.

    \[\forall x\geq0, \forall y\geq0, \mathscr{F}_i(x,y)\geq 0\text{ for }i=1,\cdots,n\]
  3. 어떤 질병 구획이 비어있을 때, 증가하는 경우만 존재한다. 마찬가지로, 당연한 가정.

    \[\text{Whenever }x_i=0, i=1,\cdots,n, \mathscr{V}_i(x,y)\leq 0\]
  4. 모든 질병 구획의 유출 속도를 합하면 0 이상이다. 마찬가지로 당연한 가정이다. 반대의 경우(질병 구획의 유입)는 감염으로 $\mathscr{F}$에 속한다.

    \[\forall x\geq 0, \forall y\geq 0, \sum^n_{i=1}\mathscr{V}_i(x,y)\geq 0\]
  5. 초기에 $(0,y)$의 형태를 가지고 시작한 모든 해(Solution)들은 하나의 점 $(0,y_o)$로 결국 귀결되게 된다. 이 것을 질병 무질병 평형(Disease-free equilibrium, DFE)라고 부르며, 이 가정은 결국 무질병 시스템 $y’=g(0,y)$가 유일한 점근적으로 안정한(Aysmptotically stable) 평형을 가진다는 뜻이 된다.

위 가정들을 가지고, 감염병의 확산 여부를 판단할 수 있는 지표인 $R_0$를 구할 것이다.

Next generation matrix

$R_0$를 구하기 위해서는 초기 상태에서 다음에 얼마나 많은 사람이 2차감염으로, 초기 상태에 의해, 걸리게 될 지 계산해야 한다. 먼저 음수가 아닌 초기 상태의 질병 상태 $x_0$가 질병 상태인 개체가 없는 집단에 감염시키는 인원들을 구해야 한다. 그러기 위해서, DFE 주변에서의 모델을 선형화시켜서(Linearize) 살펴보자.

\[\begin{bmatrix} x\\y \end{bmatrix}'= \begin{bmatrix} \frac{\partial(\mathscr{F-V})}{\partial x} & \frac{\partial(\mathscr{F-V})}{\partial y}\\ \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{bmatrix}\begin{bmatrix} x\\y \end{bmatrix}=:\begin{bmatrix} F-V & \emptyset\\ J_{21} & J_{22} \end{bmatrix}\begin{bmatrix} x\\y \end{bmatrix}\]

1번 가정에 의해서 무질병 상태 $(0,y)$들은 시간이 지나도 변하지 않을 것이다. 이는 모든 $i,j$에 대해, $\frac{\partial\mathscr{F}_i}{\partial y_j}(0,y_o)=0, \frac{\partial\mathscr{V}_i}{\partial y_j}(0,y_o)=0$임을 의미한다. 여기에서, 각 시간마다 남아있는 초기 감염자의 수는 아래 DE를 통해 구할 수 있을 것이다.

\[x'=-Vx, x(0)=x_0\]

위 식의 해를 $\phi(t,x_0)$라고 하면, $\int^\infty_0F\phi(t,x_0)dt$는 초기 감염자로 인해 걸린 사람 수를 의미하게 된다. 위 식의 해는 선형이기 때문에 아래와 같이 쉽게 구할 수 있고, $V$의 고유값(Eigenvalue)가 양수라면, 간단하게 표현 가능하다.

\[\phi(t,x_0)=e^{-Vt}x_0=V^{-1}x_0\]

즉, 다음과 같이 초기 감염자로인한 2차감염자의 수를 구할 수 있다.

\[\int^\infty_0Fe^{-Vt}x_0dt=FV^{-1}x_0\]

여기에서 행렬 $K:=FV^{-1}$을 Next generation matrix라고 부르고, 여기에서 $R_0$를 다음과 같이 정의한다.

\[R_0:=\rho(FV^{-1})\]

$\rho(\cdot)$는 행렬의 스펙트럼 반지름(Spectral radius)를 의미한다.

기초 재생산 지수가 Threshold가 되는가?

이렇게 정의한 $R_0$가 감염병 확산의 여부를 판단하는 지표로써 사용할 수 있을까? $R_0$ 값을 보고 감염자가 있을 때, DFE에서 벗어날 지 아니면 다시 DFE로 돌아오게 될 지 판단할 수 있다면, 지표로 사용할 수 있게 될 것이다.

Theorem. $R_0$를 이용하여, DFE가 점근적으로 안정한 점이 되는 지, 불안정(Unstable)한 점이 되는 지를 결정할 수 있다. $R_0<1$이면, DFE가 점근적으로 안정한 평형점이 되고, $R_0>1$이면, 반대로, 불안정판 평형점이 된다.

DFE의 안정성을 파악하기 위해, 위의 선형화된 모델을 살펴보자. 아래와 같이 행렬 $J$를 정의하면,

\[J:= \begin{bmatrix} F-V & \emptyset\\ J_{21} & J_{22} \end{bmatrix}\]

$J$의 고유값 실수부의 부호에 따라 안정성이 결정된다. 즉, 모든 고유값 실수부가 음수라면 DFE가 점근적으로 안정적인 평형이 된다. $J_{22}$와 $F-V$의 고유값들을 살펴보면 되는데, 우선 $J_{22}$의 고유값의 실수부는 가정 5번에 의해, 이미 점근적으로 안정적인 평형을 가지므로, 음수이다. 반면, $F-V$의 고유값은 조금 증명이 필요하다.

$F-V$의 고유값의 실수부는 음수이다.

먼저, 가정 1번과 2번에 의해, 행렬 $F$는 각 요소들이 Nonnegative이다. 또한, 가정 1번과 3번을 이용하면 행렬 $V$가 Z 행렬인 것을 보일 수 있다.

\[V_{ij}=\frac{\partial\mathscr{V}_i}{\partial x_j}(0,y_o)=\lim_{h\rightarrow0+}\frac{\mathscr{V}_i(he_j,y_o)-\mathscr{V}_i(0,y_o)}{h}=\lim_{h\rightarrow0+}\frac{\mathscr{V}_i(he_j,y_o)}{h}\]

$i\neq j$인 경우, $he_j$ 행렬의 $i$번째 요소는 0이므로, $\mathscr{V}_i(he_j,y_o)\leq 0$가 성립한다.

여기에서, $V_{ij}\leq0$이고, 이는 Z 행렬임을 의미한다. 또한, 가정 1번과 4번에 의해,

\[\sum^n_{i=1} V_{ij}=\sum^n_{i=1}\frac{\partial\mathscr{V}_i}{\partial x_j}(0,y_o)=\sum^n_{i=1}\lim_{h\rightarrow0+}\frac{\mathscr{V}_i(he_j,y_o)}{h}=\lim_{h\rightarrow0+}\frac{\sum^n_{i=1}\mathscr{V}_i(he_j,y_o)}{h}\geq0\]

이다. 여기에서, 아래 Lemma를 이용하여, 행렬 $V$가 M 행렬임을 알 수있다.

Lemma 1. 행렬 $V$가 Z 행렬이고, $\sum^n_{i=1}V_{ij}\geq0$이면, $V$는 M 행렬이다.

증명 과정에서 한가지 가정을하게 추가로 하게 되는데, 행렬 $V$가 가역(Invertible or nonsingular) M 행렬이라는 것이다. 많은 감염병 모델에서 이 가정은 맞기 때문에 크게 어색하진 않다. 이를 이용하면, $V^{-1}$의 각 요소가 Nonnegative임을 알 수 있고 (가역 M 행렬의 특징), 아래 계산 과정을 통해, $F-V$의 고유값에 대한 결론을 낼 수 있다.

$FV^{-1}$이 Nonnegative이므로, $I-FV^{-1}$이 Z 행렬이다. 여기에서, $\rho(FV^{-1})<1$이라는 것은, $I-FV^{-1}$이 가역 M 행렬이라는 뜻이고, 이는 $(I-FV^{-1})^{-1}\geq 0$임을 의미한다.

\[(I-FV^{-1})^{-1}=((V-F)V^{-1})^{-1}=V(V-F)^{-1}\geq 0\]

위 전개를 통해서, $(V-F)^{-1}=V^{-1}(I-FV^{-1})^{-1}\geq0$임을 알 수 있고, 이는 $(V-F)$가 가역 M 행렬임을 알 수 있다. 가역 M 행렬의 모든 고유값은 양수 실수부를 갖기 때문에, 아래 Lemma가 성립함을 알 수 있다.

Lemma 2. $F-V$ 행렬은 음의 실수부를 갖는다.

정리하면, $R_0<1$이라는 명제와 DFE가 점근적으로 안정적인 평행점이라는 명제는 서로 같은 말이 된다.

이제, 반대의 경우를 증명해보자. $R_0>1$의 경우에, 연속성(Continuity)을 사용하여 증명하게 된다. 만약, $R_0\leq1$이라면, 모든 $\varepsilon\geq0$에 대하여 $R_0:=\rho(FV^{-1})\leq 1<1+\varepsilon$이기 때문에, $(1+\varepsilon)I-FV^{-1}$은 가역 M 행렬이 된다. 즉, $((1+\varepsilon)I-FV^{-1})^{-1}\geq0$이 성립하고, 다른 면에서 $((1+\varepsilon)I-FV^{-1})=V((1+\varepsilon)V-F)^{-1}\geq0$이 성립함을 알 수 있다. 여기에서, 행렬 $(1+\varepsilon)V-F$는 가역 M 행렬이자 Z 행렬이기 때문에, 양의 실수부를 갖는 고유값을 가진다. $\varepsilon>0$이 임의의 값이고, 행렬의 고유값은 각 요소의 연속 함수이므로, $V-F$ 또한, Nonnegative한 실수부를 갖는 고유값만을 갖는다.

반대로, $V-F$가 Nonnegative한 실수부를 갖는 고유값만을 갖는다면, 모든 양수 $\varepsilon$에 대해, 행렬 $V+\varepsilon I-F$이, 아래 전개로, 가역 M 행렬이 된다.

\[\det(V+\varepsilon I-F-\lambda I)=\det(V-F-(\lambda-\varepsilon)I)=0\rightarrow\mathfrak{R}(\lambda-\varepsilon)\geq0\rightarrow\mathfrak{R}(\lambda)\geq\varepsilon>0\]

즉, Lemma 2의 전개를 이용하면, $\rho(F(V+\varepsilon I)^{-1})<1$임을 알 수 있다. 여기에서, $\varepsilon>0$이 임의이기 때문에, $R_0=\rho(FV^{-1})$은 1보다 작거나 같은 값을 가질 수 있다.

정리하면, $R_0\leq1$이라는 것은 행렬 $V-F$의 모든 고유값이 Nonnegative한 실수부를 갖는다는 것과 같은 의미가 된다. 다시말해, $R_0>1$이라면, $F-V$의 고유값 중 적어도 하나는 양의 실수부를 갖는다는 의미가 된다.

$R_0$와 DFE의 관계

우리는 위 전개를 통해 $R_0$값이 1보다 작으면 $F-V$가 음의 실수부를 갖는 고유값만을 가진다는 것을, 반면, $R_0$값이 1보다 크면, 양의 실수부를 갖는 고유값을 적어도 하나 갖는다는 것을 보였다. 그렇다면, $R_0$는 선형화된 시스템에서 DFE의 평형점에 대한 결론을 내리는 기준점이 되어줄 수 있음을 의미한다. 즉, 아래와 같은 결론이 가능하다.

\[\begin{align*} R_0>1 \Rightarrow &\text{DFE는 점근적 안정적 평형이다.}\\ R_0<1 \Rightarrow &\text{DFE는 불안정한 평형이다.} \end{align*}\]

정리

우리가 감염병 수리 모델을 구상할 때, 위 질병 구획과 비질병 구획을 구성하는 것은 조금씩 다를 수 있다. 즉, 같은 수리 모델에서도, 감염력을 가진 구획을 어디라고 생각하느냐에 따라 조금씩 다른 $R_0$ 식을 얻을 수도 있다. 하지만, $R_0$ 식은 해당 모델로 감염병을 어떻게 설명하는 지 매우 직관적으로 이해할 수 있다. 혹여나, 감염병에 대해 수리 모델로 이해할 일이 있다면, 꼭 $R_0$값을 구하는 것을 매우 추천한다.

참고 문헌

위 전개는 van den Driessche와 James Watmough의 논문을 참고하여 진행하였다. 또한 유명한 Mathematical Epidemiology 책인, Brauer의 책에도 동일 저자가 유사한 주제로 참여하여 집필하였으니 충분히 참고할만하다. van den Driessche의 후속 논문에는 $R_0$ 계산의 여러 예시 또한 나와있으니 참고하기 바란다. 또한, Z 행렬, M 행렬 등 Nonnegative 행렬의 선형 대수(Linear algebra)에 대한 지식은 이 책을 참고하였으니 참고바란다.

수정 사항

[23.05.20] 오타 수정 및 수식 오류 수정

[23.05.21] Theorem 추가

This post is licensed under CC BY 4.0 by the author.