감염병 확산의 통계물리학

김범준 통계물리학의 시선으로 일상의 궁금증을 생각해보는 것을 좋아하는 물 리학자다. <세상물정의 물리학>으로 한국출판문화상을 수상했다. 한겨 레신문, 조선일보 등의 매체에 컬럼을 연재했다. “어쩌다 어른”, “세바 시”, “XTM 밝히는 과학자”, “YTN사이언스 한국사과학탐” 등에 출연해 과학의 대중화를 위해 노력하고 있다.

2020년 전 세계는 코로나19의 감염 확산으로 큰 고통을 겪고 있다. 여러 나라에서 발생한 확진자와 사망자의 숫자는 매일 집계된다. 많은 사람들이 볼 수 있도록 세계 보건 기구(WHO)를 비롯해 여러 곳에서 매일 데이터를 공개 하고 있다. 숫자로 표현된 정량적인 데이터라는 측면에서 과학 분야의 연구와 분석의 대상이 될 수 있다는 점은 분명하다. 적절한 이론 모형을 이용해 현실의 데이터를 설명해보고, 현실의 밑바탕을 구성하는 여러 중요 요소를 판별 해내어 모형을 정교화하는 과정을 반복하는, 널리 이용되는 체계적인 과학적 방법을 적용할 수 있다.

필자가 속한 통계물리학 분야에서도 감염병 확산은 널리 연구되는 주제다. 감염병 확산을 설명하는 여러 층위의 이론 모형이 있다. 통계물리학과 복잡계 과학에는 소위 ‘거칠게 보기(coarse-graining)’라는 개념이 있다. 전체를 구성하는 구성요소 하나하나의 미시적인 정보로 출발하는 모형을 이용해 전체가 보여주는 거시적인 현상을 연구할 수도 있지만, 가장 밑단의 미시적인 구성요소보다는 이보다 큰 규모의 구성요소로부터 출발해 전체를 이해하는 시도가 바로 거칠게 보기의 방법이다. 예를 들어 생명의 진화라는 복잡한 과정도 결국은 생명체와 주변 환경을 구성하는 기본 입자들 사이의 상호작용에 기반함은 분명하다. 하지만 생명의 진화를 생명체를 구성하는 상호작용하는 미시적인 입자들의 양자역학으로 이해하려는 시도는 실패할 것이 거의 확실하다. 이럴 때는 생명체 하나를 거칠게 보아 하나의 구성요소로 다루는 방식이 훨씬 유용하다. 물리학, 화학, 생물학, 그리고 생태학과 사회학 등의 다양한 학문 분야는 나름의 거칠게 보기의 방법을 적용해 연구를 진행한다. 생명현상이 물리학의 근본 법칙을 위배할 수는 없지만 물리학의 고전역학과 양자역학을 적용해서 생명현상을 정확히 이해할 수 있다고 믿는 사람은, 길을 잡아도 크게 잘못 잡은 셈이다.

감염병 확산 모형도 어느 수준에서 대상을 거칠게 보는지에 따라 다양한 층위의 모형을 생각할 수 있다. 감염병을 일으키는 바이러스 하나, 그리고 이 바이러스의 침입으로 감염된 인체의 세포도 하나씩 고려해 감염병 확산 모형을 만드는 통계물리학자는 없다. 모형 안에 들어있는 세포 수준의 모든 구성 요소와 이들 사이의 상호작용을 모두 고려해 하루 뒤 한 도시 안에 몇 명의 감염자가 발생할 지를 예측할 수 있는 모형을 만드는 것은 현실적으로는 불가능 하다. 세포에서 인간, 인간에서 거대 도시로 이어지는 계층의 층위마다에서 도대체 어떤 일들이 벌어지는 지를 모두 파악해야 모형을 설계할 수 있는데 이는 현실적으로는 가능하지 않기 때문이다. 따라서 실제 삶을 살아가는 인간 한명이라는 개체의 수준이 감염병 확산 모형 중 가장 미시적인 모형의 출발점에 해당하게 된다. 바로 ‘행위자 기반 모형(agent-based model)’이라 불리는 방법이다. 한 도시 안의 감염병 확산을 이해하기 위해 도시에서 살아가는 한 사람 한 사람으로부터 출발하는 방식이다. 하지만 도시안의 모든 개인 각자가 어디에 살고 어떻게 이동하며 누구를 만나 얼마나 오래 머물다 집으로 돌아가는 지에 대한 세세한 구체적인 정보가 없다면 행위자 기반 모형을 현실에 맞게 정확히 설정할 수는 없다. 물론 행위자 기반 모형처럼 한 개인의 수준에서 출발하더라도 이들의 이동을 구체적인 현실의 경로를 따라 각기 추적하지 않고 통계적인 패턴으로만 감염의 과정을 기술하는 모형은 가능하다. 이는 일부 실제 연구에도 이용되고 있으며 마이크로 시뮬레이션 모형이라 불린다.

감염병 확산 그림1 (MERS)

통계 물리학의 감염병 확산 시뮬레이션

자, 이제 눈을 돌려 가장 거칠게 보는 거시적인 수준에서 감염병 확산을 설명하는 모형을 생각해보자. 바로 구획 모형(compartment model)이라 불리는 모형이다. 구획 모형에서는 한 집단을 구성하는 개개인의 행동에 관심을 두지 않는다. 단순하게 한 집단 안에 몇 명의 감염자가 있는지만 살피는 방식을 따른다. 감염자를 검은 바둑알, 아직 감염되어 있지 않은 미감염자를 흰색 바둑알이라고 가정하면 구획 모형에서는 희고 검은 바둑알이 모두 함께 마구잡이로 섞여 담겨있는 주머니를 생각한다고 할 수 있다. 검은 바둑알 하나가 흰 바둑알을 감염시켜 검은색으로 바꿀 확률은 주머니 안에 희고 검은 바둑알이 각각 몇 개씩 있는 지 그 숫자에만 의존하게 된다. 한편 위에서 설명한 행위자 기반 모형은 현실의 바둑판에 희고 검은 바둑알이 구체적인 위치들을 점유하며 전염이 일어나는 상황이라고 생각할 수 있다. 물론 각 바둑알이 제자리에 가만히 있지 않고 제각각 모두 나름의 방식으로 이동하는 상황이다. 행위자 기반 모형에서의 감염 확산은 희고 검은 바둑알이 몇 개씩 있는지만을 이 용해서는 결코 기술할 수 없다.

주머니 안에서 마구잡이로 완전히 섞여 있는 희고 검은 바둑알처럼 전염이 일어난다고 가정하는 구획 모형도 여러 종류가 있다. 먼저 가장 단순한 SI 모형을 살펴보자. 희고 검은 바둑알의 예처럼 정확히 딱 두 종류의 사람들만 있다고 가정하는 모형이다. 전체 K명의 사람으로 구성되어 있는 집단에서 현재 감염자의 숫자를 I(Infected)라고 하고, 미감염자의 숫자를 S(Susceptible)라고 하자. 한 명의 감염자가 미감염자를 만날 확률은 위에서 설명한 완전 섞임 (full mixing)의 가정을 이용하면 단순하게 현재 K명 중 몇 명의 미감염자가 있는지 그 비율에만 의존하게 된다. 통계물리학에서는 평균장 어림(meanfield approximation)이라고 불리는 방법이다. 눈을 감고 주머니에 손을 넣 어 아무 바둑알이나 하나를 고르면 흰 바둑알이 택해질 확률은 주머니 안에 들어있는 흰 바둑알의 비율로만 정해진다. 마찬가지로 SI 모형에서 오늘 날짜 에 I명의 감염자가 있는 경우 하루가 지난 내일 몇 명의 감염자가 추가로 발생 할 지는 아주 간단한 방식으로 기술된다. 감염자가 한 명의 미감염자를 만났 다고 가정하고 이 둘의 접촉으로 실제 전염이 일어날 확률을 r이라고 하면 하 루에 발생하는 신규 감염자의 수는 간단히 r×I×(S/K)로 적힌다. 한명의 감 염자가 미감염자를 만날 확률이 S/K이고, 만나면 실제로 감염이 될 확률이 r 이므로, r*(S/K)가 한 명의 감염자가 하루 동안 감염시키는 사람 수의 기댓값 이다. 감염자가 한 명이 아니라 모두 I명이 있으므로, 하루에 늘어난 감염자의 수는 r×I×(S/K)이 된다.

감염자 수 초기에 지수함수로 늘어나는 이유

위에서 소개한 단순한 SI모형을 따르면, 어떻게 감염자의 숫자가 늘어날지도 쉽게 예상할 수 있다. 처음 감염이 시작된 직후에는 감염자는 거의 없으므로 K명 중 거의 대부분의 사람들은 미감염자라고 할 수 있다. 즉, 위의 식에서 S가 K에 근접하므로, S/K는 거의 1에 가까운 값이다. 따라서, 감염 확산의 초기에는 하루에 늘어나는 감염자의 숫자는 간단히 r×I로 어림해 적을 수 있게 된다. 조금만 생각해보면 바로 지수함수를 따른 기하급수적인 증가를 보여줄 것을 예상할 수 있다. 예를 들어 r=1이라고 하면 한 명의 감염자에서 출발하면 하루가 지나면 감염자는 두 명이 된다. 처음의 감염자 1명, 그리고 이 사람이 하루 동안 감염시킨 사람이 1명, 더해서 2명이기 때문이다. 그 다음날에는 이제 모두 4명이 된다. 2명이었던 감염자 각자가 한명씩 감염을 시키므로, 2+2=4가 된다. 하루가 더 지나면 마찬가지로 계산하면 이제 8명, 그 하루 뒤에는 16명이 된다. 이처럼, SI모형으로부터 예상할 수 있는 것은 감염초기 감염자의 숫자가 급격히 기하급수적으로 늘어난다는 사실이다. 흥미롭게도 현실의 감염 확산도 초기에 마찬가지의 급격한 지수함수적인 환자 수 증가를 보여주는 경우가 많다.

SI모형 초기의 지수함수적인 증가가 영원히 계속될 수는 없다. 하루에 늘어나는 감염자의 숫자를 적은 수식 r×I×(S/K)에서, 감염자가 늘어날수록 S가 점점 줄어들기 때문이다. 따라서, K명의 사람 중 미감염자의 비율은 점점 줄어, 결국 K명의 모든 사람이 감염되고 나면(즉, I=K, S=0), 하루의 신규 감염자는 0명이 된다. 지금까지 설명한 내용을 요약해 보자. 구획 모형 중 가장 간단한 SI모형은 초기의 급격한 환자 수 증가로 시작해 이후 천천히 신규 감염자가 0으로 줄어들면서, 결국 감염의 최종단계에 들어서 결국 모든 사람이 감염된 I=K의 상황으로 수렴한다는 것을 알려준다. 환자 수 I를 그래프로 그리면 영어 알파벳 S자 모양을 따라 환자수가 변하게 된다는 것이 SI모형의 결과다. 2015년 우리나라에서 발생한 메르스 환자수의 실제 데이터를 보면 전형적인 S자모습의 곡선을 따름을 볼 수 있다(그림1). 그림 안의 작은 그래프는 세로축을 로그 스케일로 한 것인데, 확산의 초기. 지수함수를 따라 환자 수가 늘어났다는 것도 알 수 있다.

전 세계가 큰 고통을 겪고 있는 코로나19의 경우에는 위에서 설명한 SI모형은 현실과 많이 다르다. 감염자가 확진 판정을 받아 병원에서 격리치료를 받게 되면 더 이상 감염을 일으키기는 어렵기 때문이다. 감염자가 더 이상 감염을 시키지 못하는 상태인 R(Recovered)로 변하는 과정을 SI 모형에 추가한 것이 SIR 모형이다. 감염자에 의해 미감염자가 감염되는 것은 SI모형과 같지만 시간이 흐르면 감염자가 면역력을 갖는 상태로 회복되는 것도 고려한 모형이다. SIR 모형에서의 R상태는 요즘의 코로나19의 경우에는 확진 판정 후 병원에 격리된 사람에 해당한다고 해석할 수 있는 여지가 있다. 확진 판정을 받은 사람은 결국은 면역력을 갖춰 완치 판정을 받아 퇴원하거나 감염으로 사망하게 되는데, 두 경우 모두 더 이상 다른 사람에게 감염을 옮기지는 못하기 때문이다. SIR 모형의 미분방정식에서 R의 시간 변화를 구해 그래프로 그리면 개략적으로는 S-자의 꼴을 따른다는 것을 보일 수 있다. 현실에서도 코로나 19의 감염 확산이 멈춘 나라들에 대해서 확진자수를 시간의 함수로 그래프로 그려보면 대동소이한 S자의 형태를 볼 수 있다. 오늘 소개하지는 않았지만, SI와 SIR 모형 외에도 여러 다른 구획 모형이 연구에 널리 쓰이고 있다.

방역 정책 없이 여행 제한만으로는 한계

위에서 소개한 구획모형은 완전 섞임이라는 가정에 기반한다. 하지만 현실의 사람들은 당연히 이런 가정으로 설명할 수는 없다. 완전 섞임을 가정하면 서울의 미감염자는 강원도 강릉의 감염자든 아니면 인접 도시인 과천시의 감염자든 감염자를 만나 감염될 확률이 감염자의 위치와 상관없이 모두 같은데 현실에서는 당연히 강릉보다는 과천의 감염자에 의해 감염될 가능성이 훨씬 더 크다고 할 수 있기 때문이다. 전체 집단을 여러 개의 작은 집단으로 나누고 작은 집단 하나의 내부에서의 감염은 구획모형의 완전 섞임 가정을 이용해 간단히 기술하되 작은 집단 사이의 감염은 사람들의 실제 이동의 패턴을 이용하는 것이 훨씬 더 현실에 가깝다. 이러한 방식의 모형을 ‘메타 인구 모형 (meta-population)’이라 한다. 행위자 기반 모형을 정확히 설계할 수 없다는 현실적인 어려움과 구획모형의 비현실적인 가정을 동시에 해결하는 유용한 접근방식이라고 할 수 있다. 어느 정도 일정한 패턴으로 감염이 일어날 것으로 예상할 수 있는 한 국가내의 감염은 구획모형으로 기술하되, 전 세계적 인 규모의 감염의 확산은 국가 간의 항공망을 통한 인구 이동을 고려하는 거칠게 보기의 방식을 이용한 연구 논문들이 있다. 이러한 전 세계적인 규모의 메타 인구 모형을 통한 감염 확산 연구를 통해 무척이나 흥미롭고 유용한 결과가 얻어지기도 했다. 2013년 저명 학술지인 <사이언스>에 신종플루가 전 세계적으로 확산되어 퍼져 나간 순서를 메타 인구 모형의 시뮬레이션을 통해 성공적으로 설명한 논문이 출판되기도 했다. 금년 3월에는 같은 학술지에 중국을 중심으로 한 여행 제한의 효과를 비슷한 방식의 메타 인구 모형으로 살펴본 논문도 실렸다. 이 최근 논문을 포함한 기존의 많은 감염병 확산 모형에 대한 연구를 통해 알려진 중요한 사실이 있다. 국가 간의 여행 제한만으로는 감염병 확산을 막기는 어렵다는 것이다. 여행 제한은 한 나라 안에서 감염병의 대규모 확산이 시작되는 시기를 뒤로 늦출 수 있을 뿐이다. 물론 여행 제한이 효과가 전혀 없다는 뜻은 아니다. 한 국가 안에서의 강력한 방역정책의 시행이 동반하지 않는 한 여행 제한 만으로는 최종 감염의 규모를 줄이는 효과를 얻기는 어렵다는 결론이다.

감염병 확산을 이론적인 모형을 통해 이해하는 연구는 무척 큰 가치를 가진다고 할 수 있다. 특히 현실에서는 시험해 볼 수 없는 여러 다양한 방역 활동의 시나리오의 효과를 컴퓨터 시뮬레이션을 통해 사전에 확인해 볼 수 있다는 면에서 그 유용성은 아주 크다는 것이 필자의 의견이다. 예를 들어 현실을 정교하게 담아낼 수 있는 모형을 만약 우리가 가지고 있다면 학교의 개학 시기에 대한 결정, 직장에서의 재택근무자의 적정 비율의 제안, 그리고 기차와 버스 등의 이동에 대한 여행 제한의 적절할 수준 등에 대한 중요한 결정을 내릴 때 그 근거를 제공할 수 있는 여지가 무척 크다. 이러한 결정은 방역 활동에 소요 되는 경제적 비용 뿐 아니라 방역의 결과로 발생할 수 있는 경제적인 피해도 고려할 필요가 있다. 현실에서 적용 가능한 감염병 확산 모형을 구축하기 위한 여러 학문 분야 연구자들의 활발한 융합연구를 기대한다.

– 김범준

지구와에너지
(사)한반도평화에너지센터가 발행하는 신개념의 컨설팅형 입법정책 계간지 매거진 '지구와에너지' 입니다.

댓글 남기기