[바스리] “백신예약 시스템, 뭐가 문젠지 단번에 알아냈죠”

바이라인네트워크에서 스타트업 리뷰를 연재합니다. 코너명은 ‘바스리’, <바이라인 스타트업 리뷰>의 줄임말입니다. 스타트업 관계자분들과 독자님들의 많은 관심 부탁드립니다.

지난 7월 12일. 50대 이상의 코로나바이러스감염증19 백신 예방접종 사전예약이 시작됐다. 그러나 예약은 생각처럼 쉽지 않았다. 홈페이지에 접속하면 나오는 것은 “서비스 접속대기 중”이라는 안내문구와 예상대기 시간 뿐. 심지어 한때 홈페이지의 접속이 마비되기도 했다. 사람들은 전쟁을 치르듯 백신예약을 해야 했다. 우여곡절 끝에 1차 백신접종 예약은 마무리 됐다.

온라인에서는 난리가 났다. 제대로 된 서버 관리에 대한 요청도 쇄도했다. 질병관리청은 2차 백신접종(18세~49세) 예약에서 같은 문제가 발생하는 것을 막기 위해 조치에 나섰다.  원인을 파악하기 위해 모니터링 서비스 업체에 SOS를 요청한 것이다.

모니터링 서비스 업체 와탭랩스는 민관합동 전담팀(TF)에 참여해 약 2주 동안 집중적으로 백신예약 시스템의 성능을 점검했고 곧 문제점을 파악했다. TF는 와탭랩스가 파악한 문제점을 바탕으로 조치를 취했다. 그 결과 1차 백신접종 때보다 안정적으로 백신예약 홈페이지를 운영할 수 있었다.

와탭랩스의 김성조 최고기술책임자(CTO)

당시 와탭랩스는 어떤 문제점을 어떻게 알아냈고 해결했을까? 김성조 와탭랩스 최고기술책임자(CTO)를 만나 이야기를 들어봤다.

와탭랩스, 어떻게 백신예약 민관합동 전담팀(TF)에 합류하게 된 건지?

질병관리청이 고객사다. 1차 백신접종 이후 질병청에서 도움을 달라는 연락이 와서 TF에 합류하게 됐다.

백신예약 시스템, 문제의 원인이 무엇이었나?

사실 시스템은 복잡하지 않다. 본인인증을 하고 나면 건강보험시스템과 연결되어 백신을 맞았는지 여부를 확인한 다음, 병원과 연결해 예약을 하는 방식이다. 그러나 백신예약 시스템은 질병관리청에서 급하게 만들어야 하는 상황이었다. 그러다보니 가용된 예산, 리소스에 한해서 시스템을 만들었다.

와탭랩스에서는 애플리케이션, 서버, 네트워크 등 IT시스템의 성능과 안정성을 모니터링 한다. 개별 시스템을 모니터링하고 이를 시각화한 통합 모니터링 대시보드 서비스를 제공한다. 고객사는 대시보드 화면을 통해 전체 IT시스템의 성능, 안정성을 한 눈에 확인할 수 있다. 각 단계별 시스템을 통합 모니터링을 한 결과, 휴대폰 본인인증 단계의 요청(트래픽)이 과부화 상태인 것으로 확인됐다.

그 단계에서만 과부하가 됐던 이유가 있었나?

문제가 될 수밖에 없었던 점은 당시만 해도 본인인증이 동시 처리할 수 있는 트래픽 수가 몇 만 단위였다. 그러나 하루에 150만명이 백신 예약을 하기 위해 접속을 했으니 과부하가 생긴 것이다.

어떻게 해결을 했는지 당시 상황을 설명 해달라

문제를 파악한 후 과학기술정보통신부와 클라우드 업체들이 참여한 민관합동 전담팀(TF)에서 (시스템 안정성을 위해) 백신예약 시스템을 클라우드에 올리자는 얘기가 나왔다. 그런데 문제가 있었다. 건강보험시스템이 개인정보와 엮여 있어 클라우드로 이전을 할 수가 없었다.

결국 TF에서 본인인증 시스템만 클라우드로 이전하자는 의견이 모였다. 당시 참여했던 클라우드 업체들이 질병관리청의 서버운영 시스템에서 본인인증 시스템을 클라우드에 이전하고 서버를 늘렸다. 본인인증수단도 네이버, 카카오, 통신3사, 금융인증서 등 다양하게 추가했다. 클라우드에 이전한 시스템도 성능 점검을 해야 했기 때문에 와탭랩스도 본인인증 통합 모니터링 시스템을 구축했다.

2차 백신접종 때는 홈페이지 다운이나 과부하 등의 문제가 없었나?

1차 때와 비교하면 문제없이 시스템이 작동했었다. 다만, 사용자들에게 드러나지 않을 정도로 일부 본인인증 시스템에서 문제가 생겼었다. 사실 하루에 한 시스템이 100만명 이상 수용하는 것은 (기술적으로) 쉽지 않다. 당시 문제가 생긴 본인인증 채널에서 다음날 서버를 늘리는 등 긴급 조치를 취했다. 다행히 채널도 여러 개여서 (문제가 생긴 채널 위치를 뒤로 보내는 등) 본인인증 채널 순서도 살짝 바꿨다.

모든 과정이 긴박했을 것 같은데, 어려웠던 점은 없었는지?

질병청 시스템이 폐쇄망으로 이뤄져 있어, 본인인증 부문만 클라우드에 따로 구축하는 것이 어려웠다. 와탭랩스에서도 본인인증 모니터링 시스템을 클라우드로 구축하기 위해 인력들을 따로 지방으로 파견 보내야 했다. 무엇보다 (문제 진단부터 해결까지) 이 모든 과정이 2주 만에 이뤄졌다. 원래는 시간이 상당히 걸리는 작업인데, 이 기간 동안 프로그램을 옮기고 본인인증 채널을 다양화했다.

문제점을 단 시간에 잡아낸 와탭랩스만의 기술적 강점은 무엇인가?

와탭랩스에서는 서비스형소프트웨어(SaaS) 형태로 전체 서버를 통합해 모니터링을 제공하는데, SaaS 기반의 서비스가 기술적으로 쉽지 않다. 서버 한 대에서 발생하는 데이터 양은 얼마 되지 않는다. 그러나 클라우드로 전환하면 서버가 늘어나고, 또 다시 서비스를 쪼개는 마이크로서비스아키텍처(MSA) 방식을 취한다. 이 경우 모니터링 해야 하는 대상은 방대하고, 이를 수집해 시각화하는 기술은 난이도가 높다. 와탭랩스에서는 이러한 서비스 경험이 많은 것이 강점이다.

와탭랩스의 주요 고객군은 어디인가?

주로 커머스 쪽이다. 커머스 업계는 (고객들의 접점이 많은 만큼) 실시간 모니터링이 민감한 편이다. 만약 하루 할인행사가 있다고 가정했을 때, 서버 과부하로 홈페이지가 다운되면 이벤트는 그대로 끝나버린다. 커머스 업계에서는 할인 이벤트마다 트래픽이 폭주하는 편으로, 시스템 성능, 안정성 모니터링을 중요하게 생각한다.

앞으로의 계획은 무엇인가

코로나19가 종결되면, 본격적으로 5G나 사물인터넷(IoT) 시장이 열릴 것으로 전망된다. 이때가 되면 지금 시스템보다 100배, 1000배의 성능을 요구할 것이다. 대규모 시스템들을 모니터링하기 위한 준비를 하고 있다.

글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다