[BioS] 바이오헬스산업에 침투한 빅데이터와 무한한 가능성

입력 2017-08-01 09:40

  • 작게보기

  • 기본크기

  • 크게보기

분산형 바이오빅데이터 추진TF 실무위서 사업 개발 현황 공유..정부, 의료정보 공통데이터 모델 기반 기술로 표준화 정보 플랫폼 구축, 코아제타 등 빅데이터 산업 연계 시도

최근 들어 4차산업혁명시대가 화두로 제시되면서 국내 바이오헬스 분야에서 빅데이터를 새로운 비즈니스 모델 발굴에 활용하려는 시도가 늘고 있다. 실제 의료기관에서 전자의무기록(EMR)을 통해 축적된 방대한 빅데이터는 다양한 용도로 활용될 수 있어 수많은 연구자들과 제약·바이오기업들 입장에선 매력적인 자료다. 전 국민이 건강보험에 가입된 국내 의료환경 특성상 건강보험 처방 내역을 기반으로 한 공공데이터도 국내 제약·바이오 산업 수준을 한층 끌어올릴 수 있는 새로운 무기로 각광받는다.

▲지난달 28일 서울 강남구 한국기술센터 21층 대회의실에서 열린 분산형 바이오 빅데이터 추진TF 실무위원회 3차 회의에서 국내 바이오헬스 전문가들이 빅데이터를 산업에 활용하기 위한 방안들을 소개했다.
지난달 28일 서울 강남구 한국기술센터 21층 대회의실에서 열린 분산형 바이오 빅데이터 추진TF 실무위원회 3차 회의에서 국내 바이오헬스 분야에 빅데이터를 활용하기 위한 다양한 시도가 소개됐다.

지난 4월 산업통상자원부가 발족한 분산형 바이오 빅데이터 추진TF(단장 송시영 연세대 의과대학장)는 4차 산업혁명의 핵심인 바이오 빅데이터 구축·활용방안을 민관 합동으로 마련하기 위해 출범했다.

이날 열린 회의는 빅데이터를 활용한 비즈니스 현황을 파악하고 향후 실무위원회 운영을 위한 추진계획을 논의하기 위해 마련됐다. 코아제타, 신테카바이오, 메디블럭, 웰트, 휴레이, AIA 등 빅데이터와 바이오헬스 산업의 연계를 진행 중인 기업들도 자사의 사업 방향을 공유했다.

박래웅 아주대 의과대학 의료정보학과 교수는 산업통상자원부와 공동으로 구축 중인 공통데이터 모델기반 분산연구망을 소개하며 빅데이터 기반 바이오헬스 플랫폼 개발의 진행 상황을 보고했다.

▲박래웅 아주대 교수가 공통데이터 모델 기반 분산연구망을 소개하고 있다.
원리는 간단하다. 개별 의료기관에 흩어진 방대한 의료 정보를 한 곳에 끌어모아 산업이나 학술적으로 활용하는 구조다. 표준화된 바이오데이터 기반의 개방형 공유 시스템으로 수요자가 원하는 분석 결과 데이터를 공유 또는 중계하는 플랫폼을 개발하는 작업이다.

국내 의료기관의 경우 EMR 보급률이 세계 1위 수준이어서 바이오의료 데이터는 질적으로 세계 최고 수준이라는 평가를 받는다. ICT 기술과 결합한 헬스케어 신산업 창출에 유리한 환경이다. 하지만 의료기관별 EMR 형식이 상이해 산업적 활용이 어렵고 개인정보보호법 및 데이터 보유기관과 수요기관 연계 시스템 부재의 문제점이 제기된다.

박래웅 교수는 “지금까지 의료정보와 관련된 수없이 많은 시스템들은 하나의 병원에서만 구현이 됐고 병원마다 다른 정보를 표준화하는데 어려움이 있었다. 데이터를 공개했을 때 해당 기관에 불리하게 작용할 수 있다는 두려움도 있었다”라고 지적했다.

정부와 박 교수 연구팀이 구축 중인 공통데이터 모델기반 분산연구망은 공동데이터 모델(CDM, Common Data Model) 기반 기술을 통해 다양한 기관이 보유 중인 데이터를 표준화하는 플랫폼이다.

의료기관들이 보유한 EMR 자료가 CDM이라는 플랫폼을 거쳐 개인 정보와 같은 비공개 정보를 제외한 표준화된 분석코드로 제공되는 구조다. 예를 들어 임상데이터의 경우 환자의 관찰기간, 약물노출, 진단검사결과, 용량 등의 모든 정보가 표준화된 코드로 집약된다.

▲분산형 바이오 빅데이터 모델(자료: 산업통상자원부)

박 교수는 “서로 다른 데이터 구조를 지닌 여러 기관의 데이터를 CDM으로 변환해 같은 데이터 구조로 변환하고 같은 분석방법과 분석도구를 적용해 결과 수집·비교·분석이 가능하다”면서 “각 의료기관에서 수행한 분석결과만 수집하기 때문에 개인정보의 누출 위험이 원천적으로 방지된다”라고 설명했다.

표준화된 데이터는 다양한 영역에 활용이 가능하다. 표준화된 분산형 임상 비데이터를 활용해 고효율 임상시험 설계 서비스를 제공할 수 있고, 개인별 유전자 부석 결과를 활용해 다이어트 식단 제공 서비스를 발굴할 수도 있다. 환자의 임상데이터와 유전체 데이터를 활용한 암의 정밀의료 서비스도 새로운 사업 모델로 지목된다.

방대한 의료 정보는 신약 개발에도 활용된다. 오랜 기간 동안 환자들이 실제로 복용한 약물과 진료 정보를 들여다보면 시장에서 필요로 하는 약물을 찾을 수 있다. 예를 들어 서로 다른 고혈압약을 복용하는 패턴을 연구하면 향후 시장성이 높은 복합제의 조합도 미리 예측이 가능하다. 수억명의 당뇨약 복용 패턴을 연구하면 어떤 약물이 임상적으로 가장 만족도가 높았는지 추정할 수도 있다.

실제로 지난해 장질환 위험성이 불거진 고혈압치료제 ‘올메사르탄’의 국내 환자 위험성 예측에도 이 시스템이 유용하게 활용됐다. 프랑스에서 올메사르탄이 잘질환 위험도가 높다는 이유로 보험급여가 중단됐다.

박래웅 교수 연구팀은 건강보험공단의 자료를 활용해 올메사르탄 사용 코호트와 ACE 사용 코호트를 비교하는 방식으로 올메사르탄이 국내 환자들에도 장질환 위험이 높은지를 비교했다. 연구 결과 올메사르탄이 한국인에서는 장질환 위험이 나타나지 않는 사실을 알아냈다. 한국인이 프랑스인과 유전정보가 달라 부작용이 다르게 나타날 수 있다는 정보가 빅데이터 활용 연구를 통해 밝혀진 셈이다.

박 교수는 “건보공단의 12년치 100만명의 청구자료를 연구·분석하는데 불과 4시간 8분 소요됐다. 약물을 바꿔서 다시 연구하면 10분만에 분석할 수 있다. 이미 아주대병원은 22년치 자료를 공개한 상태다”라며 빅데이터를 활용한 연구·분석의 무한한 가능성을 소개했다.

이미 해외에서는 의료 빅데이터의 표준화된 임상정보로의 변환, 분석 및 활용을 위한 국제컨소시엄 ‘오딧세이(OHDSI, Observational Health Data Sciences and Informatics)’가 구축돼 있다. 오딧세이는 공통데이터모델을 기반으로 오픈소스 툴을 개발하고 분산형 연구망 구축을 목표로 하는 다국적 비영리조직이다. 14개 국가 200개 이상의 기관이 참여해 6억6000만명의 환자 데이터가 구축됐다. 국내에서도 건보공단을 포함한 14개 기관이 한국 오딧세이 컨소시엄에 참여 중이다. 국내 주요 상급종합병원을 포함해 10여개의 의료기관이 컨소시엄에 참여할 정도로 이미 충분한 데이터를 확보했다는 게 박 교수의 설명이다.

박 교수는 빅데이터를 효과적으로 활용할 수 있는 새로운 알고리즘을 속속 발굴, 새로운 비즈니스 창출에 기여하겠다는 구상이다. 다만 데이터 공급 기관에 대한 인센티브, 개인정보보호 및 생명심의윤리에 대한 의료기관별 다른 해석 등은 개선해야 할 숙제로 지적됐다.

이날 실무위원회에서는 신테카바이오(유전체데이터 활용 비즈니스), 메디블럭(데이터공유기반 비즈니스) 등이 다양한 데이터를 활용한 새로운 비즈니스 전망을 제시했다. 특히 공공 빅데이터를 기반으로 새로운 사업을 출범한 코아제타는 참석자들로부터 많은 관심을 받았다.

코아제타는 건강보험심사평가원(심평원)의 진료·처방 데이터를 재가공·분석해 제약사들에 서비스 하는 업체다.

코아제타는 4종의 표본데이터를 기반으로 다양한 자료를 분석한다. 예를 들어 코아제타는 연간 145만명의 진료·처방 정보에 해당하는 2700만건의 진료 정보를 심평원으로부터 구매한다. 이 데이터에는 성분별 약물 사용 현황, 진료 현황, 환자별 특성, 약물의 처방 지역 등 방대한 정보를 포함한다. 코아제타는 개인이나 일반 기업에서 열람할 수 없는 방대한 데이터를 자체 구축한 IT 기술을 활용해 산업 현장에서 활용할 수 있도록 재가공한다.

방대한 진료 정보에는 연도별 처방 추이, 약물 용량별 처방 현황, 병원별 처방 현황 등이 모두 들어있어 제약사의 신제품 개발에 유용하게 사용할 수 있다. 특정 연령대나 성별에서 많이 사용되는 약물도 파악이 가능하다.

▲코아제타의 PBD(PharmaBigData) 분석서비스의 특징(자료: 코아제타 홈페이지)

이홍기 코아제타 대표는 현재 시장에서 가장 많이 사용되는 DPP-4 억제제를 예로 들었다.

DPP-4 억제제는 인슐린 분비 호르몬 분해효소(DPP-4)를 저해하는 작용기전을 갖는 당뇨치료제로 현재 9개 제품이 국내 출시됐다. 실제 처방정보를 활용하면 최근 개별 약물의 처방량 패턴을 통해 현재 처방현장에서 어떤 약물의 사용량이 늘거나 줄고 있는지를 알아낼 수 있다.

복제약(제네릭)을 준비 중인 제약사 입장에선 약물 사용량이 증가하는 제품의 제네릭을 내놓는 것이 시장 전략에 유리하게 작용한다. 실제 환자들에게 처방되는 약물 조합을 통해 향후 유망한 복합제 패턴도 쉽게 찾아낼 수 있다.

이 대표는 “처방 정보를 활용하면 문헌을 찾아보는 것보다 수월하게 약물과 시장 정보를 들여다 볼 수 있다. 복합제의 경우 연구기간을 단축하고 부작용을 사전에 파악할 수 있다”면서 “의약품 개발의 패러다임을 바꿀 수 있다”고 강조했다. 이 대표는 정부가 추진 중인 EMR 자료 활용 빅데이터 사업과 코아제타의 빅데이터 분석 서비스를 접목하면 시너지를 낼 수 있을 것으로 전망했다.

최수진 산업통상자원 R&D전략기획단 신산업MD는 “바이오 빅데이터를 바탕으로 의료서비스, 제약, 금융, 유통 분야와 연계된 개인맞춤 건강관리서비스 비즈니스의 개발과 신산업 육성을 추진할 계획이다”고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소