globalmakers

[코로나가 바꾼 AI] AI알고리즘, 결핵 유발 박테리아 추적

center
코로나 19의 대유행으로 인해 인공지능(AI)의 역할이 더욱 커지고 있다. 특히 의학 분야에서는 박테리아나 바이러스 등의 연구 및 추적, 치료제 개발을 위한 다양한 데이터 분석 등에서 뛰어난 능력을 발휘하면서 주목을 받고 있다. 사진= 클립아트코리아
[글로벌메이커스 정신영 기자] 단, AI는 치료법을 정의하고 최소한의 오류로 표적을 식별하기 위한 첨단 정보 과학 응용 프로그램을 제공한다. 또 정밀의학에서 AI를 이용한 약물 화합물 스크리닝과 약물용도 변경 또는 재배치의 역할이 중요하게 작용되고 있다. 즉, 기존 약물이 COVID-19를 포함한 새로운 질병과 도전적인 질병을 치료하는 데 적극 사용되고 있는 것이다.

이와 관련, 최근 MIT 연구팀이 머신러닝에 새로운 기능을 통합하여 예측 능력을 향상시킨 AI 알고리즘에 대한 연구 결과를 발표했다. 이를 통해 결핵을 유발하는 박테리아의 생존에 필요한 단백질을 표적으로 삼는 몇 가지 화합물을 찾아낸 것으로 알려지기도 했다.

이 알고리즘은 컴퓨터 모델이 분석중인 데이터의 불확실성을 설명할 수 있는 새로운 접근 방식을 사용한 것이 특징이다.

MIT의 컴퓨터과학 및 인공지능연구소(CSAIL)의 컴퓨터 및 생물학 그룹 책임자인 보니 버거(Bonnie Berger)는 "이전에 컴퓨터 과학자들에 의해 사용된 기술이지만, 이번 연구를 통해 생물학에서도 기술이 통한다는 것을 밝혀 냈다"라며, "이러한 방법은 단백질 디자인과 다른 많은 분야에서도 유용하다는 것을 증명할 수 있을 것"이라고 말했다.

머신러닝은 알고리즘은 데이터를 바탕으로 예측하는 것을 학습하는 컴퓨터 모델링의 일종이다. 최근 몇 년 동안, 생물학자들은 특정 표적과 상호작용하는 분자를 찾기 위해 잠재적인 약물 화합물의 거대한 데이터베이스를 뒤지는 머신러닝을 사용하기 시작했다. 그러나 이 방법의 한 가지 제한은 분석하는 데이터가 훈련된 데이터와 유사할 때 알고리즘이 잘 수행되지만, 매우 다른 분자를 평가하는 데는 그다지 능숙하지 않다는 것이다.

연구팀은 이를 극복하기 위해 연구팀은 가우시안 프로세스 기법을 사용하여 알고리즘이 훈련된 데이터에 불확실성 값을 할당했다. 그러한 방법으로 모델들이 훈련 데이터를 분석할 때, 예측들이 얼마나 신뢰할 수 있는지를 고려했다.

이를 통해 연구팀은 72개의 작은 분자의 데이터 집합과 단백질 효소의 일종인 키나아제(kinases)라고 불리는 400개 이상의 단백질과의 상호작용을 가지고 모델을 훈련시켰다. 또 이 알고리즘을 사용하여 거의 11,000개의 작은 분자를 분석할 수 있었다.

이 방법을 사용하여, 연구팀은 그들이 모델에 넣은 단백질 키나아제들에 대해 매우 강한 예측 결합 친화력을 가진 분자를 식별했다. 여기에는 결핵의 원인균인 마이코박테리움에서 발견된 키나아제 1개뿐 아니라 인간 키나아제 3개가 포함됐다. 이 키나아제는 박테리아가 생존하는 데 매우 중요하지만, 결핵 항생제의 영향을 받지는 않는 것으로 밝혀졌다.

특히 연구원들은 이 모델의 예측이 매우 정확하다고 밝혔다. 실제 모델이 가장 확실성을 부여한 분자 중에서 약 90%가 실제 히트인 것으로 판명됐다. 이 수치는 약물 검사에 사용되는 기존 머신러닝 모델의 30~40%의 히트율보다 훨씬 높은 것이다.

한편, MIT 연구팀의 이 연구 결과는 시스템 생물학에 대한 연구를 다루는 셀 시스템스 온라인에 '머신러닝의 불확실성을 활용하여 생물학적 발견 및 설계 가속화'라는 제목으로 발표됐다.

news@globalmakers.co.kr
<Copyright ⓒ GlobalMarkers co, Ltd. 무단 전재 및 재배포 금지>

영상