AI+유전자 편집은 생명공학을 첨단 기술로 전환할 것을 약속한다.
2018년 화학 노벨상 강의에서 프랜시스 아놀드(Frances Arnold)는 "오늘날 우리는 모든 실용적인 목적을 위해 어떤 DNA 서열이든 읽고 쓰고 편집할 수 있지만 구성할 수는 없다."라고 말했다.
그것은 더 이상 사실이 아니다.
그 이후로 과학과 기술이 많이 발전하여 인공지능이 DNA를 구성하는 법을 배웠고, 과학자들은 유전자 변형 박테리아를 이용해 맞춤형 단백질을 설계하고 만드는 길에 들어섰다.
목표는 AI의 설계 재능과 유전자 편집의 엔지니어링 능력을 통해 과학자들이 박테리아를 수정하여 온실 가스를 줄이고 플라스틱을 소화하거나 종별 살충제 역할을 할 수 있는 새로운 단백질을 생산하는 미니 공장 역할을 할 수 있다는 것이다.
분자과학과 환경화학을 연구하는 화학 교수이자 전산화학자로서 나는 AI와 유전자 편집의 발전이 이를 현실적으로 가능하게 한다고 믿는다.
유전자 서열분석: 인생의 요리법 읽기
모든 생명체에는 자신을 복제하고 단백질을 만드는 데 필요한 유전 정보를 제공하는 유전 물질인 DNA와 RNA가 포함되어 있다. 단백질은 인간 건조 체중의 75%를 구성한다. 그들은 근육, 효소, 호르몬, 혈액, 머리카락, 연골을 구성한다. 단백질을 이해한다는 것은 생물학의 많은 부분을 이해한다는 것을 의미한다. DNA의 뉴클레오티드 염기 순서 또는 일부 바이러스의 RNA는 이러한 정보를 암호화하며, 게놈 서열분석 기술은 이러한 염기의 순서를 식별한다.
인간 게놈 프로젝트(Human Genome Project)는 1990년부터 2003년까지 전체 인간 게놈의 염기서열을 분석한 국제적인 노력이었다. 급속도로 발전하는 기술 덕분에 게놈의 처음 1%를 염기서열 분석하는 데 7년이 걸렸고 나머지 99%의 염기서열을 분석하는 데 7년이 걸렸다. 2003년까지 과학자들은 인간 게놈의 20,000~25,000개 유전자를 암호화하는 30억 개의 뉴클레오티드 염기쌍의 완전한 서열을 확보했다.
그러나 대부분의 단백질의 기능을 이해하고 오작동을 수정하는 것은 여전히 어려운 일이었다.
AI가 단백질을 학습한다.
각 단백질의 모양은 그 기능에 매우 중요하며 아미노산의 서열에 의해 결정되며, 이는 다시 유전자의 뉴클레오티드 서열에 의해 결정된다. 잘못 접힌 단백질은 모양이 잘못되어 신경퇴행성 질환, 낭포성 섬유증, 제2형 당뇨병 등의 질병을 유발할 수 있다. 이러한 질병을 이해하고 치료법을 개발하려면 단백질 형태에 대한 지식이 필요하다.
2016년 이전에는 단백질의 모양을 결정하는 유일한 방법은 단결정에 의한 X선 회절을 사용하여 분자 내 3차원 원자와 분자의 정확한 배열을 결정하는 실험실 기술인 X선 결정학을 통해서였다. 당시 결정학을 통해 약 20만 개의 단백질 구조가 밝혀졌으며 수십억 달러의 비용이 소요되었다.
머신러닝 프로그램인 AlphaFold는 이러한 결정 구조를 훈련 세트로 사용하여 뉴클레오티드 서열에서 단백질의 모양을 결정했다. 그리고 1년도 채 안 되어 이 프로그램은 서열이 밝혀지고 발표된 모든 2억 1,400만 개의 유전자의 단백질 구조를 계산했다. AlphaFold가 결정한 단백질 구조는 모두 무료로 이용 가능한 데이터베이스에 공개되었다.
비감염성 질병을 효과적으로 해결하고 신약을 설계하기 위해 과학자들은 단백질, 특히 효소가 소분자를 결합하는 방법에 대한 더 자세한 지식이 필요하다. 효소는 생화학 반응을 활성화하고 조절하는 단백질 촉매이다.
2024년 5월 8일에 출시된 AlphaFold3는 단백질의 모양과 작은 분자가 이러한 단백질에 결합할 수 있는 위치를 예측할 수 있다. 합리적인 약물 설계에서는 약물이 치료되는 질병과 관련된 경로에 관련된 단백질과 결합하도록 설계된다. 소분자 약물은 단백질 결합 부위에 결합하여 그 활성을 조절함으로써 질병 경로에 영향을 미친다. AlphaFold3는 단백질 결합 부위를 예측할 수 있어 연구자의 약물 개발 역량을 향상시킬 수 있다.
AI + CRISPR = 새로운 단백질 합성
2015년경 CRISPR 기술의 개발은 유전자 편집에 혁명을 일으켰다. CRISPR는 유전자의 특정 부분을 찾고, 이를 변경 또는 삭제하고, 세포가 유전자 산물을 어느 정도 발현하도록 만들거나 그 자리에 완전히 외래 유전자를 추가하는 데 사용될 수 있다.
2020년 제니퍼 다우드나(Jennifer Doudna)와 엠마뉴엘 샤르펜티에(Emmanuelle Charpentier)는 “게놈 편집 방법(CRISPR) 개발”로 노벨 화학상을 받았다. CRISPR를 사용하면 종별로 수년이 걸리고 비용이 많이 들고 힘든 유전자 편집을 이제 며칠 만에 적은 비용으로 완료할 수 있다.
AI와 유전공학은 빠르게 발전하고 있다. 한때 복잡하고 비용이 많이 들었던 일이 이제는 일상적인 일이 되었다. 앞으로의 꿈은 머신러닝과 CRISPR 변형 박테리아의 조합으로 설계되고 생산되는 맞춤형 단백질을 만드는 것이다. AI는 단백질을 설계하고 CRISPR를 사용하여 변형된 박테리아는 단백질을 생산한다. 이런 방식으로 생산된 효소는 잠재적으로 이산화탄소와 메탄을 흡입하면서 유기 공급원료를 배출하거나 플라스틱을 콘크리트 대체물로 분해할 수 있다.
나는 유전자 변형 유기체가 이미 농업과 제약 분야에서 미국 경제의 2%를 차지하고 있다는 점을 고려할 때 이러한 야망이 비현실적이지 않다고 생각한다.
두 그룹은 서로 다른 AI 시스템에 의해 설계된 기능적인 효소를 처음부터 만들었다. 워싱턴 대학의 데이비드 베이커(David Baker) 단백질 디자인 연구소는 독특한 발광 효소를 만드는 데 사용되는 "가족 전체 환각"이라는 이름의 새로운 딥 러닝 기반 단백질 디자인 전략을 고안했다. 한편, 생명공학 스타트업 Profluent는 모든 CRISPR-Cas 지식을 종합하여 훈련된 AI를 사용하여 새로운 기능을 하는 게놈 편집기를 설계했다.
AI가 새로운 CRISPR 시스템과 지구상에서 본 적이 없는 생물발광 효소를 만드는 방법을 배울 수 있다면 CRISPR와 AI를 결합하여 다른 새로운 맞춤형 효소를 설계할 수 있다는 희망이 있다. CRISPR-AI 조합은 아직 초기 단계이지만 일단 성숙되면 매우 유익할 가능성이 높으며 세계가 기후 변화에 대처하는 데 도움이 될 수도 있다.
그러나 기술이 강력할수록 그에 따른 위험도 더 커진다는 점을 기억하는 것이 중요하다. 또한 인간은 자연 시스템의 복잡성과 상호 연결성으로 인해 자연 공학에 큰 성공을 거두지 못하여 종종 의도하지 않은 결과를 초래한다.
이미지 출처: Gerd Altmann / Pixabay