DNA 컴퓨팅 진화: 새로운 시스템이 데이터를 저장하고, 체스를 두며, 수도쿠 퍼즐을 푼다.
DNA는 자연의 컴퓨팅 장치이다.
데이터 센터와 달리 DNA는 매우 컴팩트하다. 이 분자들은 전체 유기체의 유전적 청사진을 각 세포 내부의 작지만 정교한 구조로 포장한다. 냉동고나 시베리아 툰드라와 같이 차갑게 보관하면 DNA와 그 안에 인코딩된 데이터는 수천 년 동안 지속될 수 있다.
하지만 DNA는 단순한 저장 장치가 아니다. 수많은 분자가 유전자를 켜고 끈다. 이는 코드를 선택적으로 실행하는 것과 비슷하여 일상적인 세포 기능을 조정한다. 신체는 특정 시간에 특정 세포의 유전 코드의 일부를 "읽고" 함께 데이터를 원활하게 작동하는 건강한 삶으로 컴파일한다.
과학자들은 오랫동안 DNA를 일상적인 노트북을 보완하는 컴퓨팅 장치로 주시해 왔다. 전 세계의 데이터가 기하급수적으로 증가함에 따라 실리콘 칩은 데이터 저장 및 계산의 요구 사항을 충족하기 위해 고군분투하고 있다. 대규모 언어 모델과 기타 인공지능 모드의 등장으로 인해 대체 솔루션에 대한 필요성이 더욱 커지고 있다.
하지만 DNA 저장의 문제점은 내부 데이터를 "읽은" 후 종종 파괴된다는 것이다.
지난달, 노스캐롤라이나 주립대학교와 존스홉킨스대학교의 한 팀이 해결책을 찾았다. 그들은 여러 이미지를 인코딩한 DNA 분자를 뇌 세포와 비슷한 분지형 젤과 같은 구조에 삽입했다.
"덴드리콜로이드"라고 불리는 이 구조는 동결 건조된 구조보다 DNA 파일을 훨씬 더 잘 저장했다. 덴드리콜로이드 내의 DNA는 저장된 데이터를 손상시키지 않고 약 170회 이상 반복적으로 건조하고 재수화할 수 있다. 한 추정에 따르면 각 DNA 가닥은 일반적인 냉동고 온도에서 200만 년 이상 지속될 수 있다.
이전 DNA 컴퓨터와 달리 이 데이터는 클래식 컴퓨터의 메모리처럼 지우고 교체하여 간단한 체스 게임과 수도쿠를 포함한 여러 문제를 해결할 수 있다.
지금까지 DNA는 주로 장기 저장 장치 또는 일회용 컴퓨터로 여겨졌다. 연구 저자인 앨버트 쿵(Albert Keung)은 보도 자료에서 특정 데이터 파일을 저장, 읽기, "다시 쓰기, 다시 로드 또는 계산"할 수 있는 DNA 기술을 개발하는 것은 반복적으로 어렵거나 불가능해 보였다고 말했다.
하지만 그는 "우리는 이 DNA 기반 기술이 실행 가능하다는 것을 증명했다. 우리가 하나를 만들었으니까."라고 말했다.
모래알
이것은 저장 및 계산을 늘리기 위해 생명의 코드를 하이재킹하려는 첫 번째 시도는 아니다.
취해진 첫 번째 단계는 데이터 저장이었다. 우리 컴퓨터는 0과 1로 인코딩 된 이진 정보 비트로 실행된다. 반면 DNA는 일반적으로 A, T, C, G 문자로 표현되는 네 가지 다른 분자를 사용한다. 즉, 00, 01, 10, 11과 같은 다른 0과 1 쌍을 다른 DNA 문자로 인코딩할 수 있다. DNA는 세포에 포장되는 방식 때문에 이론적으로 디지털 장치보다 훨씬 더 적은 공간에 훨씬 더 많은 데이터를 저장할 수 있다.
쿵(Keung)은 "연필 지우개 크기의 DNA 기반 저장소에 노트북 1,000개 분량의 데이터를 넣을 수 있다."라고 말했다.
모든 컴퓨터에서 정보를 검색하고 검색할 수 있어야 한다. 우리 세포는 DNA 가닥의 특정 부분을 필요에 따라 읽는 메커니즘을 발전시켰다. 이는 특정 데이터를 추출하는 일종의 랜덤 액세스 메모리이다. 이전 연구에서는 이러한 시스템을 활용하여 DNA 파일 내의 책, 이미지, GIF를 저장하고 검색했다. 과학자들은 또한 DNA "라벨"이 있는 미세한 유리 구슬을 일종의 파일링 시스템으로 사용하여 쉽게 추출할 수 있다.
하지만 데이터를 저장하고 추출하는 것은 이야기의 절반에 불과하다. 컴퓨터는 계산을 해야 한다.
작년에 한 팀이 최소한의 에너지로 수십억 개의 다른 회로를 실행할 수 있는 프로그래밍 가능한 DNA 컴퓨터를 개발했다. 전통적으로 이러한 분자 기계는 계산 필요에 따라 다른 가닥이 서로를 잡도록 하여 작동한다. 다른 쌍은 "and", "or", "not" 논리 게이트에 신호를 보낼 수 있다. 이는 오늘날 디지털 컴퓨터의 핵심을 요약한 것이다.
하지만 읽기와 계산은 종종 원래 DNA 데이터를 파괴하여 대부분의 DNA 기반 시스템을 일회용으로 만든다. 과학자들은 또한 분자 구조의 변화를 모니터링하는 또 다른 유형의 DNA 컴퓨터를 개발했다. 이는 다시 쓸 수 있다. 표준 하드 드라이브와 유사하게 여러 라운드의 데이터를 인코딩할 수 있지만 확장하기도 어렵다.
DNA가 데이터를 만나다.
새로운 연구는 두 세계의 장점을 모두 결합했다. 연구팀은 정보를 저장하고, 계산을 수행하고, 시스템을 다음 라운드로 재설정할 수 있는 DNA 컴퓨터를 설계했다.
시스템의 핵심은 생물학의 중심 교리에 의존한다. DNA는 세포 내의 작은 케이지에 있다. 유전자가 켜지면 데이터가 RNA로 변환되고, RNA는 유전적 청사진을 단백질로 변환한다. DNA가 안전하게 저장되면 유전자를 위아래로 돌리는 단백질 "스위치"를 추가하면 RNA의 유전적 판독이 변경되지만 원래 유전적 시퀀스는 그대로 유지된다.
원래 데이터는 변경되지 않으므로 개선을 통해 단일 DNA 인코딩 데이터 세트에서 RNA 기반 계산을 여러 라운드 실행할 수 있다.
이러한 아이디어를 바탕으로 연구팀은 뇌 세포와 유사한 가지가 있는 젤리와 같은 구조를 설계했다. "덴드리콜로이드"라고 명명된 이 부드러운 소재는 각 DNA 가닥이 "처음부터 데이터 저장에 DNA를 매력적으로 만드는 데이터 밀도를 희생하지 않고" 주변 소재를 잡을 수 있도록 했다라고 연구 저자인 오를린 벨레브가 말했다.
"우리는 DNA를 손상시키지 않고 재료 표면에서 직접 DNA 정보를 복사할 수 있다. 또한 타겟 DNA 조각을 지운 다음 하드 드라이브에 저장된 정보를 삭제하고 다시 쓰는 것처럼 같은 표면에 다시 쓸 수도 있다."고 연구 저자인 케빈 린이 말했다.
연구팀은 시스템을 테스트하기 위해 200개 문자의 합성 DNA 시퀀스를 재료에 삽입했다. DNA 시퀀스를 RNA로 변환하는 분자 칵테일을 추가하면 재료는 10회에 걸쳐 RNA를 반복적으로 생성할 수 있었다. 이론적으로 생성된 RNA는 일반 냉장고 및 냉동고 온도에서 저장된 46테라바이트의 데이터를 인코딩할 수 있다.
덴드리콜로이드는 또한 각각 길이가 거의 250자인 2,700개 이상의 서로 다른 DNA 가닥을 흡수하여 데이터를 보호할 수 있다. 한 테스트에서 팀은 세 개의 서로 다른 JPEG 파일을 구조에 인코딩하여 디지털 데이터를 생물학적 데이터로 변환했다. DNA 파일에 액세스하는 것을 모방한 시뮬레이션에서 팀은 프로세스에서 데이터를 잃지 않고 10번 데이터를 재구성할 수 있었다.
게임 시작
팀은 다음으로 일종의 생물학적 "지우개"에서 영감을 얻었다. 이러한 단백질은 DNA 청사진을 손상시키지 않고 RNA를 먹어치운다. 이 과정은 세포가 일반적인 기능을 수행하는 방식을 제어한다. 예를 들어 건강에 해로운 RNA 가닥을 파괴한다.
개념 증명으로 팀은 여러 퍼즐을 풀기 위해 1,000개의 다른 DNA 조각을 개발했다. 간단한 체스 게임의 경우 각 DNA 분자는 9개의 잠재적인 위치를 인코딩했다. 분자는 풀링되었으며 각각 잠재적인 구성을 나타낸다. 이 데이터를 통해 시스템은 학습할 수 있었다. 예를 들어, 한 유전자는 켜지면 RNA에서 자체 복제하여 체스판에서 이동할 수 있다. 다른 유전자는 게임에 해로운 RNA 수준을 낮출 수 있다.
이러한 DNA-RNA 과정은 최종 결과를 확인하는 것이 임무인 엔지니어링된 단백질에 의해 제어되었다. 마지막 단계로 규칙을 위반하는 모든 RNA 가닥은 파괴되어 최종 예상 솔루션을 나타내는 가닥만 남았다. 팀은 체스 외에도 이 프로세스를 구현하여 간단한 수도쿠 퍼즐을 풀었다.
DNA 컴퓨터는 아직 초기 단계이다. 하지만 이전 세대와 달리 이 컴퓨터는 저장과 계산을 하나의 시스템에 담았다.
쿵(Keung)은 "분자 데이터 저장과 계산에 대한 기대가 많지만, 이 분야가 얼마나 실용적인지에 대한 상당한 의문이 제기되었다."고 말했다. "우리는 분자 컴퓨팅 분야에 영감을 줄 무언가를 개발하고 싶었다."
이미지 출처: Luke Jones / Unsplash