2016년에 설립되어 캘리포니아주 산타클라라에 본사를 둔 Tachyum은 데이터 센터, AI 및 고성능 컴퓨팅(HPC) 시장에 혁명을 일으킬 수 있는 파괴적인 초 저전력 프로세서 아키텍처를 개발했다고 주장한다.
이 회사의 주력 제품은 5GHz 이상에서 실행되는 최대 192개의 코어를 통합하는 Prodigy라는 칩이다. 이는 CPU, GPU 및 TPU의 기능을 단일 프로세서에 결합하여 기존 장치보다 훨씬 적은 전력을 소비하면서 광범위한 작업 부하를 처리할 수 있도록 해준다.
컴퓨팅 성능이 계속해서 기하급수적으로 증가함에 따라 에너지 요구 사항도 빠르게 증가하고 있다. 새로운 연구에 따르면 인공지능은 2027년까지 네덜란드 크기만큼의 전력을 소비할 수 있다고 한다. Prodigy 칩은 에너지 사용량을 획기적으로 줄이면서 다양한 작업을 더 효율적으로 처리할 수 있는 잠재적으로 더 다재 다능한 시스템을 제공한다.
이번 달 Tachyum은 AI 훈련을 위한 세계에서 가장 빠른 슈퍼컴퓨터가 될 수 있는 계획을 발표했다. 아직 이름이 알려지지 않은 미국 회사가 Tachyum에 무려 5050엑사플롭스를 제공하는 시스템을 주문했다. 또는 달리 말하면 초당 최대 50,000,000,000,000,000,000(또는 5천만 조)개의 계산을 수행할 수 있다.
세계에서 가장 빠른 슈퍼컴퓨터는 매년 두 번 TOP500에 선정되며 각각 LINPACK이라는 벤치마크를 사용한다. 이는 정밀도가 더 높고 과학적 시뮬레이션이나 정확도가 중요한 기타 작업에 선호되는 64비트 부동 소수점 연산(FP64)을 기반으로 성능을 테스트한다. 예를 들어 Frontier는 이러한 64비트 계산을 기반으로 2022년 5월 최초의 "진정한" 엑사스케일 머신이 되었다.
이와 대조적으로 딥 러닝 및 기타 AI 모델은 낮은 정밀도를 허용할 수 있으며 FP16 또는 BF16과 같은 16비트 작업을 사용하는 경향이 있다. FP64의 정확도는 부족하지만 이러한 작은 데이터 덩어리로 인해 계산이 더 빨라질 수 있다.
FP64 및 FP32 외에도 Tachyum의 새로운 슈퍼컴퓨터는 16비트 형식은 물론 FP8 및 Int8도 지원하며, 이러한 낮은 정밀도의 데이터 유형을 행렬 곱셈기와 결합하여 기존 솔루션에 비해 수십 배 향상된 성능을 제공한다. 이 시스템은 "슈퍼 희소성"과 같은 Prodigy 칩의 압축 기술을 활용하여 복잡성과 메모리 요구 사항을 줄이고 신경망의 속도와 효율성을 크게 향상시킨다.
"모든 워크로드에 유틸리티를 제공하는 범용 프로세서로서 Prodigy 기반 서버는 단일 아키텍처에서 AI/ML, HPC 및 클라우드와 같은 컴퓨팅 도메인 간에 원활하고 동적으로 전환할 수 있다."고 회사는 성명서에서 설명했다. "Prodigy는 고가의 전용 AI 하드웨어에 대한 필요성을 없애고 서버 활용도를 대폭 높여 자본 및 운영 비용을 크게 줄이면서 전례 없는 성능, 전력 및 경제성을 제공한다."
Tachyum은 이러한 다재다능함을 통해 자사의 기계가 OpenAI의 GPT-4 크기에 해당하는 25,000개 모델을 처리할 수 있을 것이라고 주장한다. 수백 페타바이트의 DRAM이 탑재될 것이다. 곧 설치가 시작되어 2025년에 전체 용량에 도달할 것으로 예상된다.
Tachyum의 설립자이자 CEO인 라도슬라프 다닐락(Radoslav Danilak)은 "이 설치에 필요한 전례 없는 규모와 컴퓨팅 성능은 현재 시장의 어떤 칩 제조업체도 제공할 수 없다."고 말했다. "미래 언젠가 유사한 기능을 달성하겠다는 약속을 바탕으로 수십억 달러를 받는 스타트업이 있지만, Tachyum만이 잠재적으로 인지 AI로의 전환을 가능하게 하는 규모 이상의 더 큰 기계를 경제적으로 구축할 수 있는 기능을 제공할 수 있는 위치에 있다. 이번 구매 주문은 당사의 최초 시장 지위와 전 세계 AI 시장에 긍정적인 영향을 미칠 수 있는 당사의 능력을 입증하는 것이다."