구글의 TPUv4 슈퍼 컴퓨터 (출처:hpcwire)
4월 4일(현지시간) 구글은 자사 맞춤형 인공지능(AI) 칩인 TPU가 내장된 슈퍼 컴퓨터에 대한 세부 정보를 공개했다. 구글이 제작한 TPU 기반 슈퍼 컴퓨터는 ‘TPUv4’다.
TPUv4는 구글이 2016년부터 자체적으로 개발하고 설계한 TPU 칩 4000개 이상을 장착했다.
여기서 TPU란 ‘텐서 프로세싱 유닛(Tensor Processing Unit)’의 약자로, 이와 같은 AI 칩이 수천 개 정도 탑재된 슈퍼 컴퓨터는 오픈AI의 챗GPT(ChatGPT)와 구글의 바드(Bard)와 같이 AI 모델을 학습시킬 때 꼭 필요하다.
구글은 TPUv4 슈퍼 컴퓨터의 공개에 이어 과학 논문에 담긴 내용을 토대로 이들이 자체적으로 개발한 광학 스위치를 통해 4000개 이상의 TPU 칩을 어떻게 슈퍼 컴퓨터에 결합해 내장했는지에 관해 설명하며 대중들의 이해를 도왔다.
현재 AI 모델 학습용 반도체 시장의 점유율은 엔비디아(NVIDIA)가 90%이상을 차지하고 있다. 즉, AI 모델의 대부분은 엔비디아의 칩이 내장된 슈퍼 컴퓨터로 학습된다는 것이다. 엔비디아가 내놨던 AI 모델 학습용 칩의 이름은 ‘A100’이고, 이후 학습 속도가 4배 향상된 ‘H100’ 칩을 선보였다.
하지만 AI 학습 모델용 반도체로 승승장구하던 엔비디아는 이제 구글 TPU의 등장으로 직격탄을 맞게 될 전망이다. 구글의 TPU가 엔비디아의 A100 칩보다 한층 업그레이드된 성능으로 나타났기 때문이다.
구글 연구원에 의하면, 구글의 TPUv4 슈퍼 컴퓨터는 엔비디아 A100 칩이 내장된 슈퍼 컴퓨터보다 1.2배에서 최대 1.7배 더 빠르다. 뿐만 아니라 전력 효율은 1.3배에서 최대 1.9배 더 뛰어나다.
구글은 자사 TPU를 엔비디아의 H100 칩과는 비교하지 않았다. H100의 경우, TPU보다 훨씬 더 최근에 만들어진 반도체다. 더 발전된 제조 기술로써 제작된 것이라 비교군이 될 수 없다고 판단한 것으로 관측된다.
현재 엔비디아의 H100 칩과 경쟁 구도를 이룰 만한 구글의 맞춤형 칩은 마련되지 않았다. 구글은 H100에 맞설 새로운 TPU를 개발 중이라고만 언급했을 뿐이다. 그 외에 구체적인 언급은 피했다.
한편, 구글은 TPU 칩이 내장된 슈퍼 컴퓨터를 공개하기 전, 미리 해당 칩을 자체적으로 사용하고 있던 것으로 밝혀졌다. TPUv4 슈퍼 컴퓨터는 지난 2020년부터 ‘팜(PaLM)’과 같은 자사 AI 대규모 언어 모델을 학습시키는데 활용하고 있었다. 이 과정은 총 50일이 소요된 것으로 나타났다. 이미지 생성 AI인 미드저니(Midijourney)에도 TPU 기반 슈퍼 컴퓨터로 데이터를 학습한 정황도 확인됐다.
구글의 TPU는 2016년부터 꾸준히 개발되고 있다. TPU 반도체는 4세대 버전이다.
테크플러스 에디터 김혜인
tech-plus@naver.com
댓글0