13세대 인텔 코어 프로세서의 다이 이미지. 이 안에 엄청난 수의 트랜지스터가 집적됩니다.
약간의 차이는 있지만, AMD와 인텔은 각각 약 1년에서 2년 사이 주기로 새로운 프로세서를 선보이고 있습니다. 그 결과 AMD는 라이젠 7000 시리즈를 인텔은 13세대 코어 프로세서로 이어지고 있지요. 단순히 세대만 거듭한 것은 아닙니다. 매번 업그레이드된 것은 아니지만, 일정 주기로 공정도 세밀해지고 내부 전송속도나 아키텍처의 최적화가 이뤄지면서 성능이 개선됩니다.
흔히 프로세서의 성능은 공정에 맞춰 설계되는 아키텍처 구조에 좌우된다 봅니다. 정해진 공간 안에 다수의 트랜지스터를 배치하는데 한계가 있기에 효과적으로 설계하는 게 중요하죠. AMD는 기존 불도저(Bulldozer) 마이크로 아키텍처에서 젠(Zen)으로 탈바꿈하며 성능을 크게 개선한 것이 그 예입니다. 인텔도 과거 XX브릿지 계열 아키텍처로 충격을 줬지만, 스카이레이크(Skylake) 이후 정체기를 겪었고 이후 앨더레이크(Alder Lake) 아키텍처에서 큰 성능 향상을 이뤄냈죠. 이렇게 미세공정과 그에 따른 아키텍처의 설계가 성능에 얼마나 영향을 주는지 알 수 있습니다.
이런 흐름이 최근 조금씩 한계를 맞고 있습니다. 아무래도 미세공정은 물리적인 부분으로 인해 극적으로 집적도를 높이기가 쉽지 않습니다. 현재 주로 쓰이는 5나노미터(nm)에서 7나노미터 정도의 미세공정도 도입에 제법 많은 시간이 소요됐는데요. 향후 3나노미터나 그 이후 옹스트롬(0.1나노미터) 단위로 이전하기 위해서는 많은 시행착오를 겪어야 합니다. 그렇다고 차세대 프로세서 생산을 마냥 미룰 수 없는 일입니다.
그래서 두 제조사는 미세공정 제조의 한계를 넘어서기 위한 노력을 기울이고 있습니다. 그런데 자세히 살펴보면 비슷하지만, 다른 길을 걷고 있는 게 보이는데요. 그것이 무엇일까요?
칩렛으로 미세공정 극복하는 AMD, ‘일단 쌓는다’
미세공정을 빠르게 받아들이고 효율을 높이기 위해 다양한 시도를 진행했던 AMD는 칩렛(Chiplet)이라는 개념으로 접근하며 생산 효율과 성능 향상이라는 두 마리 토끼를 잡았습니다. 특히 2세대 젠 아키텍처에서는 7나노미터 미세공정이 적용된 프로세서 블록과 12나노미터에서 생산된 입출력 전용 블록을 따로 배치함으로써 신선한 충격을 준 바 있습니다.
그 이유는 과거 프로세서 생산 방식이 프로세서(그래픽코어 포함)와 입출력 등이 한 다이 안에 포함되는 모노리식(Monolithic) 구조를 썼기 때문입니다. 인텔 또한 이 모노리식 설계를 채택해왔죠. 이유는 간단합니다. 각 블록이 최대한 가까이 붙어 있어야 최소한의 손실로 최대 성능을 낼 수 있었으니까요. 이제는 그렇게 할 필요가 없어졌습니다. 그만큼 전송대역이 빨라졌기 때문이죠.
라이젠 스레드리퍼의 다이 배치 구조로 일반적인 프로세서와 달리 칩이 여럿 배치된 형태입니다. 칩렛 설계를 통해 다수의 코어를 빠르게 경험해 볼 수 있게 됐습니다.
장점은 분명했습니다. 전송대역을 확보하고 블록의 최적화에 집중하면 되므로 기본적인 성능 확보에 유리합니다. 설계와 생산 과정에서 드는 비용도 줄일 수 있었습니다. 그러니까 이 구조를 사용하면 시장에 더 많은 코어를 가진 프로세서를 내놓는 것도 가능합니다. 실제로 AMD는 라이젠 스레드리퍼 프로세서를 통해 최대 64개 이상 코어를 제공하고 있습니다.
하지만, 이것도 지속하기란 쉽지 않지요. AMD가 떠올린 것은 바로 쌓는 겁니다. 실제로 라이젠 5000 시리즈에서는 캐시 메모리를 프로세서 블록 위에 쌓은 V-캐시(V-Cache) 라인업을 선보였습니다. 실제 해당 제품의 성능이 뛰어났으며, 이를 바탕으로 라이젠 7000 시리즈에도 V-캐시를 적용한 제품을 공개했습니다.
AMD는 다양한 형태로 프로세서 설계를 진행해왔고, 이제는 위에 쌓고 있습니다. (출처: AMD)
AMD는 이 기술을 향후 적극적으로 활용해 나갈 것으로 보입니다. 프로세서 뿐만 아니라 그래픽카드에서도 이를 적용하기 시작했습니다. 이번에 선보인 라데온 RX 7000 시리즈는 그래픽 프로세서 블록과 메모리, 입출력 블록을 각각 설계해 결합해 둔 형태를 띕니다. 기존의 구조를 따른 것인데요. 아직 V-캐시처럼 메모리를 쌓지 않았으나 향후 이를 염두에 둔 설계라고 알려져 있습니다. 정해진 공간의 한계를 극복하고 성능 향상을 위한 노력은 당분간 효과를 볼 것으로 예상됩니다.
집적도의 한계를 넘어서려는 인텔 ‘타일처럼 붙인다’
모노리식 설계를 고집해오던 인텔이 변화를 시도한 사례가 바로 레이크필드(Lakefield)입니다. 모바일 프로세서로 11세대 코어 프로세서 아키텍처에 뿌리를 두고 있는데요. 이 아키텍처의 빅코어 1개와 저전력에 초점을 둔 리틀코어, 트레몬트 아키텍처 4코어로 만들어졌습니다. 어떻게 보면 스마트폰에서 볼 법한 빅-리틀 아키텍처인 셈입니다. 인텔은 이를 하이브리드 기술(Intel Hybrid Technology)라고 불렀습니다. 실제로는 포베로스(Foveros) 적층 기술이라고 부르죠.
3D 적층 기술을 접목한 인텔 포베로스는 기술적으로 주목을 받았지만, 제품은 성공했다고 보기 어려웠습니다. (출처: 인텔)
포베로스 기반의 코어 프로세서는 3D 적층 기술을 바탕으로 2개의 블록과 2개의 메모리를 쌓은 구성을 하고 있습니다. 크기가 가로세로 12mm에 불과했는데요. 10센트 동전 크기입니다. 그러니까 크기를 극단적으로 줄여 소형 장치에 쓸 목적이었던 것이죠. 이 프로세서는 처음에 주목을 받았지만, 의외로 수명은 길지 않았습니다. 적용 제품도 적었습니다. 이후 인텔은 기존의 모노리식 구조로 프로세서를 만들어 왔습니다.
그런데 이제 인텔도 그 변화에 적응하지 않을 수 없는데요. 먼저 프로세서와 그래픽 처리장치, 입출력 컨트롤러 등을 타일처럼 블록화해 합치는 타일 아키텍처를 제안하고 있습니다. 포베로스 기술의 연장선인데요. 인텔은 2세대 포베로스라고 부릅니다. 13세대 코어 프로세서 이후에 출시될 예정인 메테오 레이크(Meteor Lake)가 이 기술을 적용할 예정이라고 합니다.
데이터센터용 프로세서인 코드명 폰테 베키오(Ponte Vecchio), HEDT 프로세서로 출시될 그래나이트 래피즈(Granite Rapids) 등도 이 기술을 씁니다. 크기가 엄청난 제품이지만 컴퓨트 타일과 초고대역 메모리(HBM) 타일, 그래픽 처리를 담당하는 Xe 타일, 대규모 통신을 위한 임베디드 멀티다이 멀티커넥트 브릿지(EMIB) 타일 등을 하나로 묶습니다. 이를 통해 기존 모노리식 수준의 성능은 물론이고 전력 소모도 어느 정도 줄일 수 있다는 것이 인텔의 주장입니다.
인텔은 차기 제품에 폭넓게 타일 구조의 아키텍처를 접목할 예정입니다. (출처: 인텔)
각각의 타일은 목적에 따라 다른 미세공정 적용을 받습니다. 프로세서 타일은 제품에 따라 인텔 4 공정이나 TSMC의 N5 공정을 사용할 예정이고요. 그래픽 관련 타일은 TSMC N7 공정에서 생산될 예정입니다. 폰테 베키오 같은 경우는 기본이 되는 베이스 타일이 인텔 7에서 만들어진다고 하는데요. 다양한 조합을 통해 생산 비용을 낮추고 성능을 최대한 확보할 예정입니다.
집적도의 한계를 극복하려는 시도, 소비자에게 더 유리하다
AMD는 이미 MCM(Multi-Chip Module)에서 나아가 칩렛(Chiplet) 구조를 완성했고, 그 위에 또 다른 반도체를 얹기 시작했습니다. 인텔은 반도체를 겹겹이 쌓아가며 얻은 노하우로 칩렛 설계를 진행하고 있습니다. 프로세서와 내장 그래픽, 컨트롤러 등 서로 다른 실리콘 다이를 최적화된 미세공정 내에서 생산해 하나로 합친다는 점에서 AMD와 인텔의 목적지는 어느 정도 비슷한 면이 있습니다. 다만 접근하는 방식의 차이가 존재합니다.
이 같은 구조는 생산 측면의 이점은 물론이고 성능도 높여줄 것으로 예상됩니다. 많은 코어를 제공하면서 처리 효율은 높아지고, DDR5 메모리 및 기본적인 전송대역의 향상으로 빠른 데이터 처리가 가능해질 것입니다. 그만큼 소비자는 더 나은 성능의 시스템을 경험하게 되리라 생각됩니다. 트랜지스터 집적도가 18~24개월 주기로 2배씩 증가한다는 무어의 법칙, 다양한 방법으로 이를 극복하려는 노력이 이어지고 있는데요. 미래의 반도체, 그리고 프로세서는 어떻게 발전하게 될까요?
댓글0