벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] ARM 코어와 x86 코어를 동등하게 다루는 AMD의 CPU 전략

tware 2014. 7. 30. 22:00

 

ARM 코어와 x86 / x64 코어를 동급의 중요도로


 AMD가 현재 목표하고 있는 것은 ARM 코어와 x86 / x64 코어를 동일한 중요도로 취급하는 "Ambidextrous (양손 잡이)" 전략이다. x86 / x64가 메인이며 ARM이 하위인 것이 아니라, x86 / x64와 ARM을 동등한 위치의 프로세서로 하려는 것으로 보인다. 독자적인 마이크로 아키텍처의 ARM 코어 개발이나, ARM과 x86 / x64를 교체 가능한 칩 설계 프레임워크의 계획이 x86 CPU 회사에서 벗어나려는 AMD의 자세를 선명하게 나타내고 있다.

 

 AMD는 독자적인 ARM CPU 코어 개발 팀을 설립해 고성능 ARM 코어 설계를 하고 있다. 또  x86 / x64와 ARM의 두 CPU 코어를 온칩 패브릭 (내부 인터커넥트)​​ 호환하고, 그 위에 동일한 물리 설계 SoC상의 CPU 모듈 공간에 양 코어를 넣는 것이 가능하도록 한다. 막대한 비용을 들여 ARM 코어의 개발을 진행하고 있으며, x86 계 CPU 코어와 ARM 계 CPU 코어의 APU / SoC를 동시 병행으로 낮은 비용으로 개발 가능한 태세를 조정할 계획이다. 향후 2 ~ 3 년에 AMD의 많은 제품 분야에서 x86 / x64 버전과 ARM 버전이 공존하게 된다. AMD는 x86 / x64과 ARM 양방의 솔루션을 투입 가능 하다는 독자성을 살리려 한다.

 

 

AMD의 아키텍처

 


 AMD는 금년 (2014년) 5월에 이러한 Ambidextrous 전략의 개요를 밝혔는데, 제품 로드맵을 도식화하여 정리하면 AMD 전략의 전체 모습이 보인다. 기존의 PC 업계의 상식으로 보면 ARM과 x86 / x64의 두 바퀴로 전환한 AMD의 현재 CPU / APU 로드맵은 뒤얽히고 복잡하다. x86 / x64 계의 CPU 코어가 PC와 서버용으로 매해 코어가 세대 교체하는 기존의 단순한 로드맵과는 다르다.

 

 

4계열의 CPU 마이크로 아키텍처가 공존하는 AMD의 로드맵


 AMD의 라인업은 2016년 이후에는, 합계 4계열의 CPU 마이크로 아키텍처 계열이 공존하게된다. x86 / x64 계열의 고성능 CPU 코어인 Bulldozer (불도저) 계와, x86 / x64 계열의 저전력 CPU 코어의 Bobcat (밥캣) / Jaguar (쟈규어)계 이외에 ARM 계열 코어가 더해지기 때문이다. AMD는 ARM에서 소프트 매크로 RTL 라이센스를 받은 Cortex-A57를 올해 (2014년) 투입. 2016년에는 아키텍처럴 라이센스에 의한 AMD의 독자 개발 마이크로 아키텍처의 보다 고성능 ARM 코어 "K12"를 투입한다. AMD는 K12과 Cortex-A57가 공존한다고 했기 때문에, x86 / x64 계와 ARM 계열 각각에서 성능 범위가 다른 두 계열의 코어가 병존하게 된다.

 

 

AMD의 아키텍처 개발

 


 제품 카테고리로 보더라도 AMD의 제품군 중에서 ARM의 입지가 확대되어 간다. 최초의 단계에서는 AMD의 ARM 제품은 서버와 내장용(임베디드) 멀티 코어 CPU 뿐이다. 그러나 내년 (2015년)에 이르면 클라이언트와 내장용 APU (Accelerated Processing Unit)가 더해진다. 2016년에는 Cortex-A57 서버 SoC쪽도 고성능인 서버 SoC가 더해진다.

 

 AMD가 향후 증가할 임베디드와 저전력 클라이언트, 그리고 스몰 코어 서버, 세미 커스텀의 모든 분야에서 x86과 ARM이 나란하게 된다. x86 만의 카테고리로 남는 것은 성능 & 메인 스트림 PC로 전통적인 고성능 멀티 프로세서 서버 시장 뿐이다.

 

 그렇지만, AMD는 기존 PC 시장도 유지할 예정이며, 성능 / 메인 스트림 PC 용 APU도 계속 개발한다. 내년에는 새로운 성능 CPU 코어 "Excavator (엑스커베이터)" 기반 APU가 등장한다. Excavator 기반 APU는 PC에서는 "Carrizo (카리조)" 서버에서는 "Toronto (토론토)". GPU 코어는 Volcanic Islands 세대가 되어, 사우스 브릿지인 FCH 칩도 통합한 SoC다. 메모리는 DDR4로 현재는 스택 DRAM 솔루션은 보이지 않는다. 또 멀티 프로세서 서버용 후속 제품도 현재는 상황이 분명치 않다.

 

 

AMD는 전통적인 PC 및 서버 시장이 회사​​의 비즈니스에 차지하는 비중은

2015년까지 50%로 줄어든다고 보고 있다

 


 이렇게 보면 AMD는 기존의 시장은 x86으로, 향후 발전할 가능성이 있는 시장은 x86과 ARM의 양륜으로 싸우려는 것이 분명하다.

 

 

내부 패브릭과 레이아웃을 호환시키는 SkyBridge


 구체적인 ARM 제품 전략으로는 올해 (2014년) 후반에 ARM 64-bit 코어 "Cortex-A57"를 탑재한 서버 CPU"Seattle (시애틀)"을 투입한다. 브랜드 명은 "Opteron A1150". 4 ~ 8 코어의 Cortex-A57을 탑재한 서버용 토러스 네트워크 패브릭 "Freedom Fabric"을 칩에 통합한다. 기존의 HyperTransport에 의한 멀티 프로세서 노드 안의 메모리 공유 접속이 아닌, 독립된 단일 칩의 노드를 대량으로 묶는 패브릭이다. Seattle의 공정 세대는 28nm이다.

 

 

Cortex-A57 아키텍처의 블록 다이어그램

 

 

 

 

 

 


 그 위에 내년 (2015년)에는 Cortex-A57의 설계를 튜닝한 물리 설계를 변경한 CPU 코어를 탑재한 APU (Accelerated Processing Unit)를 투입한다. 이쪽은 서버용이 아닌 클라이언트 및 임베디드용 이다. 이 2015년의 ARM APU는 차세대 저전력 x86 APU와 핀 호환이다. 이 x86과 ARM의 호환 "칩 설계 프레임 워크"가 "Project SkyBridge (스카이브리지)"다. Jaguar를  발전시킨 x86 코어 "Puma+"와 Cortex-A57가 SkyBridge 프레임 워크에서 사용할 수 있게 된다.

 

 

Jaguar 아키텍처

 


 SkyBridge에서 정말 중요한 점은, 핀 호환뿐이 아닌 내부 패브릭 (유닛 간의 인터커넥트)​​에서도 x86과 ARM이 호환이 되는 점. 그 위에 다이 레이아웃에서도 거의 같은 공간에 ARM 코어와 x86 코어를 끼워넣게 된다는 점에 있다. 즉, 칩의 논리 설계와 물리 설계 수준에서 x86 코어와 ARM 코어가 교환 가능하게 된다. "칩의 외부에서는 핀 레벨로 호환이지만, SoC의 내부도 매우 호환성이 높다"고 SkyBridge를 담당하는 Jim Keller 씨 (Vice President and Chief Architect of AMD 's Microprocessor ​​Cores)는 Web 캐스트로 말했다.

 

 

SkyBridge의 설계 방식

 

 

 

 

 

 


 이것은 AMD가 2계통 칩의 병행 개발 노력을 대폭으로 줄일 수 있다는 것을 의미한다. 실제 문제로서, ARM과 x86가 같은 마더 보드에 올린다는 "SkyBridge 표면 선전문구"에 매력을 느끼는 시스템 벤더는 적을 것이다. SkyBridge의 진정한 포인트는 설계 프레임 워크 구축에 의해서, AMD에게 두계통의 APU를 낮은 가격으로 병행 개발 가능하도록 하는 점에 있다고 볼 수 있다. 실제로 Web 캐스트에서도 아키텍트 측은 핀 호환은 한마디 언급한 정도로, 내부 패브릭 호환이나 물리 설계를 강조했다.

 

 이처럼 SkyBridge에는 마케팅으로 알기 쉬운 핀 호환과 진짜 포인트인 내부 호환 두가지 측면이 있다. ARM과 x86에서 공통인 GCN (Graphics Core Next) GPU 코어를 SoC에 통합시켜 HSA를 유효하게 한다는 SkyBridge의 소프트웨어면 에서의 중요 변혁은, 그 설계 공통화에 타고 있다. SkyBridge 프레임워크 세대에서 제조 공정은 20nm로 옮겨진다.

 

 

 

 참고로, SkyBridge와 같은시기의 성능 x86 / x64 계의 Excavator 기반 Carrizo / Toronto의  공정 기술에 대해서는 밝혀지지 않았다. 그러나 이쪽은 28nm 일 가능성이 높다. AMD의 성능 CPU 코어는 제조 파운드리를 쉽게 옮길 수 없기 때문에 계속 GLOBALFOUNDRIES에서 제조되는 것으로 보인다. 또 성능 CPU 코어는 성능을 높이기 위한 물리 설계에 시간이 걸리기 때문에 20nm나 14 / 16nm 공정으로 제조하기 위해서는 공정이 생기면서부터 일정한 시간이 필요하다. 따라서 내년 타이밍으로는 성능 APU는 28nm에 머물 것으로 추측된다.

 

 AMD는 ARM이 설계한 Cortex-A57의 IP 라이센스를 얻은뿐만 아닌, ARM에서 아키텍처럴  라이센스도 취득. AMD 독자의 프롬 스크래치 (제로에서 시작) 설계를 행한 ARM 64-bit CPU 코어의 개발도 스타트 했다. AMD 독자의 ARM 코어 "K12"는 2016년에 등장 예정으로, ARM의 최고봉인 Cortex-A57 보다 고성능 코어가 된다 보여진다. K12도 확장된 공통 패브릭으로  연결된다.

 

 

SkyBridge의 공통 패브릭

 

 

 

 

 


 AMD는 현재 ARM 코어와 x86 코어의 양 CPU 코어 설계 팀을 동시 병행으로 개발하여 상호 연계도 시키고 있다. CPU 설계의 노하우를 서로 이용하는 것으로 고성능화와 고효율화를 도모해 간다. x86 / x64에서 키운 고주파화의 노하우를 ARMv8에 가져와 ARMv8 설계에서 발견한 전력 효율 기술을 x86 / x64에 환원한다. 또 AMD는 자사의 검증 내용에도 ARM을 넣어, 설계 플로우도 ARM과 x86로 통합 할 전망이다.

 

 

홉 스텝 점프의 3단계 ARM 전략


 정리하면, AMD는 ARM 코어 전략은 홉 스텝 점프의 3단계로 (세단뛰기) 구성되어 있는 것을 알 수 있다. 홉은 Cortex-A57의 Seattle로, AMD는 ARM 기반의 CPU 설계와 소프트웨어 스택을 습득한다. 다음 스텝의 조율은 Cortex-A57으로 칩 설계 수준에서 x86 / x64과의 통합을 확립한다. GPU 코어도 통합한 APU와 SoC (System on a Chip) 설계 프레임워크 SkyBridge를 x86 / ARM 공통으로 짠다. 동시에, HSA (Heterogeneous System Architecture) 소프트웨어 스택을 ARM에서도 완성시킨다.

 

 


 마지막 점프가 되는 K12에서는 AMD의 성능 CPU 설계의 노하우를 살려, 고성능 ARM 코어를 만든다. K12에 의해 ARM 코어의 커버 범위를 한층 넓힌다. 즉, 홉에서 칩을 실제 설계해서  소프트웨어를 정비, 스텝에서 AMD 공통의 설계 프레임워크와 소프트웨어 프로그래밍 프레임워크를 확립, 점프에서 ARM 코어 자체의 아키텍처 개발에 뛰어든다.

 

 그 위에, AMD는 자사가 전개하는 세미 커스텀 칩 설계에도 ARM 코어를 사용할 수 있도록 한다. AMD의 세미 커스텀 APU는 현재 최신 게임기 "PlayStation 4 (PS4)"와 "Xbox one"에 탑재되고 있는데, 이러한 솔루션에도 ARM 코어를 이용 가능하다. 고객은 동일한 패브릭, 동일한 주변 장치의 SoC나 APU로 x86 코어와 ARM 코어를 자유롭게 선택할 수 있게 된다.

 

 

 

AMD의 다이 사이즈 추이

 


NVIDIA의 ARM 전략과 부분적으로 겹쳐


 AMD가 최초로 밝힌 ARM 코어의 이용은 고밀도 서버 시장 뿐이었다. 그러나 현재는 임베디드와 클라이언트를 대상으로한 ARM APU가 보인다. 중반 예상된 일이지만, 전체 모습을 보면  AMD가 ARM에서 폭 넓은 범위를 대상으로 하고 있음이 판명된다.

 

 또 CPU 개발 자원을 투입하는 독자 ARM 코어의 개발 계획에서는 AMD가 ARM 코어를 매우 중시하고 힘을 쓰고 있는 것이 판명된다. 원래 K12의 "K"는 AMD의 성능 x86 CPU 코어의 개발 코드 네임에 붙여져 있었다. AMD는 ARM의 자사 개발 코어에 K를 붙이는 것으로, 진심도를 보여 주려는 것으로 보여진다.

 

 ARMv8 아키텍처럴 라이센스를 얻고 서버를 대상으로한 고성능 ARM 코어를 개발하는 점은 NVIDIA의 "Denver (덴버)"와 완벽하게 경쟁한다. 다만 바이너리 변환 방식을 취할 것으로 보이는 Denver와 하드웨어 제어 Out-of-Order 실행 슈퍼 스칼라 될 것으로 보이는 K12는 큰 차이가 생긴다. 그러나 NVIDIA도 홉에서 Tegra에 ARM의 Cortex-A15 코어를 통합하고, 스텝에서 ARM 위에 CUDA GPU 컴퓨팅 프로그래밍 모델을 구축, 점프에서 독자 아키텍처 개발 Denver를 가져 오는 결과는 AMD와 거의 동일한 흐름의 전략이다.

 

 AMD는 조율 버전의 Cortex-A57이나 K12의 개발에서, 설계 방법을 바꾸는 것을 강조한다.  AMD는 말할 필요도 없이 고성능 로직 설계의 스페셜리스트로, 맞춤 설계나(커스텀 설계) 반 맞춤 설계(세미 커스텀  설계)에 의한 고속화에 기술이 있다. x86 / x64 CPU 설계로 기른 맞춤 설계 기술을, 논리 합성이 주류인 ARM에 적용하려 한다고 예상된다.

 

 

ARM과 x86이 시장을 지배한다고 보는 AMD


 이렇게 분석하면 AMD가 Ambidextrous 전략에서 어떻게 ARM 코어 제품에 힘을 쓰고 있는지 알 수 있다. 그 이유로 AMD는 x86와 ARM의 2가지 CPU ISA (Instruction Set Architecture)가 시장을 지배하고 있다고 설명한다. 금액 기준으로 보면, 컴퓨팅 기기 중 ARM의 시장 점유율이 급속히 증가하고 있어, 결과적으로 ARM과 x86 이외의 아키텍처가 점점 축소되고 있다고 AMD는 본다. 2014년은 ARM과 x86의 양 ISA에서 시장 전체의 80%, 금액 기준으로는 800억 달러가 점유하고 있다고 한다. 2 아키텍처 독점의 상황은 차후도 한층 나아간다고 AMD는 보고 있으며, 따라서 ARM과 x86의 양 아키텍쳐를 커버하는 것이 유효하다고 판단했다고 한다.

 

 

 

 

 

 


 물론 이러한 애널리스트용 설명은, 기업 사정에 좋은 마케팅 용어를 늘어 놓은 것으로, 액면 그대로 받는 것은 위험하다. 그러나 명확히 보이는 부분도 있다. 하나는 x86 만의 세계에 계속 있어서는 좋지 않다고 AMD가 판단하고 있는 것, ARM의 세계라면 AMD에 승산이 있는 필드가 존재한다고 생각하는 것.

 

 왜 승산이 있는가? ARM이 고성능으로 향해 서버나 메인스트림 컴퓨팅 시장으로 향한다면 그 분야에서 실적이 있는 AMD가 칩 설계에서 강점을 발휘할 수 있다는 것이 하나. 헤테로지니어스 (Heterogeneous : 이종 혼합) 컴퓨팅의 열쇠인 GPU 코어 설계와 프로그래밍 모델에서도 AMD가 하루의 길이(차)가 있다고 보는 것이 하나. AMD는 이러한 이점을 지렛대로 키워  ARM의 파도를 타려고 한다.

 

 

 

 

 

 


 반대로 말하면 그만큼 x86 시장에서 AMD가 괴로운 입장에 있는 것도 보여준다. x86 시장 규모는 지금도 거대하지만, Intel의 압력은 강하고, AMD의 점유율은 전성기와 비교하면 상당히 떨어진다. Intel과의 총력전은 AMD의 심신을 깎을 것이며, 노력에 비해 얻는 것이 적어지고 있다. 그러나, Intel은 일찍이 가졌던 ARM 코어 (StrongARM 계)를 손을 놓아 버려, 한때는  검토했다는 ARM 기반의 제품 계획도 모습이 보이지 않는다. AMD 에게는 ARM 시장은 Intel이라는 골칫거리 적과 정면으로 베고 싸우지 않아도 장소이기도 하다.

 

 AMD는 대 Intel의 x86 전선도 유지하면서, ARM 시장에서의 리더십을 잡으려 한다. 개발 자원이 제한된 AMD가, 이 두 정면 전략을 수행하기 위해 필요한 것이 SkyBridge 설계 프레임워크는 라는 것이다.

 

2014년 7월 30일 기사

 

 

[분석정보] ARM 서버는 어디에 사용될 것인가?

 

 

[분석정보] ARM 코어의 다양한 라이센스 모델과 CPU코어의 설계 흐름

 

 

[고전 2000.08.28] 휴대전화에 1GHz 프로세서가 들어간다? Intel의 새로운 CPU XScale 아키텍처

 

 

[분석정보] IPC가 40% 향상된 AMD의 차세대 CPU Zen과 2017년 까지의 로드맵

 

 

[분석정보] NVIDIA의 ARM 코어 Denver 등이 Hot Chips에서 발표