벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] Intel, 저전력 서버용 SoC Atom C2000 발표

tware 2013. 9. 5. 20:00


아웃 오브 오더로 일신


9월 4일 (현지 시간) 발표


Atom C200


미국 Intel은 4일 (현지 시간) 개발 코드 네임 Avoton (아보톤) / Rangeley (랭글리)로 알려진 22nm 공정의 서버용 SoC "Atom C2000 '시리즈로 발표했다. Intel은 이미 32nm 공정 방식으로 제조한 서버용 SoC "Atom S1200"(개발 코드 명 : Centerton)를 저전력 서버 시장에 투입하고 있지만, Atom C2000은 그것의 뒤를 잇는 제품이다.


Intel이 발표한 Atom C2000


 서버 시장은 현재 변혁기를 맞이해 기존의 중장대한 대규모 서버에서 고밀도 전력 효율을 중시한 저전력 서버로 이전이 시작되고 있다. 새로운 선택지로 ARM 아키텍처의 서버용 SoC도 각사에서 출시되고, AMD도 2014년에 ARM 기반의 서버용 SoC를 투입할 계획이다. 차세대 누가 우위인지 관심이 쏠리고 있다.

 그런 가운데, Intel이 내놓은 대답이 이번에 발표한 Atom C2000 이다. 5월에 개요가 발표된 새로운 아키텍처 Silvermont (실버 몬트, 개발 코드 네임) 기반 CPU 코어를 채용해 기존의 Atom 프로세서에 비해 처리 능력과 전력 효율이 크게 올라 있다.

 Avoton이 일반적인 서버용으로 Rangeley가 암호화 처리 하드웨어 엔진을 더해 제품 수명을 길게 가는 네트워크 장비 내장 (임베디드) 용이다.



저전력 서버를 담당하는 Atom C2000


 이번 Intel이 발표한 Atom C2000은 TDP (Thermal Desgin Power)가 5W~20W로 수십 ~ 백 W 초과로 설정되어 있어 지금까지 서버용 CPU와 비교하면 대폭 낮게 설정되어 있다 . 현재 서버용 시장에서도 클라이언트와 같이 다운 사이징의 흐름이 강해지고 있으며 보다  대규모 서버에서 블레이드 서버와 같은 소형 서버를 다수의 랙에 밀어넣는 방향으로 바뀌고 있다. Atom C2000는 그러한 세그먼트에 적합한 제품이 된다. 이미 Intel은 작년 (2012년), Atom S1200 (개발 코드 명 : Centerton)을 이러한 시장에 투입하고 있으며, 이번 Atom C2000은 그것의 후계다.

 Atom C2000 과 Atom S1200은 모두 x86의 SoC 인 것은 공통이지만, 내장된 CPU 아키텍처가 일신되고 있다. Atom S1200에서는 인 오더 형이었던 반면 Atom C2000은 아웃 오브 오더 형이 되었다. 이 CPU의 새로운 아키텍처는 Intel이 5월에 발표한 Silvermont에 근거한다 (Silvermont의 자세한 내용은 다른 기사 참조 ).

 이번에 발표된 Atom C 프로세서는 제품 SKU에 따라 차이는 있지만, 최대 8 코어까지 지원하도록 설계되어 있는 점도 새롭다. Silvermont의 아키텍처는 CPU 코어 2 개 +1 MB의 L2 캐시가 1개의 모듈로 되어 있어, 8 코어의 경우 이 CPU 모듈이 4개의 내장된 설계다. 이 CPU 모듈은 Silvermont System Agent (SSA)라는 내장 컨트롤러에 전용 버스로 연결되어 있으며 SSA를 통해 메모리, 각종 I / O에 연결되는 형태가 되고 있다.

(불도저의 모듈형 코어와는 다른게.. 불도저계열은 내부의 2코어가 모듈내에서 2코어, FPU, 프런트 엔드가 유기적으로 서로 결합된 형태 입니다. 반면에 실버몬트는 아주 쉽게 설명을 하면, 예전 코어2 듀오 2코어 버전이 모듈로 2개 4개 들어가서 4코어,8코어가 된다 이렇게 생각하면 됩니다. 네할렘부터 이미 모듈식 설계를 도입했는데..  도저의 모듈식 코어와 명칭에서 구분을 해서 부른다면, 인텔은 각각의 기능별 블럭을 설계하고 끼워맞추는 블럭식 설계라고 하면 되겠습니다. 즉 AMD는 소프트웨어가  동작하는 방식은 2코어가 맞지만, 설계상의 (하드웨어적 동작방식) 관점으로 본다면 모듈 전체가 1코어적 설계라고 볼수 있습니다. 반면에 인텔쪽은 1코어 마다 하나의 독립된  코어로 되어 있어 이점이 다르죠. 반명에 재규어 같은 경우는 인텔과 같다고 할 수 있습니다.)


 CPU의 명령어 세트는 Silvermont에서 지원되는 명령어 세트 (SSE4.2, AES-NI 등) 모두, 말할 필요 없이 Intel64에도 대응. 이점에서, 현재 32bit에 머물러 있는 ARM 세력에 크게 선도한다. (ARM의 64bit 대응 서버용 프로세서는 내년 이후 본격적으로 출하 될 전망).

 메모리 컨트롤러는 DDR3에서 DDR3L 대응으로, 싱글 채널 또는 듀얼 채널에서 이용 할수 있다. 클럭은 1,600 MHz까지, 듀얼 채널 구성으로 이용시에는 25.6GB/sec의 메모리 대역폭을 실현할 수 있다. 탑재 메모리의 최대 용량은 64GB가 되고 이점도 앞서 말한대로, 32bit로 4GB의 벽을 넘을 수 없는 ARM 계열의 프로세서와 비교하면 큰 장점이다. ECC에도 표준으로 대응하고 있다.


(32bit CPU는 주소확장을 하지 않은 경우라면 메모리의 주소 지정을(어드레싱) 최대 32비트까지 가능합니다. 컴퓨터에 조금 지식이 있는 사람이면 8비트면 최대 표현가능한 수가 256이고, 16비트가 되면 65,536인 것을 알것 입니다.VGA에서 라도 봤을 겁니다. 16비트 색상으로 설정하면 65,536색으로 표현되죠.


32비트면 4,294,967,296 까지 표현이 가능합니다. 8bit면 2의 8제곱, 16비트면 2의 16제곱, 32비트면 2의 32제곱  이렇게 계산되기 때문에 1000단위가 아닌 1024 단위가 1k가 되구요.(2의 10제곱이 1024) 그래서 저걸 1024로 계속 나누면? 4096 또한번 나누면 4가 되죠. 비트단위 였으니까 4Gbit가 되겠죠.


주소 지정은 1비트당 메모리의 1Byte 단위마다 주소를 지정해 주고요. 실제 집마다 주소를 붙이듯이.. 아무튼.. 총 4,294,967,296 개의 주소를 나눠줄수 있는데, 각 주소에 매칭되는 메모리는 1Byte 단위마다 붙으니까.. 결과적으로 32비트 CPU에서 최대로 사용 가능한 메모리는 4G Byte가 되는 것 입니다.(사용가능 이라고 하니까 오해가 생길 수도 있어서 조금 바꿔보면.. 다룰수 있는 메모리라고 하는게 더 맞는거 같습니다. 사용 가능한 메모리는 멤컨에 따라 달라지겠죠. 즉 실제 메모리 껴서 인식하고 사용가능한거 말이죠. 다룰수 있다. 사용가능하다 이렇게 나누면 굳이 설명도 필요 없을테고..)


참고로 16bit CPU인 80286의 경우는 24bit 주소버스를 가져서.. 16M 까지 사용이 가능했습니다. 32bit에서도 P6이후에 36bit PAE(물리적 주소 확장) 지원으로 64GB까지 가능했죠. 8bit = 1Byte 인것은 다 아실테고... 약간 다른 얘기지만 이래서 인터넷 속도 100M bps라고 해도 컴퓨터에서 용량 단위로 쓰고 있는 Byte로 바꾸면 12.5 MBps가 되겠죠. 12.5 MB/s 초당 12.5MB씩 전송한다는거죠. 1분이면 750MB CD용량 정도 받는거죠. )



Atom C2000의 블록 다이어그램.

모든 기능이 하나의 칩으로 되어 있는 것이 최대의 특징


시스템 버스에 해당하는 SSA (Silvermont System Agent)에

CPU 코어 블록 (2 개의 CPU 코어 +1 MB 캐시)가 연결되는 형태.



전력 효율성을 실현하기 위해, 고속 부분과 중속 부분으로 분리한 내부 버스


 SoC 내부에 있는 기존 칩셋에 해당하는 부분은 고속부인 High Speed​​ IOSF (Intel on-chip System Fabric) 와 중속부인 Medium Speed​​ IOSF 두가지가 준비되며 접속하는 I / O에 따라 구분하여 처리. PCI Express와 같은 고속 버스는 High Speed​​ IOSF에 접속하며 USB 2.0 나 SATA 등 비교적 고속이 아닌 버스는 Medium Speed​​ IOSF에 접속된다. 이렇게 두 부분으로 나뉘어있​​는 것은 절전을 위해. 필요에 따라 전력을 미세하게 차단이 가능해지기 때문이다.

 PCI Express는 Gen2까지 대응하며, 4개의 컨트롤러를 내장하고 있어서, x16 × 1, x8 × 2, x8 × 1, x4 × 4, x4 × 2의 설정이 가능하다. 각 컨트롤러는 각기 x1로 다운 그레이드하여 이용하는 것도 가능하고, 그 경우에는 x1 × 4라는 설정도 이용 가능하다. 또한 Medium Speed​​ IOSF에 연결되는 SATA 컨트롤러는 합계 6 포트 지원되지만, 내부 2 포트가 SATA 6Gbps, 4포트가 SATA 3Gbps로 이용된다. 또한, USB 2.0 4 포트까지 지원된다 (USB 3.0은 미대응).

 이 외에 네트워크 컨트롤러를 표준으로 내장하고 있는 것도 특징으로 들수 있다. 내장된 컨트롤러는 최신 i350 (개발 코드 명 : Powerville 파워빌)에 상응해, Gigabit Ethernet (1000BASE-TX)이 4포트 구현되는 사양을 뽐내고 있다. 단, PHY (물리 계층)은 내장되어 있지 않기 때문에, 만일 제품에 포트를 구현하는 경우에는 필요한 PHY를 구현해야 한다.

 또한 기존의 Atom S1200에서는 이러한 네트워크 컨트롤러 등을 탑재하고 있지 않았기 때문에, 별도 구현할 필요가 있었지만, Atom C 프로세서에서는 그러한 필요가 없어 져 마더 보드를 보다 컴팩트하게 할수 있는 것도 장점 중 한가지라 말할수 있다.

 Rangeley과 Avoton의 차이는 2가지로, 하나는 Intel Quick Assist Technology (QAT)라고 불리는 암호화 하드웨어 가속화 기능이 내장되어 있다는 것이고, 또 다른 하나는 제품의 제공 기간이 Avoton에 비해서 장기간으로 설정되어 있는 것. QAT를 이용하면 AES / DES 등의 암호화 및 MD5 등의 인증, RSA 등의 공개 키 등의 처리를 하드웨어로 할 수 있다. 다만 QAT는 Rangeley의 모든 SKU에 대응하고 있는 것이 아니라 일부 SKU에만 구현되어 있다.

 Intel의 발표 자료에 따르면 Atom C2000 시리즈는 다음과 같은 SKU가 준비돼 있다.



프로세서 번호
코어수
클럭 주파수
(터보) 

 L2 캐쉬
 패키지
 TDP 천개당
가격
 Atom C2570
8코어
 2.4GHz(2.6G)
 4MB  FCBGA 1283
 20W $171
 Atom C2730
8코어
 1.7GHz (2G)
 4MB  FCBGA 1283  12W $150
 Atom C2550
4코어
 2.4GHz (2.6G)
 2MB  FCBGA 1283  14W $86
 Atom C2530
4코어
 1.7GHz (2G)
 2MB  FCBGA 1283   9W $70
 Atom C2350
2코어
 1.7GHz (2G)
 1MB  FCBGA 1283   6W $43


(저도 잘은 모르지만.. 1000개당 가격이라고 해서 이 가격이 아니라.. 인텔에서 최소한도로 구입 가능한 1000개당 단가 입니다.  큰 기업에서 엄청나게 많이 사면 인텔이 책정한 어떤 할인 규칙에 의해서 할인이 들어 갑니다. (얼마나 사야 얼마가 할인되는 지는 당연히 전 모릅니다. 또는 할인이 되는 특정 기업이 있다던가.. 어떤 계약에 의해서) 그러니까.. 이건 반대로 인텔에서 구입하는 가장 비싼 가격이라고 보셔도 됩니다. 다만, 단품으로 유통되면.. 유통사도 이익을 봐야 할테니까.. 이정도 가격에 파는거죠. 대충 그렇습니다. 자세한건 관련 기업직원을 아시면 물어보세요.)


  프로세서 번호
 코어 수
 클럭  L2 캐
 QAT  TDP
  Atom C2758
 8  2.4GHz  4MB  O  20W
  Atom C2738
 8  2.4GHz  4MB  -  20W
  Atom C2718
 8  2GHz  4MB  -  20W
  Atom C2558
 4  2.4GHz  2MB  O  15W
  Atom C2538
 4  2.4GHz  2MB  -  15W
  Atom C2518
 4 1.7GHz  2MB  -  13W
  Atom C2358
 2 1.7Ghz
(2G)

 1MB  O  7W
  Atom C2358
 2  1.7GHz
(2G)

 1MB  -  7W



지금까지 칩셋에 해당하는 부분에는 고속과 중속의 IOSF가 준비되며,

I / O 버스 활용도에 맞게 효율적인 전력 관리를 한다.


Atom C2000는 SoC에 네트워크 컨트롤러가 내장되어 있으며 외부의 PHY를 준비하면

최대 4 포트의 Gigabit Ethernet을 이용할 수 있다


Rangeley의 일부 SKU에만 탑재된 Intel Quick Assist Technology (QAT).

하드웨어 암호화 가속을 한다.



Intel Atom C2000 시리즈의 패키지


Atom C2000 (Avoton)를 탑재한 블레이드 서버 마더보드



기존 제품에 비교해 전력 효율이 최대 10배


 Intel은 Atom C2000 (C2750을 사용) 벤치 마크 결과에 대해서도 밝혔다. 전체적인 경향으로 말하면 기존의 32nm의 Atom S1200 (S1260 사용)과 비교하면 순수 성능은 1.4 ~ 1.9 배 이지만 소비 전력당 성능에서는 3.8 ~ 10.3 배에 이른다고 말한다. 이것은 제조 공정 방식이 22nm로 미세화 된 것과, 또한 전력 절약 설계가 계획됐기 때문인 것에 의해 실현된 것으로 보인다.

 ARM의 Cortex-A9 기반의 서버용 SoC 와의 성능 비교에서는 3.9 ~ 35.6 배라는 결과가 나와, 현재의 32bit의 ARM SoC와 성능 차이는 꽤 있다고 말할 수 있다. 특히 메모리 부분의 테스트는 4GB 까지 밖에 사용할 수 없는 32bit ARM CPU의 제한이 크게 나오는 일이 있어, 일부 벤치 마크 테스트에서는 32bit ARM 프로세서에서는 만족하게 돌리게 할 수 없었다고, Intel 는 지적했다.

 이에 대해 64bit의 ARM 관해서는, 현재는 제품이 발매되고 있지 않기 때문에, 경쟁 업체의 컨퍼런스 등에서 공개 된 수치 등에서 예상되는 수치의 비교가 되​​지만, 소비 전력당 성능은 1.8배 가까이 될 것으로 예상되어 있다고 Intel에서는 설명한다.

Intel이 사내에서 시험한 결과로는 Atom C2000은 현행 Atom S1260에 비교하면 성능은 1.4 ~ 1.9 배 이지만, 전력 효율은 3.8 ~ 10.3 배. 32bit의 ARM과의 비교에서는 성능에서 3.9 ~ 35.6 배, 64bit의 ARM에 비해 1.8 배의 전력 효율이 "예상" 된다


SPEC CPU2006의 싱글 쓰레드의 결과


SPEC CPU2006의 멀티 쓰레드 성능 결과. C2750은 S1260에 비해 5.1 배


메모리 대역에서는 C2750은 S1260에 비해 4.1 배


Web 서버로 이용할 경우 성능. C2750은 S1260에 비해 7.2 배,

32bit의 ARM에 비해 3.9 배


Java의 성능 결과. C2750은 S1260에 비해 4.2 배 내지 14.4 배


캐시 성능을 측정하는 Memcached는 C2750이 Atom S1260에 비해

7.2 내지 9.7 배, 32bit ARM과 비교하면 35.6 배


전력 효율은 C2750이 S1260에 비해 3.8 배로 AppliedMicro가

공개한 64bit ARM 성능 데이터와 비교하면 1.8 배가 된다


Atom S1260 및 Atom C2750 비교 요약



2014 년은 ARM 세가 64bit 대응을 투입하여 큰 전쟁 시작


 Intel은 다음주 (9 월 10 일 ~ 12 일) 미국에서 진행될 Intel Developer Forum (IDF)에서 같은 22nm 공정 방식으로 제조되는 Atom 프로세서인 Bay Trail을 발표할 예정이며, 기기서 Bay Trail 정보 등이 공개된다 (스마트 폰용 Merri Trail은 2014 년 1 분기에 예정되어 있어 아마도 MWC에서 발표된다).

 이에 앞서, 22nm 공정 방식으로 제조되는 Atom의 선봉으로 (적을)칠 서버용 Avoton / Rangeley가 발표된 배경에는 앞으로 저소비 전력 서버 시장이 치열한 경쟁의 장이 되어 간다고 생각하고 있어, 거기에서 Intel 입장에서도 힘을 담아 가고 싶다는 뜻이 있다고 생각할 수 있다. 이미 말한대로, 서버 시장에서도 전력 효율이 중시되는 시대를 맞​​이하고 있고, 여기에 ARM의 SoC에 참가하는 것을 고려하고 있는 벤더는 늘어나고 있다.

 특히 64bit ARM 프로세서를 설계하는 반도체 업체들은 거의 예외없이 서버 시장에 참여해 Intel의 아성에 도전하려고 한다. NVIDIA, AMD도 64bit ARM 아키텍처의 서버 SoC를 계획하고 있어, 빠르면 2014 년에도 제품이 투입된다. 그러한 상황 안에서, Intel이 가만히 있으면 과거의 스마트 폰이 그랬던 것 처럼 시장 점유율이 떨어지고 Qualcomm과 같이 다른 벤더에 시장이 가져가 지는 것이 일어날수 밖에 없다.

 하물며 지금 서버 사업은 Intel 제품 부문의 이익의 대부분을 내고있어 그 시장을 지키는 것은 Intel에게 큰 의미가 있다. 이 때문에 공격에 이르는 Atom C2000 시리즈가 가진 전략적 의미에 이르게 될 것이다.



[분석정보] ARM 서버는 어디에 사용될 것인가?



[분석정보] 스몰 코어 CPU Avoton '에서 밝혀진 Intel의 저전력 CPU 전략



[분석정보] Toshiba, 8인치 LCD 채용 Windows 8.1 태블릿을 전시



[분석정보] Intel, 14nm SoC 버전 Broadwell / Denverton 절전 서버 출시



[분석정보] 컴퓨텍스 2013 Bay Trail-T와 LTE 모뎀을 무기로 모바일 시장에 파는 Intel



[분석정보] 태블릿 윈도우 라이센스 재검토 시작 윈텔(Wintel) 제국의 역습



[아키텍처] 인텔 22나노 아톰(ATOM) CPU코어 실버몬트(Silvermont) 세부 사항



[아키텍처] 저전력 x86 시장에서 AMD의 재규어와 싸울 인텔 실버몬트



[정보분석] 인텔 22나노 아톰(ATOM) CPU코어 실버몬트(Silvermont) 세부 사항



[정보분석] Clover Trail +과 같은 과정을 무기로 전진하는 Intel 스마트 폰 사업



[정보분석] 아웃 오브 오더 및 최신 프로세스를 채용하는 향후의 Atom



[정보분석] 14나노 공정까지 달려가는 인텔 아톰 스마트폰, 타블렛 전략



[정보분석] IDF에서 보다. Google, Microsoft, Intel의 줄다리기



[정보분석] Clover Trail +과 같은 과정을 무기로 전진하는 Intel 스마트 폰 사업



[정보분석] 아웃 오브 오더 및 최신 프로세스를 채용하는 향후의 Atom



[모바일 리뷰] 삼성 아티브 스마트 PC 500T 아톰기반 윈도우8 태블릿



[모바일 리뷰] 인텔 클로버 트레일(Atom Z2760) 리뷰 에이서 W510



[정보분석] 14나노 공정까지 달려가는 인텔 아톰 스마트폰, 타블렛 전략



[정보분석] CES 2012 인텔 폴 오텔리니 기조연설. 인텔 스마트폰 출시