벤치리뷰·뉴스·정보/아키텍처·정보분석

[정보분석] 2년 주기로 아키텍처를 쇄신하는 Intel

tware 2006. 5. 9. 18:14

 

 

 

오리건과 이스라엘 두 팀으로 병행하여 개발

 Intel은 향후 2년 사이클로 새로운 CPU 마이크로 아키텍처를 투입해 간다. 올해 (2006 년) 중반에 투입하는 "Core Microarchitecture (Merom : 메롬)"을 시작으로, 2008 년경에"Nehalem (네할렘)", 2010 년경에"Gesher (게셔?) "가 등장한다.

 

Core Microarchitecture가 65nm 공정, Nehalem이 45nm 공정 Gesher가 32nm 공정이 된다. Intel의 Paul S. Otellini (폴 S 오텔리니)씨 (President & CEO)는 4 월 27 일에 진행한 "Intel 2006 Spring Analyst Meeting"의 Webcast에서 2년마다 공정 기술과 마이크로 아키텍처를 쇄신하는 전략을 설명했다.

 

 

인텔 마이크로 아키텍처 주기

 

2년마다의 공정 주기는 종전대로 이지만, 2년마다 마이크로 아키텍처 혁신은 기존의 쇄신 과정보다 훨씬 짧다. NetBurst (Willamette : 윌라멧) 아키텍처는 2000년에 등장 데스크탑에서는 Core Microarchitecture로 교체되기 전까지 6년 계속됐다. 갑자기, 아키텍처 쇄신이 급가속 된 셈이다.

 가속 된 이유는 명백하게, Intel이 현재 2 팀으로 x86 계의 PC용 CPU 마이크로 아키텍처의 개발을 진행하고 있기 때문이다. 통상의 CPU 아키텍처 개발주기는 4년 이상이지만, 두 팀이 오버랩하여 개발을 진행하는 것으로, 2 년씩에 새로운 마이크로 아키텍처의 투입을 실현한다. Intel의 이스라엘 개발팀이, Banias(베니어스) 아키텍처계를 성공시켜 실적을 쌓은 것으로 2 팀 체제가 확립했다.

 이번 로드맵에서는 Core Microarchitecture와 Gesher가 이스라엘. 차기 Nehalem이 P6 (Pentium Pro / II / III)와 NetBurst (Pentium 4)를 개발한 미국 오리건 팀이된다. 원래 로드맵에서는 Nehalem이 NetBurst의 후계 아키텍쳐가 되는 것이었다.

 

그러나 CPU 아키텍처 개발이, 성능 중시에서 성능 / 소비 전력 (Performance / watt) 중시로 이동했기 때문에, 모바일계 CPU를 담당하고 있던 이스라엘 Core Microarchitecture가 사이에 들어갔다. 따라서 Nehalem은 당초 예정보다 2 ~ 3 년 늦게 등장하게 된다.

 


공정 및 아키텍처의 쇄신을 반 사이클 늦추는

 2년 주기의 공정과 마이크로 아키텍쳐의 쇄신을, Intel은 주기를 어긋나게 하는 것으로 보다 효율적으로 한다고 설명한다. Spring Analyst Meeting에서 Intel의 Otellini 씨는 다음과 같이 설명했다.

 "현재 출하하고 있는 65nm 공정의 제품은 모두 이전 세대 제품의 미세화판 이거나 파생 버전이다. Presler (플레슬러)와 Dempsey (뎀프시)는 NetBurst 제품 라인으로, 두 번째의 코어를 더했다. Yonah는 Centrino 제품 라인을 미세화시켜서, 두번째 코어를 더했다. 그래서 65nm의 장점을 살리면서 매우 신속히 세울 수 있었다. 그리고 이번 여름 초에 신 마이크로 아키텍쳐를 65nm 공정으로 도입한다. "

 "우리는 다음 사이클에서도 이것을 계속한다. 45nm도 동일한 모델로, 최초는 Core 제품 라인을 기반으로 하는 미세화판이나 파생판을 투입. 공정 기술이 일어선 후에, 차기 마이크로 아키텍쳐 Nehalem으로 이행한다. 32nm에서도 같은 모델이다 "

 즉, 우선 새로운 공정의 일으킬 때에는, 이미 검증이 끝난 마이크로 아키텍처나 그 파생 아키텍처의 CPU를 생산, 공정을 신속하게 일으킨다. 공정기술이 어느 정도 일어선 단계에서, 새로운 마이크로 아키텍처의 CPU를 도입한다는 스텝이다. 새로운 마이크로 아키텍처의 경우는, 샘플 칩이 완성되고 부터 검증에 상당한 시간이 걸리기 때문에 이것은 합리적인 이행 계획이다.

 

 

Intel 's Microarchitecture Cycle 과 Core Design

 

 구체적으로는 다음과 같다. 45nm 공정은 Merom의 미세화 / 파생판인 "Penryn (펜린) "으로, 먼저 공정을 드라이브하고 그 후, 아마 2008 년에 중에 Nehalem을 투입한다. 32nm는 Nehalem의 미세화 / 파생판이 되는 Nehalem-C (Nehalem Compaction)로 공정을 일으켜 세워, Gesher로 인계.

 NetBurst는 Willamette (180nm) → Northwood (130nm) → Prescott / Smithfield (90nm) → Cedar Mill / Presler (65nm)와 4 공정 세대에 걸쳤다. 하지만 이번 설명을 보는 한, Core Microarchitecture 이후는, 기본적으로 2 공정 세대로 이행해 가는 것 같다.

 Intel은 현재 파생 CPU 전체에 다른 코드 네임을 붙이기 시작했으며, 따라서 코드 네임의 수가 비정상적으로 늘었다. 예를 들면, Merom의 데스크톱 버전이 Conroe로, Conroe에서 기능 제한 버전 "Allendale (앨런데일, 콘로2MB 캐시 버전)"과 밸류 CPU 버전 "Millville (밀빌)"이 파생하는 상태다. 이전이라면 동일한 코드 네임이 붙었던 CPU에도, 다른 코드 네임을 할당하고 있다. 그러나 중요한 것은 핵심 제품의 코드 네임으로, 그것이 이번 보인 코드네임 군이다. (예전이라면 콘로2MB라고 할게 앨런데일 이라고 하는 것)

 


Intel 내부에서 CPU 아키텍처의 통일화에 합의?

 2팀으로의 x86 CPU 마이크로 아키텍처 개발은, Intel은 이전에도 진행했었다. "90년대 초반 P5 (Pentium)는 미국 캘리포니아주 산타 클라라, P6이 오리건으로 중첩 개발을 진행하고 있었다. 그러나 산타 클라라가 IA-64 개발로 이동했기 때문에, 오리건 팀 혼자 x86계 CPU 마이크로 아키텍처 개발의 중책을 맡게 되었다. 이번 포진은 그 당시로 되돌렸다고 볼 수 있다.

 

 

아키텍처 전환

 

그러나 크게 다른 점도 있다. 그것은 이번에는 2개의 개발팀이, 각각 다른 사업부에 묶여있는 것이다. 이스라엘 팀은 Intel의 Mobility Group에 오레곤 팀은 Digital Enterprise Group에 각각 묶여있다. 한 업계 관계자는 2005년 말에, 두 팀이 각각 마이크로 아키텍처의 개발을 진행하고 있었지만, 각각의 아키텍처를 Intel 전체에서 쓰라고는 정해지지 않았다고 말했다. 즉, Nehalem은 어디까지나 데스크탑의 후계 아키텍처, Gesher는 모바일의 후계 아키텍처라는 위치였던 것 같다.

 그러나 이번 설명에서는, Core Microarchitecture -> Nehalem -> Gesher로 이행한다고 명확하게 Intel은 설명했다. 아마도 Intel 내부에서 아키텍처의 통일에 대해서 합의가 확립된 것으로 보인다.

 또 Intel은 오리건 팀의 Nehalem을 포함해서, 향후의 CPU는 성능 / 전력 소비를 중시한 아키텍처가 된다고도 설명한다. 당초 Nehalem은 고클럭 아키텍처였다고 보였기 때문에, 코드 네임은 같아도 Nehalem 프로젝트의 내용은 크게 달라졌다고 추측된다.

 


Gesher 대한 힌트를 주기 시작한 Intel

 이스라엘 팀의 "Gesher"의 존재가 Intel에서 공식적으로 밝혀진 것은, 2월 Intel 개발자 컨퍼런스 "Intel Developer Forum (IDF) Spring ". 이스라엘 개발팀을 이끄는 Ofri Wechsler 씨의 프로필 란에 "Ofri Wechsler는 Mobility Group의 Intel Fellow에서, Mobility Microprocessor ​​Architecture 디렉터. 그 직무로서 Wechsler는 Yonah, Merom, Penryn 패밀리의 아키텍처와 차세대 Gesher CPU 아키텍처의 개발을 책임지고 있다"고 자연스럽게 공지되었다.

 이 프로필은, 최초에 IDF 참가자 사이트에 업된 때는, Gesher가 적혀있지 않았는데, IDF 기간 중에 특별히 덧쓴 것이다.

 Gesher라는 코드 네임은, 다른 이스라엘 개발 모바일 CPU와 같은 모양으로 히브리어다. Gesher의 정확한 발음 표기는 아직 확정되어 있지 않다. 직접 들었던 느낌으로는 게샤 였지만, 발음으로는 "게이샤 (geisha)"에 비슷하다고 적혀있기고 했다. 다만 코드명 상정에서, 문제가 되는 것은 현지어로 정확한 발음인가 아닌가가 아니라, Intel 내부에서 어떤 발음 혹은 철자를 하는지가 중요하다.

 참고로, Intel의 Justin R. Rattner (저스틴 R · 래트너) 씨 (Intel Senior Fellow, Cheif Technology Officer, Corporate Technology Group)는 코드 네임에 대해서 다음처럼 웃었다. "Intel은 전통적으로 코드 네임에 지명을 사용한다. 그런데 코드 네임을 붙이는 사람이 착각을 해서, 잘못된 철자법을 해 버리는 것이 있다. 따라서 실제로는 존재하지 않는 지명의 코드 네임이 되어 버린 적도 있다 "

 


8년이 걸리는 CPU 아키텍처 개발팀의 육성

아래는 추측되는 Intel 2 팀의 CPU 마이크로 아키텍처 개발 사이클이다. 이전 이 칼럼에서 설명한, 이스라엘의 차세대 CPU "Gilo (기로)"프로젝트는 실제로는 Gesher로 대체했다. 코드 네임은 실수가 있었지만, 개발주기에 대해서의 추측 자체는, 그다지 다르지​ 않은것 같다.

 

인텔 CPU 개발주기(추정)

 

Intel은 NetBurst 세대에서는 모바일 CPU를 별도의 아키텍처로 할 수 밖에 없었다. 따라서 데스크탑 & 서버 CPU를 오레곤, 모바일 CPU를 이스라엘이 담당하는 분업 체제가 되었다. 130nm와 90nm 공정에서는 2 아키텍처가 병행하게 되었다.

 그러나 Intel의 이스라엘 개발 센터가 실적을 쌓아, 메인 스트림 데스크탑 CPU까지 커버 할 수 있는 아키텍처를 개발하게 된 것으로 입장이 바뀌었다. 원래 모바일용으로 시작한 Merom이, Core Microarchitecture로서 서버 및 데스크탑까지 커버하는 것이 되어, 2팀 체제가 완성되었다.

 

Intel의 Rattner 씨는 개발팀의 육성에 대해서 다음과 같이 말한다.

 "CPU 설계팀을 키우려면 8년이 걸린다. 2 사이클이다. 이스라엘이 성공 사례로, 통솔과 제휴가 잡힌 좋은 팀이다. 단지 칩 엔지니어를 모은 것으로, 좋은 설계팀은 될 수 없다. 팀 조직화가 중요하며, 육성에는 8년이 필요하다 "

 이스라엘 팀의 경우 "Tillamook (틸라무크, 0.25μm 판 MMX Pentium)" 에서 시작해서, 통합 CPU"Timna (팀나)"등을 거쳐서 Banias로 비약했다. Tillamook의 개발은 95 ~ 96년 무렵으로, 시작부터 8년에 걸려서 Banias 완성과 Merom 개발의 시작까지 도착하게 된다.

 참고로, Rattner 씨에 의하면, 실패 사례는 인도의 개발 센터라고 한다.

 "인도에서는 쿼드코어 CPU를 설계했지만, 늦어짐이 계속됐기에, 결국 완성 할 수 없다고 판단해서 중단했다. 문제의 하나는 정보의 공유가 잘 되지 않은 것으로, 설계자 끼리의 연계가 잘되지 않고, 개발이 난항을 겪었다 "

 인도에서는 Merom 기반의 쿼드 코어 "Whitefield (화이트필드)"를 개발하고 있었다고 말했는데 (1다이 4코어 제품. 이게 취소되며 2다이 4코어 켄츠필드가 서버용으로도 판매), 이 프로젝트는 중단되었다. 잘 갔으면, Intel은 8년 후에는 또 하나, 인도에 개발팀을 가지는 것이 가능했을지도 모르지만, 그것은 실패한 것 같다.

 


어느정도 예상되는 Nehalem과 Gesher

 그러면 2 개의 다른 설계팀이 개발하는 Nehalem과 Gesher는, 각각 어떤 아키텍처가 될 것인가? Gesher에 대해서는, 어느정도 추측이 가능하다. 그것은 이스라엘 팀의 연구원이 발표한 "PARROT (Power AwaReness thRough selective dynamically Optimized Traces) " 이라 부르는 차세대 아키텍처에 힌트가 가득하기 때문이다.

 

 PARROT의 논문에는 Core Microarchitecture의 Macro-Fusion도, 선취해서 기술되어 있어, 향후는 Macro-Fusion을 한층 발전시키는 형태로 아키텍처 개량이 징행되는 것이 쉽게 예측 가능하다.

 예를 들면, Core Microarchitecture에서 채용한 비교 명령 (cmp)와 조건 분기 명령 (jcc) 조합의 퓨전뿐만 아니라, 예를 들어, "and / sub + cmp + jcc" 조합의 퓨전, 여러 연산 명령이나 로드 / 스토어 명령의 SIMD 화, 중복하는 로드나 스토어의 삭제 등이 예상된다.

 

 또 이러한 복잡한 퓨전이나 최적화를 효율적으로 처리하기 위해, 백그라운드에서 최적화 패스를 갖는 것 등도 상정된다. 즉, PARROT의 채용이 진행되어 간다고 추정된다.

 한편 Nehalem에 대해서는, 성능 / 소비 전력 중시로 바뀐 현재, 예측이 매우 어렵다. Intel은 투기 멀티 스레딩에 대해서 여러번 언급하고 있어, 그것을 보조하기 위한 밸류 프리딕션 (값 예측)등에 대해서도 말했다. 투기 멀티 스레딩을 가능하게 하면, 컴파일러 수준에서 스레드의 자동 생성이 용이하게 된다. Intel의 오레곤 팀이 방향을 모색하고 있는 것은 틀림 없지만, 시기적으로 시간에 맞출지 어떨지는 알 수 없다. 또 효율 중시로 바뀐  Nehalem에서 구현될지 어떨지도 의문이다. 투기적인 멀티 스레딩에 의해, 낭비가 발생하기 때문이다.

 다만, 4 월에 요코하마에서 진행된 CPU 컨퍼런스 Cool chips에서 연설을 진행한 연구자 Antonio Gonzalez 씨 (Intel Corp. and Universitat Politecnica de Catalunya)는, 현재 CPU에서는 ILP (Instruction-Level Parallelism) 수준의 투기 실행으로 이미 많은 낭비가 발생하고 있다는 것을 지적. 전력 효율면에서는 TLP (Thread-Level Parallelism)의 쪽이 효과가 있다고 말했다. 성능 / 소비전력 효율면에서도, 투기 멀티 스레딩 더 뛰어나다는 결론이 나올지도 모른다.

 

 

pc watch

 

 

 

[아키텍처] Core Microarchitecture"속도의 비밀은 "CISC의 아름다움"



[분석정보] x86에서의 탈피를 도모 Intel의 새로운 로드맵

 

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom


 

[정보분석] 2개의 CPU 개발팀이 경쟁하는 Intel의 사내 전략

 

 

[분석정보] Intel 4번째 x86 CPU 개발 센터 방갈로르

 

 

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

 

 

[분석정보] 5W 이하의 저전력 프로세서의 개발로 향하는 Intel

 

 

[고전 1998.11.4] DEC의 Alpha 개발 팀이 대 Intel 진영에

 

 

[정보분석] Merom(메롬) 이후인 Nehalem(네할렘) 과 Gilo(길로)

 

 

[정보분석] 2년 주기로 아키텍처를 쇄신하는 Intel

 

 

[고전 2000.2.25] 인텔 사내경합이 낳은 Willamette 1.4GHz

 

 

[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기