벤치리뷰·뉴스·정보/고전 스페셜 정보

[고전 2000.2.25] 인텔 사내경합이 낳은 Willamette 1.4GHz

tware 2005. 8. 2. 12:00

 

 

 

 

 

CPU 개발 팀을 충돌시켜 우수한 제품을 낳는 Intel


 "개발 팀을 사내 경쟁시켜 뛰어난 제품을 만들어 낸다는 Intel의 상투적 수단"

 이것은 일전 만난 Intel OB의 대사이다. 실제로 지금까지도 Intel은 사내 경쟁에 져 사라진 제품이 산처럼 많고, 경쟁을 통과한 제품이 Intel의 주력으로 시장에서도 이겨왔다. 그리고 이번에 그 사내 경쟁 전략이 보기 좋게 성공 한 것이 "Willamette (윌라멧)"이다. Willamette은 같은 Intel의 "Itanium (Merced)"에 대항하기 위해 이만큼의 고클럭 CPU로 진화한 것으로 보인다.

 Intel은 메인 CPU 개발 팀이 크게 두 가지가 있다. 하나는 IA-64 팀이고 다른 하나는 Willamette 팀이다. IA-64 팀은 캘리포니아주 산타 클라라에, Willamette 팀은 오리건주에 있다. 이것은 두 프로세서의 출시로 등장하는 Intel 직원의 소속을 보면 분명하다. 덧붙여서, 코드 네임도 마찬가지로, Merced가 캘리포니아주 강, Willamette이 오리건의 강이다.

 Intel 486 이후, PC 용 CPU 개발 팀을 2 개로 나누어 번갈아 CPU를 출시하기로 했다. 양 팀이 담당하는 CPU는 다음과 같았다.


하이테크 혁명(下(하)) 컴퓨터기술의 고도화 1993.12.03

.......이번 컴덱스쇼는 마치 인텔의 펜티엄과 IBM 모토롤라 애플연합의 파워PC 칩간의 전쟁터를 방불케했다. 펜티엄은 널리 알려진대로 586PC용 마이크로프로세서이다......  인텔은 이에 더해 현재 차세대 프로세서 개발 계획인 P7프로젝트를 진행중이다.....


COMPANY NEWS; Intel Forms Chip Pact With Hewlett-Packard June 9, 1994

산타 클라라 팀
Pentium ['93 년] → Itanium (Merced) [2000 년]

 

오리건 팀
P6 (Pentium Pro / II / III) ['95 년] → Willamette [2000 년]


 Intel은 CPU의 개발에 걸리는 기간을 4년 정도로 추정하고 있으며, 두 팀이 교대로 CPU를 내는 것으로 2 년에 1개의 새로운 CPU가 등장하는 것이었다. 그러나 산타 클라라 팀은 당초 개발하던 P7 대신 새로운 아키텍처인 IA-64의 개발로 향해 버렸기 때문에 개발 일정이 늦어졌다. Pentium 및 Itanium 까지 무려 8년, 따라서 Itanium과 Willamette은 동년, 즉 올해에 등장하게 되었다.

 

 한편, 오리건 팀은 Pentium Pro를 예정대로 출시한 뒤, 같은 팀에서 P6 코어를 확장 (Pentium II / III)시키면서 Willamette을 시작했다. IDF의 Willamette 기술 세션에서는 "Willamette 개발 그룹은 P6과 같은 그룹"이라고 설명하고 있으며, 이것은 확실하다.

 Willamette이 시작된 시점에서 산타 클라라와 오리건에 다른 사명이 주어 있었던 것 같다. 산타 클라라는 명령어 세트 아키텍처를 일신하여 성능 향상을 도모한다는 사명, 오리건은 명령어 세트 아키텍처는 기존의 IA-32의 상태에서 성능 향상을 도모하는 사명이다.

 여기에서 양팀 모두 IA-64 아키텍처 CPU의 개발로 향하지 않은 것이 Intel의 교묘함인 것이다. 2 팀을 IA-64 및 IA-32에서 분담 해두면 IA-64으로의 전환에 실패했다고 해도, 오리건 팀이 구해주게 된다. 또 두 팀을 보면, CPU의 최종적인 성능에서, 어떤 접근 방식이 정답인지를 묻기 때문에 필사적으로 개발해야 한다. 즉, Intel은 내부 충돌시킴으로써 IA-64 및 IA-32의 개발을 모두 부스트 하려고 한 것으로 보인다.


오리건 팀은 필연적으로 고클럭화로 진행

 x86 CPU의 세계에서, 명령어 세트 아키텍처가 (ISA) 기존의 IA-32 있는 한, 더욱 병렬 실행의 정도를 지금 이상 향상시키는 것이 어렵다고 한다. 즉, 1 클럭에서 처리 할 수 ​​있는 명령 수의 평균을 향상시키기가 어렵다는 것이다. 그래서 산타 클라라 팀은 IA-64에 의해 명령어 세트 수준에서 병렬 실행을 할 수 있도록 바꾸기로 했다. 명령어 세트 수준에서 변혁해 병렬성을 높인다는 것은 IA-64는 같은 클럭에서도 IA-32보다 성능은 높아진다.

 이렇게 산타 클라라 팀이 병렬성을 근본적으로 높이는 방향을 가지고 있었기 때문에, Willamette의 오리건 팀의 방향성은 필연적으로 클럭을 철저하게 강화쪽으로 결정된 것으로 보인다. 이것은 IA-32 라는 제약 속에서 사내 경쟁인 산타 클라라 팀에 대항하려면 클럭을 높여 병렬성의 불리함을 뒤집는 방향 밖에 없기 때문이다. 즉, 1 클럭에서 처리 할 수​ ​있는 명령 수는 IA-64보다 적더라도 클럭 자체를 올릴 수 있도록 해 버리면 성능이 오르는 셈이다. IA-32에서 병렬성을 추구해서 IA-64에는 절대로 이길 수 없으니까, 오리건 팀의 승기는 여기 밖에 없다. 그리고 그 결과가 IDF에서 열린 1.5GHz라는 Willamette 시현이었던 것이다.

 Willamette은 4분기 등장 할 때 최고 클럭 1.4GHz로 등장하는 것으로 알려져 있다. 대조적으로 2000년 1분기 전에 등장하는 Itanium 클럭은 800MHz. 실로 1.75 배라는 압도적인 차이로 병렬성이 불리함을 날리기에 충분한 효과를 가지고 있다. 물론 성능은 응용 분야별로 다를 있으며, Itanium 64 비트의 주소 공간이라는 무기가 있기 때문에 쉽게 비교할 수 없다. 그러나 1.4GHz의 충격으로 엔트리 레벨에서 미드 레인지에서의 서버 및 워크 스테이션에서는 확실히 IA-64의 존재감이 희미해져 버렸다. 즉, 이번 라운드에서는, 오리건 팀이 이긴 셈이다.


클럭 지상주의가 정세에 딱 적합하다.

 원래, 오리건 팀은 P6 코어 때부터 클럭 우선의 사상을 가지고 있었다. P6는 슈퍼 파이프 라인을 채택,이를 통해 클럭에서 동 세대의 x86 CPU를 따돌리고 많은 RISC 프로세서도 (정수 연산에서는) 호각으로 싸울 수 있도록 했다. 이제 와서는 오래된 P6 코어는 Athlon 등 새로운 세대의 x86 호환 CPU에 대항하여 5년 이상 싸운 것은 클럭 지상주의의 P6의 기본 사상이 시장의 요구에 부합하고 있었기 때문이다.

 그리고, 오리건 팀은 차세대 Willamette 에서는 P6을 더욱 발전시켜 빠듯하게 고클럭 화를 추구했다. 이것은 회사의 경쟁에 대항할 뿐 아니라 시장도 점점 클럭에 끌려가고 있다 읽었다고 생각된다. 아마도 경쟁 업체도 오리건 팀이 여기까지 클럭 지상주의를 가지고 있다고는 생각하지 않았음이 틀림 없다. 그 증거로, Athlon는 Willamette 같은 극단적인 클럭 추구 아키텍처가 아니다.

 그런데 5년을 던진 Willamette 가 드디어 데뷔하는 시장은 클럭이 이끄는 세계로, 정확히 1GHz를 돌던 AMD와 싸움을 벌이고 있는 상태다. 즉 지금 오리건 팀의 읽기는 정확하다. 클럭 경쟁이 한창인때 클럭을 추구하는 "Speed​​ Demon" Willamette을 낼 수 있는 상황이 된 것이다. 정확히 들어 맞는 타이밍이라 말해도 좋다.


 지금 Intel에서 가장 따끈 따끈한 얼굴은, 오리건 팀을 오랫동안 이끌었던 패트릭 P · 겔싱어 부사장 겸 총괄 관리자 (Desktop Products Group)임이 틀림 없다.

 

(클럭 지향형으로 설계가 되서, 펜티엄 3보다도 클럭당 성능이 낮다는 오명을 받았죠. 특히나 0.18 마이크론 시절의 윌라멧의 경우가요. 0.13 노스우드 시절은 L2 캐시도 늘고, 클럭도 쭉쭉 올리면서 절대적 성능이 높다보니 그런 말이 좀 들어갔구요. 물론 0.9 마이크론 시절의 프레스컷에서 다시 또 구라클럭, 발열왕 등의 오명을 쓰지만 말이죠. 프레스캇은 여러가지로 노스우드(0.13 마이크론 = 130나노)의 개선판으로 추가적인 여러 개선이 있고, SSE3를 통해서도 몇몇 소프트웨어세서 확실한 향상을 도모하기도 했는데, 파이프라인의 길이가 노스우드 20단계에서 31단계로 길어지며 페널티가 존재했죠. 파이프라인이 길게 한 것은 클럭을 더 높일 수 있는 설계이구요. 분기예측 실패시 더 긴 파이프라인을 다시 통과해야 하기 때문에, 성능의 페널티가 더 큽니다. 그렇기 때문에 분기 예측을 더 강화하고, 캐시를 더 늘리고 했지만, 성능 증가가 (클럭당 성능)크지가 않았죠. 모 그러면 클럭이라도 쭉쭉 올렸다면 상품으로서는  고성능 이라는 목적이라도 도달했을 텐데, 클럭조차 제대로 올리지 못해서 구라클럭, 발열왕이 되버렸죠. IPC(클럭당 명령어 처리 능력, 클럭당 성능)야 낮다고 해도 5Ghz ~ 6Ghz로 돌아가고, 발열과 전력이 적당했다면? 호사가들이 구라클럭이네 라고 해도 제품으로서는 실제 성능이 좋기 때문에 문제가 없었겠지만, 클럭도 못 올리니 실패가 되어 버렸죠. 물론 그럼에도 불구하고 경쟁사인 AMD의 제조 능력이 구공장 신공장 합쳐서 x86 시장의 20% 가량밖에 되지 못했기 때문에 점유율 자체는 어느정도 유지했지만요.)

 

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom


 

[정보분석] 2개의 CPU 개발팀이 경쟁하는 Intel의 사내 전략

 

 

[분석정보] Intel 4번째 x86 CPU 개발 센터 방갈로르

 

 

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

 

 

[분석정보] 5W 이하의 저전력 프로세서의 개발로 향하는 Intel

 

 

[고전 1998.11.4] DEC의 Alpha 개발 팀이 대 Intel 진영에

 

 

[정보분석] Merom(메롬) 이후인 Nehalem(네할렘) 과 Gilo(길로)

 

 

[정보분석] 2년 주기로 아키텍처를 쇄신하는 Intel

 

 

[고전 2002.01.31] Intel은 IA-32의 64bit 확장 "Yamhill"을 개발하는 이유

 

 

[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기

 

 

[고전 2002.10.04] Pentium 8 후보 Nehalem 아키텍처

 

 

[고전 1997.10.15] Intel과 HP공동으로 "Merced"의 기초 기술을 발표 및 단신 모음

 

 

[고전 1997.08.28] 차세대 MPU를 위한 포석 AGP