벤치리뷰·뉴스·정보/고전 스페셜 정보

[고전 1998.11.18] COMDEX에 AMD-K7의 실물이 500MHz로 등장!

tware 2005. 6. 11. 08:30


AMD가 빠르게 K7의 샘플을 공개




K7이 500MHz로 움직였다.


AMD는 11월 16일부터 라스베가스에서 시작된 COMDEX Fall에서 1999년에 투입하는 차기  MPU 제품 "AMD-K7"과 "Sharptooth"를 선보였다. Sharptooth는 400MHz 버전과 Pentium II 450MHz 버전의 성능 비교를 언론과 고객에게 공개. 또 AMD-K7은 실제 샘플 칩이 500MHz로 동작하는 데모를 함께 특정 언론과 고객에게 보였다. Sharptooth는 1999년 1분기에, AMD-K7은 1999년 상반기 중 각각 출시 할 예정이다. 이 시현에서 AMD는 자사의 로드맵이 결코  그림이 아니라 실제임을 증명한 것이다.


 Sharptooth는 이전 "AMD-K6-3"라고 부르던 K6-2의 강화판. K6-2 코어에 256KB의 2차 캐시  SRAM을 통합, 풀 스피드 액세스를 가능하게 한다. 통합에 의해, 512KB의 2차 캐시를 외부에 붙인  Pentium II보다 성능이 높다고 AMD는 말한다.


 그러나 Sharptooth 이상으로 업계의 관심을 모은 것은, AMD가 K7를 보였다는 것이다. 이 시점에서 Sharptooth 샘플이 움직이는 것은 아무런 놀라움도 없지만, K7의 샘플이 있다는 것은 충격이 있다. 그것은 K7 아키텍처가 대담하고, 여기에 더해 AMD 내건 목표가 너무 높기  때문이다. AMD로도 "K7의 실물이 움직인다"는 것을 어떻게 해서라도 빨리 고객과 미디어에게 보여줄 필요가 있었다.


 시현에서는 K7을 500MHz로 구동. 일련의 벤치 마크를 실행이나 DVD 컨텐츠의 소프트웨어 재생을 시현했다. 다만 벤치 마크에서 AMD는 벤치마크의 결과 자체는 밝히지 않았다. 또 K6-2에 비해 동일한 클럭으로 얼마나 성능이 향상 되는지도 밝히지 않았다.


 다만 아키텍쳐 상으로 K7은 고성능을 달성해도 아무런 이상함도 없다. 예를 들어, K7의 실행 유닛은 3개의 정수 연산 유닛 (IEU), 3개의 주소 생성 유닛 (AGU), 3개의 부동 소수점 연산 / MMX / 3DNow! 유닛의 총 9개. 각각의 유닛에 동시에 내부 명령을 발행 (이슈)가능하다. 즉, 9명령 동시 발행이 가능하다는 것이다. 이것은 Pentium II의 5 명령을 크게 웃돈다.


 또 AMD는 0.25 버전의 K7은 처음부터 500MHz 이상으로 출하, 0.18 마이크론에서는 1GHz를 목표로 한다. 이것도 아키텍처를 보면 설득력이 있다. K7은 정수 연산에 10단, 부동 소수점  연산에서 15단 이라는 깊은 파이프 라인 구조로 되어 있기 때문이다. 파이프 라인을 깊게하는 것으로, 1스테이지에서 통과하는 게이트 수를 줄이고, 높은 클럭을 실현 가능하다. 10월의  MPU 업계 컨퍼런스 "Microprocessor ​​Forum"에서 K7의 프레젠테이션을 진행한 AMD의 Dirk Meyer (더크 메이어)씨 (K7 디렉터)는 높은 클럭으로 유명한 DEC의 RISC 프로세서 "Alpha 21064/21264 "의 설계자 중 한명이다. 그런만큼 K7의 고클럭 화는 현실성이 있다.


Intel 로드맵의 거대한 공백


 K7가 만약 아키텍처로 보여준대로 성능을 발휘하고, 깊은 파이프 라인에 의해 고클럭도 달성하고, 게다가 순조롭게 생산 생겼하게 되면, 가장 빠른 x86 프로세서의 타이틀을 처음으로 Intel에서 빼앗을 가능성이 생긴다.


 "AMD가 Intel을 추월!?" 라고 말하면 믿을 수 없는지도 모르지만, 실은 이것도 배경을 알면 그다지 이상한 일이 아니다. 이렇게 말하는 것은, Intel의 로드맵에 큰 공백이 있기 때문이다.


 K7의 트랜지스터 수는 2,200 만으로, Pentium II (750 만)의 3배. 원론적으로 말한다면, 3배의 자원을 소비하면, 고성능을 실현 가능한 것은 당연하다고 할 수있다. 또한 K7은 0.25 마이크론 184 제곱 mm로 약간 큰 다이 사이즈 (반도체 본체의 면적)로, 0.18 마이크론 공정으로  옮기면 125 제곱 mm에 이른다. 대량생산 영역에 들어오는 칩이다. 반면 Pentium II는 0.25 미크론에서 131 제곱 mm에 이르러 볼륨 존에 들어왔다. 즉, Pentium II와 K7은 1세대 다른 셈이다.


 그런데 Intel은 K7에 해당하는 세대의 MPU를 가지고 있지 않다. Intel 로드맵의 그 부분은 사실은 큰 공백이 있다. 돌아보면, Intel은 Pentium (펜티엄: P5)을 93년에, Pentium Pro (펜티엄 프로 : P6)를 95년에 발표했다. 그 사이는 약 2년 반. 이때 인텔 일본 법인은, 두개의 팀이 교대로(동시에 중첩해서) MPU를 개발하고 있기 때문에 Intel에서는 2년 간격으로 새로운 설계의 MPU를 투입 된다고 설명했다. 그 말대로라면, Intel은 1997년이나 1998년에 다음 세대 MPU를 발표해야 했다. 그런데 이시기에  차세대 MPU 코어의 발표가 아닌, 1999년에 등장하는 Katmai도 P6 코어를 확장한 것이다. 뿐만 아니라, Intel의 다음 IA-32 (x86) MPU "Willamette (윌라멧)"은 2000년경에 등장하는 것으로 보인다. 즉, Intel은 5년이라는 사이에 새로운 코어를 투입하지 않는, 비정상 사태에  빠져있는 것이다.


 Intel은 Pentium II Xeon을 발표하고, KNI (카트마이 신 명령 = SSE)을 발표하며, 성실히 프로세서를 강화하고 있는 것처럼 보이지만, 실은 코어의 아키텍처는 5년간 바꾸지 않았다. 라고 하던가, 바꿀 수 없었다. 이것은 추월해 주세요 라고 말하는 정도의 상황이다.



Merced가 Intel의 로드맵에 공백을 열었다


 Intel의 로드맵에 이런 거대한 공백이 열린 것은 틀림없이 Merced 개발의 영향이다. 원래, Intel은 Pentium 개발이 끝난 시점에서, P6 후계의 x86 프로세서로 P7의 개발을 시작했다. 그런데 인텔은 1994년 6월에 방향을 크게 전환, Hewlett Packard (HP)와 제휴하여 새로운 아키텍처 "IA-64"의 MPU"Merced"를 개발한다고 발표했다. 그 결과, P6 다음에 나올 P7이 Merced로 바뀌어 버려, 그 부분이 쏙 로드맵 상 공백이 되어버린 것이다. 세대적으로 본다면 Willamette은 본래는 P7 다음, P8 이라고 말할 세대가 될 것이며, 그 사이에 1 세대가 빠져있다. (머시드는 개발 당시 워낙 큰 회로규모의 칩이라 인텔+HP 2팀이 공동 개발로도 개발이 지연. 늦은 1999년에서 적어도 2000년에 나와야 할 것이 2001년에 출시.)


 즉, 요약하면, AMD는 당연한 코스로 계속 1세대마다 MPU를 개발하여 왔는데, Intel은 1세대 비워져 버렸다. 이것은 그런 단순한 이야기​​인 것이다. 지금 AMD는 NexGen 인수와 구 DEC  등에서 인재 유입에 의해 개발팀이 강화되어, 새로운 MPU 코어를 2개 병렬 개발해서 교대로  낼 수 있게 되었다. 그 반면 Intel은 IA-64 개발 자원을 꽤 가지고 있어, x86의 로드맵에 1세대 만큼의 공백이 열린 것이다.


 물론 K7의 미래는 아직 미지수이며, Intel의 MPU와 버스 호환성이 없는 MPU가 어디까지 성공 가능한지는 아직 알 수 없다. 그러나 성능면에서는 추월 가능성은 충분히 있다. 그리고 Intel에게 나쁜 것으로, IDT / Centaur Technology와 National Semiconductor / Cyrix 등 다른 x86 호환 메이커도 세대를 추진, 새로운 코어를 투입해 간다. 그들은 K7 정도로 공격적은 아니지만, 코어 아키텍처가 오래된 Pentium II / Katmai의 미드 레인지에서 아래의 시장 충분히 위협이 될 수 있다. 성능 차이가 작아지고 있는 것이다. 이것은 모두 Intel이 차세대 코어 아키텍처를 투입하지 못함으로 생기는 문제다.


 하지만, Intel도 Merced 프로젝트를 시작할 때, 이 위험에 충분히 느끼고 있었을 것이다. Intel이 제조 공정의 미세화에 박차를 가하며, 공정 기술에 의한 고클럭화로 차이를 내려고 서두르는 것은, 아키텍처면에서의 불리를 알고 있기 때문일지도 모른다. 또 이것은 Intel이 이러한 위험도 각오로, IA-64에 의한 대형 홈런에 걸고 있다는 결의도 보여준다. 여기에서 어느정도 따라 잡혀도 IA-64로 단번에 떼어놓으면 최후에 웃는것은 Intel이라고 생각하고 있는 것은 아닐까? (제온이나 아이테니엄 같은 고가의 제품이 매출대비(판매량 대비) 이익이 크죠. AMD가 생각처럼 크지 못하는 이유 중 하나. 그나마 AMD 64 x2 옵테론 시절이 나름 선전을 했지만.. 또 인텔과 비교하면, 인텔의 사업부문이 훨씬 다양하다는 것.)



풍부한 K7 아키텍처





 마지막으로, 대충 K7 아키텍처를 되돌아 보자.

 K7은 지금까지의 MPU에 없는, 9명령 동시 발행을 실현했지만, 이러한 실행 유닛에 명령을 공급하는 디코더도 강화되었다. K7은 어떤 조합에서도 3개의 x86 명령을 동시에 디코딩 할 수 있다. Pentium II도 3개의 x86 디코더를 갖추고 있지만 복잡한 명령을 디코딩 할 수 있는 것은 그 중의 하나뿐으로, 나머지 2개는 간단한 명령에 한정되어 있다. K7 쪽이 원리적으로는 디코더의 성능이 훨씬 좋은 것이다.


 Pentium II와 K6는 x86 명령어를 RISC 형의 내부 명령으로 일단 변환한다. 이때 메모리 액세스를 포함한 연산 명령은, 연산과 메모리 액세스 명령으로 분리된다. 그런데 K7에서는 x86 명령을 내부 명령 "MacroOp"로 변환 할 때에, 이러한 분해를 하지 않는다. 메모리 액세스를 포함 x86 명령은, 연산 오퍼레이션과 로드/스토어 오퍼레이션의 두 가지 오퍼레이션을 포함 1 개의 MacroOp로 변환한다. MacroOp는 스케줄러 회로에서 최초로 오퍼레이션으로 분해되어  실행 유닛에 대해 실행 가능한 것 순으로(아웃 오브 오더) 발행되는 구조다. 이 구조에 의해서 K7에서는 Pentium II와 K6보다 디코더의 부담을 줄이고, 그래서 3명령의 동시 디코딩을 가능한 것 같다.


 K7의 데모에서는 3D 렌더링 속도가 특히 눈길을 끌었는데, 그것도 당연하다. 부동 소수점 연산 유닛은 3개의 파이프 라인으로 전체에 파이프라인화 되어 있다. 10월의 MPU 업계 컨퍼런스 "Microprocessor ​​Forum"에서 K7의 프레젠테이션을 진행한 AMD의 Dirk Meyer (더크 메이어)씨 (K7 디렉터)는 K7의 부동 소수점 연산 유닛에 대해 "지금까지의 x86 프로세서에서 가장 성능이 높다"고 자랑스럽게 말했다.


 K7은 캐시도 강화된다. 64KB 데이터 캐시와 64KB의 명령 캐시의 합계 128KB의 L1 캐시를 탑재. 또한 시스템 버스와 분리된 별도의 2차 캐시 버스도 갖는다. 즉, Pentium II와 같은 구조를 취한 것이다. 실제로 K7은 사진처럼 Slot 1과 물리적으로 동일한 형상의 슬롯에 꽂는 기판으로 제공된다. 데모 룸에서는 이 K7 카트리지의 속살도 공개했는데, 그것을 보면 K7과 2차  캐시 SRAM 2개를 장착한 형태로 되어 있다. 이것을 보는 한, 일정량의 2차 캐시까지 지원하는 태그 RAM이 내장되어 있는 것 같다. K7에서는 512KB ~ 8MB까지의 2차 캐시를 지원. 2차 캐시 인터페이스 속도는 설정 가능하며, 2배의 속도로 데이터를 전송하는 "DDR (Double Data Rate) SRAM"도 지원한다고 한다.


 그런데, 사진을 봐도 알 수 있듯이 K7은 물리적으로 Slot 1 호환 모듈로 제공된다. 그러나 호환인 것은 물리적인 형상정도로, 프론트 사이드 버스 프로토콜 자체는 다르다. K7은 Alpha 용으로 개발된 EV6 버스를 라이센스를 받아 채용했다. EV6 버스는 최고 400MHz까지 지원하지만, K7은 메인스트림 데스크탑도 커버하기 위해 200MHz (100MHz의 버스 클럭의 양 에지에 전송 = DDR 전송)로 했다. 또한 완전한 분할 트랜잭션 버스로 1개의 MPU에 대해 최고 20개까지의 트랜잭션을 동시에 실행 가능하다.


 EV6 버스는 Pentium II 버스와 달리, 점 대 점 방식을 취하고 있다. CPU 버스를 여러 MPU에서 공유 할 수 없다. 따라서 K7으로 멀티 프로세서 구성을 하려면, 칩셋 측이 여러 CPU 버스를 갖출 필요가 있다. 이 방식은 칩셋의 부담은 크지만, (개별)버스의 부담이 줄어들어 EV6 처럼 고속인 버스를 구현하는데 적합한것 같다.



https://youtu.be/q9YTokNDEV4


https://youtu.be/iFHwNf7-oZk


최근 몇년간의 제품들은 여러 시스템간 비교(벤치) 영상을 통해서라도 AMD시스템도 꽤 볼 수 있지만, 과거 시스템일수록 개인이 올려야 하고, 판매량 때문인지, 인텔 시스템에 비하면 압도적으로 영상을 찾기가 어려우니.. 영상은 직접 찾아 보세요.



[고전 2003.09.12] AMD의 차기 CPU 코어 "K9"는 2005 년에 등장인가?



[고전 1997.10.31] Intel과 DEC 전격 제휴 MPU의 판도가 바뀐다



[고전 1998.06.10] Pentium II Xeon으로 서버 시장이 바뀐다



[고전 2001/05/30] Intel IA-64 프로세서 Itanium 정식발표



[분석정보] 9년전의 아이디어에서 태어난 아톰. 리서치 @ 인텔



[고전 1997/10/15] AMD, K6+3D와 K7을 포함한 새로운 프로세서 로드맵을 발표



[고전 1998/06/04] "Katmai 대 K6-3"를 향해서 질주하는 Intel과 AMD



[고전 1998.06.19] Intel 새 Socket 규격을 차세대 Celeron에 채용



[고전 1998.06.19] PC EXPO : 컴퓨터 메이커의 생존을 건 새로운 패러다임 "Xeon"서버



[고전 1998/10/14] AMD, 차세대 CPU"K7"을 발표, 버스 클럭은 200MHz



[고전 1998.11.4] DEC의 Alpha 개발 팀이 대 Intel 진영으로



[고전 1999/02/23] AMD, L2캐시 내장, L3캐시까지 대응하는 K6-III



[고전 1999/02/23] K6-III로 정면으로 펜티엄 III에 맞서는 AMD



[고전 1999.02.23] AMD와 인텔의 새로운 CPU



[고전 1999.02.22] 펜티엄 III 아난드텍 벤치마크



[고전 1999/03/30] K6-III 시험 리포트, 소켓 7 기사회생 할까?



[고전 2003/02/17] 100MHz 부터 3066MHz까지 65 CPU 벤치마크



[고전 1999.08.11] AMD의 조커는 Socket판 Athlon Select?



[분석정보] 2008년 중에 95%를 듀얼 코어로 하는 Intel CPU로드맵의 비밀



[고전 2000.2.25] 인텔 사내경합이 낳은 Willamette 1.4GHz