벤치리뷰·뉴스·정보/고전 스페셜 정보

[고전 1999.08.19] 2차 캐시 통합판 Athlon과 Athlon Mobile의 계획이 왜 없는가?

tware 2005. 7. 8. 09:00


AMD의 가장 큰 기회는 Coppermine 지연


 "지금까지는 이쪽의 실수만 계속됐다. 그러나 이번에는 반대로 저쪽이 실수를 했다. 이것은 최대의 기회. 가끔은 이러한 좋은 일도 없으면"


 이것은 Athlon 발표시 일본 AMD의 한 간부가 흘린 말. 무엇을 말하는가 말하면, Intel의 0.18 마이크론 판 Pentium III 프로세서 (코드네임, Coppermine : 코퍼마인)의 지연이다.


 Intel이 당초 예정대로 9월에 Coppermine을 내놓을 계획 그대로라면, Athlon의 충격은 약했다. Athlon 650MHz에 대해서도 Coppermine 667MHz을 앞당겨 발표한다는 대항 수단이 있었다. 그러나 현재 600MHz 이상의 Coppermine 출하는 11월 예정으로 보여진다. 즉, 본격적인 0.18 마이크론 공정이 일어서는 연내 겨우 정도로 늦어져 버렸다.


 AMD도 Fab 25에서 0.18 마이크론을 제 4분기 중에 일으킨다고 주장하고 있기 때문에, 공식 스케줄로는 Intel과 AMD의 데스크탑 PC용 프로세서의 0.18 마이크론의 전환시기가 거의 같아졌다. 만약 이대로 가면 Intel이 연내에 Coppermine 667MHz를 투입 가능해도, AMD가 Athlon 700MHz를 연내에 발표 가능하면, AMD는 가장 빠른 x86 왕관을 유지 가능하다.


 여기에 더해 Coppermine / Cascades (0.18 마이크론 판 Pentium III Xeon의 코드 네임) 코어는 최고 클럭 제품이 현재로는 800MHz 정도의 예정인데, AMD는 Fab 30의 0.18 마이크론 공정에서 구리 배서을 채용하는 것으로 내년 중 1GHz를 달성하려 한다. Intel이 이것을 요격하려면 1GHz를 달성 가능한 차세대 IA-32 프로세서 "Willamette (윌라멧)"이 나오는 내년 말까지 기다리지 않으면 안된다. 즉, AMD는 잘 되면 1년 이상 동안, 가장 빠른 x86 프로세서의 지위를 지킬 가능성이 있는 것이다.


 다만 이것은 AMD의 2개의 Fab 각각이 0.18 마이크론 공정이 무사히 일어서면의 이야기로, 여기에 더해 AMD의 재정이 이를 위해 필요한 투자를 유지하는 것이 가능하다면 이라는 조건도 붙는다. 그래서 장애물은 결코 낮지 않다.


 그러나 이번에는 Intel 측도 Coppermine 샘플의 이야기가 지금까지 들려 오지 않는 상황에 있어 나름대로 어렵다. 업계 관계자로 부터 Coppermine가 더 늦어진다는 소문이 끊이지 않는  상태다. 그래서 AMD가 기회라고 말하는 것이다. 반대로 말하면 AMD는 이 천재일우의 기회를 살리지 못하면, 이제부터 장래는 매우 흐린진다고 생각해도 좋을 것이다.



Athlon Mobile은 왜 나오지 않나?


 그런데 AMD의 예정된 Athlon 제품군 전개에는 하나 부족한 것이있다. 그것은 "Athlon Mobile"이다. Athlon 모바일의 전개는 지금까지 불분명하다. 예를들면, AMD는 지난달 개최된 컨퍼런스 "Platform 99"에서 자사의 모바일 전략을 발표했는데, Athlon 모바일 버전에 대한 설명은 없었다. Athlon 발표회에서도 "현재 우리의 주 전략은 K6 패밀리에 집중되어 있다", "미래는 Athlon에서도 가능하다고 생각하지만, 조만간은 아니다"라고 설명한다.


그러나 Athlon Mobile이 없는 것도 이상하지 않다. 그것은 Athlon이 "아주 뜨겁기"때문이다. 지금의 0.25 마이크론 버전 Athlon의 Typical Thermal Power는 650MHz 버전이 48W, 500MHz 버전이 38W. Pentium III (Katmai)보다 훨씬 소비 전력이 높고 뜨겁다. 이만큼 크고 고집적 칩이라면 그것도 당연하지만, 이것으로는 0.18 마이크론으로 이행하고 클럭과 전압을 떨어 뜨려도 노트북에 올리는 것은 어렵다. 그것에, 모바일에서는 2차 캐시 SRAM의 통합이 강하게 요구된다.


 아마도 Athlon Mobile은 공정 기술이 초기의 0.18 마이크폰 보다 미세화시켜 그 위에 2차 캐시 SRAM을 통합 (on-die)할 때가 아니면, 실현은 어려운 것이 아닐까. 그렇게 생각하면, 모바일로의 전개는 꽤 뒤가 될 것 같다.



2차 캐시의 통합은 512KB를 탑재 가능하게 되고 부터?


 여기에서 나온 또 하나의 Athlon에 관한 의문은, 언제 2차 캐시를 MPU에 통합 (on-die) 화 하는가다. 직접 경쟁하는 Intel의 0.18 마이크론판 Pentium III (Coppermine)이 256KB의  2차 캐시를 통합해 오기때문에, 이 의문은 당연하다. 그러나 AMD는 그 가능성은 당분간은 낮다고 설명한다. 그것은 SRAM 셀의 성능 등 기술 요인뿐만 아니라, Athlon의 캐시 구성에도 이유가 있다.


 128KB의 1차 캐시 (명령 64KB, 데이터 64KB)를 탑재하는 Athlon에서는, 2 차 캐시는 온다이로도 512KB 정도 올리지 않으면 의미가 없다. 그러나 0.18 마이크론 에서도, 512KB를 경제적인 다이 크기로 올리는 것은 조금 어렵다. 그렇다면 1 차 캐시를 64KB로 줄여서, 2 차 캐시를 256KB로 줄이면 좋다 (K6-III와 같은 구성) 라는 생각하겠지만, 이것도 간단치 않을지도 모른다. Athlon의 설계가 128KB의 L1 캐시를 전제로 하고 있어, 64KB 줄이면 성능이 떨어지도 모르기 때문이다.


 원래, Athlon는 캐시 부분의 설계가 조금 다르다. 예를들면, Athlon의 1 차 데이터 캐시는 듀얼 포트 (리드 또는 라이트를 동시에 2 가지 실행 가능)로, 단순 계산으로 메모리 대역은 10GB / sec 이상 (650MHz시)이나 이른다. 한편, 1 차 데이터 캐시의 로드 레이턴시는 3 사이클에 파이프 라인화 되어 있다고, 반도체 관련 컨퍼런스 "ISSCC 99 "에서 AMD는 설명했다. 이것을 보면, Athlon의 1 차 데이터 캐시는 대용량에 고대역이지만 레이턴시가 긴 설계로 보인다.


 지난해 Microprocessor ​​Forum 세미나에서, 마이클 슬레이터 씨 (MPU 애널리스트 업계지 Microprocessor ​​Report의 편집국장)는, 1 차 캐시를 대용량화 하면, 고클럭 MPU는 레이턴시가 1 사이클 보다 길어진다고 지적했다. 또 Intel이 1 차 캐시의 양을 좀처럼 늘리지 않는 것은, 부주의 하게 늘리면 고클럭 화의 발을 잡아 버린다고 생각하고 있기 때문이라는 설도 있다. 참고로, 고클럭 대용량 캐시가 예상되는 IA-64에서는, 1 차 데이터 캐시로부터의 로드 레이턴시는 2 사이클로 전망된다.


 이 부분의 정보를 기반으로 판단하면, AMD는 Athlon에서 소용량에 레이턴시가 짧은 1 차 캐시라는 방법이 아닌, 레이턴시는 길지만 대용량에 대역이 넓은 1 차 캐시를 취한다는 디자인상의 판단을 내렸을지도 모른다. 엔지니어가 아니기 때문에, 기술적으로 확실한 것은 알 수 없지만, 지금까지 이상으로 1 차 캐쉬 주변의 설계가, MPU 아키텍처에 깊이 관여하고 있다는 정도는 말할 수 있을 것이다. 그렇게 되면, 용량도 그만큼 쉽게 변경할 수 없는 것은, 이라고 생각되는 것이다. 어쩌면, Athlon의 2 차 캐시 통합은, 0.15 마이크론으로 이행 혹은 광학적으로 축소해서 512KB를 온다이에 올릴 수 있게 될 때까지 기다려야 할지도 모른다.


 다만, Athlon은 2 차 캐시를 외부에 붙여도 성능이 오르게도 설계되었다. 512KB까지의 2 차 캐시를 지원 가능한 TagRAM를 내장하고 있기 때문에, 히트 / 미스의 디텍션이 고속으로 가능하다. 참고로, 512KB 이상의 2 차 캐시를 탑재한 경우는 외부 부착 TagRAM이 필요하며, 내장 TagRAM은 히트 / 미스의 조기 디텍션을 위해 사용된다고 한다.



물량 작전의 부동 소수점 유닛


Athlon에 대해서, 또 하나 재미있는 것은, 그 설계가 블록마다 정연하게 나누어져 있는 것이다. 특히 눈에 띄는 것은 부동 소수점 연산 / MMX / 3DNow! 유닛으로, 이것은 직사각형 블록으로 깔끔하게 나뉘어 있다. 사실, Athlon의 경우, 이 FPU 유닛은 아키텍처 적으로도 나뉘어 있다. 부동 소수점 유닛과 정수 연산 유닛은, 각각 별개의 스케줄러를 갖는다. AMD 자체도 Athlon 부동 소수점 유닛은, 코 프로세서로서 독립해서 디자인 되어 있다고 ISSCC 99에서 설명했다. 즉, 독립된 코 프로세서가 온다이로 통합되어 있다는 이미지이다.


 참고로, 이 부동 소수점 유닛은 240만 트랜지스터에 10.5 × 2.6mm의 다이 면적을 차지한다. Pentium 1 개분의 로직이, 전부 부동 소수점 연산용으로 들어가 있다고 생각하면 좋을 것이다. 그 알맹이도 3 개 파이프 라인에, 물리 레지스터는 90 비트 폭의 것이 88 개, 스케줄러가 핸들 가능한 명령수는 36 엔트리. 물량 작전과 같은 물건이다. 여기까지 가면, 확실히 부동 소수점 성능은 올라서 당연할지도 모른다.



[고전 1997/10/15] AMD, K6+3D와 K7을 포함한 새로운 프로세서 로드맵을 발표



[고전 1997/10/17] Katmai 대 AMD-K6+ 3D 대 Cayenne, 그 후에는 Merced가 보인다



[고전 1997/11/27] AMD가 차기 MPU AMD-K6 3D를 COMDEX에서 프리뷰



[고전 1998/06/04] "Katmai 대 K6-3"를 향해서 질주하는 Intel과 AMD



[고전 1998.06.03] COMPUTEX TAIPEI 98 보고서 Vol.1



[고전 1998.06.04] COMPUTEX TAIPEI 98 보고서 Vol.4


[고전 1998.06.09] COMPUTEX TAIPEI '98 보고서 Vol.5



[고전 1998/08/14] Intel, AMD, Cyrix, IDT의 차세대 MPU의 모습이 10월 13일에 밝혀진다


[고전 1998/10/14] AMD, 차세대 CPU"K7"을 발표, 버스 클럭은 200MHz


[고전 1998.11.4] DEC의 Alpha 개발 팀이 대 Intel 진영으로


[고전 1998.11.18] COMDEX에 AMD-K7의 실물이 500MHz로 등장!


[고전 1999/02/23] AMD, L2캐시 내장, L3캐시까지 대응하는 K6-III


[고전 1999/02/23] K6-III로 정면으로 펜티엄 III에 맞서는 AMD


[고전 1999/04/15] AMD결산 발표, 수율 문제로 1억 2,836만 달러 순손실


[고전 1999/08/09] AMD 신세대 MPU 애슬론 발표, 최고 속도판은 650MHz


[고전 1999/08/10] AMD, Athlon을 발표. 공개 벤치 마크 등 자신을 보여


[고전 1999.08.11] AMD의 조커는 Socket판 Athlon Select?