벤치리뷰·뉴스·정보/아키텍처·정보분석

콘로가 주는 IPC 증가의 착각

tware 2014. 12. 26. 16:53

 

CPU에서 2006년 7월에 출시된 콘로의 위력이 대단한 것은 누구나 다 기억하고 있을테죠. AMD의 AMD 64에 밀린 펜티엄4로 인해서 인텔의 CPU 점유율이 순간적으로  75% 이하까지 떨어지고 반대로 AMD는 승승장구 하던걸 콘로가 나오면서 전부 평정해 버렸으니까요. 가격도 엄청나게 비싸던 AMD 64에 비해서 싸게 나왔구요 (인텔 입장에서는 기존 펜4 가격을 이어받은 것이지만, 성능대비 가격이 싼). AMD도 가격할인 경쟁을 시작하고, 두번이나 제품 가격을 최대 50%까지(가까이) 할인하면서 이때부터 AMD 64 제품이 콘로보다 저렴하게 나오기 시작했죠. (간혹 이시기 AMD 호황기때 50% 점유로 기사를 통해 알고 계신 분도 계신데, 그건 순간적인 분기의 미국내, 그것도 조립시장에 한정한 점유율 입니다. 완제품/서버/노트북(베니어스,도선) 다 합쳐서, 전체 x86 시장에서 20 ~ 25% 정도가 AMD의 최대 생산량 이었다고 보면 됩니다. 더 점유율을 올리고 싶어도 공장에서 더 만들 수가 없어서 못 올립니다. 애초에 AMD의 생산량이 거기 까지 밖에 안됩니다. 인텔의 FAB 수와 AMD FAB 수는 차이가 큽니다.  콘로 나오기 전의 AMD 신공장(FAB 36) 까지 치면 더 늘어나는데, 여기서 본격적으로 쏟아지는 물량은 콘로 이후 연말에서 다음해 연초 정도 입니다. 글 하단의 Fab 36 관련 글을 보세요.) 

 

[분석정보] AMD Fab 36의 위험과 기회

 

 

[분석정보] 메가화 노선을 유지하는 인텔과 팹리스를 목표한 AMD

 

 

[고전 2005.08.05] 새로운 공장 건설에서 보는 인텔의 Fab 변천

 

 

가격문제나 회사문제는 지나간 일이니까 대충 넘어가고, 성능에서 당시의 CPU들을 압도했다는 점은 누구나 다 알고 있는 사실 입니다. 그러나 콘로의 대폭적인 IPC 증가가 사람들이 생각하는 그것 그대로냐? 라고 한다면 그것은 아니라고 말할 수 있습니다.

 

지금도 인텔이 위기일때는 콘로를 내놓더니, 지금은 IPC 증가가 왜 콘로처럼 안되냐고 하는 분들이 많은데, 콘로는 펜4 대비 IPC가 좋은 것이지, 정말 엄청나고 대단한 외계인을 갈아넣은 제품은 아닙니다. 간단히 말하면 그냥 펜티엄 4의 IPC가 너무너무 구림으로 인한 착각? 착시? 라는 것이죠.

 

(펜티엄4 자체가 IPC는 접어두고 클럭을 마구마구 올릴 수 있는 구조로 설계. 전력과 발열만 문제 없으면 사실 IPC가 떨어지고 클럭이 6Ghz이고 성능이 좋으면 다 사죠. 이건 불도저도 마찬가지구요. IPC가 떨어지면 어떻겠습니까? 클럭을 마구 올려서 성능만 좋으면 그게 좋은거죠. 문제는 펜4와 불도저는 전력과 발열을 잡지 못했기 때문에 문제가 되는 거였죠. 펜4 프레스컷이 4 GHz를 넘어서 AMD 64와 성능이 비슷하고(당시 클럭의 AMD 64) 전력역시 비슷했다면? 나쁜걸까요? 사용자에게 중요한건 IPC 자체가 아닌 나온 제품의 실제 성능과 전력이죠. 불도저도 마찬가지.. FX 9590이 4.8 Ghz에 터보 5 Ghz에 TDP 220W 가 아닌 TDP 70 ~ 80W 였다면 어떨까요? IPC가 떨어지니까 나쁘다고 할수가 없죠. 실제 성능이 중요한거죠. 좀 다른 얘기지만, 켄츠필드가 2코어를 MCM으로 패키징해서 4코어를 만들었다고 나쁜 CPU라고 할수 없는것과 마찬가지죠. MCM 켄츠필드가 네이티브 4코어 페넘1 보다 월등히 성능이 좋으니 오히려 페넘1이 안좋고, 켄츠필드가 더 좋은 CPU죠. 결국  제품의 성능+전력이 중요한거죠. 다만 적정한 IPC + 적정한 클럭이 아닌, 클럭에만 몰두해서 성능을 올리는게 문제가 되는건 현실적으로 전력을 잡기가 어렵기 때문에 문제가 되는 거죠.)

 

과연 과거의 CPU부터 성능이 어땠는지를 보면 이해는 더 쉽게 됩니다.

(기본적으로 높은게 좋지만, 그래프에 따라서 Less is better 또는 lower is better 이런게 적혀있으면 낮은게 성능이 좋은 것 입니다. 대부분 걸린 시간일때 그렇죠. 전력이나.. 또 여기에 같은 cpu 라도 소프트웨어에서 신명령어 지원을 후에 함으로 인해서 특정 소프트웨어들이 신버전에서는 더 성능이 좋게 나올수 있구요.)

 

 

 

 

 

전체적으로 대충 보면 펜티엄3와 AMD의 애슬론은 비슷한 성능을 가진것을 알 수 있습니다. 지나건 제품이 어땠나 정도로 보는거니까.. 일일이 하나하나 따지지는 말구요.다른 더 다양한 프로그램 벤치를 보면 조금씩 더 차이가 나는 것도 있지만, 지금은 쓰지도 않는 CPU 뭐가 조금 더 잘났다 논쟁할 필요는 없죠. 또 사용자들이 가장 민감한 게임, 인코딩, 오피스 위주로.. (오피스나 인코딩이 없으면 해당 벤치에서 안한 겁니다.)

펜3는 DDR 지원이 (오로지 SDR만, 잠깐 나왔다 사라진 램버스 지원도 있기도 했지만) 없습니다. 싱글채널 SDR 지원. (아  끝물에 비아의 DDR 칩셋이 있습니다. 사용한 사람은 거의 없을 듯..)

 

 

 

 

 

 

 

 

 

 

 

 

노스우드 시대의 벤치마크

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

이 시기의 AMD는 실제 클럭을 제품에 표기하지 않고, 2100+ (실클럭은 1733Mhz)와 같은 PR 등급을 표기하던 시기 입니다. 이전의 애슬론 1400은 실클럭이 1400Mhz, 애슬론 XP 1500+ 는 실클럭이 1333Mhz. 하이퍼쓰레딩을 지원한 첫번째 CPU 펜티엄4 3.06B (FSB 533)도 있지만, 당시는 싱글코어만 프로그램들이 지원하던 때라 있어봐야 무용지물. 이시절에 2코어가 있어도 마찬가지로 무용지물(일부 전문 프로그램은 효과가 있었죠. 3D 소프트나 그래픽 소프트 등. 이런 소프트는 예전 펜티엄/펜티엄2 시절에도 듀얼 CPU를 지원 했으니까요. 또 이런 소프트가 멀티CPU (멀티 코어, 하이퍼스레딩 (SMT)를 활용하기 쉬운 소프트 입니다.). 물론 프로그램 자체를 여러개 켜면 그때는 하이퍼쓰레딩이나 2코어나 효과 상승.

 

[고전 2002.09.12] Hyper-Threading Technology를 지원하는 HTT Pentium 4 3.06GHz

 

 

[고전 2002.11.14]Pentium 4 3.06GHz 빠른 리뷰 Hyper-Threading의 효과는 얼마나?

 

예전 펜티엄4 하이퍼 스레딩 기사는 위 링크 글과 글 속의 하이퍼 스레딩 켜고 끈 동영상을 참고 하세요. 영상은 3.6Ghz HT 끈 것과 3.06 HT 켠 것의 비교 입니다. 예전 시대다 보니 소프트를 동시에 실행할 때 차이가 확 납니다.

 

Intel Processors (Socket 478)

200 (x4 = 800) MHz DDR 400 Dual

Pentium 4 Extreme Edition 3.4 GHz (2 MB L3-Cache)
Pentium 4 Extreme Edition 3.2 GHz (2 MB L3-Cache)
Pentium 4 3.40 GHz (512 kB L2-Cache)
Pentium 4 3.20 GHz (512 kB L2-Cache)
Pentium 4 3.00 GHz (512 kB L2-Cache)
Pentium 4 2.80 GHz (512 kB L2-Cache)
Pentium 4 2.60 GHz (512 kB L2-Cache)
Pentium 4E 3.20 GHz (1 MB L2-Cache)
Pentium 4E 3.00 GHz (1 MB L2-Cache)
Pentium 4E 2.80 GHz (1 MB L2-Cache)

 

133 Mhz FSB Dual DDR 333

Pentium 4 3.06 GHz (512 kB Cache)
Pentium 4 2.80 GHz (512 kB Cache)
Pentium 4 2.66 GHz (512 kB Cache)

 

AMD Socket A

200 MHz FSB Dual DDR 400

Athlon XP 3200+ (2200 MHz, 512 kB L2-Cache)
Athlon XP 3000+ (2100 MHz, 512 kB L2-Cache)

 

133 Mhz FSB Dual DDR 333

Athlon XP 3000+ (2166 MHz, 512 kB L2-Cache)
Athlon XP 2800+ (2083 MHz, 512 kB L2-Cache)
Athlon XP 2700+ (2166 MHz, 256 kB L2-Cache)
Athlon XP 2600+ (1917 MHz, 512 kB L2-Cache)
Athlon XP 2500+ (1833 MHz, 512 kB L2-Cache)

 

 

AMD Processors (Socket 940)

200 MHz FSB (Dual DDR400 reg.)

Athlon 64 FX-51 (2200 MHz, 1 MB L2-Cache)

 

AMD Processors (Socket 754)

200 MHz HT (Single DDR400) 

Athlon 64 3400+ (2200 MHz, 1 MB L2-Cache)
Athlon 64 3200+ (2200 MHz, 1 MB L2-Cache)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

AMD 64의 등장과 프레스컷의 등장후 벤치마크. 클럭당 성능으로 따지면 펜티엄4 쪽이 많이 떨어지죠.프레스컷은 클럭을 보다 쉽게 올릴수 있는 구조로 성능을 내는 형태라. 문제는 전력인거죠. 전력이 좋으면 프레스컷이든, 불도저든 IPC가 좀 떨어지면 어떻겠습니까.... 전력만 타 제품과 비슷하거나 좋으면 클럭을 올려서 성능이 좋더라도 장땡이죠. 물제는 펜4는 프레스캇에서 AMD는 불도저에서 현실로 만들지를 못해서 욕먹었죠. 전력과 발열이 너무 심해서요. 경쟁사 대비 절대 성능도 떨어지구요. 현실에서 전력 발열을 못잡는게 문제. 잡기만 하면 모.. 클럭빨 이었다 해도 실제 성능이 좋은면 그게 좋은거죠.

 

 

지금까지 대충 보면 펜티엄4는 본래부터 클럭당 성능이 매우 떨어집니다. AMD 64 (K8)은 이전의 K7을 기반으로 이걸 대폭적으로 개선하고 64비트 지원을 한 제품이죠. 프레스컷은 역시 64비트 지원 + 더 클럭을 잘 올릴수 있는 긴 파이프라인 구조.(프레스컷 이전의 윌라멧,노스우드도 펜3에 비하면) 그럼 인텔의 이 시기에 모바일용으로 출시된 펜티엄 M 베니어스의 성능은 어떨까요? 노스우드 시절까지는 모바일 제품도 펜티엄4 M 이라는 제품이 노트북에 쓰였지만 (펜티엄4 윌라멧은 전력과 발열로 인해 노트북에 쓰이지 않고, 노트북은 계속 펜티엄3M 을 씁니다. 노스우드가 나온 뒤에 노스우드 펜티엄4M 출시. 다음 프레스캇은 전력이 더 높기에 노트북용 펜티엄M (베니어스, 도선, 코어솔로/코어듀오 등) 개발은 인텔로는 필수 요소.), 이후 바로 모바일 전용인 펜티엄 M 브랜드의 (인텔 센트리노 노트북으로 유명한) 베니어스가 (130나노) 출시되죠. 베니어스는 펜티엄 3를 기반으로 대대적으로 개선해서 새로운 아키텍처라고 불릴정도로 만들어진 제품 입니다. (콘로를 만든 하이파 개발센터가 개발)

 

----------------------------------------------------------------------------------------

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

이 벤치마크는 참고해야 할 점이..  양 노트북이 같은 ATI 모빌리티 라데온 9000이지만, 펜티엄4 쪽은 64MB을 달고 있고, 펜티엄 M 1.4 쪽은 32MB 메모리를 가지고 있습니다. 3D 마크에서는 펜티엄M이 이기지만 실게임에서 떨어지는 부분이 메모리에 있는지도... 다른 벤치마크 프로그램과  실제 프로그램도 펜티엄M 1.4가 더 좋게 나오죠. 오로지 실 게임 빼고요.

------------------------------------------------------------------------

 

130나노 펜티엄M 베니어스를 90나노 공정으로 바꾸고 캐쉬증가및 개선을 한 펜티엄 M 도선 Dothan

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

베니어스가 펜티엄 4에 비해서 늦게 출시가 되어서 어쩔수 없지만, 만약 펜티엄4 출시와 비슷하게 할수 있었고, 펜티엄4는 그냥 출시하지 말고, 베니어스, 도선으로 연이어서 출시가 되었다면?? 

 

베니어스 도선은 모바일 용이라 전력도 적게 먹습니다. 펜4 윌라멧이 (180나노 공정) 2000년에 (2000년 11월 20일 출시. 거의 2001년 출시나 마찬가지.) 나오죠 . 펜티엄M 베니어스는 2003년에 나오구요. 펜4가 본격적으로 팔리기 시작한 시절은 2002년 노스우드(130나노 공정) 시대구요 ( 펜4 초기는 펜3와 경쟁하던 시기이며, RDRAM 가격 여파로 윌라멧 시대는 많이 안팔림. 펜3보다 윌라멧이 코어 크기도 커서 비싸기도 했구요). 즉 그냥 쭉 펜3 투알라틴 (130나노 공정)으로 어떻게든 클럭을 조금씩 끌어 올리면서 2002년 정도까지 버텼다면 (펜4는 안나오고).... 그리고 바로 베니어스가 데스크탑까지 다 쓰였다면??? (투알라틴 중에서도 투알라틴 셀러론은 2002년까지 쭉 팔렸죠) 가정은 없다고 할 수도 있지만, 이 경우는 없는 제품을 가정한게 아니라, 있는 제품이기 때문에 말하는 겁니다. 단지 데스크탑으로 쓰지 않았을 뿐인거죠. 물론 아주 데스크탑으로 쓰지 않은 것은 아니고, MoDT 모바일 온 데스크탑 이라고 펜티엄M 소켓을 가진 데스크탑 보드들이 몇개 나왔습니다. 이와 함께 노트북용 479 CPU를 데스크탑 보드에 사용할 수 있게 해주는 어댑터도 나왔구요. 위의 벤치도 그래서 할 수 있는 것이죠.)


이후에 도선을 개선 명령어 추가한 모바일 듀얼코어로 만든 65나노 코드네임 요나인 코어 듀오가 (코어2 듀오 콘로(메롬) 아님) 출시 됩니다.

 

인코딩 같은 경우 그래프 마다 다릅니다. 어떤건  높은게 좋은걸로 표시된 그래프가 있고, 낮은게 좋은걸로 된 그래프가 있습니다. 위에서 말했듯이 Lower is better냐 highter is better냐를 보시던가,  전체 CPU의 클럭을 보고 낮은게 좋은지 높은게 좋은지 판단하세요. 낮은게 좋은건 인코딩에 걸린 시간 단위 일테고, 높은게 좋은 것의 경우는 초당 몇 프레임을 처리하는가 이겠죠.

 

 

 

 

 

 

 

 

 

 

 

여기에서 다시 요나가 지원하지 않던 64비트 모드를 지원하고 마크로 퓨전등을 추가해서 이전의 요나까지가 모바일 전용인 것과 다르게, 데스크탑, 모바일,서버까지 모두 투입되는 메롬(콘로) 출시. (요나까지는 요나는 모바일, 데스크탑 서버는 펜티엄4 넷버스트 아키텍처) 콘로는 한마디로 말하면 요나 + 펜4의 인코딩 성능 (미디어 관련 성능) + 개선판 정도쯤?

 

코어 듀오 (요나) VS 코어 2 듀오 (메롬,콘로)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

콘로 VS AMD 64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

펜티엄 4에서 엄청나게 IPC를 증가시켜서 나온거 봐라 AMD 때문이다 이런말 하는 분들이 계신데.. 그거하고 관련이 없죠. 펜티엄4를 만들지 않고, 펜티엄 3 -> 베니어스 -> 도선 -> 요나 -> 콘로로 진행이 성능증가를 보면 매우 자연스러운 것이죠. 원래 늘어날 수치인 거지.. 갑자기 노력해서 늘어난 수치도 아니고, AMD 때문에 갑자기 나온 제품도 아닙니다. 또 CPU는 갑자기 나올 수 있는 제품이 아닙니다. 신 아키텍처는 개발에서 출시까지 5년이 걸립니다 (다만 작은 개선판은 1~2년이면 나옵니다. 베니어스 -> 도선 같은. 도선을 듀얼 요나로 같은 경우. 콘로 -> 울프 같은 경우).  펜4로 인해서 그런 착각 착시가 생길 뿐 입니다. 알면서도 끼워 맞추기를 해서 말을 만들어 내거나 말이죠.

 

[고전 2001.08.10] Banias의 샘플은 내년 여름, 발표는 2003 봄?

 

[고전 2001.08.29] 베니어스 2003년 상반기 출시 발표, 3.5Ghz 펜티엄4 데모

 

[고전 2002.09.11] 이것이 Banias 플랫폼이다 CPU 마이크로 아키텍처 편

 

[고전 2003.02.20] Pentium M 1.60GHz의 처리 능력

 

[고전 2000.2.25] 인텔 사내경합이 낳은 Willamette 1.4GHz

 

[아키텍처] Core Microarchitecture 속도의 비밀은 CISC의 아름다움

 

[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기

 

(배니어스도 AMD 때문에 만들었을까요? 아니죠. 펜티엄4의 전력과 발열이 높으니까 필요에 의해서 노트북용 펜티엄M (베니어스, 도선, 코어솔로, 코어듀오 등)을 만든 거죠. 펜4 180나노 윌라멧은 노트북용으로는 힘들어서 펜티엄III-M이 계속 쓰였고, 130나노 펜티엄4 노스우드에 와서야 간신히 펜티엄4-M으로 넘어가서 노트북에도 펜티엄4가 쓰였죠. 그렇기에 당연히 필수 요소로 펜티엄M을 개발 할 수 밖에 없는 거구요. 이후 펜티엄4 프레스컷은 더더욱 노트북용으로는 쓸 수 없구요. 그렇기에 펜티엄M 개발은 너무도 당연한 겁니다 (다른 기사에 보면 1999년도 부터 펜티엄M 개발 시작. 1999년이면 펜4 윌라멧 개발은 마무리 된 상태구요. 개발을 끝내고  버그 수정과 양산및 출시 까지 1년 이상 걸립니다.). 콘로가 급격한게 아닌 그냥 펜4가 클럭당 IPC가 구린 것. 설계 사상이 그렇기 때문이죠. IPC 증가보다는 클럭빨로 승부를 보는 형태니까요. 반면 콘로는 Banias의 설계 사상을 발전 시켜서 만들어졌죠. 그러니 특성이 비슷 합니다.전력당 성능이 좋고, IPC가 높은 CPU가 되죠.)

 

한마디로 그냥 펜티엄 4가 클럭당 성능이 워낙 떨어지는 제품이다 이런거죠. 그나마 노스우드까지는 전력을 잡았기 때문에, 클럭당 성능이 떨어져도 클럭을 올려서 성능이 나오니까 욕을 먹지 않고 잘 팔렸던 것이고, 프레스컷부터 전력&발열이 높고, 본래 6 GHz 이상까지 가려던게 4Ghz 가서 막히게 되서 망한거죠. 그리고 경쟁상대도 이전과 다르게 AMD 64로 바뀌었구요.

 

AMD 역시 새로운 아키텍처의 차세대 제품이 불도저 같은 형태가 아닌 다음에야 콘로때 처럼 불도저 대비 대단한 향상이(IPC 증가) 있을 확률이 높죠. 이쪽도 똑같이 불도저가 그냥 클럭당 성능이 떨어지고 (불도저는 기존보다 IPC를 떨어트려 가면서 코어를 작게 만들고 대신 작은 코어를 8개 넣음. 낮아진 IPC로 인한 1코어당 성능은 클럭을 끌어올려서 만회하려는 아키텍처), 전력&발열이 높아서 그런거지... 인텔 요나같은 불도저 대신 다른 제품이 있었다면 , 꾸준한 증가로 나타나겠죠. (불도저 = 펜4 와 비슷한 형태 IPC를 증가시키기 보다 클럭으로 코어당 성능을 잡는 형태. 다만 불도저는 멀티코어 시대라서 코어를 작게 만들고 대신 8코어를 넣었다는게 다른 점. 펜4 시대는 싱글코어 시대라는게 다르죠.)

 

아무튼 콘로가 펜4 대비 클럭당 성능 1.5배씩 나도록 만든, 인텔이 노력하면 나오는 대단한 제품이고, 노력 안하면  네할렘 -> 샌디브릿지 -> 하스웰 처럼  조금씩 향상되서 나온다 이런게 아니라는 거죠. (CPU가 맘먹으면 바로 개발을 해내고 나올수 있는 제품도 아니죠. 무엇보다 AMD는 하나의 신 아키텍처를 개발해서 CPU를 출시하면, 그 다음 신 아키텍처까지는 4~5년 이상 걸립니다. 그러면 전세대에 비해서 차이가 더 커보이는 착시가 또 생깁니다. 그에 비해서 인텔은 개발팀이 풍부한 관계로 새로운 신 아키텍터를 개발해서 출시하면 그동안 다른팀이 중첩개발하던 신 아키텍처가 2년 조금 지나면 나옵니다. 그러니 더욱 전세대 대비 점진적인 증가로 보이게 되죠. 어짜피 인텔이나 AMD나 CPU 개발에서 출시는 4~5년이 걸리죠. 그러니 팀이 많은 인텔은 중첩 개발로 신 아키텍처의 출시가 더 빠르죠..)

 

그냥 펜3 -> 베니어스 -> 도선 -> 요나(듀얼코어) -> 콘로 (듀얼코어)로 왔다면 지금과 비슷하죠.

 

IPC 증가 얘기는 아니지만,  예전에는 클럭에 의존해서 1Ghz CPU가 한 2년 지나면 2Ghz가 돼서 CPU 마이크로 아키텍처적으로 아무런 노력을 안해도 성능이 그냥 2배가 되는 시절이었지만, 지금은 10년 전의 펜티엄4가 찍은 4Ghz에서 이미 클럭이 정체되어 있죠.(TDP 220W의 비정상적인 TDP로 클럭을 올린 AMD FX 9590 제품은 제외하고)

 

과거의 클럭 의존으로 그냥 성능이 증가되고 + 몇년 뒤에 신 아키텍처 개발이 합쳐지던 시절과 클럭이 정체되고 오로지  아키텍처 개발로만 성능을 올리고 있는 콘로 이후 지금을  1 : 1 로 비교할수가 없겠죠. 개발이 오히려 꾸준히 되고 있기에  클럭이 멈춘 지금도 성능이 증가하는 것이죠.

 

--------------------------------------------------------------------------------

[고전 2001.02.06] 2010년 CPU 전력은 600W?

 

그리고 CPU의 성능이라고 하면, 지난 10년간 75배가 됐다고 한다. 이 가운데 13배가 이미 말한 순수하게 공정 기술로 클럭 향상 분, 그리고 6 배 분이 마이크로 아키텍처와 디자인(시스템 버스 및 캐시 등)에 의한 것이라고 한다.

--------------------------------------------------------------------------------------

위 링크 글에서도 볼수 있죠.자세한건 링크글 참조.. 아무튼 클럭이 멈추면 그만큼 최종 CPU 성능 증가는 현저히 떨어지게 되죠. 클럭향상 x 아키텍처 향상 = 최종성능이 되니까요. 100의 성능을 갖는 CPU가 클럭이 1.6 배가 되면 160 의 성능 x 아키텍처 IPC 증가가 1.2 배가 된다고 하면 = 최종 192로 거의 2배의 성능이죠. 과거는 이런식 이었죠.

 

클럭이 지금처럼 1.1배 x IPC 1.2배 라고 해도 132로 32%의 성능증가뿐이 안되죠. 몇년 사이의 제품들 클럭을 보면 거의 제자리 인건 누구나 아는 내용이죠. 3Ghz 대에서  0.1 ~ 0.4 Ghz 정도 오른 수준... (3Ghz 면 0.3Ghz가 올라야 10% 클럭 증가)

 

(CPU 자체의 아키텍처 변경과 실행엔진 확대, 프런트 엔드 강화와 별개로, 네할렘 부터 CPU내장 메모리 컨트롤러의 이점으로 인해서 메모리 대역폭 의존적, 메모리 레이턴시 의존적인 부분은 확실히 이전보다 대폭 늘어나긴 했습니다. AMD는 이미 AMD 64 부터 내장 멤컨이라, 멤컨 위치에 따른 이득을 더 보고 말고 할수가 없구요.

 

추가로 이전처럼 캐쉬를 늘려서 성능을 더 올리지 그러냐? 라는 말이 나올수도 있는데, 캐쉬라는건 사용자 환경에 따라서 일정한 용량 이상은 효과가 발휘되지 않습니다. 캐쉬가 작았다가 커질때 마다 실제 CPU의 최종 성능은 늘어나지만, 어느수준이 되면 그 이상을 늘려봐야 거의 효과가 나타나지 않습니다. 회로 낭비가 되는 셈이죠.

 

실 예를 들면 진짜 펜티엄3와 펜티엄3 셀러론의 캐쉬를 볼수도 있겠죠. 셀러론이 투알라틴이 되면서 L2 캐쉬가 256이 되고, 펜3는 투알라틴이 되면서 L2 512가 되는데.. 이전에 셀러론 128kB, 펜티엄 256kB 일때는 차이가 제법났지만,  256kB, 512KB가 되면서는 차이가 줄어들죠. 그래서 투알라틴 셀러론이 인기가 컸던 거구요.(가격은 싸고 성능은 좋고, 오버도 잘되고..) 펜4 시절도 셀러론 128일때는 사무용이나, 인코딩은 괜찮지만, 가장 사용자에게 민감한 게임에서는 거의 폐급 취급 당하다가.. 256KB로 올라온 뒤로는 그래도 평가가 조금은 좋아졌죠. 펜4 자체는 256 -> 512 에서도 역시 성능 증가가 약간 있었고 더 좋은 평가를 받았지만.. 1M -> 2M는 사람들이 캐쉬 구분해 가면서 성능 따지는 경우가 별로 없었죠. (512 -> 1M를 뺀건 프레스컷에서 파이프라인이 길어져서 달라졌기에 직접 비교가 안되기 때문에..)

 

가장 가까이는  i3의 4M L3 캐쉬 모델과 L3 3M 캐쉬 모델이 있죠. 이쪽도 보면 알겠지만, 성능 차이가 거의 없다라고 할 정도의 수준입니다.

 

간단히 정리하면, 서버용의 제온같은 경우는 애초에 용도가 다르고 캐쉬사용의 범위가 다르니까 이쪽은 많을수 밖에 없고, 데스크탑&노트북 으로 말하면 예전에는 성능을 위해서 더 넣고 싶어도 크기때문에 넣을수 없었다가, 공정이 축소되면 그때 추가해서 성능을 더 증가시키던 시절이고, 지금은 더 넣을수 있어도 넣어봐야 효용성이 크지 않아서 안넣는 시대라고 할수가 있다는 거죠.(시대가 변하면 또 용량이 늘어날수 있겠지만) 추가할 캐쉬 회로가 차지하는 면적에 차라리 내장 GPU나 다른쪽에 활용하는게 훨씬 유용하니까요. 캐쉬 조금 더 넣어서 별 차이도 없는 성능을 증가시키기 보다 GT1 급 GPU라도 내장하는게 기능상으로도 좋고, CPU + GPU 통합 연산을 통해서 최종 연산성능 증대등을 생각하면 이쪽이 기능 + 최종성능 에서 훨씬 좋다는건 누구나 알수 있죠. (GT1급이면 무시할지도 모르지만, 당장 사무용만 되도 GT1이면 충분하고, 제조사 입장에서도 가장 싼 외장 VGA 하나 더 끼워서 사무용으로 내놓는거랑, 그냥 GT1 내장된 CPU로 사무용 컴으로 파는거 누가 더 싸게 내놓을수 있을지는 뻔하죠. 델,HP, 레노버 이런 회사서 어떤걸 사무용으로 공급할지 뻔한 겁니다.

 
  인텔이 펜티엄4를 만든것은 콘로가 돋보이는 추진력을 얻기 위함이다!!!!  불도저를 추진력 삼아 이제 AMD도 돌진~!!!!! (------ 유머인거는 아시죠;;;)

 

 

펜4 3.2Ghz 노스우드와 프레스컷. 프레스컷이 31단계로 파이프라인이 길어졌지만, 그것을 커버하기 위한 분기예측 강화, L1, L2 캐시 2배로 성능이 전체적으로 약간 더 좋고 (물론 일부 소프트는 오히려 약간 성능이 하락이 있기도 함. 증가/하락 전체적으로는 성능 증가), SSE3 명령의 지원으로 SSE3 지원 소프트의 경우 SSE3에 의한 성능 향상. SSE3의 명령중 MONITOR / MWAIT 명령으로 스레드 제어를 더 원활하게 가능.

 

같은 소프트를 775 펜티엄 E5300으로 돌린 경우.

단 구형 소프트들의 특징으로 꽁으로 CPU 점유하는 특성으로 차이 크게 안날뿐, 다른 소프트를 단일로 돌리거나 멀티로 돌리거나, 멀티 스레드(멀티코어) 지원 소프트를 펜4와 각각 돌릴때 차이는 매우 큽니다. 이점은 오해 없어야 합니다. 펜4와 코어2 계열의 코어당 성능 차이는 누구나 다 알고 있는 정도로 차이가 크죠. 게다가 아무리 HT가 있어도 1코어와 2코어의 차이이니. (펜4 듀얼인 펜D의 극 오버가 콘로랑 비슷하다 이러면 또 모를까.)

 

고전 펜티엄4 PC 그냥 잡담....

 

 

 

 

[분석정보] CPU와 메모리의 속도 차이를 해소하는 캐시의 기초지식

 

 

[고전 2001.08.10] Banias의 샘플은 내년 여름, 발표는 2003 봄?

 

 

[고전 2002.09.11] 이것이 Banias 플랫폼이다 CPU 마이크로 아키텍처 편

 

 

[고전 2003.02.20] Pentium M 1.60GHz의 처리 능력

 

 

[고전 2005.5.25] 도선 오버 넷버스트

 

 

[고전 2004.07.21] 인텔 90nm 펜티엄 M 775 Dothan

 

 

[고전 2005.08.25] Intel이 차세대 마이크로 아키텍처 CPU를 공개

 

 

[고전 2001.02.07] 인텔 폴락의 법칙이 등장 Intel 겔싱어 CTO의 ISSCC 강연

 

 

[고전 2000.08.25] 그래픽 통합 CPU 팀나(Timna)의 개요를 분명히-극적인 다이 크기 축소를 실현

 

 

[고전 1998.11.4] DEC의 Alpha 개발 팀이 대 Intel 진영에

 

 

[고전 2000.2.25] 인텔 사내경합이 낳은 Willamette 1.4GHz

 

 

[고전 2001.07.31] 이번 전쟁은 I/O 버스 전쟁이다 드이어 격돌 Hyper Transport 대 3GIO

 

 

[분석정보] Intel 차세대 하이퍼 쓰레딩 (Hyper-Threading) 기술 공개

 

 

[정보분석] 모든 CPU는 멀티 스레드로, 명확하게 된 CPU의 방향

 

 

[분석정보] AMD의 차기 CPU 코어 "K9"는 2005 년에 등장인가?

 

 

[분석정보] K9는 DDR2 메모리와 차세대 HyperTransport에 대응

 

 

[분석정보] Many-Core CPU로 향하는 Intel. CTO Gelsinger 인터뷰 1/2부

 

 

[분석정보] 시리얼이 되는 FSB와 메모리. CTO Gelsinger 인터뷰 2/2부

 

 

[분석정보] 5W 이하의 저전력 프로세서의 개발로 향하는 Intel

 

 

[아키텍처] 폴락의 법칙에 찢어지고 취소된 테자스(Tejas)

 

 

[정보분석] 암달의 법칙(Amdahl's law)을 둘러싼 Intel과 AMD의 싸움

 

 

[분석정보] 2015년 컴퓨터 플랫폼 IDF Spring 2005

 

 

[분석정보] 듀얼 코어의 다이 사이즈로 부터 판단되는 AMD의 CPU 전략

 

 

[분석정보] 더 밝혀진 Yonah의 모습 확장된 C4스테이트

 

 

[정보분석] IDF 2005 저스틴 래트너 기조 연설 미래의 기술

 

 

[정보분석] Merom(메롬) 이후인 Nehalem(네할렘) 과 Gilo(길로)

 

 

[분석정보] K8 이후 크게 바뀐 AMD의 CPU 개발주기

 

 

[분석정보] Intel 모빌리티 사업부 가디 싱어 씨 인터뷰 초소형 PC Ultra Mobile PC의 현장

 

 

[분석정보] 명확해진 Core Microarchitecture

 

 

[분석정보] AMD Fab 36의 위험과 기회

 

 

[정보분석] 2년 주기로 아키텍처를 쇄신하는 Intel

 

 

[아키텍처] Core Microarchitecture 속도의 비밀은 CISC의 아름다움

 

 

[분석정보] AMD와 ATI 프로세서는 하나로 융합한다

 

 

[분석정보] 심플 코어로 향하는 차세대 CPU 아키텍처

 

 

[분석정보] 메모리가 큰 벽이 되는 AMD의 퓨전 (FUSION) 프로세서

 

 

[분석정보] AMD가 2009년의 CPU 코어와 통합 CPU의 개요를 발표

 

 

[분석정보] 이스라엘에서 발신되는 인텔의 차세대 CPU 기술

 

 

[아키텍처] 환경 조건을 이용하여 성능을 끌어 올리는 터보 모드

 

 

[정보분석] 2개의 CPU 개발팀이 경쟁하는 Intel의 사내 전략

 

 

[정보분석] Penryn의 1.5 배 CPU 코어를 가지는 차세대 CPU "Nehalem"

 


[분석정보] 계층화가 Nehalem MA의 특징


[아키텍처] Intel의 차기 CPU "Nehalem"의 설계 개념은 "1 for 1"


[분석정보] 9년전의 아이디어에서 태어난 아톰. 리서치 @ 인텔

 

 

[분석정보] Atom의 절전 기술도 탑재한 Nehalem

 

 

[분석정보] Intel 4번째 x86 CPU 개발 센터 방갈로르

 

 

[분석정보] 그리고 CPU는 DRAM 다이도 통합

 

 

[분석정보](암달의 법칙) 2010년대 100 코어 CPU 시대를 향해서 달리는 CPU 제조사

 

 

[분석정보] Sandy Bridge와 Bulldozer 세대의 CPU 아키텍처

 

 

[아키텍처] 정수 연산 성능을 희생해서 효율성을 거둔 AMD의 "Bulldozer"

 

 

[분석정보] AMD GPU 통합 CPU Llano의 CPU 코어 기술을 발표

 

 

[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기

 

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom

 

 

[분석정보] Intel 래트너 CTO에게 듣는 Atom 탄생 비화

 

 

[분석정보] IDF 2010 왜 Sandy Bridge는 성능이 높은가?

 

 

[아키텍처] 트릭을 거듭한 Sandy Bridge 마이크로 아키텍처

 

 

[분석정보] AMD가 확장판 K10 코어 기반의 APU Llano 를 첫 공개

 

 

[분석정보] 보여진 AMD의 차기 CPU Llano의 실상

 

 

[분석정보] 드디어 밝혀진 AMD의 불도저 (Bulldozer)

 

 

[아키텍처] AMD 불도저 제품은 4GHz 이상

 

 

[고전 2005.06.01] AMD, Athlon 64 X2 발표회

 

 

[고전 2003.09.24] AMD 64bit 프로세서 Athlon 64 정식 발표

 

 

[고전 2003.11.21] 939핀 플랫폼과 90nm 공정 도입을 서두르는 AMD

 

 

[고전 2003.02.20] Intel 차세대 CPU Prescott의 정체를 밝혀

 

 

[고전 2003.02.27] Prescott,Tejas는 5GHz대, 65nm Nehalem은 10GHz이상

 

 

[고전 2001.01.17] 10GHz CPU를 실현하는 Intel 0.03μm 트랜지스터 기술

 

 

[고전 2001.11.27] 인텔 테라 헤르츠 트랜지스터 기술 발표

 

 

[고전 2002.09.19] Intel, 3 차원 구조의 "트라이 게이트 트랜지스터 ' 발표