메모리 기술의 혁신이 이끄는 메모리 아키텍처의 단일화
Justin Rattner (저스틴 래트너) 씨
Intel은 원래는 DRAM 제조 업체이며, 비 휘발성 메모리에 일시적으로 노력해 왔다. 그러나 반도체 메모리는 DRAM도 NAND 플래시도 큰 변혁기를 맞이하고 있다. 미세화의 한계에 도달 차세대 메모리 기술의 바톤 터치가 다가오고 있다. Intel은 이러한 메모리 기술의 변혁을 어떻게 보고 있는가. Intel의 연구 부문을 이끄는 Justin Rattner (저스틴 래트너) 씨 (Vice President, Director, Intel Labs and Intel Chief Technology Officer, Intel Senior Fellow)는 다음과 같이 말한다.
"NAND 기술은 기본적으로 15nm 기준으로 스케일링이 그칠 것으로 생각하고 있다. 그 전에 메모리 기술 자체가 이행된다고 생각하고 있다. Intel은 지금까지 스토리지 셀이 20nm 이하로 미세화 할 수 있도록 주력해 왔다. 그것이 메모리 기술의 이행을 지연하는 방향으로 밀어내고 있는지도 모른다.하지만 메모리 기술의 이행은 반드시 온다.
일부 메모리 기술의 후보가 있다. 스핀 주입 메모리, Memristor, 상 변화 아마도 대여섯 정도의 재미있는 메모리 기술이있다. NAND와 같은 블록 주소가 아닌 바이트 주소가 가능하고, 낮은 읽기 레이턴시를 갖춘다. 새로운 메모리도 쓰기 레이턴시는 여전히 높지만, 읽기 레이턴시는 낮다. DRAM과 동등하다 말할 수 없지만, DRAM에 필적할 정도다.
그러한 메모리 장치가 등장하면 ...... 그것은 대량으로 안정적으로 제조 할 수 있으면 좋겠다고 하는 이야기이지만, 메인 메모리는 비 휘발성 메모리가 되어 갈 것이다. 그리고 메인 메모리는 비 휘발성이 되면 메모리 아키텍처의 단일화의 생각을 시작할 수있다. 시스템 안의 메모리 (& 스토리지 메모리)를 단일화하는 생각이다.
비 휘발성인 메인 메모리 스토리지도 겸할 수 있을지도 모른다. 확실히 Samsung 은 퍼펙트 메모리라는 호칭을 했던 것 같다. 퍼펙트 메모리가 2020년 까지 가능할수 있는지 모르겠다. 또한 아키텍쳐적 으로는 아마 일정한 양의 캐시 (CPU 측에) 요구되는 것이다. 그러나 비 휘발성 됨으로써 메모리 아키텍처의 단일화 가능성이 나온다. "
Rattner 씨가 언급하고있는 것은, 일반적으로 "유니버설 메모리 (Universal Memory)"라고 불리는 경우가 많은 아이디어이다. 대용량이고 빠른 새로운 비 휘발성 메모리 기술을 사용하여 프로그램을 실행하는 워크 메모리와 코드나 데이터 저장 장치를 단일 메모리가 겸하게 할 수 있을 것으로 기대되고 있다. PC로 말해서, 메인 메모리의 DRAM 및 스토리지 NAND의 SSD를 하나로 하는 이미지다. 이전 휴대 전화는 NOR 플래시를 워크 메모리 겸 스토리지에 사용, NOR에서 프로그램을 직접 실행하는 "XIP (eXecute In Place) '모델도 있었지만 그 연장에서 고급 컴퓨팅 장치에서 메모리 기술의 단일화를 실현하고자 하고 있다.
유니버셜 메모리로의 이행
메모리 단일화로 파일 시스템이 없어진다
DRAM과 NAND의 후계자로 거론하는 새로운 메모리 기술은 Rattner 씨가 언급한 바와 같이, MRAM을 발전시킨 "STT-RAM (또는 STT-MRAM, Spin-Transfer Torque RAM : 스핀 주입 메모리)" , Memristor를 포함한 넓은 의미의 "ReRAM (또는 RRAM, Resistive RAM : 저항 변화 메모리)"계 메모리 상 변화를 사용 "PCRAM (또는 PRAM, Phase-Change RAM : 상 변화 메모리)"등. 어떤 계통에서도 대용량 및 바이트 주소 지정과 NAND 보다 빠른 액세스 속도를 제공할 것으로 예상되고 있다. 특징은 모두 메모리 셀의 전하가 아니라 저항 값을 변화시켜, 전류량에 0과 1을 나타내는 기술인 것이다.
차세대 비 휘발성 메모리 기술
아래는 대략적으로 각 메모리 기술의 장래 전망 맵의 그림이지만, 정확하게 예측하는 것은 어렵다. 예를 들어, 한마디로 ReRAM 이라고 해도 다양한 다른 기술이 각각 특성이 다르다. 그림은 어디 까지나 다양한 논문의 값을 맵으로 나타낸 대략적인 방향을 제시한 것에 불과하다.
차세대 비 휘발성 메모리의 위상
실제로는 작업 메모리로 사용하려면 속도와 용량뿐만 아니라 메모리 셀 재기록 횟수를 사실상 무제한으로 해야 한다는 벽이 쉽지 않다. 그러나 유니버설 메모리가 실현되면 시스템 설계뿐만 아니라 소프트웨어 측면에도 큰 영향이있다. Rattner 씨는 다음과 같이 설명한다.
"메모리 아키텍처의 단일화가 실현되면 논리적 결과로서 파일 시스템이 존재하는 이유가 없어진다. 데이터를 액세스에 몇십 msec 정도 매우 긴 레이턴시가 디스크로 나갈 필요가 없어진다. 필요한 데이터는 모두 메모리에 있고, 50nsec (나노초)와 100nsec 리드 레이턴시로 빠르게 액세스 할 수 있고, 바이트 단위로 주소가 있다. 그러면 파일 시스템이라는 구조의 의미가 없어진다.
따라서, 새로운 메모리 기술이 시장에 등장하면, 개혁과 발명이 가속되게 된다고 생각한다. 하이 엔드 시스템은 아마도 일정량의 캐시가 필요하고, 그것은 여전히 DRAM 스택 등으로 해결되는 것이다. 그러나 휴대폰이나 태블릿에서 단 1 종류의 메모리로 단일화 될지도 모른다. 이 경우에도 SoC 측의 코어 내부에는 캐시 계층이 존재 하겠지만, 그 밖의 메모리는 단일화 될 가능성이 있다. "
Rattner 씨가 말하는 대로 메모리 아키텍처의 통합이 실현하면 파일이 필요 없게된다. 이것은 종래부터 지적되고 있는 점이지만, 프로그램은 파일에서 메모리로 확장하는 것이 아니라 메모리에 상주하는 것이된다. 데이터 저장소인 메모리에서 처리된다. OS 측에도 큰 영향이 있는 것을 알고있다. 그러면 이러한 변화를 가져올 수있는 새로운 메모리는 언제쯤까지 등장할 것으로 예상하고 있는 것일까.
"메모리 아키텍처의 혁신은 온다. 그러나 이것은 경마와 같은 것으로 예측이 어렵다. 일반적으로 말하면, 새로운 스토리지 셀을 만들어 데모하는 것은 비교적 간단하다. 모든 다른 기술을 사용하여 데모로 보여줄 수는 있다.
더 어려운 것은 그 스토리지 셀을 큰 볼륨으로 양산하고 높은 신뢰성을 제공하는 것이다. 이것은 정말 어렵다. 내가 지금 특정 기술에 대해 큰 기대를 초과하지 않도록 하는 것은 그 어려움을 알고 있기 때문이다. 어느 기술이 정말 확실한 제조 단계에 들어갈 때까지는 기대를 낮추고 있다. "
Intel 에서는, 현재 양산 볼륨에 충분한 수준에 도달 할 것으로 판단 할 수 있는 메모리 기술이 없다는 것이 Rattner 씨의 말에서 알수 있다. 사실, 새로운 메모리는 전쟁 초기 상태로 있고 지금 장군을 건 기술이 아니다.
Compute-In-Memory 형 아키텍처도 계속 연구
Rattner 씨의 설명에서, 현재는 CPU 내부의 캐시 계층은 새로운 비 휘발성 메모리 기술의 채용은 심각하게 고려하지 않은 것 같다. Intel은 내부 메모리에 새로운 기술을 사용 연구 논문을 내고 있지만, 그것은 더 먼 비전임을 알 수 있다. CPU 내부의 비 휘발성화는 CPU의 전력 효율성을 획기적으로 높일 수 있는 가능성이 있지만 기술적인 도전도 많다.
CPU에서 메모리를 비휘발로
사실, Intel의 로직 공정 기술의 미세화의 속도는 매우 빠르고, 새로운 메모리 기술을 추종하는 것은 매우 어렵다. 많은 메모리 기술은 원리적으로는 10nm 공정 이하로 스케일 다운 할수 있다고 여겨지고 있지만 실제로 시제품은 성숙된 공정으로 이루어지고 있으며, 아직 입증되어 있지 않다. 또한 새로운 메모리 기술은 배선층에 크로스 포인트 메모리 셀을 생성 할 수 있는 옵션이 많아 미세화보다는 오히려 셀 적층화 등으로 공간을 창출하는 방향을 강조 할 가능성도 높다.
그러나 크로스 포인트이기 때문에 새로운 메모리 기술의 대부분은 논리 프로세스와도 궁합이 좋을 가능성이 높다. DRAM과 NAND와 같은 기존 메모리 기술을 고속 로직에 혼재하는 것은 어렵지만, 새로운 메모리라면 더욱 쉽게 혼재되어 있을지도 모른다. 그러면 대용량 비 휘발성 메모리와 CPU의 통합이라는 아이디어도 생겨난다.
이러한 기술은 컴퓨터 아키텍처를 바꿀 가능성을 가지고 있다. Intel에서 ExaFLOPS 슈퍼 컴퓨터를 담당하는 Shekhar Borkar 씨 (Intel Fellow and Principal Investigator DARPA Ubiquitous High Performance Computing)는 이전 "코드는 크기는 작지만 데이터는 크기가 크다. 지금은 데이터를 코드에게 가져가고 있지만, 데이터에 코드를 가지고 갈 아키텍쳐가 전력 효율면에서 보면 합리적일지도 모른다 "고 했다. 새로운 메모리 기술이면 데이터를 저장한 메모리 측에 코드를 실행하는 프로세서를 혼재하여 아이디어를 현실화할 가능성이 나온다.
코드를 데이터로 가져갈 아키텍처
지난해 IDF에서 Rattner 씨와 Shaker 씨 (왼쪽)
사실, 이러한 구상은 지금까지도 "Compute-In-Memory" 등 다양한 이름으로 연구되어왔다. Intel의 연구 부문에서는 이러한 아키텍처를 어떻게 다루고 있는지 궁금하다. Rattner 씨는 Intel이 이구상에 깊은 관심을 보이고 있다고 설명한다.
"Compute-In-Memory에, 우리는 지속적으로 열심히 연구하고 있다. 실제로 FPGA에서 Compute-In-Memory 아키텍처 에뮬레이터를 시작한 경우도 있다. ALU 군과 시퀀서를 메모리 다이에 명시하도록 에뮬레이션 했다. 따라서, IA 명령 세트의 확장에서 정의한 (웃음). 그래서, 우리는 실제로 Compute-In-Memory 대해 매우 활성화된 실증 실험을 실시해 왔다.
이 아이디어는 스택 메모리와 결합 할수 있다. 작년 (2011년)의 IDF 나의 키 노트 스피치에서 Shaker 씨가 무대에 등장했을 때 하이브리드 메모리 큐브 (HMC)를 소개했다. HMC는 로직 다이를 스택한 메모리 다이의 하단에 배치했다. 그 때 나는 일종의 컴퓨테이셔널 기능을 그 로직 다이에 담을 수도 있을지도 모른다고 시사했다. 그러한 방향도 생각하고 있다.
현재 우리는 이러한 구상의 로우 레벨 디자인, 즉, 실리콘 디자인은 행하고 있지 않다. 그러나 우리는 아키텍쳐 적으로는 어떻게 Compute-In-Memory 기능을 IA 프레임 워크에 반입 할 수 있는지를 항상 검토하고 있다. 그것에 우리가 현재 주력하고 있는 중이다. "
시제품 실리콘을 만드는 정도 단계는 아니지만, 아키텍처의 가능성은 항상 고려하고있는 것 같다. 그리고 현재 온칩 통합뿐만 아니라 실리콘 관통 비아 (TSV : Through Silicon Via) 등에 의한 스택도 검토하고 있는 것으로 알고있다.
메모리 일관성 도메인은 가능한 크게 유지
Intel은 현재의 프로세서 아키텍처는 메모리 계층의 일관성 유지를 매우 중시하고 있다. 매니 코어인 'MIC (마이크 : Many Integrated Core)'아키텍처의 코어 사이의 메모리 일관성을 유지한다. 하지만 코어 수가 증가할수록 메모리 일관성은 부담이 간다. Intel은 이 정책을 앞으로도 계속하는 것일까. Rattner 씨는 대답한다.
"메모리 일관성은 프로세서 설계자에게 확실하게 도전이다. 그러나 지금까지의 프로그래밍 모델을 수용 할 수 있다는 장점이 크다. 그것은 아마도 경쟁에서도 큰 장점이 된다.
지난해 CERN의(유럽 입자 물리 연구소) 연구원과 만났을 때, 그들은 MIC는 많은 프로세서를 쉽게 프로그램 할 수 있다고 평가해 주었다. CERN 이라고 하면,이 4 ~ 5 년은 GPU 프로그래밍의 "강호" 였다 (웃음). 그들은 프로그래밍 모델을 유지할 수 있다면, MIC가 매우 많은 코어가 있어도 Xeon에서 빠른 소프트웨어 마이그레이션이 가능하며, 적당한 노력의 성능 조정은 최대 잠재적 성능을 이끌어 낼 수 있는 것이라고 말했다. 그들을 때문에, MIC의 것이 더 간단한 경로임을 알았다고 한다.
우리는 계속해서 다양한 온칩 네트워크 설계를 연구하고 있다. 그리고 적어도 온다이 에서는 가능한 한 큰 일관성 도메인을 유지하려고 하고 있다. 현재, 우리는 디렉토리 기반의 분산적인 일관성 메소드에서 명백하게 잘되고 있다. 매우 효율적이고 고성능의 일관된 메커니즘을 제공할 수 있도록 노력을 해왔다.
그리고 바로 이것이 현재 MIC 아키텍처가 열성적으로 맞이될 수 있는 이유의 하나가되고 있다. 사용자는 "MIC 경우 프로그램을 Xeon에서 쉽게 옮길 수있다. 오 마이 갓. CUDA 라든지 재 작성하고 알고리즘을 새롭게 생각에 몇 개월도 낭비 할 필요가 없다 "고 말하고 있다.
솔직히 말하면, 사실 우리 자신도 업계 프로그래밍 모델을 유지하기의 중요성을 과소 평가했다. 지금까지 반응이 있다고는 생각하지 않았다. 지금은 GPU 프로그래밍 모델인 방향의 미래는 보지 않는다."
Intel은 노력과 비용을 들여 메모리 일관성을 유지하는데 현재는 큰 의미를 발견하고있다. 기존의 CPU와 프로그래밍 모델의 일관성을 유지할 수 있기 때문으로, MIC를 내고 이후는 Intel 자신이 그 중요성을 재인식 했다는 것을 알수 있다. Intel은 지난해 단계에서는 아직, 사내의 그래픽 코어를 사용한 범용 컴퓨팅의 가능성과 MIC 아키텍처의 양다리를 걸치고 있는 분위기가 있었지만, 현재는 저울이 MIC 측에 상당히 기울어 진 분위기가 있다.
하지만 일관성 도메인을 온다이에도 분할 할 가능성도 다소이지만 제안하고 있다. 이 부분은 현실적인 구현과의 상담이 될 것으로 보인다.
MIC 아키텍처에 대한 올해 (2012 년) 8월의 Hot Chips에서 발표
2012년 10월 18일 기사 입니다.
[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 1/2부
[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2/2부
[분석정보] Research @ Intel 2013 Direct Compressed Execution 등을 시현
[분석정보] Research @ Intel 2012 리포트
[분석정보] Intel 래트너 CTO에게 듣는 Atom 탄생 비화
[분석정보] 5W 이하의 저전력 프로세서의 개발로 향하는 Intel
'벤치리뷰·뉴스·정보 > 아키텍처·정보분석' 카테고리의 다른 글
[분석정보] 2013년에 출시되는 Intel의 새로운 서버용 프로세서 (0) | 2012.11.15 |
---|---|
[분석정보] 인텔 슈퍼컴퓨터용 가속기 Xeon Phi 5110P 발표 (0) | 2012.11.13 |
[분석정보] Intel, HPC 전용 보조 프로세서 Xeon Phi 2013년 1월부터 일반용으로 출시 (0) | 2012.11.13 |
[분석정보] Windows 8로 떠오르는 Intel 태블릿 SoC 클로버 트레일의 배경 (0) | 2012.10.31 |
[정보분석] 14나노 공정까지 달려가는 인텔 아톰 스마트폰, 타블렛 전략 (0) | 2012.10.06 |
[분석정보] 2012년 vPro는 클라이언트 관리의 결정적 수단이 되는가? 2/2부 (0) | 2012.09.20 |
[분석정보] 2012년 vPro는 클라이언트 관리의 결정적 수단이 되는가? 1/2부 (0) | 2012.09.19 |
[분석정보] IDF 2012 리포트 디지털 RF 무선 기술을 강하게 내세운 Intel (0) | 2012.09.19 |