Introduction
심재웅 교수님은 전기공학부 입학, 스타트업 병역특례, SNU MS, Georgia Tech Ph.D, Intel Labs, SNU Assistant Professor 순으로 경험함.
Computer Architecture Research Area
Conventional & GPGPU Architecture, 3D Stacked Memory 등 다양한 분야의 연구를 진행할 수 있음. Intel Labs 에서는 Machine Learning Accelerators & System 등을 했음.
Computer 101
컴퓨터는 어찌보면 엄청 단순한 기계임. 프로세서와 메모리가 있고 둘이 상호작용하는 것이 high level 관점에서 바라본 컴퓨터임. 컴퓨팅 성능 향상을 위해서는 프로세스 코어를 증가시키는 방법 등으로 데이터 프로세싱 파워를 늘릴 수 있고, 메모리 성능 향상을 위해서는 데이터 전송 속도를 늘릴 수 있음.
하지만, 이제는 더이상 데이터 프로세싱 파워를 증가시키기도, 많은 데이터로 프로세서를 바쁘게 하는 것도 어려워짐. 1971 년에 첫 번째 프로세서가 생겨난 뒤 clock speed 를 늘리거나, bit 단위를 늘리거나 해서 x86 아키텍처가 생겨났음. 1993 년에는 Pipeline width 를 늘려서 여러개를 처리할 수 있게 하는 기술인 superscalar 가 생기게 되었고, 2006 년에는 듀얼코어가 처음 생겨남. 오늘날에는 프로세서가 다중코어를 가지게 됨.
무어의 법칙에 따라서 트랜지스터의 개수를 늘려가고 이 개수가 늘어남에 따라서 캐시를 증가시키는 등 새로운 것들을 새로운 아이디어로 많이 할 수 있었음. 하지만, 요새는 2년마다도 트랜지스터의 개수가 2배가 되고 있지는 않음. 이는 트랜지스터를 점점 작게 만드는 것이 점점 어려워지고 있기 때문임. 실제로 Moore 또한 4 개의 년도에 대한 데이터만으로 예측을 한 것인데 50년동안 지켜질 줄은 몰랐다고 이야기 함.
Problem #1: Slowdown of Moore’s Law
점점 트랜지스터 스케일링이 느려지고 있음.
Problem #2: Data Movement
CPU 와 Memory 간 데이터 이동을 효율적으로 할 필요가 있음.
How do Computer Architects attack these problems?
3D Stacking 은 트랜지스터를 위 아래로 쌓는 방법론임. 이렇게 3D 로 쌓는 방법론은 Moore’s Law 를 연장시킬 수 있을 것이라는 기대를 가지고 있음.
Hardware Accelerators 는 특정 task 를 빠르게 실행할 수 있는 구조를 만듬. 특히 ML 을 빠르게 돌릴 수 있는 구조들을 많이 연구함.
Data Centric