엔비디아가 3월 26∼29일까지 미국 캘리포니아 산호세에 위치한 산호세 매키너리 컨벤션센터(San Jose McEnery Convention Center)에서 연례 행사인 GTS 2018(GPU Technology Conference 2018)을 개최했다.
기조연설에 나선 엔비디아 CEO 젠슨황은 소형 슈퍼컴퓨터 DGX-2와 자율주행 차량을 가상 공간에서 수십억 km 주행하도록 해 학습할 수 있게 해주는 가상 시뮬레이터 드라이브 콘스텔레이션(Drive Constellation) 등을 발표했다. 키노트 영상은 이곳(https://www.ustream.tv/channel/20165212)에서 확인할 수 있다.
먼저 DGX-2는 테슬라 V100 32GB GPU(Tesla V100 32GB GPU) 16개를 이용해 2.4TB에 달하는 대역폭으로 연결, 엔비디아의 표현을 빌리면 세계 최대 GPU로 동작한다는 슈퍼컴퓨터. 테슬라 V100 32GB GPU는 엔비디아의 데이터센터용 GPU인 테슬라 V100 메모리 용량을 이전보다 2배 키운 32GB로 늘린 것이다.
DGX-2는 테슬라 V100 32GB 16개를 엔브이링크(NVLink)를 기반으로 한 NV스위치(NVSwitch) 12개를 이용해 연결, 메모리 용량 512GB를 확보하고 있다. 쿠다코어 수는 8만 1,920개.
DGX-2의 특징은 뛰어난 가성비와 소비전력대비 성능이라고 할 수 있다. 10kW 전력 정도로 2PFLOPS 반정밀도 부동소수점 연산 성능을 기대할 수 있다는 것. DGX-2의 가격은 39만 9,000달러지만 젠슨황에 따르면 같은 성능을 CPU 기반으로 실현하려면 300만 달러, 소비전력은 180kW가 필요하다는 설명이다.
반면 DGX-2를 이용하면 랩 15개를 차지하는 서버 300대에 필적하는 딥러닝 처리 능력을 갖추면서도 크기는 60분의 1, 전력 효율은 18배에 이른다는 것이다. 젠슨황은 “엔비디아가 무어의 법칙을 웃도는 속도로 플랫폼 성능을 끌어올리고 있다”면서 (DGX-2를 비롯한 자사 제품이) 의료나 교통, 과학 탐사 등 수많은 분야에서 돌파구를 제공하는 단초가 될 것이라고 강조했다.
드라이브 콘스텔레이션은 자율주행 차량 테스트용으로 개발한 가상 시뮬레이션 시스템이다. 실제 현실과 비슷한 환경을 가상으로 재현하고 이 안에서 자율주행 차량을 가상 주행하도록 해 실제 차량을 이용하지 않더라도 차량 인공지능 학습을 진행할 수 있게 한다는 것이다. 이를 통해 개발 중인 자율주행 차량의 안전성을 더 높이는 건 물론 확장성을 제공한다는 것.
드라이브 콘스텔레이션은 서버 2대를 기반으로 삼는다. 1대는 시뮬레이션 소프트웨어를 실행해 카메라와 라이더, 레이더 등 자율주행 차량에 탑재한 온갖 센서를 시뮬레이션하는 역할을 한다. 다른 1대에는 AI 차량 컴퓨터인 엔비디아 드라이브 페가수스(NVIDIA DRIVE Pegasus)를 탑재, 자율주행 차량용 소프트웨어를 실행해 마치 실제 도로를 주행하는 센서에서 얻은 데이터인 것처럼 처리하는 작업을 한다.
자율주행 차량을 도입하려면 수십억km에 달하는 주행 시험과 검증이 필요하다. 이를 통해 안전성과 신뢰도를 확보해야 하는 것이다. 드라이브 콘스텔레이션은 이를 위한 솔루션이라고 할 수 있다. 가상 시뮬레이션을 통해 수십억km 분량 시나리오와 가상 테스트를 실시, 알고리즘의 안전성과 신뢰도를 높일 수 있다. 실제 도로에서 테스트를 하는 것과 견주면 시간과 비용 면에서도 이득이 많다는 설명이다.
이 시스템에선 GPU가 시뮬레이션한 센서 데이터를 생성, 처리하기 위해 드라이브 페가수스에 전달한다. 드라이브 페가수스에서 이뤄지는 주행 지시는 시뮬레이터로 가는 등 디지털 피드백 루프(hardware-in-the-loop)가 만들어진다. 이런 사이클은 초당 30회 실시되고 드라이브 페가수스가 실행하는 알고리즘과 소프트웨어는 시뮬레이션한 차량이 제대로 작동하는지 유효성 검증에 이를 이용하게 된다.
드라이브 시뮬레이션 소프트웨어는 데이터 스트림을 생성하고 폭풍우나 눈보라 같은 비정상적인 날씨나 하룻동안 시간대별 태양빛, 시야가 제한된 야간 환경, 온갖 지형과 노면 등 수십억km에 달하는 다양한 테스트 환경을 만들어낸다. 이를 통해 사람을 위험하지 않게 한 상태에서 자율주행 차량이 반응하는 능력을 테스트할 수 있도록 한 것이다. 드라이브 콘스텔레이션은 올해 3분기부터 제공 예정이라고 한다.
엔비디아는 또 실시간 레이트레이싱(Ray Tracing)을 지원하는 그래픽카드인 쿼드로 GV100(Quadro GV100)도 함께 발표했다. 레이트레이싱이란 자연 환경과 같은 구조로 빛이 눈에 들어오는 과정, 모습을 재현해 현실에 가까운 CG를 만들 수 있게 해주는 기술이다. 쿼드로 GV100은 이를 실시간 연산 처리할 수 있다는 것이다.
이 제품은 볼타(Volta) 아키텍처, 실시간 렌더링 지원을 지원하는 기술인 엔비디아 RTX(NVIDIA RTX)를 채택했다. 쿠다 코어 5,120개와 텐서코어 640개, HMB2 방식 메모리 32GB를 곁들였다. 64비트 배정밀도(Double Precision, FP64)에서 7.4TFLOPS, 단정밀도(single precision, fp32)에서 14.8TFLOPS, 텐서 성능 118.5TFLOPS 연산 능력을 제공한다.
쿼드로 GV100은 엔브이링크를 이용해 메모리를 64GB까지 확장할 수 잇으며 가상현실을 통한 협업 설계, AI 렌더링 성능 향상 등을 기대할 수 있다. 가격은 8,999달러다.
이번 행사에서 엔비디아는 다양한 제휴도 발표했다. 소프트뱅크 산하 반도체 IP 업체인 ARM과 손잡고 ARM의 머신러닝 솔루션인 프로젝트 트릴리움(Project Trillium) 플랫폼에 딥 러닝 가속기(NVIDIA Deep Learning Accelerator)를 통합, 제공한다. 엔비디아는 이를 통해 사물인터넷 칩 기업이 손쉽게 인공지능을 설계에 반영, 지능형 제품을 저비용으로 만들 수 있도록 해 수십억 명에 달하는 소비자에게 공급할 수 있도록 하는 기반이 될 것으로 기대한다고 밝히고 있다.
엔비디아는 또 구글 텐서플로우 프레임워크에 텐서RT(TensorRT) 추론 소프트웨어를 통합하는 내용도 발표했다. AI 관련 프레임워크에 대한 지원을 확대해 딥러닝 품질을 끌어올릴 수 있도록 하는 한편 서버 비용 절감에도 도움이 될 것이라는 설명이다.
엔디비아가 단순 그래픽카드 회사인줄 알았는데... 많은걸 준비하고 있네요
그렇죠. 똑똑한 기업이 아닐까 싶습니다. 예전에는 그냥 그래픽 칩이었던 게 GPU가 되고 그래픽 처리 하나에 머무는 게 아니라 AI 관련 분야도 역할을 확산시킨 것도 그렇고요.