테크소식

테슬라 슈퍼 컴퓨터 도조(Dojo)로 비전방식 자율주행 구현 시도

런홈즈 2021. 6. 23. 10:02

테슬라가 얼마 전 북미 지역에 출시되는 모델 3과 Y에는 레이더 센서를 뺄 것이라는 발표를 했습니다.

 

테슬라 CEO 일론 머스크는 자율주행에 있어 라이다(Lidar) 센서는 너무 비싸고 사용하기 어려워 바보들이나 쓰는 장치라고 주장해 왔습니다. 상대적으로 라이다 대비 비용이 적게 들고 경량화 제작이 가능한 레이더(Radar) 센서와 카메라만 있으면 충분히 자율주행을 구현할 수 있다는 지론을 펴왔는데 이제는 레이더 센서마저 버리려고 시도하는 것 같습니다.

 

테슬라는 카메라로부터 입력된 비디오 영상만 가지고도 충분히 자율주행을 구현할 수 있다는 자신감을 갖고 있는 것 같은데, 그 자신감의 중심에는 방대한 양의 영상 데이터를 실시간으로 학습할 수 있는 슈퍼 컴퓨터 도조(Dojo)가 있습니다. 

 

간간히 머스크가 2019년부터 도조(Dojo)의 존재를 언급하며 신경망 학습(Neural Network training)을 통해 영상 데이터에 전적으로 의존하는 비전 방식의 자율 주행의 달성 가능성을 넌지시 비쳐 왔습니다.

 

테슬라 슈퍼컴퓨터 도조(Dojo) 이미지 (CVPR 컨퍼런스 발표 자료)

 

슈퍼 컴퓨터 도조(Dojo)는 아직 개발 단계의 프로토타입 버전으로 그 실체가 외부에 잘 알려지지 않았습니다. 하지만 이번주 월요일 2021 컴퓨터 비전 및 패턴인식(CVPR) 컨퍼런스에서 조금이나마 관련 정보가 공개되어 이목을 끌었습니다. 테슬라의 인공지능 책임자인 안드레이 카르파티(Andrej Karpathy)가 이날 발표한 자료에 따르면 슈퍼 컴퓨터 도조(Dojo)는 10 페타바이트(petabytes)의 NVME SSD 저장공간을 보유하고 있으며, 초당 1.6 테라바이트(terrabytes)의 연산속도를 갖추고 있습니다.

 

슈퍼 컴퓨터 도조는 초당 180경번 연산이 가능한 1.8 엑사플롭스(exaFLOPS) 성능을 갖추고 있는데 전 세계적으로 다섯 번째로 강력한 슈퍼 컴퓨터라고 합니다. Top 500 슈퍼컴퓨터로 기록되기 위한 벤치마크 수행을 아직 하지 않았기 때문에 공식적으로 인정이 되지는 않는 기록입니다만, 카르파티(Karpathy)는 엔비디아(NVIDIA) 슈퍼컴퓨터 셀렌(Selene)이 공식적으로 5위에 랭크되어 있고 테슬라의 도조는 셀렌과 유사한 아키텍처를 갖고 있으면서 셀렌의 4480개 GPU보다 많은 5760개의 GPU를 보유하고 있다는 근거를 제시하고 있습니다. 

 

랭크 5위가 진실이건 아니건 한가지 분명한 것은 테슬라가 자금을 부어서 고성능 슈퍼 컴퓨터를 장만했다는 것은 사실인 것 같습니다.

 

그럼 슈퍼컴퓨터 도조를 장만한 배경은 무엇일까요?

 

테슬라는 뉴럴 네트워크를 활용한 시각 정보 기반의 자율 주행 시스템을 구축하기 위해 슈퍼 컴퓨터 도조를 활용한다는 것입니다. 다른 자율 주행 차량 회사들은 고가의 라이다 센서와 고화질 지도 정보를 사용합니다. 즉, 모든 도로 차선과 신호 등을 포함하여 차량이 운행 중인 장소에 대해 매우 상세한 지도 정보가 필요합니다.

 

하지만 테슬라는 카메라와 머신러닝에 의존하여 레이더나 라이더 없이도 자율 주행의 구현이 가능하도록 시스템을 구축하겠다는 포부를 갖고 있습니다. 

 

컴퓨터 비전에 전적으로 의존하는 접근 방식은 세계 모든 곳에 고화질 지도를 수집하고 운영 유지하는 것보다 어떤 면에서는 용이한 일이 될 수 있지만, 물체를 감지하고 차량 주행 시 이를 즉각적으로 적용하기 위한 신경망의 정보 수집과 학습 능력이 뒷받침되어야 하기 때문에 훨씬 더 어려운 작업이 될 수 있다고 합니다. 인간 수준의 사고 능력과 빠른 인식 능력에 버금가는 정도의 방대한 양의 데이터를 처리할 수 있어야 합니다.

 

테슬라 오토파일럿 뉴럴 네트워크 작동 화면 (테슬라 홈페이지 제공)

 

당장에 완전한 자율주행은 안되겠지만 카르파티는 테슬라의 슈퍼 컴퓨터 도조가 운전자의 나쁜 습관을 수정하는데 도움이 될 수 있는 몇 가지 예를 들었습니다. 컴퓨터의 물체 감지 기능의 작동으로 보행자와 충돌하는 것을 방지하는 비상 제동과 노란색 신호등을 식별할 수 있는 교통 통제 경고 등 같은 것들 말입니다. 충분히 거리를 두고 감속을 시작하지 않을 경우 운전자에게 시스템이 경고를 보내는 것입니다.

 

사실 위와 같은 운전 보조 기능들은 이미 테슬라의 현재 주행 차량들에도 적용되어 있는 기술입니다.

 

테슬라 오토파일럿(Autopilot) 관련 이미지

 

결국 테슬라의 슈퍼 컴퓨터 도조는 차량을 둘러싼 8개의 카메라를 통해 초당 36 프레임으로 촬영된 영상 정보를 수집하여 주변 환경에 대한 방대한 양의 정보를 제공해야 하는 미션을 갖고 있는 것입니다. 

 

카르파티는 수년에 걸친 연구 끝에 머신러닝을 위한 지도 학습의 문제점을 해결해야 하는 도전적 과제들을 해결해 왔다고 합니다. 이 기술을 테스트하는 엔지니어들은 운전자의 개입 없이 인구 밀도가 낮은 지역을 주행할 수 있다는 것을 발견했지만 "샌프란시스코와 같은 매우 복잡한 주행 환경에서 확실히 더 많은 어려움이 많다."는 것을 인정하고 있습니다. 고화질 지도 및 추가 센서와 같은 항목의 필요성을 낮추려면 인구 밀집 지역에서도 시스템이 제대로 작동하고 훨씬 더 능숙하게 잘 처리해야 합니다.

테슬라(Tesla) 인공지능팀의 게임 체인저 중 하나는 자동 라벨링(Auto Labeling)을 통해 차량 카메라에서 촬영한 수백만 개의 비디오에서 도로 위험 요소 및 기타 물체와 같은 항목을 자동으로 라벨을 지정할 수 있습니다. 

 

인공지능을 위한 데이터의 확보를 위해 영상 속에 있는 사물들의 이름을 지정하는 라벨링을 사람들이 직접 한다면 매우 방대하고 비용과 시간의 소모가 심할 수 있는데 이 작업들을 컴퓨터가 쉽게 수행할 수 있는 것입니다.  

 

최신 슈퍼 컴퓨터인 도조를 통해 테슬라는 약 10 초 분량의 동영상 1 백만 개를 축적했고 영상 속에 원근감 깊이와 주행 속도 및 가속도 정보와 더불어 60억 개의 물체에 라벨링을 실시했습니다. 이 모든 데이터는 약 1.5 페타바이트(petabytes)의 스토리지 용량을 차지한다고 합니다. 엄청난 양처럼 보이지만 테슬라가 비전 시스템에만 의존하는 자율 주행 시스템(Auto Pilot)에 필요한 신뢰성을 달성하려면 훨씬 더 많은 시간이 필요할 것이라고 합니다.

 

따라서 더 강력한 슈퍼 컴퓨터를 계속 개발해야 할 것이며 테슬라의 무기가 자율주행에 있는 만큼 좀 더 진보되고 세련된 인공지능(AI)을 추구하려고 합니다. 

 

많은 사람들이 지적하듯이 카메라를 통해 입력되는 영상 정보는 날씨와 같은 변수에 취약한데 앞으로 이를 어떻게 극복할지가 관건이 될 것 같습니다. 레이더나 라이다 없이 자율 주행을 완벽하게 구현할 수 있을지 좀 더 두고 볼 일입니다.