테크소식

마이크로소프트, OpenAI의 GPT-3 모델에 대한 독점 라이선스 획득

런홈즈 2020. 9. 25. 16:36

마이크로소프트는 지난 일주일 동안 여러 가지로 바쁜 한주를 보냈습니다. 월요일에는 비디오 게임 기업인 제니맥스(Zenimax)의 모든 게임 자산을 인수하기 위해 75억불짜리 계약을 발표했습니다. 단번에 Xbox 플랫폼의 미래가 훨씬 밝아졌습니다.

 

수요일에는 마이크로소프트가 향후 몇 년 동안 큰 영향을 미칠 수 있는 또 다른 거래를 발표했습니다. OpenAI의 GPT-3 언어 모델에 대한 독점 라이선스를 획득한 것 입니다.

 

 

OpenAI는 수년간 굵직한 기사들을 만들어 왔습니다. 주로 인공지능의 미래에 대해 회의적인 일론 머스크가 초기 투자자였기 때문입니다. 하지만 최근에는 인공지능 연구에 대한 성과가 속속 나오면서 자기회귀(Autoregressive) 언어 모델이 독자적으로 관심을 끌고 있습니다. 마이크로소프트는 작년에 10억달러의 자금을 이 회사에 투입한 바 있는데 당시 그 배경이 무엇인지는 제대로 알려지지 않았습니다.

 

이제 GPT-3 언어 모델의 독점적인 라이선싱 발표로 당시 자금 투입의 배경과 성과가 더욱 조명을 받게 되었습니다. 아마도 OpenAI가 인공지능의 연구와 개발에 대한 결과물을 대외적으로 공유할 것을 표방하고 있었던 만큼, 마이크로소프트와 새로운 언어 모델의 사용에 대한 독점적인 계약을 맺는다는 것에 부담을 느꼈기 때문이 아닌가 생각이 됩니다.

 

GPT-3(Generatition Pre-trained Transformer 3)은 OpenAI가 개발한 인공지능 모델로 딥러닝을 이용해 인간다운 텍스트를 만들어내는 자기회귀 언어 모델입니다. 총 1,750억개의 매개변수를 통해 구현된 인공지능 모델로 이전 버전인 GPT-2보다 100배 이상 크다고 합니다.

 

9월 초 영국 매체인 가디언에서 GPT-3에 글쓰기에 대한 주제와 조건을 주고 생성된 문장을 통해 신문 사설을 게재한 내용이 화제가 되었습니다. 당시 가디언의 편집자는 완벽하지는 않았지만 통상 사람들이 작성해온 원고와 비교해서 적은 편집 노력을 투입하고도 사설 내용을 완성할 수 있었다고 합니다.

 

GPT-3가 세계 최초로 개발된 자연어 처리 인공지능 알고리즘은 아니지만 인간과 같은 언어를 모방하고 평이한 영어로 간단한 지시를 받는데 있어 현존하는 어떤 것보다 뛰어난 모델이라고 할 수 있겠습니다. 마이크로소프트는 그 능력을 보고 인공지능 활용 영역에서 아마존과 같은 경쟁 기업대비 우위에 설 수 있는 교두보를 마련했다고 볼 수 있습니다.

 

마이크로소프트의 최고기술책임자(CTO)인 케빈 스콧은 "GPT-3의 자연어 생성이 가능한 놀라운 기술 혁신을 활용하여, 고객을 위해 고급 AI 솔루션을 개발하게 되어 기쁘다"고 말했습니다.

 

스콧은 염두에 두고 있는 "솔루션"에 대해 구체적인 언급을 피하면서, GPT-3가 마이크로소프트에 대해 제공할 가치를 강조하고 고객에게 혜택을 주기 위해 자체 제품, 서비스 및 경험에서 모델의 기능을 사용할 것이라고 말했습니다. 또한 스콧은 OpenAI의 작업이 인간의 창의성과 독창성을 발휘해야하는 분야에서 도움을 줄 수 있을 것으로 기대하고 있습니다. 예를들어 글쓰기와 스토리 구성, 대단위 블록을 갖는 긴 형식의 데이터(코딩원문 포함)를 설명하고 요약하기, 자연어를 다른 언어로 변환하는 것과 같은 영역에서 말입니다.

 

이번 발표에서 라이선스가 무엇을 포함하는지에 대해 명확하지 않지만, 마이크로소프트의 대변인은 “독점 라이선스를 통해 회사가 일련의 기술 발전을 포함하는 GPT-3 모델의 코드에 대한 고유한 접근 권한을 획득하고, 마이크로소프트의 제품과 서비스에 직접적으로 빠르고 긴밀하게 통합을 이룰 수 있습니다. 결국 새롭고 강력한 AI 기반 솔루션을 고객에게 제공할 수 있게 되었다는 것입니다."라고 답변했습니다.

 

스콧은 개발자가 마이크로소프트의 아주르(Azure) 클라우드 서비스에서 독점적으로 실행되는 OpenAI의 폐쇄형 API(Application Programming Interface)에 계속적으로 액세스할 수 있다고 합니다. 모델을 사용할 수 있는 집단의 예로는 "연구자, 기업가, 기업체 직원 및 취미가" 등이 될 수 있다고 했습니다. 

 

OpenAI도 보도자료를 통해 GPT-3 모델에 대한 지속적인 액세스에 영향을 주는 건 없다고 하였는데, 명확하게 무엇이 독점적 라이언스가 되는 것 인지에 대해서는 말을 아끼고 있습니다.

 

적용 사례를 생각해 봤을 때  마이크로소프트가 일반 소비자를 대상으로 한 것보다는 대중적인 관심이 없는 다소 지루한 기업용 솔루션에 집중할 것으로 예상할 수 있습니다. GPT-3는 콘텐츠 생성, 자동화된 고객 서비스, 챗봇, 간단한 웹 사이트 디자인, 번역 서비스, 음성 지원 최적화, 면접 수행에 사용될 수 있으며, 인간을 대신해 매체의 기사를 작성할 수도 있습니다.

 

마이크로소프트 홈페이지

 

GPT-3의 기능 대부분이 그동한 상상조차하지 못했던 것들인데, 이러한 기계 학습 제품들에서 나타날 수 있는 시스템 남용 가능성에 대한 편견과 논란이 여전히 많습니다.

 

OpenAI는 이전 버전인 GPT-2를 처음 세상에 내놓았을 때, 일반 대중에 모든 것을 공유하기에는 너무 위험하다는 우려를 공개적으로 표명했습니다. 모델이 얼마나 발전되어 왔는지를 본다면 GPT-2에는 15억개의 매개 변수가 있고 GPT-3는 1,750억개의 매개 변수로 작업한다는 점만 알아 두면 됩니다. 최신 모델은 상당히 발전했으며 우리가 본적이 없는 허위 정보 기계로 무기화될 수 있다는 측면에서 훨씬 더 위험할 수 있습니다.

 

GPT-3는 합성 기원에 대해 인간과 안정적으로 의사소통하고 속일 수 있기까지는 아직 갈 길이 멀다고 할 수 있습니다. 하지만 점점 더 영향력이 커지고 있는 큐아논(Qanon) 음모 이론에 대한 게시판을 살펴본 사람은 온라인 허위 정보가 엄청난 영향을 미치기 위해 명확성이나 일관성을 포함할 필요가 없다는 것을 알고 있습니다.

 

인공지능을 어떻게 활용하느냐에 따라 인간의 생산성을 획기적으로 높여주는 도구가 될 수 있고 사람들에게 불신과 불안감을 조성하는 무기가 될 수 있는데, 확실히 최근의 기술발달 추세를 보면 이러한 논란은 점점 더 커져갈 것으로 예상됩니다.

 

 

※ 위 내용은 Gizmodo라는 매체를 통해 보도된 내용을 바탕으로 일부 내용을 추가 작성했습니다.