자비스(J.A.R.V.I.S.), 울트론(Ultron), 비전(Vision), 프라이데이(F.R.I.D.A.Y.), 캐런(Karen), 이디스(E.D.I.T.H.)
마블 시네마틱 유니버스에 등장하는 AI들의 이름이다. 이들은 주인공을 돕거나 혹은 대립하고, 또 인간과 같은 모습으로 어벤져스의 일원이 되기도 한다. 다양한 인간 군상처럼 말이다. 이런 설정은 AI가 미래 인류의 조력자가 될지 대립자가 될지 더 지켜보자고 말하는 듯하다.
국내 주요 ICT 대기업들이 개발과 투자에 뛰어들고 있는 ‘초거대 AI’ 프로젝트 소식이 화제다. 초거대 AI(Super-Giant AI)라는 용어는 지난해 12월 출범한 LG AI 연구원에서 처음 명명한 조어(造語)로 보인다. 연구원 측에서 정의한 초거대 AI의 개념은 딥러닝1) 기법을 쓰는 인공신경망 가운데서도 그 파라미터(매개변수)가 무수히 많은 AI를 뜻한다. 현존하는 최고의 초거대 AI는 세계적인 인공지능 연구소 ‘오픈 AI’가 만든 GPT-3 모델로 파라미터 수가 1,750억 개다. 그런데 LG는 올해 하반기 6,000억 개의 파라미터를 갖춘 AI를 공개하겠다는 것이다. 파라미터는 인간 뇌에서 정보를 학습하고 기억하는 역할을 담당하는 시냅스와 유사한 역할을 한다. 학습량이 많을수록 좋은 결과를 낼 가능성이 높은 것처럼, 파라미터의 규모가 커질수록 AI가 데이터를 분석하는 지능도 비약적으로 확대된다. 6,000억 개의 파라미터를 가진 초거대 AI는 언어뿐만 아니라 이미지와 영상을 이해하고, 데이터 추론까지 가능하다는 설명이다.
OpenAI의 자연어 모델 기반 딥러닝 시스템 GPT-3
출처 : OpenAI초거대 AI의 원형으로 거론되는 GPT-3는 몇 개의 키워드만 넣으면 대화의 문맥을 파악해 사람처럼 대화하거나 창의적인 답변을 내놓는다. 인간이 작성한 뉴스 기사와 구분하기 어려운 정도의 기사나 수필, 소설을 창작하기도 한다.
GPT-3 같은 자연어 기반의 초거대 또는 초대규모(Hyperscale) AI가 만들어지면 어떤 일이 벌어질까? 지난 수백년간 쌓인 무수한 논문과 특허를 AI가 직접 분석해 데이터베이스를 만들고 거기서 유의미한 콘텐츠를 만들어낼 수도 있지 않을까?
네이버는 여기에 한발 앞선 미래를 예견했다. 지난 4월 북미 최대 테크 콘퍼런스 <콜리전(Collision)>에 참가한 네이버웹툰 김준구 대표는 “앞으로 아이디어나 스토리만 있다면 누구나 이미지형 콘텐츠를 만들 수 있도록 AI 기반 오토드로잉(Auto Drawing) 등 ‘그림 그리기’의 허들을 넘을 수 있는 다양한 제작 도구를 준비하고 있다”고 언급했다.
현재도 예술 콘텐츠 분야에서 AI는 의외의 성과를 보여주고 있다. 구글이 2017년부터 웹브라우저로 무료 제공 중인 오토드로우(www.autodraw.com)가 그 예다. AI가 사용자의 생각을 인지해 어떤 그림을 그리려 하는지 파악하고 추천 그림을 제안하는 형태다. 구글의 AI ‘딥 드림(Deep Dream)’은 빈센트 반 고흐나 렘브란트 화풍의 색채, 질감, 구도 등을 그대로 재현해주기도 한다. 실제 딥 드림이 빈센트 반 고흐의 화풍을 모사한 작품 29점은 9만 7,000달러(한화 약 1억 1,100만 원)에 팔렸다.
구글의 AI 그림 그리기 도구 ‘오토드로우’
출처 : Autodraw.com2020년 3월 20일 일본 이동통신 업체 NTT도코모가 개최한 클래식 공연에서는 알터3(Alter3)라는 로봇 지휘자가 등장했다. 알터3는 <G 선상의 아리아>를 지휘해 박수갈채를 받았다. 조지아공대에서 개발한 연주로봇 시몬(Shimon)은 마림바를 수준급으로 연주함은 물론 작사와 작곡, 심지어 노래까지도 하는 만능 싱어송 라이터다. 사람과 랩 결투까지 즉흥적으로 해낸다. 일본의 로봇 과학자인 이시구로 히로시 박사가 만든 인공지능 로봇 제미노사이드 F는 65가지의 표정 연기가 가능해, 인간과 함께 연극 무대에도 올랐다.
온라인 콘텐츠 기획과 글쓰기를 지원하는 AI 서비스도 그 수를 세기 어려울 정도로 많다. 이미지와 동영상, 오디오 등 비주얼 콘텐츠 분야에도 다양한 AI 연동 서비스가 이미 활성화 중이다. 글로벌 IT 전문 커뮤니티 Business2community의 지난 2월 포스팅2)에는 AI 서비스를 통하면 기획자나 마케터가 전문 디자이너 또는 영상 편집자를 고용하지 않고 직접 일정 이상의 품질을 갖춘 비주얼 콘텐츠를 생성할 수 있다는 내용이 담겼다. AI가 콘텐츠 창작 산업의 영역에도 깊이 들어와 있음을 실감하는 순간이다.
사실 이러한 조짐은 예고된 것이었다. 슈퍼 휴머노이드의 위험성을 그린 2016년 영화 <모건(Morgan)>은 영화 자체보다도 예고편이 더 화제가 됐었다. 이 예고편을 만든 것이 사람이 아닌 IBM의 인공지능 왓슨(Watson)이었기 때문이다. 왓슨은 100편의 영화를 학습하고 2만 2,000개 장면을 분석해 단 하루 만에 10편의 예고편을 만들었다. 물론 매끄럽지 못한 장면은 인간 편집자가 다소 손을 봤지만 왓슨은 열흘, 길게는 한 달이 걸리는 작업 시간을 24시간으로 줄였다고 한다. 이 예고편은 일반인들에게 AI의 딥러닝(Deep learning) 개념을 인식시킨 계기가 됐다.
2018년 SBS에서는 AI를 이용해 영상을 축약하는 편집을 시행한 바 있다. AI가 중요한 장면을 판단해 편집하면 사람과 인공지능이 해당 편집 콘텐츠의 품질을 결정하는 방식이었다. 네이버에서도 스포츠 하이라이트 영상 분석, 편집, 업로드까지 일련의 작업을 모두 AI에게 맡겨 ‘AI 득점 하이라이트’라는 형태로 선보인 적 있다. 능숙한 편집자가 붙어도 3~4시간이 걸리던 작업을 인공지능은 5분 정도 만에 해냈다. 엔씨소프트의 야구 정보 서비스 페이지(PAIGE)도 AI가 경기 영상을 편집해 제공한다. 종합편성채널 MBN은 지난해 10월부터 앵커 김주하 씨의 AI가 ‘이 시각 주요뉴스’ 및 ‘종합뉴스’ 예고를 맡고 있다. 제작이 복잡해 AI가 자동으로 만들기 어려울 것이라던 영상 콘텐츠 분야까지 AI의 진입이 성큼 다가온 것이다.
MBN의 AI 앵커
출처 : MBN 뉴스 화면 캡처필자는 지난 6월 초 열렸던 한 산·학연 학술토론회에서 국내 AI 동영상 테크기업 파이온코퍼레이션 ‘비스팟(Vispot)’의 시연을 보며 이러한 시대상을 더욱 확연히 느꼈다. AI 광고 플랫폼 비스팟은 쇼핑몰 사업자가 스마트폰으로 간단한 영상을 찍어 올리기만 하면 머신러닝으로 영상 속의 제품, 모델의 동작, 상세 컷을 순식간에 분석 후 수백 개 버전의 숏폼 동영상 광고를 제작해준다. 백미는 광고의 자동 집행 공정이다. 이 동영상 광고들을 페이스북, 인스타그램, 유튜브, 틱톡 등 SNS 매체에 노출하고 고객 호응을 분석해 가장 반응이 좋은 광고 포맷을 도출, 이를 중점으로 최적화 매체 광고 플랜까지 마련한다. 동영상 광고계의 ‘자비스’가 따로 없다. 비스팟의 사례를 접하면서, 앞서 살펴본 SBS의 AI 편집 클립 영상 서비스를 보도했던 미디어오늘의 해당 기사 마지막 줄이 겹쳐졌다. “미래에는 24시간 편집실에 갇혀있던 조연출이 사라질지 모른다.”
AI 동영상 테크기업 파이온코퍼레이션의 AI 광고 플랫폼 ‘비스팟’
출처 : 파이온코퍼레이션AI의 학습을 위한 기본적인 데이터는 결국 인간의 지식과 문화, 역사다. 최종적으로 암기력, 응용력이 뛰어난 ‘인간’에 근접하는 수준이다. 규칙 내에서 최적의 알고리즘을 계산해 답을 지원해주지만, 감정은 없는 ‘기계’일 뿐이다. 인간을 뛰어 넘긴 어렵다는 이야기다.
이렇게 단언할 수 있는 근거는 《수사학》에서 아리스토텔레스가 제시한 설득의 3요소 로고스(Logos), 파토스(Pathos), 그리고 에토스(Ethos)에서 찾을 수 있다. 명확한 설득 논리(로고스)와 청중의 감성을 헤아리는 능력(파토스)이 물론 중요하지만, 아리스토텔레스는 에토스를 가장 중요하다고 역설했다. 화자(話者), 이야기를 하는 사람의 호감도(성품, 매력, 카리스마)와 진정성이다. 그는 기본적으로 사람들이 화자를 신뢰해야만 설득이 가능하다고 했다. 이는 인간이 이성적, 논리적인 존재임과 동시에 지극히 본능이나 감성적 충동에 의해서도 영향을 많이 받는 존재라는 것을 시사하고 있다.
바로 이 인간적인 부분이 AI가 닮기 어려운 지점이다. 다른 사람들의 호응과 공감을 얻을 수 있는 매력적인 이야기를 창조하는 작가, 감독의 자리를 AI가 대신하기는 어려워 보인다. AI가 인간처럼 에토스를 풍기려면 그 불완전함 까지도 닮아야 할 텐데 그렇게 만들 이유가 있을까.
AI는 존재 자체보다 이를 활용하는 인간의 역할에 따라 다른 모습을 띨 것이다. AI 영상 기술인 딥페이크가 음란물 등에 사용되어 논란으로 떠오르고 있지만, 같은 기술이 영화 <아이리시맨>에서는 로버트 드 니로의 젊은 시절 연기를 자연스럽게 재현하며 시청자들의 감동을 끌어내기도 한다. 마틴 스코세이지 감독의 손에 들린 AI와 불법 페이크 영상 제작자의 손에 들린 AI는 같은 기술이다.
결국 AI가 마블 영화 속 자비스가 될지, 울트론이 될지, 혹은 비전이 될지는 인간들의 선택에 달렸다. AI의 위험성을 경고하는 데 많이 쓰이고 있는 다음과 같은 경구도 같은 맥락에서 해석해야 할 것이다.
“컴퓨터는 향후 100년 이내에 AI를 통해 인간을 따라잡을 것이다. 그렇게 되면 컴퓨터가 인류와 같은 목적을 갖도록 해야 한다.”(스티븐 호킹)