ICT SPOT ISSUE(2024-02호)
멀티모달 AI 경쟁과 다가오는 AGI
□ 생성형 AI는 텍스트, 이미지, 코드 등 유니 모달에서 멀티 모달로 진화
- ㅇ 디지털 시대의 패권을 좌우하는 핵심 디지털 기술은 보편화된 생성형 AI이며, 생성형 AI 시장은 수천억 개 이상의 매개변수를 가진 텍스트 기반의 대규모 언어 모델(LLM)에서 대규모 멀티모달 모델(LMM)로 발전
- ㅇ 멀티모달 AI는 인간 수준의 인지 능력 구현, 자연스러운 인간-기계 상호작용, 복합 문제 해결력 향상, 새로운 응용 분야 개척 등 미래 AI 기술의 핵심 축으로 성장
- ㅇ 멀티모달 AI 기술은 아직 초기 단계로, 각 모달리티의 특성을 효과적으로 통합하고 상호 연관성을 파악하는 등 해결해야 할 과제가 많으며, 강력한 성능을 내기 위해서는 지속적인 연구와 혁신이 필요한 분야
□ 빅테크 기업의 멀티모달 AI 경쟁
- ㅇ AI 챗봇은 텍스트 입력과 텍스트로 답하는 LLM보다, 텍스트와 이미지까지 입력하고 답하는 멀티모달 AI 기반의 LMM의 활용을 통한 서비스 제공이 더욱 중요
- ㅇ GPT-4 Turbo(오픈AI), 클로드3 Opus(앤스로픽), 제미나이 Pro(구글) 등 AI 모델은 지금까지 가장 인간적인 AI을 갖추고자 지속적으로 성능 향상 진행중
□ 인간-컴퓨터 상호 작용의 구조 자체를 재정의하는 혁신기술, LAM 등장
- ㅇ LAM은 단순한 모델이 아니라 AI 시스템이 컴퓨터 애플리케이션에서 인간의 행동을 이해하고 실행하는 방식에 대한 획기적인 패러다임 전환 기술
- ㅇ LAM은 AI의 미래를 혁신적으로 변화시킬 수 있는 능력을 가지고 있으며, 행동 가능한 지능의 발전을 향한 중요한 단계의 기술
- ㅇ AI 기반 멀티모달 디바이스 시장이 성장함에 따라, Rabbit R1과 Humane AI Pin과 같은 스타트업의 제품들이 출시와 함께 주목을 끔
□ 현재 AI는 ‘좁은 의미의 인공지능(ANI)’이며, AGI, ASI로 진화
- ㅇ 인간과 같은 수준의 AGI(범용인공지능)는 가까운 미래에 달성 가능하다고 또는 AGI를 만드는 것이 너무 복잡하거나 심지어 불가능하다고 주장
- ㅇ AGI는 많은 도전과 불확실성을 극복하여 세계와 인류를 변화시킬 수 있는 잠재력을 지닌 매력적이고 중요한 주제
- ㅇ 대규모 언어/멀티모달 모델은 모델 성능 및 효율성 개선, 안전성과 통제 가능성 향상, 다양한 멀티모달 데이터 통합, 대규모 학습 인프라 구축 등 지속적 투자가 중요
ICT SPOT ISSUE(2024-02호)