인공지능 (Artificial Intelligence) 기술과 일상의 삶은 더 이상 분리할 수 없습니다. 제조, 유통, 금융, 의료, IT 등 다양한 산업 분야를 혁신하고 있고, 가정, 직장 등의 일상부터 공공 분야까지 곳곳에 자리 잡고 있습니다. 나아가 게임 산업에서도 AI가 적극 활용되고 있지요.
크래프톤은 산하 딥러닝 본부에서 제작한 AI 툴과 매뉴얼을 활용하여 업무 생산성에 도움을 받고 있으며, 전 직원의 90% 이상이 업무에 AI를 활용하고 있습니다. 챗GPT 등 딥러닝 솔루션 이용료 일체를 전 직원에게 지원한 것은 오래전의 일이고요.
이토록 AI에 진심인 크래프톤이 AI와 함께 걸어온 길과 앞으로 걸어갈 길에 대해 딥러닝 본부 성준식님, AI 전략팀 김도균 님을 만나 이야기를 들었습니다.
만나서 반갑습니다. 자기 소개 부탁드립니다.
성준식: 안녕하세요, 저는 딥러닝 본부 내 딥러닝 응용실 실장을 맡고 있는 성준식이라고 합니다.
김도균: 안녕하세요, 저는 신생 팀인 AI 전략팀의 매니저, 김도균이라고 합니다. AI 전략팀은 크래프톤과 크리에이티브 스튜디오에게 AI 기술 도입을 지원하고, 이에 필요한 AI 기술 확보를 위한 전략을 수립하며, 장기적으로는 크래프톤 내부의 우수한 기술에 대한 사업화를 검토할 예정입니다.’
최근 크래프톤 외에도 다양한 국내 게임사들이 AI 기술 개발에 박차를 가하고 있어요. 이 가운데, 크래프톤에서 내세울 수 있는 강점은 무엇이 있을까요?
성준식: 우선, 음성 생성 연구개발력은 국내 최고 수준으로 자부하고 있습니다. 관련 최신 연구 결과가 세계 3대 딥러닝 학회 중 하나인 ICLR (The International Conference on Learning Representations) 2024에 게재될 예정이며, 이를 다양하게 활용하여 사내 및 게임으로의 접목 시도도 활발하게 진행 중입니다.
음성생성 못지 않게 NLP (Natural Language Processing, 자연어 처리) 연구개발 역시 매우 높은 수준에 이르러, 언어모델을 가장 잘 활용하는 연구팀을 보유하고 있습니다. 이들은 현존하는 언어모델의 한계인 생성 속도 및 정확성을 우회하여 게임에 적용할 수 있는 방안을 만드는 것에 전력하고 있어서 이 결과도 조만간 소개드릴 수 있을 것으로 기대합니다. 뿐만 아니라 2D/3D asset, motion 생성 등을 포함한 다양한 연구개발도 수행하고 있으며, 영입이 진행 중인 국내 최고 수준의 인재들과 함께 더 높은 수준으로 나아가고 있습니다.
김도균: AI 기술에 대한 높은 이해와 역량, 의지를 가진 경영진. 새로운 기술에 대해 열린 마음으로 활용해보시는 스튜디오. 전사적으로 AI 기술 활용에 대한 기대감으로 정리할 수 있을 것 같습니다. 결국 이러한 분위기가 크래프톤의 가장 큰 장점 아닐까요? (웃음).
생성형 AI 기술이 산업군에 미칠 영향에 대한 관심도 뜨거워지고 있습니다. 게임업계는 관련 발전으로 어떤 혁신을 이룰 수 있을 거라 생각하시는지요? 또 업계는 AI 시대에 어떤 역할을 할 수 있을 거라고 보십니까?
성준식: NPC와 대화의 경우, 작가들이 작성해낼 수 있는 물리적인 한계를 넘어 같은 시간에 더 많은 내용을 구성할 수 있어, 유저가 경험할 수 있는 스토리의 폭을 크게 확장할 수 있습니다. 음성에 대해서도, 기존에는 물리적, 비용적 한계로 인해 다량의 보이스오버를 게임에 탑재하지 못하였습니다. 발달한 음성생성 기술에 의해 현존 기술로도 많은 부분은 직접 녹음 없이 음원을 제작할 수 있게 되었는데요. 이렇게 되면서 텍스트 너머의 감정 흐름까지 유저에게 전달할 수 있게 됩니다. 이에 따라 게임 내 전달할 수 있는 감동의 폭이 넓어지고 이는 전체적인 게임성 향상으로 이어진다 할 수 있습니다.
다른 분야와 마찬가지로 큰 생산성 향상이 게임업계에도 기대가 됨과 동시에, 유저들에게 더 많은 경험을 제공할 수 있어서 게임성 향상까지 이어질 것으로 기대할 수 있겠습니다.
김도균: 크래프톤에서 AI 기술을 활용하여 기대하는 바, 즉 혁신은 크게 두 가지, 자세하게는 네 가지입니다. AI 기술은 게임 제작 혁신과 새로운 즐거움을 제공해 줄 것으로 기대하고 있으며, 자세하게 다음과 같은 내용을 포함합니다.
1. AI 기술 기반의 제작 비용 효율화
2. AI 기술을 활용한 창의력 발굴 및 창작
3. 함께 게임 플레이하는 버추얼 프렌드
4. 유니크하고 끝없는 게임플레이.
해당 내용은 현재 상황에 맞는 기대효과이며, AI의 역할이 변화하고 확장됨에 따라 크래프톤에서 기대하는 효과 또한 시간이 지나며 변화/확장할 것으로 예상됩니다.
게임은 다양한 오프라인 현실 환경을 온라인에 구현한 플랫폼으로, 앞으로 현실에 도입될 AI 기술들을 빠르게 접목하고 활용해 볼 수 있습니다. 최근에 OpenAI에서 발표된 SORA와 같이 AI 모델이 현실세계의 물리 법칙을 이해하는데 게임 데이터가 활용된 것처럼, 오프라인 현실 세계의 특징을 가진 게임의 온라인 데이터는 AI 산업의 발전에 중요한 요소인 데이터를 제공하고 있습니다. 이렇듯 게임 산업과 AI 산업은 서로가 필요한 부분을 제공하며 함께 발전할 수 있을 것으로 생각합니다.
생성형 AI를 게임에 도입하는데, 가장 큰 걸림돌로 ‘반응 속도(이용자의 입력에 대해 응답하는 속도)’도 꼽히고 있는데요. 이를 어떻게 해결할 예정인지 궁금합니다.
성준식: 기본적인 방법은 좋은 성능을 보여주는 큰 모델의 성능을 최대한 유지하면서 요구되는 반응속도 이내로 동작하는 작은 모델을 디자인하여 학습하는 지식 증류(Knowledge Distillation) 방법이 있습니다. 그러나 이것은 목적하는 것에 따라 아주 다양한 범위를 포함하게 되는데요. 각 요소기술을 상황에 따라 적절히 조합한다면 충분히 활용 가능할 것입니다.
- 강화학습은 어떤 형태로 활용하느냐에 따라 다르지만, 일반적으로는 모델 크기가 비교적 작기 때문에 반응속도 내로 구동이 충분히 가능합니다.
- 음성인식/음성생성의 경우 상품화레벨의 다양한 알고리즘들이 존재하며, 이중 매우 빠른 구동이 가능한 것들도 있습니다. (1초의 음원을 인식/생성하는데 각 0.1초 이하)
- LLM의 경우 아시는바와 같이 반응속도가 빠른 단계는 아닙니다만 위에서 설명드린 지식 증류 방식, 또는 목적하는 도메인에 대해 좋은 성능을 보이는 작은 모델 설계를 통해 반응 속도를 줄일 수 있습니다.
- 다만, 각 요소별 한계가 있기 때문에 현시점에서 이 모든 요소를 다 연결해서 구성하기 보다는 (궁극적인 버추얼프렌드는 위의 모든 기술 파이프라인을 활용하겠지만요) 필요 요소들을 적절히 조합하는 것으로도 충분히 좋은 효과를 거둘 수 있을 것으로 기대합니다.
- 예를 들면, 디펜스더비 역시 LLM으로도 풀어내는 방법론이 있을 수 있습니다. 다만 주어지는 시간 내에 결과를 달성하기에는 강화학습을 활용하는 것이 적절하고요.
- 사용자와 소통하는 봇을 만든다고 했을 때, <음성인식+LLM+음성생성> 대신 <음성인식+sLM> 혹은 <음성인식+강화학습> 조합만으로도 원하는 효과를 달성할 수도 있고, 사용자 액션에 맞추어 반응하는 <sLM+음성생성> 등의 것을 구축하는 것도 가능할 것입니다.
아무래도 국내외로 주목받고 있는 inZOI(인조이) 개발에도 AI 기술이 적용되었는지를 많은 팬 분들이 기대하실 것 같은데요, 귀뜸해 주실 부분이 있을까요?
성준식: 아시다시피, 인조이는 유저가 인생 시뮬레이션을 경험해보는 게임입니다. 많은 NPC와 상호작용하고, 유저가 인조이 세계 내에서 많은 것들을 표현하고 경험해볼 수 있도록 디자인하는 과정에 활용 가능한 AI 기술들을 검토하고 있구요. 게임 구동환경 및 시나리오 내에서 동작 가능케하는 것 역시 함께 진행하고 있습니다.
마지막으로 하시고 싶은 말씀이 있다면?
성준식: 결국 게임의 본질은 재미를 추구하는 시뮬레이션이라고 볼 수 있습니다.
따라서 게임에서 AI가 ‘제대로’ 적용된다면, 유니크하고 엔드리스한 게임을 만들 수 있을 것이라는 생각이 듭니다. 구체적으로 설명한다면, 대화형 인공지능을 이용할 때 각각 이용자마다 다른 메시지를 주고받을 수 있는 것처럼, 각각의 플레이어가 저마다 자신만의 고유하고 무한한 게임을 즐길 수 있게 되는 것이지요. 저는 이 날이 머지 않았다고 믿습니다 (웃음).