KRAFTON

누구나 쉽게 하는 오디오 스토리텔링을 꿈꾸다

크래프톤 Project Beluga 실 인터뷰

SNS, 블로그, 뉴스레터 등 온라인 공간에서 자신만의 생각과 이야기를 담은 글을 쓰는 이들이 늘고 있다. 이런 크리에이터들이 텍스트의 한계를 넘어, 혼자서도 간단하게 강력한 스토리텔링의 힘을 지닌 오디오 콘텐츠를 만들어 팬들과 소통하도록 돕는 서비스를 만드는 사람들. ‘음성 인공지능’을 활용해 오디오 콘텐츠 분야의 변화를 만들어 가고 있는 크래프톤 Project Beluga 실의 세 팀장, 최동운, 유제준, 이창호 님을 만났다.

세 분, 만나서 반갑습니다! 크래프톤 블로그 독자 여러분들께 자기 소개 부탁드립니다.

최동운: 안녕하세요. Project Beluga 실 Beluga Product 팀장 최동운입니다.

유제준: Beluga Biz 팀장 유제준이라고 합니다. 마케팅에서부터 커뮤니티 빌딩에 이르기까지 개발과 디자인을 제외한 여러 분야에 걸친 업무를 담당하고 있습니다.

이창호: Beluga Dev 팀장을 맡고 있는 이창호입니다. 딥러닝 기술을 기반으로 작가들이 입력한 텍스트를 오디오로 만들어주는 제작 툴, 그리고 만들어진 오디오 콘텐츠를 서비스할 수 있는 콘텐츠 플랫폼을 모바일 앱으로 개발하고 있습니다.

Project Beluga 실은 어떤 조직인가요?

최동운: Project Beluga 실은 Deep Learning 본부의 산하 조직이예요. Deep Learning 본부는 내부적으로 ‘버추얼 프렌드’라고 부르고 있는 버추얼 휴먼 (Virtual Human)을 만들기 위해 다양한 인공지능 기술들을 연구개발하고 있는데요, 이 버추얼 휴먼의 목소리를 구현하는 기술을 연구하던 프로젝트 이름이 ‘돌핀’이었어요. 프로젝트 벨루가는 프로젝트 돌핀에서 파생된 건데, 처음 이름을 고민하던 중에 한 동료분이 ‘돌고래 친구 벨루가 (흰돌고래)로 하자’라고 이름을 지어 주셨어요. 다들 마음에 들어서 그대로 이름을 정했죠. (웃음)

딥러닝 기술을 기반으로 구체적인 프로덕트를 개발하기 위해 프로젝트 벨루가가 시작된 셈이네요?

최동운: 네 맞아요. 어떤 기술이 발전하려면, 기술이 적용된 실제 프로덕트가 있어야 시장의 반응에서 더 배우고 기술을 고도화시킬 수 있어요. 보다 명확한 목표가 생기기 때문이예요. 많은 회사들이 버추얼 휴먼을 개발하고자 하고 있는데, 저마다 잘 할 수 있는 영역이 달라요. 크래프톤은 유저들과 대화도 하고, 움직이기도 하는 게임 캐릭터를 만드는 일을 계속 해왔기 때문에, 이런 방향성에서 기술을 개발하고 있고요.

버추얼 휴먼을 만들기 위해서는 인공지능이 스스로 상황에 맞는 텍스트를 만들고, 그 텍스트에 상응하는 목소리를 입혀야 하고, 텍스트 내용과 목소리에 어울리는 비주얼도 구현되어야 해요. 이런 장기적인 목표를 위해 여러 기술과 프로덕트를 개발해야 하는데, 그 중 하나가 ‘음성 인공지능 (Voice Artificial Intelligence)’를 활용한 프로젝트 벨루가인 셈이죠.

앞서 Project Beluga 실에서 음성 인공지능 기반의 오디오 콘텐츠 제작 툴, 그리고 이런 콘텐츠가 유통되는 플랫폼을 제작하고 있다고 하셨는데요, 이런 것들을 만들게 된 배경이 궁금합니다.

최동운: 영상 콘텐츠를 제작하는 방식의 변화를 보면, 처음에는 소수의 프로페셔널들만 만들다가 점차 그 장벽이 낮아지면서 많은 일반인들도 할 수 있게 되고 있어요. 앞으로는 인공지능의 도움을 받아 그야말로 누구나 할 수 있게 되겠죠. 아직 오지 않은 미래의 이야기이지만요. 하지만 오디오 콘텐츠는 여전히 전문가와 비전문가 사이의 장벽이 있는 상태예요. 저희는 인공지능을 활용해 누구나 스토리만 있으면 오디오 콘텐츠를 만들 수 있는 서비스를 생각했어요.

저희가 프로젝트 벨루가를 막 시작하려던 1년쯤 전, 모바일 기반 소셜 오디오 서비스가 뜨면서 녹음으로 오디오 콘텐츠를 만드는 크리에이터들이 많아졌어요. 하지만 한 사람의 크리에이터가 다양한 캐릭터를 표현하기는 어려웠죠.

음성 인공지능 기술에는 크게 두 가지 분야가 있어요. 텍스트를 자연스러운 사람의 목소리로 바꾸는 ‘텍스트-투-스피치 (Text-To-Speech. TTS)’와 내 목소리를 다른 사람의 목소리로 바꾸는 ‘보이스 컨버전 (Voice Conversion. VC)’가 그것이예요. 저희는 처음에 보이스 컨버전을 활용한 콘텐츠 제작에 착안했죠.

처음에는 재미있다는 반응도 있었어요. 하지만 거기까지 였죠. 오디오 콘텐츠는 스토리텔링, 그리고 눈과 손을 쓰지 않고도 즐길 수 있다는 점이 포인트인데, 짧고 자극적인, 오디오 콘텐츠 본연의 장점을 못 살리는 것들만 나왔어요. 그래서 하던 것을 접는 과감한 결정을 내렸고, 이후 TTS 기술로 눈을 돌려서 지금까지 이어지고 있는 새로운 도전을 하고 있어요.

현재 프로젝트 벨루가의 진행 상황은 어떤가요?

최동운: 현재는 음성 인공지능 기술을 활용해 ‘누구나 나만의 이야기를 들려줄 수 있는 오디오 콘텐츠 플랫폼’을 만들고 있습니다. 요즘 개인 블로그나 소셜 미디어, 커뮤니티, 뉴스레터 등 온라인 공간에서 자신의 이야기를 들려주기 위해 글을 쓰는 사람이 늘고 있어요. 그리고 더 많은 사람들에게 나의 생각을 전하기 위해 글 말고도 다른 형태로 확장하고자 하는 니즈도 커지고 있고요. 오디오도 그 중 하나인데요, 문제는 기존의 방식으로는 작가나 개인 크리에이터들이 직접 이런 오디오 콘텐츠를 만들기에 기술적, 비용적 장벽이 너무 높다는 거예요.

저희는 개인 작가들도 쉽고 간단하게 오디오 콘텐츠를 만들 수 있도록 TTS를 비롯해 다양한 기술을 활용해 그 과정을 자동화하고, 간소화하는 데 집중하고 있어요.


AI 기반 오디오 콘텐츠 제작 툴, 쿼티스(QWERTY’S) 둘러 보기

No-code 오디오 뉴스레터 플랫폼, 오디오픽(Audiofic) 둘러 보기


그러면 지금은 ‘오디오 콘텐츠 플랫폼’를 시장에 내놓기 위한 준비를 하고 있는 거군요?

최동운: 네 맞아요. 오디오 콘텐츠의 감상, 소통, 제작의 세 가지 경험이 유기적으로 결합된 오디오 콘텐츠 플랫폼을 출시하는 것이 목표예요. 그 전 단계에서 음성 인공지능 기반 오디오 콘텐츠 제작 툴 ‘쿼티스 (QWERTYs)’과 ‘노-코드 (No-code)’ 툴을 활용한 웹페이지를 하나 만들어서 만들어진 오디오 콘텐츠를 들어볼 수 있도록 했어요. 이름은 임시로 ‘오디오픽 (Audiofic)’이라고 붙였고요. 나중에 이 두 가지를 하나로 합칠 예정입니다.

저희는 누구나 오디오 콘텐츠를 만들고 함께 즐길 수 있는 크리에이터들과 팬들의 놀이터를 만들고자 하고 있어요. 전문가가 만든 콘텐츠를 일방적으로 감상하기만 하는 수동적인 소비가 아니라, 누구나 만들 수 있고, 만든 콘텐츠로 소통하는 능동적인 소비를 유도하는 공간이 되기를 희망하고 있고요.

유제준: 우선은 크리에이터들을 많이 모으고자 하고 있어요. 그 중에서도 뉴스레터 크리에이터들에 집중하고 있어요. 퀄리티가 확보되기도 하고, 연재 형태로 배포가 되는 콘텐츠니까요. 그리고 웹소설 작가들도 보고 있어요. 마찬가지로 연재가 된다는 점이 포인트예요. 여기에 청취자들이 모이면 더 많은 콘텐츠를 만들고자 하는 사람들이 생길 거고요. 그렇게 굴레가 돌아갈 수 있도록 하는 것이 목표입니다.

세 분은 프로젝트 벨루가에 합류하기 전에 어떤 경험을 하셨는지 궁금합니다.

최동운: 저는 첫 회사 생활을 ‘PUBG: 배틀그라운드’ 개발팀에서 시작했어요. 2017년이었는데, 배틀그라운드가 막 출시돼서 폭발적인 인기를 모으던 시기였죠. 우리나라에서 유일하게 전 세계 시장을 대상으로 하는 글로벌 게임 서비스를 하는 곳이라 이런 경험을 함께하고 싶어서 입사하게 됐어요. 처음에는 데이터 분석가로 시작했어요. 그러다가 배틀그라운드를 오래도록 사랑받는 게임으로 만들기 위해서는 새로운 비즈니스 모델을 도입해야 한다, 아이템을 팔 수 있는 상점 시스템이 필요하다고 생각했어요. 그리고 그 일을 맡아서 하려고 손 들고 자원했고, 프로덕트 매니저로 역할을 전환하게 됐어요.

그러다가 작년 상반기쯤 새로운 일, 새로운 도전을 하고 싶다는 생각이 들었어요. 그 때 크래프톤 김창한 대표님이 저에게 보이스 AI와 콘텐츠를 키워드로 뭔가 해보지 않겠느냐고 말씀하셨어요. 재미있겠다고 생각했고, 여기까지 오게 되었습니다.

유제준: 저는 컨설팅 업계에서 커리어를 시작했어요. 글로벌 스포츠 의류 기업에 다닌 적도 있고요. 크래프톤에 합류하고 나서 얼마 후 장병규 의장님이 프로젝트 벨루가 합류를 권해 주셨어요. 그래서 최동운 님과 미팅을 했고, 도전에 대한 의지가 생겨 합류하게 되었습니다. 회사 차원에서도, 또 주변의 많은 동료 구성원들이 관심을 갖고 지원과 응원을 보내주고 계셔서 저희 Project Beluga 실 전체가 더 힘내서 도전에 나서고 있습니다.

이창호: 저는 2001년에 보안, 카드 결제 분야의 개발자로 일을 시작했어요. 그러다가 2005년에 김창한 님이 하시던 게임 개발 프로젝트에 참가했는데, 그때의 인연으로 지노게임즈라는 개발사 창립 멤버로 합류했어요. 당시에는 엔지니어링 팀장 역할을 맡았었고요. 이후 배틀그라운드 개발 업무도 오래 했고요. 그러던 중 작년에 김창한 님으로부터 프로젝트 벨루가에 대한 이야기를 들었어요. 저도 게임 개발은 제법 오래 해온 터라, 새로운 서비스 개발에 대한 열망이 있었어요. 개인적으로 팟캐스트 같은 오디오 콘텐츠를 즐겨 듣기도 했고요.

또, 배틀그라운드 개발을 맡고 있을 때는 계속 매니저 역할을 해야 했어요. 매니저로 오랫동안 일하다 보니, 다시 직접 프로그래밍을 하고 싶다는 생각이 컸던 것이 프로젝트 벨루가에 합류한 또 다른 큰 이유였어요.

인공지능 기반 개발에 도전하는 결정을 할 때, 새로운 기술에 대한 확신이 있었는지 궁금합니다.

최동운: 사실 확신 같은 것이 있지는 않았고요, 재미있어 보여서 합류했어요. (웃음) 앞선 인터뷰에서 Deep Learning 본부 이강욱 본부장님도 딥러닝을 ‘심해’라고 표현하셨듯이, 아직 우리가 잘 모르는 영역인 만큼 개척도 덜 됐고, 그래서 오히려 좋다고 생각했어요. 파보면 할 것이 많겠다 싶었죠.

유제준: 저도 비슷해요. 어쨌든 기술은 시간이 지날수록 고도화될 거라는 것은 자명한데, 세상이 딥러닝이라는 기술을 어떻게 써야할 지 아직 잘 모르는 상황에서 우리가 그것을 정의해가면서 만들어갈 수 있는 것이 굉장히 많을 거라고 생각했어요.

Project Beluga 실은 어떤 분야에서 오신 분들로 구성되어 있나요?

유제준: 저희 Beluga Biz 팀 구성원 분들 출신이 가장 다양해요. 출판사나 라디오 방송국에서 오신 분도 있고, 오디오 스트리밍 서비스 업체에서 일하다 오신 분도 있고요. 음원 스트리밍 서비스 업체에서 마케팅 디자인 업무를 하다 오신 분도 있어요. 오디오 혹은 콘텐츠 분야와 관련된 경험을 하신 분들이 있는 편이예요.

이창호: Beluga Dev 팀에는 다른 딥러닝 관련 회사에서 프론트엔드 개발을 하셨던 분도 있고, 배틀그라운드 백엔드 개발하다 오신 분도 있어요.

최동운: Beluga Product 팀에는 스타트업 출신 분들이 많아요. 아무래도 저희가 바닥부터 프로덕트를 만들어야 하니까요. 저는 사실 이미 만들어진 프로덕트를 성장시키는 일을 했었지, 새로운 것을 처음부터 만드는 경험을 한 사람이 아니라서, 저에게 없는 경험과 역량을 채우고자 했어요.

Project Beluga 실에서 일하기 위해 필요한 역량이나 마인드셋은 무엇일까요?

최동운: 첫째는 ‘오픈 마인드’예요. 될 거라는 걸 확실할 수 없는 상황에서 세상에 없던 걸 만들어야 하기 때문이예요. 새로운 무언가 찾아왔을 때 열린 마음으로 받아들이는 것이 정말 중요하죠. 둘째는 ‘성장 마인드’예요. 결과를 100퍼센트 담보할 수 없기 때문에 과정 자체를 즐기고 그러면서 성장한 자기를 발견하기를 좋아할 수 있어야 해요. 셋째로 ‘긍정적인 태도’가 필요해요. 새로운 것을 만들어 내려는 도전에는 실패와 고난, 역경이 어느 정도 예정되어 있어요. 그것을 긍정적으로 견뎌낼 수 있는 자세가 필수라고 생각합니다.

이창호: 저도 세 가지로 말씀 드릴게요. 먼저, 계속해서 변화하는 기술을 끊임없이 학습하는 자세가 필요해요. 동향을 파악하려는 노력도요. 둘째로, 개발하다 보면 난이도가 높은 기능을 개발해야 될 수도 있고 원인을 찾기 어려운 버그를 해결해야 하는 경우도 있는데, 이것들을 해결하기 위해 몰입할 수 있어야 하고요. 마지막으로, 우리는 혼자서 개발하는 것이 아니라 다른 직군의 여러 동료들과 함께 해내야 하기 때문에 협업할 수 있는 자세도 중요합니다.

유제준: 저희 팀 내에서 자유로운 환경을 팀원들에게 제공하려고 노력하는 스타일이예요. 그런데 그 자유로움 속에서 스스로 전문성을 갖고 자체적으로 일을 해 나갈 수 있는 사람이 좋을 것 같아요.

구성원들 사이에 아이디어를 나누고, 의사를 결정할 때도 Project Beluga 실은 뭔가 다른 것이 있을 것 같다는 느낌이 들어요. 실제로 조직을 하나로 만들기 위해 어떤 것을 하고 있나요?

최동운: 소개하고 싶은 것들이 많은데요. (웃음) 같이 일하는 동료들끼리 서로를 이해하는데 소요되는 시간을 단축시키기 위해 여러가지 장치들을 많이 만들었어요. 첫째로, 구성원들 가운데 임의로 두 명을 일대일로 매칭해서 ‘커피챗 (Coffee Chat)’을 매주 진행하고 있어요. 또 목요일마다 한 명씩 정해서 ‘무물 (무엇이든 물어보세요)’을 진행해요. 왜 마케터가 되었나요, 프로젝트 벨루가에 왜 왔어요, 민트 초코 좋아하세요 같이 그야말로 뭐든지 물어봐요. 무물 할 때 제일 인기 많은 분이 창호 님이예요. 경력이 길어서 동료들이 궁금한 점이 많기도 하고, 또 그만큼 답변을 잘 해주시거든요.

의사결정을 위해서 저희는 ‘DACI (Driver, Approver, Contributor, Informed)’ 프레임워크를 사용해요. 구성원들의 역할을 명확하게 하는 것이 목표예요. 또, ‘찜찜이 미팅’이라는 것도 얼마 전부터 시작했어요. 아직 올바르게 문제 정의가 되지는 않았지만, 걱정되거나 불안한 것, 찝찝한 것들에 대해 이야기를 꺼내는 미팅이예요. 문제가 터지고 나서, 혹은 문제가 정의되고 나서 이야기를 시작하면 늦다고 생각해요. 편하게 이야기하자는 뜻에서 이름은 조금 귀엽게 ‘찜찜이’라고 붙여봤어요. 중요한 건, 여기서는 아이디어만 내고, 실제 실행은 담당자가 하도록 한다는 점이예요.

제준 님과 창호 님은 이런 프로그램들에 대해 어떻게 생각하시나요?

이창호: 저희 조직에 저와 같이 40대인 동료가 딱 한 명 있어요. 저는 기본적으로 성격 자체가 말이 많거나 사교적이지 않아요. 나이차도 있다 보니까 다른 동료들과 거리감이 있는 상황이긴 해요. 커피챗 같은 걸 하면 조금 부담스럽긴 하지만, 실제로 해보니 저도 즐거웠고, 사람들을 더 알 수 있어서, 또 그들이 어떤 일을 하고 어떤 생각을 하는지 알게 돼서 좋다고 생각하고 있어요.

앞서 이야기했던 무물 때 어떤 분이 몇 살때까지 일하고 싶냐고 질문하신 적이 있어요. 저는 내 눈으로 코드를 볼 수 있을 때 까지는 계속 코딩을 하고 싶다고 답했죠. (웃음)

유제준: 저는 ‘커피챗’이 특히 잘 작동하고 있다고 생각해요. 랜덤이다 보니까 실제로 이미 긴밀하게 일하고 있는 두 사람이 매칭될 때도 있거든요. 그래도 커피한잔 하면서 이야기하다 보면 또 새로운 이야기가 나와요.

저희가 아직 규모가 큰 조직은 아니지만, 회사라는 곳이 그리고 프로젝트를 하다 보면 의사결정의 체계와 커뮤니케이션의 흐름이 일방적이 될 가능성이 있잖아요. 구성원의 다양한 근심과 걱정을 경청하는 미팅 및 프로그램을 통해서 좀 더 균형 있는 조직 내 소통을 꾀하고 있어요.

그 외에도 저희는 워크샵 때 구성원들이 다 같이 각자의 성격과 강점, 단점 같은 것을 분석해볼 수 있는 검사를 받았어요. 결과도 함께 받아봤는데, 서로에 대해서 더 잘 이해할 수 있는 기회였다고 생각해요.

사람들이 프로젝트 벨루가에 합류해서 함께 일하면 커리어 상 어떤 메리트가 있을 거라고 말씀해주실 수 있을까요?

최동운: 가장 큰 메리트는 새로운 것을 창조하는 ‘제로 투 원 (Zero-to-One)’ 도전을 할 수 있다는 점이라고 생각해요. 우리는 ‘팔로워 (Follower)’가 아니라 ‘리더 (Leader)’가 되고자 하고 있어요. 그것이 가장 큰 경험이 아닐까 생각해요. 남들이 가본 적 없는 길을 가는 거죠.

이창호: 저희 프로젝트가 이제 1년 정도 됐어요. 지금 새로운 동료들이 프로젝트에 합류하시게 된다고 해도 이 프로젝트는 여전히 초창기예요. 하나의 프로젝트에 초창기부터 참여해서 함께 도전하는 것이 흔한 경험은 아니라고 생각해요. 여기서 얻는 것, 배우는 것도 많을 거라고 생각하고요. 저희 Beluga Dev 팀에는 경력이 많은 엔지니어도 여럿 있으시고, 능력 있는 주니어 동료들도 많아서 함께 하신다면 분명 배울 것들이 많을 것 같아요.

유제준: Beluga Biz 팀에서는 다양한 의사 결정에 관여할 수 있는 기회, 그리고 자유를 경험할 수 있어요. 이 분야에서 일하면서 다른 회사에서라면 더 많은 연차나 경력이 있어야만 가능한 그런 경험을 할 수 있을거라고 생각해요.

마지막 프로젝트 벨루가의 도전에 관심있는 분들에게 한 마디 한다면?

이창호: 저희는 웹 기반의 제작 툴과 모바일 앱 형태의 콘텐츠 플랫폼을 모두 만들고 있기에 웹 개발을 하시는 분, 백엔드를 하시는 분, 앱 개발을 하시는 분 모두 환영합니다!

유제준: 마케팅부터 커뮤니티 빌딩까지 다양한 업무를 리딩하면서 직접, 함께 하시고 싶은 분들이라면 저희와 함께 즐겁게 일할 수 있을 거라고 말씀드리고 싶어요.

최동운: 저희는 오디오 콘텐츠로 제작에서 유통, 감상의 과정을 혁신하고 새로운 경험을 만들어가고 있습니다. 세상에 없던 프로덕트를 함께 만들고 싶은 분들의 많은 관심 바랍니다.


음성 (TTS/STT) 딥러닝 엔지니어 (2년 이상)

MLOps Engineer (3년 이상)

Backend Developer (2년 이상)