기존의 인공지능(AI) 기술이 이미지와 텍스트 생성에 주로 사용되던 것과는 달리, 최근에는 동영상 분야에서도 그 존재감을 빼곡히 느끼게 되고 있다. 특히 ‘생선형 AI’ 등의 기술이 비디오 제작에 접목되면서, 브루노 마스와 같은 유명 연예인을 비롯하여 퀄리티 높은 노래와 영상이 인공지능에 의해 제작되고 있다. 그러나 이 기술이 어떻게 작동하는지, 그리고 미래에 어떤 영향을 미칠지에 대한 궁금증은 여전하다.
기술의 핵심: 겐(GAN)에서 디퓨저(Defuser)까지
기존에는 생성적 적대 신경망(Generative Adversarial Networks, GAN)이라는 기술이 주로 사용되었다. 이 기술은 ‘지폐 위조범’과 ‘경찰’의 관계를 모방하여 더 완벽한 ‘가짜’를 생성하도록 설계된다. 그러나 최근에는 디퓨저(Defuser) 모델이 새롭게 등장하였다. 이 기술은 열역학에서 영감을 받아 ‘퍼지는 현상’을 역으로 연산하여 의미 있는 이미지나 동영상을 생성한다.
텍스트에서 움짤까지
이러한 기술의 발전으로 현재는 단순한 텍스트만을 가지고도 움직이는 이미지나 ‘움짤’, 심지어는 동영상까지 제작이 가능해졌다. 이러한 현상은 동영상 제작의 민주화를 가져올 것으로 예상되며, 더 다양한 형태의 컨텐츠가 쏟아질 것으로 보인다.
유튜브 바로가기
퀄리티의 문제: 연속성과 자연스러움
비록 아직은 기술이 완전히 발전하지 않아, 인간이 보았을 때 어색한 부분이 존재하지만, 이러한 문제는 지속적인 연구를 통해 해결될 것으로 보인다. 특히 동영상에서는 여러 프레임이 연속성 있게 이어져야 하기 때문에, 이에 대한 연구가 활발히 이루어지고 있다.
미래의 우려: 학습 데이터의 한계
인공지능이 컨텐츠를 주도하는 미래에는 새로운 학습할 수 있는 데이터가 부족해질 우려가 있다. 이에 대한 해결책으로는 학습용 데이터를 생성하는 연구가 진행 중이며, 기업들 역시 이 문제에 대비하고 있다.