https://the-decoder.com/youtube-ceos-warning-to-openai-over-sora-training-data-could-backfire-spectacularly/
https://www.bloomberg.com/news/articles/2024-04-04/youtube-says-openai-training-sora-with-its-videos-would-break-the-rules

YouTube CEO Neal Mohan은 OpenAI의 텍스트-비디오 생성기 Sora를 훈련시키는 데 YouTube 동영상을 사용하는 것은 플랫폼의 규칙을 위반하는 것이라고 말했다고 블룸버그 통신이 보도했습니다.


인터뷰에서 모한은 크리에이터가 YouTube에 "자신의 노력"을 업로드할 때 "특정 기대"가 있다고 말했습니다. 이러한 기대 중 하나는 대본이나 동영상의 일부를 다른 곳에서 사용하지 못하도록 하는 "서비스 약관이 준수될 것"이라는 것입니다. 모한은 이는 YouTube의 규정을 "명백히 위반"하는 것이라고 말했습니다.


Sora와 같은 AI 도구는 이를 구축하는 회사가 라이선스가 있든 없든 웹에서 다양한 유형의 콘텐츠를 스크랩하기 때문에 작동합니다. 이러한 데이터를 사용하여 AI 모델을 학습시키고, 이 학습 과정을 통해 학습 데이터와 유사한 새로운 콘텐츠를 만드는 방법을 학습합니다.


Mohan은 OpenAI가 Sora를 훈련하는 데 YouTube 동영상을 사용했는지 여부는 알지 못한다고 말했습니다. OpenAI의 CTO인 미라 무라티는 최근 인터뷰에서 Sora의 훈련 데이터에 대해 언급하지 않았습니다.


모한, 구글의 AI 전략에 막대한 해를 끼친다


구글이 텍스트, 이미지, 음악, 동영상, 코드 등 자신의 데이터를 인터넷에서 무단으로 가져와 AI 모델을 훈련시켰다고 주장하는 아티스트와 작가들로부터 수많은 소송을 당하고 있는 구글에게 모한의 OpenAI에 대한 경고는 문제가 될 수 있습니다.


그러나 Google은 AI 학습을 위한 데이터 스크래핑은 데이터 자체를 복제하는 것이 아니라 모델이 학습하는 데만 데이터를 사용하기 때문에 '공정 사용'에 해당한다고 주장합니다.


모한은 구글이 유튜브의 규칙을 따르는 방식으로 자체 AI 모델을 훈련하는 데에만 유튜브 동영상을 사용했다고 말했습니다. 하지만 다른 경우에는 다른 플랫폼과 수십만 명의 크리에이터의 데이터를 사용하기도 했습니다. 구글은 이에 대해 완전히 솔직하지 않았습니다.


법정에서 구글에 불리하게 사용될 경우 모한의 발언은 구글에 심각한 문제를 일으킬 수 있습니다.