OpenAI首席运营官拒绝回答Sora是否接受过YouTube视频训练

导读： OpenAI的文本转视频模型Sora既令人印象深刻又令人恐惧，具体取决于视角。它可以帮助您将您的想法变成视频剪辑，甚至无需相机。但它也可以夺...

OpenAI的文本转视频模型Sora既令人印象深刻又令人恐惧，具体取决于视角。它可以帮助您将您的想法变成视频剪辑，甚至无需相机。但它也可以夺走这些工作。对于那些不熟悉的人来说，人工智能模型可以根据简单的文本描述生成长达一分钟的视频剪辑。

这家微软支持的初创公司刚刚发布了由Sora生成的第一个主要音乐视频。重要的是，该模型仍处于测试阶段，尚未向公众开放。因此，在不同方面仍有改进的空间。

OpenAI是否在YouTube视频上训练了Sora?

上个月，YouTube首席执行官已经警告OpenAI不要使用其视频来训练Sora。在彭博技术峰会最近的一次采访中，首席运营官BradLightcap谈到了他们的人工智能产品的潜在商业应用。Sora是这家初创公司的著名产品之一，具有潜在的商业应用，也出现在对话中。谈到Sora，面试官提出了一个问题：“使用哪些训练数据来训练模型?”

更具体地说，采访者敦促OpenAI官方明确澄清他们是否在YouTube视频上训练了Sora。然而，Lightcap似乎不愿意提供直接答案。相反，他讨论了各个方面，包括内容生成、利用这些内容作为模型训练的数据、确保数据使用的透明度、内容创建者的潜在利益等等。然而，对于OpenAI是否使用该平台的视频对Sora进行过训练的描述性“非回答”中，他一次都没有提到YouTube。

“所以，是的，我们正在研究这个问题，这真的很难。我们还没有得到所有的答案，”他最后说道。OpenAI确实分享了一些关于“了解我们在网上看到和听到的内容的来源”的信息。然而，这主要是关于内容的真实性以及他们计划如何保持内容来源的透明度。然而，这篇文章并没有真正谈论他们已经使用或正在使用哪些数据来训练语言模型。更不用说它也没有谈论YouTube内容的使用。

回想一下，上个月早些时候，该公司的首席技术官MiraMurati也被问到了有关Sora的同样问题。对于这个问题，她也无法给出明确的答案。

据今年早些时候的报道，OpenAI使用YouTube视频来训练GPT-4，这违反了平台规则。然而据报道谷歌也做了同样的事情。说到Sora的训练数据，复杂的无答案暗示了使用YouTube视频的可能性。该模型可能会在2024年下半年(可能是8月)向公众发布。