专题:聚焦谷歌2024年I/O开发者大会:实时交互、视频模型登场
财联社5月15日讯(编辑 刘蕊)美东时间周二,谷歌I/O开发者大会正式召开,谷歌在大会上新公布了一系列“谷歌AI全家桶”,发布了多款AI应用。
然而,就在谷歌发布新模型的前一日,OpenAI周一刚发布了GPT-4o,其功能与谷歌新发布的AI应用颇有重叠,似乎是有意精准狙击谷歌。
在谷歌I/O开发者大会结束后,Alphabet CEO桑达尔·皮查伊(Sundar Pichai)在接受采访时,也对OpenAI进行了公开的反击。
将解决Sora滥用Youtube视频训练的问题
在接受接受采访时,桑达尔·皮查伊表示,如果谷歌确定OpenAI依赖YouTube内容来训练其Sora模型,谷歌将要“解决这个问题”。
今年初,OpenAI发布了AI文生视频模型Sora,一度惊艳市场。但Sora的模型训练数据来源却引起了外界的怀疑。
今年3月,OpenAI首席技术官米拉•穆拉蒂(Mira Murati)在接受采访时表示,OpenAI只是利用了公开可用的数据和授权数据来训练模Sora模型,她不确定YouTube视频是否属于该公司Sora模型的训练数据的一部分。
据媒体后来报道说,OpenAI已经转录了超过100万小时的YouTube视频。
当被问及如果OpenAI此举违反了谷歌的服务条款,谷歌是否会起诉OpenAI时,皮查伊没有提供具体细节,但表示:
“我认为这是他们应该回答的问题,我没有什么要补充的,我们有明确的服务条款。所以,你知道,我认为通常在这些事情上,我们会与企业接触,并确保他们理解我们的服务条款。我们会解决的。”
皮查伊表示,谷歌已经制定了程序来查明OpenAI是否没有遵守规定。目前,《纽约时报》等报纸已经将矛头对准了OpenAI,称其违反版权法,并使用其文章来训练模型。
最新AI项目撞车OpenAI?
在周二的谷歌I/O大会上,谷歌刚刚官宣了新的人工智能模型,包括一款文生视频模型Veo,与OpenAI的Sora颇为类似。
同时,其万能AI助手项目Project Astra以及其AI语音聊天功能 Live,都与OpenAI前一日推出的GPT-4o功能颇为类似。
在前一日OpenAI发布的演示中,GPT-4o可以实时对音频、视觉和文本进行推理。而从谷歌的演示视频来看,谷歌的AI助手Project Astra也并不逊色于GPT-4o,可以通过视频画面接受信息、理解复杂多变的环境并做出回应。
皮查伊在谈到OpenAI时表示:“我认为他们还没有向用户提供演示。我不认为他们的这一功能将在产品中可用。”
OpenAI周一在一篇博客文章中表示,其ChatGPT Plus订阅的客户将能够在未来几周内试用GPT-4o的早期版本。而皮查伊也表示,谷歌的Project Astra多媒体聊天功能将在今年晚些时候出现在Gemini聊天机器人上。
皮查伊表示:“我们清楚地知道如何处理这个问题,我们会把它做好的。”
谷歌将和苹果联手?
谷歌表示,该公司依靠定制的TPU和英伟达的GPU,已经将其人工智能模型在网络搜索上提供服务的成本降低了80%。谷歌在主题演讲中表示,它将开始在美国所有用户的搜索结果中显示其人工智能的概述功能(AI Overviews)——搜索引擎会直接归纳总结搜索结果。
今年6月,苹果将在加州库比蒂诺召开全球开发者大会。此前有报道称,苹果正在讨论在iPhone上添加谷歌AI模型Gemini的想法。皮查伊表示,谷歌“多年来一直与苹果保持着良好的合作关系”。
“我们一直致力于为苹果生态系统提供出色的体验,”皮查伊说。“这是我们非常重视的事情,我相信——我们有很多方法来确保我们的产品是可访问的。今天,我们看到AI概述已经成为iOS上的一个受欢迎的功能,所以我们将继续——包括Gemini。我们将继续努力实现这一目标。”