联合国教科文组织国际创意与可持续发展中心
日前,美国人工智能公司“开放人工智能研究中心”OpenAI发布的首款文生视频模型Sora,因其模拟逼真场景的强大能力,引爆全网,持续引发关注。这是继文本模型ChatGPT和图片模型Dall-E之后,OpenAI又一款极具颠覆性的AI大模型产品。
该模型目前可以只靠文本指令或者文本与一张图像的结合制作长达60秒的视频,能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。更值得一提的是,Sora模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。目前,Sora并未正式开放给所有用户。
Sora生成的龙年春节短视频,人山人海热闹非凡。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。
一位时尚女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的城市标志。此外,还有狗在雪中嬉戏、汽车在路上行驶以及鲨鱼在摩天大楼之间的半空中游泳等奇幻场景。
一方面,是其强大的“基因”。推出Sora模型的美国人工智能研究公司OpenAI堪称AI界“顶流”,其推出的任何产品都自带“流量”加持。
另一方面,Sora生成视频的效果确实惊人。Sora可以自动生成包括复杂场景、多角色动态交互在内的长达一分钟的流畅高清视频。按照Open AI的说法,Sora“继承”了Open AI对文本的理解能力,能够根据提示词生成出高质量的图片和视频,并且能够对视频进行向前或者向后的拓展。比如,可以基于同一个视频开头继续拓展,延伸出不一样的结尾。或者是从不同的开头引入,最终汇聚到同一个结尾。
简言之,Sora模型的核心优势体现在它能够理解人类语言输入,并基于这种理解进行视频内容的创造性生成。通过深度学习和跨模态技术,Sora能够将文本描述中的抽象概念、情境、甚至是情感色彩映射到视觉表达上,生成与描述相匹配且具有一定连贯性的视频片段。
尽管目前生成的视频可能在细节处理、物理真实感或者复杂交互场景等方面还存在不完善之处,但其突破性在于首次实现了从文本到高质量视频内容的有效转化,这为内容创作者提供了一种全新的工具,大大提升了创意表达的效率和可能性。此外,Sora的应用价值也体现在教育、娱乐、广告设计等众多领域中,它有可能重塑这些行业的生产方式,并为未来更加智能化的内容创作打下坚实基础。
盘古智库高级研究员江瀚认为,在教育领域,Sora可迅速生成个性化、生动有趣的教学视频,减轻教师制作课件的负担。在广告和营销领域,它助力企业打造创意广告,增强品牌影响力。影视制作、动画、虚拟现实和游戏开发行业也能因此提高效率、降低成本,创作出更多惊艳作品。对于新闻报道和社交媒体内容创作者,Sora则有望成为他们制作高质量视频的得力助手。
市场研究公司ABI research高级分析师里斯海登认为,这类人工智能模型可能会对数字娱乐市场产生重大影响,新的个性化内容,将在各个渠道传播。
在万兴科技AI创新中心总经理齐镗泉看来,Sora通过文生视频技术快速生成短视频素材,减少了对传统素材库的依赖,对视频素材行业带来一定冲击。同时,Sora提高了短视频制作效率,降低了成本,为创作者提供了更多创作自由,推动了行业创新,对短视频行业而言是重大机遇。
中国政法大学传播法研究中心副主任朱巍认为,随着技术的发展,尤其是AI大模型,艺术家和普通人的界限将被打破,人人皆可成为艺术家。“技术使得创意转化变得更加容易和迅速。以前,创意转化为成果需要艺术家付出大量的时间和精力。现在,普通人通过技术也能很轻松地将自己的创意转化为成果。”
360创始人周鸿祎认为,这次Sora只是小试生刀,它展现的不仅仅是视频制作能力,大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。他指出,Sora意味着AGI实现将从10年缩短到1年。
人工智能飞速发展,固然令人欣喜,但随之而来的新型风险也必须警惕。Sora的出现对人工智能技术的监管能力提出了诸多新挑战,把控AI大模型潜藏风险已然是迫在眉睫。
“AI大模型对传统版权保护制度提出了挑战。”朱巍认为,随着Sora等视频大模型的涌现,全球版权制度正面临前所未有的调整。此外,AI大模型的崛起对内容合规监管带来了新挑战。朱巍指出,随着AI技术的快速发展,创造力极大提升,成本大幅下降,这导致造谣的门槛大幅降低,内容监管变得愈加困难。尤其是迈入AI时代,有的法律体系却还停留在工业时代,有的思维观念甚至停留在农业社会,这种错位使得人们对一些问题的认知出现了割裂。
此外,深度伪造也引起了公众极大的担忧。今年是全球选举大年,据统计将影响到包括40多个国家的40多亿人。AI深度伪造技术可能会产生大量的虚假音视频以及图像来影响选举。
加利福尼亚大学伯克利分校的哈尼法里德说:“与生成式人工智能的其他技术一样,没有理由认为,文本转视频技术不会继续迅速改进让我们越来越接近一个真假难辨的时代。这项技术如果与人工智能语音克隆技术结合,就可以开辟一条全新的战线,制造出深伪内容,显示人们在说从未说过的话,做从未做过的事。”
脸书母公司Meta的全球事务总裁直言,无法“一刀切”直接禁止AI生成的内容在社交媒体传播,因为“打地鼠式”的做法总是会有漏洞存在,现在采取的做法主要是披露,任何由AI生成的内容都需要打上水印,告知看到的用户。不过如何识别不同平台生成的AI内容,还是一大难点。
针对上述风险,华东政法大学人工智能与大数据指数研究院院长高奇琦指出,从企业角度说,由于相关技术开发会产生巨大而广泛的社会效应,OpenAI需要承担起相应的社会责任,比如开放相关的技术细节。从政府角度说,要将社会各个部门整体动员起来以建立一种新的规则。例如,针对庞杂的人工智能生成物,建立一系列知识创新规则,在一定程度上保障其知识产权,避免知识的无序状态,并在创新过程中产生新的秩序。从全球来看,主要国家需要尽快在大模型技术发展问题上形成共识。各国可以设立一些试验区,充分观察这些技术可能产生的破坏性效应,并尽可能将破坏性效应降到最低。国际组织也需要将OpenAI这一类头部企业的社会责任履行和信息技术细节公开等列为重要治理议题。火狐电竞平台app火狐电竞平台app