【摘要】文生视频大模型Sora是人类图像文明千百年来交织的技术表达,对于黄河文化传播具有重要价值:“生产—接受”效率提升将会推动黄河文化传播进程加速,跨模态理解将会推动黄河文化传播的视觉转向,虚实互动则会推动文化黄河数字孪生。然而,Sora驱动的黄河文化传播也存在传播权力重构导致的“技术失控”危机,幻觉强化引发的“感性至上”症候,虚实颠倒带来的“形象失真”问题等隐忧。未来需要我们推进文生视频大模型自主研发,强化黄河文化传播优势,重视黄河文化的深层挖掘,探索黄河文化传播多元形式,以负责任的态度,推动大模型更安全地赋能黄河文化传播。
【关键词】Sora;黄河文化传播;风险
图像是语言的始祖,与语言共同构成符号系统。[1]
黄河文明沉淀下大量图像宝藏,以文载道,更以“图”传道,深刻地塑造着人类的思维方式,以“文—图”的双元接续传递着人类文明。图像与现代文明发展相伴相生。现代性中,人们把世界建构为一种图像,“现代的基本事件是对作为图像的世界的征服”“正是世界变成了图像区分出现代的本质”。[2]在“世界图像化”的转型之中,出现“世界模拟器”——文生视频模型Sora。生成式人工智能本就是技术与文化的杂合体(hybrid),Sora的产生正是人类图像文明千百年来交织的技术表达。在通向AIGW(人工智能生成的世界)之路上,Sora能够帮助我们思考如何在图像涌流的时代强化黄河文化的感染力与影响力,保护好、传承好、弘扬好黄河文化。
一、Sora驱动黄河文化传播的全新特征
(一)“生产—接受”效率提升与黄河文化传播进程加速
从UCG到AICG的升级,黄河文化传播速度将进一步加快。目前,Sora已经能够生成60秒及以上的视频,与其他文生视频大模型形成代差,这意味着大模型实现从静态到动态、从“动图”到“视频”的转化,极大地提升了视频的生产效率,降低了生产成本。一方面,文生视频模型实现快速高效的数据遍历,根据提示词快速抓取海量数据,并完成自动分析处理,将简单的需求转变为准确的提示词,实现精准的信息提取,极大地缩短从“想法”到“表达”的生产时间,将会带来短时间内文化成果的增量,满足黄河文化产品快速生产、稳定品质、多样风格的需求。另一方面,生产可及性吸纳更多黄河文化创作主体,进一步激发创作活力。现代媒介技术支撑的视觉文化不仅突破精英群体的限制,更重要的是因为图像理解的直观性、丰富的层次性和多元的可能性,使各种不同文化处境的受众都可以获得各自有效的图像阐释,也使受众在一定程度上不再依赖精英化的权威阐释。[3]Sora出现后,部分影视从业者无须昂贵的设备或实拍环境,包括剪辑、色彩调整和特效制作等,“高大上”的影视行业降低了独立制片人、小型制作公司以及个体从业人员的准入门槛。[4]一旦这一技术广泛应用,不仅可以提高传播效率,而且将更多的黄河文化创作者纳入其中,使得黄河文化能够更快、更好、更广地被人们所了解和接受。
(二)跨模态理解与黄河文化传播的视觉转向
图像作为一种直观性和具象性的全球“通用语言”,在跨文化传播中具有极其重要的作用,其开放性、多样性、广泛性和普遍性特点使其成为不同民族、国家之间和不同阶级、阶层之间的有效沟通理解方式。以往的文化传播大多依靠语言文字的媒介载体,而Sora类文生视频大模型会真正实现文化传播的视觉转向。图像化转向在改写人类文化景观的同时,也在改变人类的学习和认知模式,使图像在传递复杂信息和触发情感反应方面的能力得以凸显。[5]直观性和具象性使得图像能够拉近与人之间的距离,打破语言文化的文字模式,改变人们理性解读的惯性,代之以感性形象呈现。首部文生视频AI系列动画片《千秋诗颂》将古典诗词歌赋转化制作为唯美的国风动画,似乎为文生视频大模型技术推动黄河文化在内的传统文化传播提供了一幅全新的可能图景。以Sora为代表的新一代文生视频大模型,具有更好的跨模态理解能力,让纷繁复杂的黄河文化专著、档案转变为栩栩如生的视频,跨越语言、地域的障碍,更好地推动黄河文化故事讲述与黄河文化标识传播。与AR、VR、MR、XR结合,Sora类文生视频大模型可以创造出沉浸式的文化体验,使黄河文化传播更加生动、直观,提升文化传播触达率,从而有效提升文化传播的感染力和影响力,更加体现出黄河文化的世界性。
(三)虚实互动与文化黄河数字孪生
Sora驱动的黄河文化传播的重要特征是“虚实互动”,利用Sora类文生视频大模型技术,推动传统黄河文化传播向数字孪生转型,构拟“数字文化黄河”与“模型文化黄河”,实现真实世界和数字孪生世界的联动。一方面,对原有的黄河文化进行组合与重塑,交融汇通形成全新的“数字文化黄河”,通过Sora辅助黄河文化遗产可视化建模,根据相关材料将原已不存在的遗珍进行数字化重构,构建系统的文化遗产数字资源库。另一方面,融会当今的黄河文化成果,构建“模型文化黄河”。通过衔接大数据技术,收集受众关于黄河的文化产品需求,将传统技术上难以实现的,人们对于黄河文化的美好想象转变为生动的动态画面,并根据已有的科学数据,对未来黄河文化发展趋势进行预判并进行可视化表达,以此形成未来黄河文化的数字孪生。
二、Sora驱动黄河文化传播的风险隐忧
(一)传播权力重构导致“技术失控”危机
视频生产速度的提升不仅意味着传播效率的提升,更意味着传播权力的转移。如若Sora类文生视频大模型被广泛使用,将会引发传播权力的重构。一是传统文化与现代文化之间的权力关系改变。同一文化生产方式高速扩散威胁文化遗产保护。恩格斯指出:先进的生产方式“在哪一个工业部门被采用,就不容许任何旧的生产方法在那里和它并存”,例如“它控制了手工业,就把旧的手工业消灭掉”,因此“劳动场地变成了战场”。[6]黄河文化从历史深处走来,其传播不仅依靠先进技术的“快传播”形态,更有依托传统方式,得以缓慢、细腻渗透进入人们生活的“慢传播”形态。如果放任Sora等文生视频大模型不加约束地应用,将会极大地影响黄河文化保护的环节。二是技术主宰者与技术匮乏者之间的权力重塑。目前黄河文化的传播主体既没有办法充分应用Sora进行文化的创作与生产,也无法理解“技术黑箱”之中的技术的真正运行机理。即便后续即将开源,依然会存在技术不公平的现象,例如部分黄河非物质文化遗产传承人的年龄较大、数字素养不足,将难以运用大模型开展文化遗产传承活动。如何尊重和保护文化主体生存权利、生存方式、文化成果成为一个巨大的难题。三是人类与机器之间的权力关系重构。黄河文化的生产、发展与传播归根到底都是人的活动。然而,技术一旦出现与发展起来,它们往往会遵循自身的规律持续“进化”,很多时候不会再以人类的意志为中心,人的主体性不可避免地会被消解。
(二)幻觉强化引发“感性至上”症候
鲍德里亚指出:“大众传播将文化和知识排斥在外。它绝不可能让那些真正象征性或说教性的过程发生作用,因为那将会损害这一仪式意义所在的集体参与——这种参与只有通过一种礼拜仪式、一套被精心抽空了意义内容的符号形式编码才能得以实现。”[7]受限于技术水平,Sora单向延伸人类的视觉器官,而无法同步提升人的听觉、触觉等其他感知能力,也难以直接提升人的概念思维与具身体悟能力,极易将文化传播变成媚俗的“礼拜仪式”与“无意义符号编码”。一是黄河文化的高度异质性对Sora涵括能力提出更高的要求。黄河文化从来都不是同质性的文化,而是纷繁复杂的文化集合体。通过Sora类文生视频大模型对文化信息的统一呈现,可能忽略文化符号、文化景观、文化实践中嵌入的空间细微差别和本地化意义。二是黄河文化的高度连续性对Sora的模拟能力提出更高要求。由于数据库接入的限制,Sora类文生视频大模型难以把握这种高度连续性的文明体,即便生成具有一定历史意义的视频,依然仅仅会沦为当下的文化碎片。三是黄河文化的高度抽象性对Sora的理解能力提出更高要求。黄河文化是一个多维度、多层次的存在,是物质与精神的统一、理念与实践的统一、显性与隐性的统一,除文化的表征外,更是一种文化气质、精神和价值观。诚然,更多的图像、更绚丽的画面可以让这些价值观念得到一定程度上的形象呈现,但是真正对黄河文化的精神意涵进行全面而深层的把握,人们依然需要依靠严肃的概念思维能力与具身的体悟能力。
(三)虚实颠倒带来“形象失真”问题
文生视频大模型驱动的数字孪生技术既会让虚拟世界更加真实,同时也会带来许多挑战。一旦对虚拟世界的感知和情感反应超越现实世界,虚拟世界将会变得难以辨别,导致广泛的成瘾性与依赖性,干扰人们对现实世界的认知。一方面,“有损压缩”影响人们对黄河文化的事实性判断。基于大规模数据的深度学习,能够一定程度上生成符合预期的文本,但其生成结果中往往存在一些与预期不一致的内容。这种对现实世界的失真描述会给人们带来一些虚假、模糊或歧义的信息,当这种视频通过“深伪”(deep fake)的逻辑大量生成后,将会推动大量无效、冗余、碎片的信息加速扩张,动摇“眼见为实”的图像信任,从而干扰人们对真实文化的认识。另一方面,算法偏见影响黄河文化的价值性判断。人工智能文生视频大模型可以成为不同文化视角的叠加,能够一定程度上反映或模拟多种文化价值观,但同时也可能因为缺乏深度的文化理解和批判性思维而产生误解或误用。因此,在传播黄河文化时,不能仅仅依靠人工智能的简单计算和识别,而更需要依靠事实与价值本身进行核心判断。
三、Sora驱动黄河文化传播的提升路径
(一)推进文生视频大模型自主研发,强化黄河文化传播优势
借助Sora类文生视频大模型发展的机遇,完善文化科技融合促进机制,推动黄河文化与人工智能融合发展,不断推出满足人民群众需求的文化和科技创新成果。一方面,要加快推动文生视频大模型自主研发。全球文生视频大模型技术还处于初步发展阶段,大模型的系统构建与规模化应用尚不完善;同时我国算力已经得到极大提高,但是文生视频大模型等新领域与国际领先水平依然有很大的差距。需要把握这一机遇,加大对文生视频大模型研发的支持力度,强化人工智能相关领域的人才培养,推动我国生成式人工智能从应用端向研发端拓展。在解决黄河文化传播的实际问题中,融合多个领域的知识与数据资源来开发更多适用于不同传播场景的文生视频大模型。另一方面,要强化黄河文化资源优势。借助文生视频大模型,提高文化内容生产的效率,推进文化内容生产数字化,以沉浸式、体验式、互动式技术推动数字出版、数字艺术等黄河文化产业新业态发展,培育数字创意产业新增长点,推动形成一批有影响力的数字文化创意产品。以新技术发展“数字+文化”“数字+旅游”等融合模式,打造文生视频文化产业品牌,推进相关数字文化创意产业发展,支持开展文生视频产业基地、体验基地和创意园等新型文旅产业空间载体建设,打造具有国际影响力的文旅产业创新集群。
(二)重视黄河文化的深层挖掘,探索黄河文化传播多元形式
持续提高黄河文化研究和传播水平,注重挖掘黄河文化的历史渊源,重视历史文献的整理和研究,为文生视频大模型的发展提供学理支撑。例如,在打造黄河文化主题博物馆的过程中,可以运用文生视频大模型让“文物活起来”,以真实的历史资料为基础,用文生视频描述黄河文物的前世今生。要继续推动相关文化产业的发展,用更多高质量文化产品扩大训练集。进一步探索大模型在黄河文化传播中的作用,创新传播载体,实现黄河文化传播形式的多元化,创作者运用Sora大模型等数字技术将黄河文化以新形式进行再创造,使其更好地适应当下社会发展和大众生活,发挥其在提升内容生产效率、增强受众体验感等方面的优势,满足人民群众对黄河文化的多样精神需求。
(三)以负责任的态度,推动大模型更安全地赋能黄河文化传播
Sora类文生视频大模型的发展不仅要遵循技术本身的规律,更要遵循社会公共道德与伦理道德的规范。在Sora类文生视频大模型赋能黄河文化传播的过程中,应当充分考虑一项或者几项模型的发展与应用是否符合“可靠可控、透明可释、数据保护、多元包容、明确责任”的价值观。要对Sora类文生视频大模型进行安全性、有效性评估与可持续性审查,如果某些模型与模型的某些应用无法改进黄河文化的传播效果,甚至起到反效果,更有甚者危害黄河文化传播的根本价值,就需要运用治理手段暂停或限制某些创新活动的发展。
四、结语
展望未来,Sora类文生视频大模型具有多领域应用的潜力,将会成为驱动黄河文化深度发展的关键力量。Sora驱动黄河文化传播不仅具有技术意义,更具有文化意义,能够将中国优秀传统文化与现代科技相结合,为黄河文化注入新鲜血液,从而推动黄河文化不断发展。然而,在其不断发展成熟的过程中存在一定的风险隐忧,需要进行预判与规避。应在“有限度”与“负责任”的基础之上,积极探索和尝试将Sora类文生视频大模型应用于黄河文化传播的新方式和新途径,推动黄河文化在新时代焕发出新的活力。
[基金项目:2025年度河南省软科学研究计划项目“河南推动AI赋能黄河文化遗产保护研究”(项目编号:252400410316);2024年度河南省哲学社会科学规划基本项目“人工智能技术在黄河文化遗产保护传承中的实践探索与策略研究”(项目编号:2024BXW027)]
参考文献:
[1]肖建华.图像文化的哲学基础[J].国外社会科学,2009(1):77-84.
[2]Heidegger.The Question Concerning Technology and Other Essays[M].New York:Harper and Row,1977:134.
[3]李应志.“图像时代”与文化权力的大众化[J].西南大学学报(社会科学版),2021(2):161-174.
[4]令小雄,王鼎民,唐铭悦.ChatGPT到Sora:Sora文生视频大模型对影视创作的机遇、风险及矫治[J/OL].新疆师范大学学报(哲学社会科学版),2024-04-17:1-9.
[5]程立涛.图像的价值传播功能三题[J].高校马克思主义理论研究,2019(4):89-95.
[6]马克思恩格斯全集:第二十五卷[M].北京:人民出版社,2001:401.
[7]让·波德里亚.消费社会[M].刘成富,全志钢,译.南京:南京大学出版社:2001:105.
作者简介:张柏林,河南省社会科学界联合会副研究员(郑州 450002);彭兆龙,华东师范大学马克思主义学院硕士生(上海 200241);杨浩源,河南省传播学会会员(郑州 450000)。
编校:张红玲