热门文档
- 2023-10-28 08:02:39 一种液冷一体储能电池管理系统的设计_潘明俊
- 2024-02-04 09:01:48 2023年各省市双碳政策汇总
- 2023-10-28 07:56:41 液冷将成储能装置核心冷却方式
- 2024-05-16 17:07:11 【Excel计算表】工商业储能峰谷套利模型
- 2024-02-03 14:35:00 太阳能光伏光热建筑一体化(BIPV_T)研究新进展_王君
- 2024-06-08 14:51:19 产品碳足迹量化方法 钢铁(征求意见稿)
- 2024-05-24 15:35:05 203060双碳文库更新文件240524
- 2024-05-28 12:53:37 电化学储能电站的安全与高效设计
- 2023-11-02 14:34:29 讲义13丨中国独立焦化企业温室气体核算方法与报告指南
- 2023-11-10 08:32:58 世界银行-乌兹别克斯坦的气候变化与残疾人包容(英)-2023.10-39页
- 2024-05-16 17:18:12 【PPT】中储国能张栩:压缩空气储能发展现状及未来展望
- 2024-05-10 10:30:30 B.12_基于安全测试的新能源汽车产品竞争力评价

1、本文档共计 25 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
5、有任何问题,文件需求请联系WX:baomafenxiang520
2024年02月18日计算机软件行业研究买入(维持评级)行业深度研究计算机组分析师:陈矣骄(执业51130523020001)分析师:孟灿(执业51130522050001)chenyijiao@gjzq.com.cnmengcan@gjzq.com.cnSora开启创意领域iPhone时刻,关注全球文生图/视频投资机会行业观点■Sora问世,视频创作领城迎来“iPhone时刻".2023年2月15日,OpenAl发布视频生成大模型Sora,通过文本指令,S0可以直接输出长达60秒的高清视频,包含高废写实的背景、复杂的多角度镜头以及富有情感的多角色叙事,更为可贵的是,S0生成的视频表现出对于真实世界物理常识的深刻理解。部分媒体报道惊叹一一“So之后,现实将不再存在”。从本轮Al应用端发展实践来看,以文本创作(小说、剧本入、图像创作(绘画、平面设计、摄影入视频剑意(广告、短视频、传统影视、游戏)为代表的创意创作领域因其高容错率、高投入度,在A|浪潮之初就被市场广泛认为将会成为最先被A|深刻赋能的产业之一;从本轮A1模型发展演绎来看,以ChatGPT为代表的文本创作以Midjourney、Stable Diffusion为代表的图像创作以Runway、Sora为代表的视频创作的发展速度无疑是极为惊人的。我们认为,从文字到图像到视频,A!内容创作的信息升维越来越考验模型的创作效率与生成结果的稳定性(早期版本的Midjourney存在生成时间长、生成结果违背物理常识或者“Al感”明显的问题;Runway Gen-12也存在生成视频时长较短且生成视颜逻辑连贯性较弱等缺陷),但正如Midjourney V5/6已逐步广泛实现多行业的商业化落地,我们认为Sora的问世有望推动着视频创作领域的“iPhone时刻”到来。■Sora取法Tokens文本特征标记,是基于Patches视觉特征标记的Diffusion Transformer模型。OpenAl研究团队从LLM中汲取灵感,认为LLM范式的成功在一定程度上得益于Tokens的使用,故而通过将视频信息分解为带有时空特征的Patches训练了Diffusion Transformer模型。从训练角度而言,基于Patches视觉特征标记对原生视频进行采样扩大了可用样本的规模且省去了标准化样本的步骤。从推理角度而言,基于原生视颜训练的模型在生成新视频方面改善了构图和取景。OpenAl目前发布的Sora视频大模型主要具备文生视频、视频编辑、文生图三类功能,在文生视频过程中,用户通过输入Prompt提示词→DALL·E生成图像→Sora生成视颜.■文生图和文生视频是当下川应用端落地焦,点,海外相关技术产品迭代迅速。据Discord,按邀请页面流量排序的十大A|应用程序中,有5个是图片生成应用程序,2个是音频生成应用程序,2个是视频生成应用程序,其中,Midjourney位列第一,Pika位列第二,图片约占前10名流量的74%,视频约占前10名流量的8%。文生图领域,海外有Adobe(老牌创意软件巨头,现已发布下一代Firefly支持多种文生图功能Midjourney(文生图模型新锐,现已广泛实现商业化落地)。文生视频领城,海外有Pik(Al初创公司,支持一键生成3秒共计72帧视频)Runway(拥有最早商业化的T2V模型Runway Gen-2),■国内推荐关注万兴科技和美图公司等创意软件龙头投资机会。万兴于2023年9月宣布即将发布国内首个专注于以视频创意应用为核心的百亿级参数多媒体大模型“天幕”,具备一健成片、A美术设计、文生音乐、音频增强、音效分析、多语言对话等核心能力。2022年底至2023全年万兴对旗下T2V川多款拳头产品进行A1功能更新,Al赋能之下订阅收入占比及订阅续约率取得双增。美图公司于2023年12更新视觉大模型MiracleVision4.0,具备文生视频、图生视频、视频生视频等多模态能力,A赋能之下订阅业务收入占比逐年增长。投资建议■Sor开启创意领域新纪元,国内推荐关注万兴科技、美图公司、虹软科技、科大讯飞;海外推荐关注Adobe.风险提示■海外基础软硬件使用受限的风险:A应用落地不及预期的风险;行业竞争加剧风险。1扫码获取更多服务行业深度研究内容目录1.OpenAl视频大模型S0ra:不止于视频,剑指世界模型,初步理解物理规律..41.1S0a问世:OpenA发布视频生成大模型,剑指物理世界通用模拟工具41.2技术路径:基于Patches视觉特征标记的Diffusion Transformer模型41.3算法实现:Patches实现更灵活的采样+更优化的构图514功能解读:文生视频+视频编辑,确保“物理世界常识"始终在场的通用模拟工具72。文生图/视频海外标杆:A应用端焦点,技术及产品迭代迅速82.1文生图/视频为当下A应用焦点:相关产品流量排序名列前茅82.2文生图-T2I(Text to Image上Diffusion模型莫定文生图商业化基石,新老玩家广泛入局92.2.1 Adobe:老牌创意软件巨头向AlG出征,发布下一代Firefly支持多种文生图功能102.2.2 Midjourney:文生图模型新锐,提升创意设计工作效率,广泛实现商业化落地…112.3文生视频-T2V(Text to Vide0上创意产业工作流变苹前夜,MGC时代大幕下的先行者.112.3.1Pika:Al初创公司发布1.0工具,支持一键生成3秒共计72桢视频.132.3.2 Runway:拥有最早商业化的T2V模型之一-Runway Gen-2143.文生图/视频国内映射:万兴、美图头部标杆,相继发布视觉大模型,订阅收入占比势能向上…143.1万兴科技:发布“天慕"大模型整合T2V川能力,A赋能订阅及续约率双增…3.2美图公司:自研视觉大模型MiracleVision4.0,订阅业务收入占比逐年增长..184。投资建议192