一站式AI视频成主流受益概念股速览 AI多模态爆发将至

摘要：落脚到A股市场，不止于随着用户对高质量短视频需求的增加，AI视频大模型无疑将满足市场日益增长的创作需求。截至9月，豆包语言模型的日均tokens使用量超过1.3万亿，相比5月首次发布时猛增十倍，多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

展望后市，光大证券分析，豆包大模型公布低于行业99%的定价，引领国内大模型开启降价潮，有望加速大模型的普及和发展，带动整个AI产业链的发展。

A股投资机会

落脚到A股市场，不止于视频生成，从AI生成到AI工作流，一站式AI视频生成+剪辑+故事创作有望成为AI视频产业的核心发展方向，关注在AI大模型、上游的AI语料&算力、下游的AI应用等环节占据领先地位的龙头企业。

根据市场公开资料显示，相关概念股包括：果麦文化、中文在线、华策影视、万兴科技等。

AI视频生成领域｜Video Diffusion Models

AI视频生成领域经历了全面革新，扩散模型的引入标志着这一领域的巨大进步。最近，NUS Showlab的教程全面回顾了2022年初以来，视频领域扩散模型的主要进展与趋势，揭示了这一技术的最新面貌。扩散模型，如Stable Diffusion、Imagen、Midjourney等，已广泛应用于图像生成领域，并在2022年初扩展至视频生成，引发了生成模型的爆发性增长。探索文本转视频的路径时，依赖已预训练的文本转图像（t2i）模型成为关键。视频数据的三维特性（时间序列）与二维图像之间的差异，促使研究者采用伪三维（2+1D）方法，将时间维度与图像模型融合，重点解决帧间一致性问题。早期奠基模型多由大型公司与实验室开发，如Google的VDM论文，标志着视频领域扩散模型的开端。作者基于DDPM的理论，采用伪三维策略，结合空间注意力与时间注意力层，以实现视频生成的统一性。 Meta的Make a Video论文引入了递进模型结构，通过四个核心模块，分步骤生成高质量视频。 Imagen Video与Align your latent等模型，同样遵循伪三维加空间时间方法，但具体实现细节与策略有所不同。随着奠基模型的出现，视频生成技术路线逐渐明确，但模型并未开源。其他公司与实验室基于已有模型训练了各种视频大模型，部分开源了模型，如Control等。个性化与可控性成为研究热点，通过ControNet、LoRA或Dreambooth技术，利用模型插件或特定策略增强生成内容的可控性与个性化。为生成长视频，研究者探索利用语言模型（如VideoDirectorGPT、LLM-Grounded VDM等）编写脚本分镜，以及关键帧技术，以确保视频连续性。多模态输入的探索，如MCDiff（基于草图引导的运动控制）、AADiff（声音输入的视频生成）与MRI信号输入的视频生成，拓展了生成模型的应用边界。视频编辑领域同样活跃，尤其是在基于现有视频进行修改的场景中，方法与效果得到广泛认可。这类工作与文本输入生成的可控性增强有交集，强调在已有视频基础上进行高效、高质量的编辑。综上所述，AI视频生成领域在扩散模型的驱动下，技术路线不断优化，个性化与可控性成为重要研究方向，多模态输入与长视频生成技术也得到了快速发展，呈现出多元化与创新性的技术生态。

一站式解读多模态——Transformer、Embedding、主流模型与通用任务实战（上）

飞桨星河社区开发者高宏伟（ID: GoAI）通过系列文章深入解读多模态技术，上篇主要介绍了多模态学习的基础概念、任务类型、数据集以及模型发展。多模态学习是利用模型处理多种数据形式，如图像、文本和语音，以增强人工智能处理复杂数据的能力。它涵盖了广泛的应用领域，如文本和图像理解、视觉问答等，并列举了基础和详细任务数据集版本。文章重点介绍了多模态模型的发展关系，如基于Transformer的模型结构，包括模态编码器（如图像、视频和音频编码器）、输入投影器（如线性投影和多层感知器）、大模型基座（如ChatGLM和LLaMA）以及输出投影器和模态生成器。此外，文章还提及了Transformer在多模态学习中的核心作用，如自注意力机制、多头注意力和位置编码等，这些都是模型理解跨模态信息的关键组成部分。文章以文本和图像的对齐为例，阐述了如何通过Tokenization和Embedding技术将不同模态转换成向量，以便进行有效的交互和理解。在下篇，将深入探讨多模态对齐方法，如PaddleMIX框架，并介绍多模态模型的训练流程，包括预训练和指令调优两个阶段。通过理解这些内容，读者能够全面掌握多模态技术的基础知识，为实际项目中的多模态任务实施提供坚实的基础。

A股：最新市场主流“AI芯片”概念梳理（附股）

一、A股“AI芯片”概念梳理接入Kimi公司梳理：掌阅科技、华策影视、中文在线、皖新传媒、捷成股份、掌趣科技、海天瑞声、中广天择等公司与Kimi有合作关系，涉及数字阅读、影视版权、数据资源、AI大模型应用等。 Kimi应用上市公司梳理：凡拓数创、天下秀、彩讯股份、超讯通信、福昕软件、金山办公、力盛体育等公司在文本、图像、虚拟人等场景中应用AIGC技术，拓展AI+3D数字李生、AI智能助理等。 Kimi算力提供上市公司梳理：润泽科技、亚康股份、润建股份、先进数通等公司提供算力资源给Kimi。二、谷歌产业链核心标的梳理中际旭创、腾景科技、博创科技、太辰光等公司为谷歌提供光模块、数据连接等产品或服务，受益于谷歌云基础设施投入。 AMD AI芯片MI300系列，MI300X拥有超过1500亿个晶体管，内存是英伟达H100芯片的2.4倍，MI300A则能提供更高性能的计算、更快的模型训练以及30倍的能效提升。 A股AMD产业链核心标的梳理：通富微电、芯原股份、锐捷网络、中电港、奥士康、胜宏科技等公司为AMD提供封装测试、Chiplet技术、GPU方案、CPU分销、PCB制造等服务。三、中国主流AI芯片梳理华为升腾芯片、海光信息AI芯片、寒武纪思元系列AI芯片、龙芯中科AI芯片、燧原邃思系列AI芯片等。大华股份发布多模态融合的行业视觉大模型，亿嘉和发布基于多模态超融合技术的大模型，汤姆猫、新华网上线AIGC-Safe平台，数字政通、云从科技、昆仑万维、因赛集团、博汇科技、苏州科达、力盛体育等公司推出AI多模态应用。

通过万利股票开户网办理股票开户，享交易佣金万分之0.874，还可以免5，国企背景头部证券公司。可以手机开户，或者电脑网上开户，一般20分钟即可办完手续。开户微信：gpkhcom

上一篇：GPU代工激增25%概念股受益匪浅英伟达AI 下一篇：算力上市公司与概念股一览

A股投资机会

AI视频生成领域｜Video Diffusion Models

一站式解读多模态——Transformer、Embedding、主流模型与通用任务实战（上）

A股：最新市场主流“AI芯片”概念梳理（附股）

相关文章