首页 首页

一站式AI视频成主流 受益概念股速览 AI多模态爆发将至

摘要:落脚到A股市场,不止于随着用户对高质量短视频需求的增加,AI视频大模型无疑将满足市场日益增长的创作需求。截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

一站式AI视频成主流受益概念股速览AI多模态

展望后市,光大证券分析,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮,有望加速大模型的普及和发展,带动整个AI产业链的发展。

A股投资机会

落脚到A股市场,不止于视频生成,从AI生成到AI工作流,一站式AI视频生成+剪辑+故事创作有望成为AI视频产业的核心发展方向,关注在AI大模型、上游的AI语料&算力、下游的AI应用等环节占据领先地位的龙头企业。

根据市场公开资料显示,相关概念股包括:果麦文化、中文在线、华策影视、万兴科技等。


AI视频生成领域|Video Diffusion Models

AI视频生成领域经历了全面革新,扩散模型的引入标志着这一领域的巨大进步。 最近,NUS Showlab的教程全面回顾了2022年初以来,视频领域扩散模型的主要进展与趋势,揭示了这一技术的最新面貌。 扩散模型,如Stable Diffusion、Imagen、Midjourney等,已广泛应用于图像生成领域,并在2022年初扩展至视频生成,引发了生成模型的爆发性增长。 探索文本转视频的路径时,依赖已预训练的文本转图像(t2i)模型成为关键。 视频数据的三维特性(时间序列)与二维图像之间的差异,促使研究者采用伪三维(2+1D)方法,将时间维度与图像模型融合,重点解决帧间一致性问题。 早期奠基模型多由大型公司与实验室开发,如Google的VDM论文,标志着视频领域扩散模型的开端。 作者基于DDPM的理论,采用伪三维策略,结合空间注意力与时间注意力层,以实现视频生成的统一性。 Meta的Make a Video论文引入了递进模型结构,通过四个核心模块,分步骤生成高质量视频。 Imagen Video与Align your latent等模型,同样遵循伪三维加空间时间方法,但具体实现细节与策略有所不同。 随着奠基模型的出现,视频生成技术路线逐渐明确,但模型并未开源。 其他公司与实验室基于已有模型训练了各种视频大模型,部分开源了模型,如Control等。 个性化与可控性成为研究热点,通过ControNet、LoRA或Dreambooth技术,利用模型插件或特定策略增强生成内容的可控性与个性化。 为生成长视频,研究者探索利用语言模型(如VideoDirectorGPT、LLM-Grounded VDM等)编写脚本分镜,以及关键帧技术,以确保视频连续性。 多模态输入的探索,如MCDiff(基于草图引导的运动控制)、AADiff(声音输入的视频生成)与MRI信号输入的视频生成,拓展了生成模型的应用边界。 视频编辑领域同样活跃,尤其是在基于现有视频进行修改的场景中,方法与效果得到广泛认可。 这类工作与文本输入生成的可控性增强有交集,强调在已有视频基础上进行高效、高质量的编辑。 综上所述,AI视频生成领域在扩散模型的驱动下,技术路线不断优化,个性化与可控性成为重要研究方向,多模态输入与长视频生成技术也得到了快速发展,呈现出多元化与创新性的技术生态。

一站式解读多模态——Transformer、Embedding、主流模型与通用任务实战(上)

飞桨星河社区开发者高宏伟(ID: GoAI)通过系列文章深入解读多模态技术,上篇主要介绍了多模态学习的基础概念、任务类型、数据集以及模型发展。 多模态学习是利用模型处理多种数据形式,如图像、文本和语音,以增强人工智能处理复杂数据的能力。 它涵盖了广泛的应用领域,如文本和图像理解、视觉问答等,并列举了基础和详细任务数据集版本。 文章重点介绍了多模态模型的发展关系,如基于Transformer的模型结构,包括模态编码器(如图像、视频和音频编码器)、输入投影器(如线性投影和多层感知器)、大模型基座(如ChatGLM和LLaMA)以及输出投影器和模态生成器。 此外,文章还提及了Transformer在多模态学习中的核心作用,如自注意力机制、多头注意力和位置编码等,这些都是模型理解跨模态信息的关键组成部分。 文章以文本和图像的对齐为例,阐述了如何通过Tokenization和Embedding技术将不同模态转换成向量,以便进行有效的交互和理解。 在下篇,将深入探讨多模态对齐方法,如PaddleMIX框架,并介绍多模态模型的训练流程,包括预训练和指令调优两个阶段。 通过理解这些内容,读者能够全面掌握多模态技术的基础知识,为实际项目中的多模态任务实施提供坚实的基础。

A股:最新市场主流“AI芯片”概念梳理(附股

一、A股“AI芯片”概念梳理接入Kimi公司梳理:掌阅科技、华策影视、中文在线、皖新传媒、捷成股份、掌趣科技、海天瑞声、中广天择等公司与Kimi有合作关系,涉及数字阅读、影视版权、数据资源、AI大模型应用等。 Kimi应用上市公司梳理:凡拓数创、天下秀、彩讯股份、超讯通信、福昕软件、金山办公、力盛体育等公司在文本、图像、虚拟人等场景中应用AIGC技术,拓展AI+3D数字李生、AI智能助理等。 Kimi算力提供上市公司梳理:润泽科技、亚康股份、润建股份、先进数通等公司提供算力资源给Kimi。 二、谷歌产业链核心标的梳理中际旭创、腾景科技、博创科技、太辰光等公司为谷歌提供光模块、数据连接等产品或服务,受益于谷歌云基础设施投入。 AMD AI芯片MI300系列,MI300X拥有超过1500亿个晶体管,内存是英伟达H100芯片的2.4倍,MI300A则能提供更高性能的计算、更快的模型训练以及30倍的能效提升。 A股AMD产业链核心标的梳理:通富微电、芯原股份、锐捷网络、中电港、奥士康、胜宏科技等公司为AMD提供封装测试、Chiplet技术、GPU方案、CPU分销、PCB制造等服务。 三、中国主流AI芯片梳理华为升腾芯片、海光信息AI芯片、寒武纪思元系列AI芯片、龙芯中科AI芯片、燧原邃思系列AI芯片等。 大华股份发布多模态融合的行业视觉大模型,亿嘉和发布基于多模态超融合技术的大模型,汤姆猫、新华网上线AIGC-Safe平台,数字政通、云从科技、昆仑万维、因赛集团、博汇科技、苏州科达、力盛体育等公司推出AI多模态应用。

通过万利股票开户网办理股票开户,享交易佣金万分之0.874,还可以免5,国企背景头部证券公司。可以手机开户,或者电脑网上开户,一般20分钟即可办完手续。开户微信:gpkhcom

相关文章