依星源码资源网,依星资源网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

【好消息,好消息,好消息】VIP会员可以发表文章赚积分啦 !
查看: 86|回复: 0

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解

[复制链接] 主动推送

1万

主题

1万

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
14856
发表于 2025-3-26 11:09:53 | 显示全部楼层 |阅读模式
python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解
面向大规模分布式训练的昇腾多模态大模型套件,同时支持多模态生成及多模态理解,旨在为华为 昇腾芯片 提供端到端的多模态训练解决方案, 包含预置业界主流模型,数据工程,分布式训练及加速,预训练、微调、在线推理任务等特性。

配套版本与支持模型
【现版本实测性能(硬件信息:Atlas 900 A2 PODc)】
下述列表中支持的模型,我们在各模型的README文件中提供了相应的使用说明,里面有详细的模型训练、推理、微调等流程
模型列中的超链接指向各模型的文件夹地址, 参数量列中的超链接指向模型的社区资源地址
认证【Pass】表示已经通过测试的模型,【Test】表示测试中的模型
Samples per Second 为 (SPS); Frames per Second 为 (FPS); Tokens per Second 为 (TPS)
亲和场景为调整少量结构或参数,使得模型更加亲和昇腾,性能更优
A3 为硬件 Atlas A3 训练系列产品
MindSpeed-MM模型列表[td]
模型任务模型参数量任务集群精度格式NPU性能参考性能认证
多模态生成HunyuanVideo13B预训练1x8BF160.171 (SPS)0.181 (SPS)【Test】
OpenSora 1.05.5B预训练1x8BF163.18 (SPS)2.04 (SPS)【Pass】
OpenSora 1.25.2B预训练1x8BF167.31 (SPS)8.15 (SPS)【Pass】
OpenSoraPlan 1.28.7B预训练1x8BF160.42 (SPS)0.37 (SPS)【Pass】
OpenSoraPlan 1.3-T2V8.6B预训练1x8BF161.29 (SPS)1.27 (SPS)【Pass】
OpenSoraPlan 1.3-I2V8.6B预训练1x8BF161.17 (SPS)1.15 (SPS)【Pass】
CogVideoX-T2V5B预训练1x8BF160.37 (SPS)0.46 (SPS)【Pass】
CogVideoX-I2V5B预训练1x8BF160.37 (SPS)0.46 (SPS)【Pass】
CogVideoX 1.5-T2V5B预训练1x8BF161.88 (SPS)2.09 (SPS)【Pass】
CogVideoX 1.5-I2V5B预训练1x8BF161.81 (SPS)2.01 (SPS)【Pass】
Qihoo-T2X1.1B推理1x1BF16//【奇虎360贡献】
SDXL3.5B预训练1x8BF1629.92 (FPS)30.65 (FPS)【Pass】
3.5B预训练1x8FP1628.51 (FPS)30.23 (FPS)【Pass】
SD32B全参微调1x8BF1616.09 (FPS)16.01 (FPS)【Pass】
SD3.58.1B全参微调1x8BF1626.20 (FPS)28.33 (FPS)【Pass】
8.1BLora微调1x8FP1647.93 (FPS)47.95 (FPS)【Pass】
Flux12B全参微调1x8BF1655.23 (FPS)53.65 (FPS)【Pass】
Sana1.6BLora微调1x8BF1628.7 (FPS)32.8 (FPS)【Pass】
Kolors2.6B推理1x1FP16//【Test】
多模态理解LLaVA 1.57B全参微调1x8BF1648.27 (SPS)49.94 (SPS)【Test】
InternVL 2.02B微调1x8BF1633.77 (SPS)22.46 (SPS)【Pass】
8B微调1x8BF1612.86 (SPS)11.00 (SPS)【Pass】
26B微调1x8BF163.31 (SPS)3.26 (SPS)【Pass】
76B全参微调8x16BF16214 (TPS)191 (TPS)【Test】
InternVL 2.578B微调8x8BF16//【Test】
Qwen2-VL2B微调1x8BF1634.15 (SPS)34.88 (SPS)【Pass】
7B微调1x8BF1613.28 (SPS)11.66 (SPS)【Pass】
72B微调4x8 (A3)BF16261.25 (TPS)257.63 (TPS)【Pass】
语音识别Whisper1.5B预训练1x8BF1693.38 (SPS)109.23 (SPS)【Test】

其他已适配昇腾的多模态大模型[td]
模型参数量任务集群精度格式NPU性能参考性能认证
CogVLM-28B微调1x8BF163.9 (s/it)3.3 (s/it)【Pass】
PLLaVA7B预训练1x8BF160.841 (s/step)0.935 (s/step)【Pass】
7B预训练1x8FP320.935 (s/step)1.08 (s/step)【Pass】
miniCPM-V 2.58B全参微调1x8BF161046 (s)/50-200steps847 (s)/50-200steps【Pass】
8BLora微调1x8BF16603 (s)/50-200steps490 (s)/50-200steps【Pass】
HunYuanDiT1.5B预训练1x8BF161099.5 (ms/step)1059.3 (ms/step)【Pass】
InternVL 1.526B微调训练1x8BF164.952 (FPS)5.151 (FPS)【Pass】

图生视频: OpensoraPlan 1.3 I2V

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
输入图片

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
Prompt: A rocket ascends slowly into the sky
文生视频: OpensoraPlan 1.3 T2V

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
Prompt: A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee
文生图:Flux T2I

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
Prompt: A cat holding a sign that says hello world

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
Prompt: A cat holding a sign that says MindSpeed
理解模型:InternVL2 & Qwen2VL

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...

python源码面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解 ...
Input image for both models:
Input text for both models: Please describe the image shortly
InternVL2推理结果: The image depicts a serene lakeside scene with a wooden dock extending into the calm water. The water reflects the surrounding landscape, which includes dense forests and a mountain range in the background. The sky is partly cloudy, adding to the tranquil atmosphere of the scene
Qwen2VL推理结果: The image depicts a serene lakeside scene with a wooden dock extending into the calm waters. The dock is made of weathered wooden planks and leads to a small platform with a ladder, suggesting it is used for swimming or diving. The lake is surrounded by lush green forests and mountains in the background, creating a picturesque and tranquil setting. The sky is overcast, adding to the calm and peaceful atmosphere of the scene.
Input text for InternVL2: 请简短描述这张照片
InternVL2推理结果: 这张图片展示了一个宁静的湖泊,湖面平静,反射着天空和周围景物的影像。湖的中央有一个木制码头,延伸到湖中,码头上有几根柱子支撑。 湖的远端是一片茂密的森林,树木高大,覆盖着茂密的绿色植被。森林的尽头是一座高耸的山峰,山峰上覆盖着积雪,显得格外壮丽。 天空中有一些云朵,但整体上是晴朗的,阳光从云层中透出,照亮了整个湖面和周围的景色。 这张图片整体给人一种宁静、祥和的感觉,仿佛是一个远离尘嚣的世外桃源
Input text for Qwen2VL: 请用中文简短描述这张照片
Qwen2VL推理结果: 这张图片展示了一座木制码头延伸到平静的湖面上,背景是连绵的山脉和茂密的森林。天空多云,整体色调偏冷,给人一种宁静和自然的感觉。


链接:https://pan.quark.cn/s/f8179e64469b
提取码下载:
文件名称:提取码下载.txt 
下载次数:0  文件大小:16 Bytes  售价:59金钱 [记录]
下载权限: 不限 [购买VIP]   [充值]   [在线充值]   【VIP会员6折;永久VIP4折】
安全检测,请放心下载





相关帖子

扫码关注微信公众号,及时获取最新资源信息!下载附件优惠VIP会员6折;永久VIP4折
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免责声明:
1、本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与商业和非法行为,请在24小时之内自行删除!
2、本站所有内容均由互联网收集整理、网友上传,并且以计算机技术研究交流为目的,仅供大家参考、学习,请勿任何商业目的与商业用途。
3、若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
4、论坛的所有内容都不保证其准确性,完整性,有效性,由于源码具有复制性,一经售出,概不退换。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
5、用户使用本网站必须遵守适用的法律法规,对于用户违法使用本站非法运营而引起的一切责任,由用户自行承担
6、本站所有资源来自互联网转载,版权归原著所有,用户访问和使用本站的条件是必须接受本站“免责声明”,如果不遵守,请勿访问或使用本网站
7、本站使用者因为违反本声明的规定而触犯中华人民共和国法律的,一切后果自己负责,本站不承担任何责任。
8、凡以任何方式登陆本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。
9、本站以《2013 中华人民共和国计算机软件保护条例》第二章 “软件著作权” 第十七条为原则:为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。若有学员需要商用本站资源,请务必联系版权方购买正版授权!
10、本网站如无意中侵犯了某个企业或个人的知识产权,请来信【站长信箱312337667@qq.com】告之,本站将立即删除。
郑重声明:
本站所有资源仅供用户本地电脑学习源代码的内含设计思想和原理,禁止任何其他用途!
本站所有资源、教程来自互联网转载,仅供学习交流,不得商业运营资源,不确保资源完整性,图片和资源仅供参考,不提供任何技术服务。
本站资源仅供本地编辑研究学习参考,禁止未经资源商正版授权参与任何商业行为,违法行为!如需商业请购买各资源商正版授权
本站仅收集资源,提供用户自学研究使用,本站不存在私自接受协助用户架设游戏或资源,非法运营资源行为。
 
在线客服
点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
售前咨询热线
312337667

微信扫一扫,私享最新原创实用干货

QQ|免责声明|小黑屋|依星资源网 ( 鲁ICP备2021043233号-3 )|网站地图

GMT+8, 2025-4-4 17:15

Powered by Net188.com X3.4

邮箱:312337667@qq.com 客服QQ:312337667(工作时间:9:00~21:00)

快速回复 返回顶部 返回列表