蚂蚁集团推出两款不同规模MoE大语言模型 使用国产AI芯片训练

2025-03-24 14:44
南方财经3月24日电,据证券时报,近日,蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示,蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿),两者性能均达到行业领先水平。除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE(混合专家)大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。
相关文章
蚂蚁集团,AI重大突破!推出新款MoE大语言模型 可在使用国产GPU的低性能设备上完成高效训练
2025年3月24日
蚂蚁集团,突传重磅!
2025年3月24日
蚂蚁集团或布局AI智能眼镜,科创芯片ETF(588200)飘红,近3个交易日“吸金”超4.3亿元
2025年3月24日
官网更新,韩歆毅正式接任蚂蚁集团CEO
2025年3月1日
站长统计