【ITBEAR】8月23日消息,英伟达近日在其官方博文中宣布,已于8月21日正式发布了Mistral-NeMo-Minitron
8B小型语言AI模型。这款模型凭借其卓越的精度和高效的计算能力,特别适用于配备GPU加速的数据中心、云环境以及工作站上运行。
继上月与Mistral AI联合发布开源的Mistral NeMo 12B模型后,英伟达再次推出这款规模更小的Mistral-NeMo-Minitron
8B模型。该模型拥有80亿个参数,并能够在搭载英伟达RTX系列显卡的工作站上流畅运行,为用户带来更加便捷高效的体验。

据ITBEAR了解,英伟达通过采用宽度剪枝技术对Mistral NeMo
12B模型进行优化,并结合知识蒸馏方法进行轻度的重新训练,最终成功获得了这款Mistral-NeMo-Minitron
8B模型。这一研究成果已在《Compact Language Models via Pruning and Knowledge
Distillation》论文中发表。
宽度剪枝技术通过去除对模型准确率贡献最小的权重,有效缩小了神经网络的规模。而在“蒸馏”过程中,研究团队在一个小型数据集上对剪枝后的模型进行重新训练,显著提升了因剪枝而降低的准确率。
在规模上,Mistral-NeMo-Minitron
8B模型在语言模型的九项流行基准测试中表现出色,遥遥领先于其他同类模型。这些基准测试涵盖了语言理解、常识推理、数学推理、总结、编码以及生成真实答案等多种任务,充分展示了该模型在多个领域的卓越性能。
艾德金融:钧达股份(02865.HK)成功在港上市,为“光伏电池A+H第一股”
(2025年5月8日,香港)海南钧达新能源科技股份有限公司 Hainan Drinda New Energy Technology Co., Ltd.(简称「钧达股份」,股票代码02865.HK)成功于香港联交所主板挂牌上市。钧达股份本次全球发行6,343.23万股新股,集资总额约14.05亿港元。艾德金融担任本项目的联席牵
2025-05-08
“从遗产管理到财富传承的传家方案”研讨会召开,传家律所分享成功经验
2025年4月20日,由桂客学院、律新社主办、北京传家律师事务所承办的“从遗产管理到财富传承的传家方案”研讨会在京召开,中国老龄事业发展基金会遗嘱库项目办荣誉主任、桂客学院院长刘桂明,中国行为法学会总监事黄永维,中国政法大学法律学院院长,教授、博士生导师许
2025-04-22
SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
4月21日,昆仑万维SkyReels团队正式发布并开源SkyReels-V2——全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion
2025-04-21
元鼎智能1亿美金出售股份:创始人套现背后的战略困局
近日,元鼎智能旗下清洁机器人品牌Aiper宣布获得全球泳池设备巨头Fluidra的1亿美元战略投资。Fluidra以发行新股方式获得Aiper 27%股权,投后估值3.7亿美元。然而,这一交易因复杂的对赌条款和行业前景争议引发市场关注——创始人选择此时套现离场,究竟是顺势而为,还是
2025-04-15
逆势扩张150㎡,用“大店思维”让张亮麻辣烫在县域称王
从71㎡小店到150㎡大店,张建军用7年时间完成了县城里从生存到引领的蜕变。他的经历验证了县域经济的一个道理:真正的下沉不仅是模式降维,更是门店空间和服务内容的重构。在张建军看来,餐饮从业者的护城河,从来不在那多收的“三五斗”,而在于持续进化的勇气。当绝大
2025-04-08