英伟达发布 80 亿参数新 AI 模型,可在 RTX 工作站上部署

科技动态

英伟达新发布了一款名为 Mistral-NeMo-Minitron 8B 的小型语言 AI 模型,该模型精度高、计算效率高,可在 GPU 加速的数据中心、云和工作站上运行。该模型是在宽度剪枝和知识蒸馏的基础上,从 Mistral NeMo 12B 模型中得来的。Mistral-NeMo-Minitron 8B 在九项流行基准测试中表现优异,这些测试包括了语言理解、常识推理、数学推理、总结等任务。


本站提供的内容用于个人学习、研究以及其他非商业性或非盈利性用途,内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注