Mistral AI 发布其首个多模模型 Pixtral 12B

科技

法国 AI 创业公司 Mistral AI 发布了其首个多模模型 Pixtral 12B,具有语言和视觉处理能力,它能识别图像但不能生成图像。用户可通过 Hugging Face 和 GitHub 访问其源代码,源码采用 Apache 2.0 许可,用户可以不受限制的下载、微调和使用。Pixtral 12B 有 120 亿参数,模型大小 24GB。它是基于文本模型 Nemo 12B,应该能执行为图像添加文字描述和计算照片中物体数量等任务。Mistral 没有披露使用了哪些图像去训练模型。

https://techcrunch.com/2024/09/11/mistral-releases-pixtral-its-first-multimodal-model/
https://huggingface.co/mistral-community/pixtral-12b-240910
https://github.com/mistralai/mistral-common/releases/tag/v1.4.0


本站提供的内容用于个人学习、研究以及其他非商业性或非盈利性用途,内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注