牙齿是tooth,医生是doctor,那为什么牙医不是tooth doctor,而是dentist ?
特朗普表示美军阅兵式将超越奥运会或世界杯,这背后的意义和成本如何评估?
剧版《长安的荔枝》相较于原著改编得如何?
这一轮以色列和伊朗的冲突谁会笑到最后?最终会如何收场?
开战斗机从上海到北京要多久,那是一种什么样的体验?
和父母无法沟通你有多绝望?

如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

发布日期:2025-06-18 01:20:11 浏览次数:0

卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先***地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的MiniMax-Text-01模型上增量训练得来的,结构跟MiniMax-Text-01模型一致,MoE结构,总参数456B,激活参数45.9B。

Paper:***s://github***/MiniMax-AI/MiniMax-M1/blob/main/…。

如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?