MiniMax开源混合架构推理模型M1
6月17日,MiniMax开源混合架构推理模型M1。M1模型采用MoE与lightning attention相结合架构,模型大小为456B ,单token激活参数为45.9 B,M1原生支持100万token的上下文长度,包含40K和80K思维预算两个推理模型。(钛媒体AGI)

6月17日,MiniMax开源混合架构推理模型M1。M1模型采用MoE与lightning attention相结合架构,模型大小为456B ,单token激活参数为45.9 B,M1原生支持100万token的上下文长度,包含40K和80K思维预算两个推理模型。(钛媒体AGI)