-
DeepSeek-V3-0324: 685B 多領域推論のためのパラメトリック・モデル
DeepSeek-V3-0324 是深度求索公司发布的大规模语言模型,相比前代在推理能力(如 MMLU-Pro 从 75.9 提升至 81.2,AIME 从 39.6 跃升至 59.4)、前端开发代码可执行性、中文写作质量(支持 R1 风格)、搜索能力(增强报告分析)及函数调用准确性等方面均有显著优化。模型参数达685B,采用MIT 许可证,并提供了温度参数映射机制(API 温度 1.0 对应模型...- 47
- 0