小红书开源首个大模型 预训练未使用合成数据
发布日期:2025-06-10 11:22:59
浏览:
小红书开源首个大模型 预训练未使用合成数据
【小红书开源首个大模型 预训练未使用合成数据】《科创板日报》10日讯,小红书开源了首个大模型dots.llm1,小红书方面告诉《科创板日报》,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。(记者 张洋洋)
上一篇:今局地大到暴雨!上海雷电+3区暴雨预警!“天天早上下大雨”何时休?
下一篇:没有了
- 维修知识
- 安装知识
- 清洗保养
- 行业新闻
- 常见问题
- 浙江发布今年首个省级洪水预警06-10
- 山西高考成绩将于6月25日公布06-10
- 三预警齐发!多地将有10级以上雷暴大风06-08
- 预警!雷雨!大风!强对流!这时影响天津→06-09
- 南方出现焖蒸型高温06-08
- 台风有新消息!高温+暴雨!即将抵达福建!06-08
- 西北西南华北高温连成片 多地高温耐力十足06-10
- 河南6月25日高考可查分06-10
- 《藏海传》如何成为“集体智力游戏”06-09
- 暑期档电影片单发布!有没有你想看的06-08
- 空调一开一关费电,还是一直开着费电?06-08