(图为群友拿 r1 搞的离谱涩涩 这玩意一个 cot 模型怎么 rp 这么得劲)
DeepSeek 真属于是大模型圣人了,几乎有啥开啥,推理服务还量大管饱,甚至资源紧张的时候优先保证 Web 端(免费使用)的供应,先停 API...
上午群友还在讨论有没有谁去蒸馏一份 r1-preview 下午官方就直接放了蒸馏的小半杯 属实是饭喂嘴里 送佛送到西了
还有 r1-zero 这种纯靠 rl 没有 sft 搞出来的神秘东西...
强烈建议群友快去试试 DeepSeek v3 和 r1-preview,效果非常一流,虽然一些方面打不过 o1 也是顶尖模型了(benchmark 基本可以和 o1 打平甚至超越)
https://huggingface.co/deepseek-ai/DeepSeek-R1