宋旭晟 发表于 2025-2-6 09:01

感谢分享

yjj008818 发表于 2025-2-6 09:08

最近到处都挺火,无处不在,普及得非常到位

boy2008xp 发表于 2025-2-6 10:13

离线使用,这个不错的,就是电脑跑不动的

p93506 发表于 2025-2-6 10:39

我还是习惯用豆包

思の凡 发表于 2025-2-6 12:49

JARK006 发表于 2025-1-28 15:16
如果显卡一般,也可以参考我这种方法跑蒸馏版CPU版,蹦字较慢:

1. 去 https://github.com/ggerganov/llam ...

请问 deepseek-r1-distill-qwen-32b-q4_k_m.gguf如何下载下来?

达芬奇密码 发表于 2025-2-6 14:07

deepseek火啦 支持made in China

JARK006 发表于 2025-2-6 14:21

思の凡 发表于 2025-2-6 12:49
请问 deepseek-r1-distill-qwen-32b-q4_k_m.gguf如何下载下来?

直接给你网址吧,32B / 14B / 1.5B按自己电脑配置选,需要魔法上网 :

https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-32B-GGUF/tree/main

https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-14B-GGUF/tree/main

https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-1.5B-GGUF/tree/main

hardkin 发表于 2025-2-11 10:27

看看第三步是啥

tedhaoyang 发表于 2025-2-11 10:40

谢谢,试试看

yxamos 发表于 2025-2-11 10:55

deepseek最近哪儿都是啊

yxamos 发表于 2025-2-11 10:56

围观,看潮人们先玩

glta 发表于 2025-2-11 17:28

ollama-webui run 32b

william0320 发表于 2025-2-14 13:28

感谢楼主分享,学习了。

helppcbeta 发表于 2025-2-14 14:07

这么方便上手

绝体绝命幻影 发表于 2025-2-14 14:24

可以调用npu嘛

lza200708 发表于 2025-2-14 14:46

glta 发表于 2025-1-28 20:22
無須頂級顯示卡,有8gb記憶體顯示卡都可以.




这个是什么配置下的,速度多少tokens/s

jxliudh 发表于 2025-2-14 15:36

感谢大佬

陈伟飞 发表于 2025-2-14 15:46

昨晚换32大模型,出字好慢,最后换成14B。运行32大模型GPU基本不动,32g内存使用70%,cup也是70%{:5_264:},只能换成14B

yepulu 发表于 2025-2-14 16:29

支持国产大模型,

glta 发表于 2025-2-14 18:03

lza200708 发表于 2025-2-14 14:46
这个是什么配置下的,速度多少tokens/s

cpu 12600kf 32gb ram msi 3060 8gb,run deepseek 32b 比較慢,几多tokens/s無研究,純粹試玩下.
页: 1 2 3 4 5 6 7 8 9 [10] 11 12
查看完整版本: deepseek-r1安装