宋旭晟
发表于 2025-2-6 09:01
感谢分享
yjj008818
发表于 2025-2-6 09:08
最近到处都挺火,无处不在,普及得非常到位
boy2008xp
发表于 2025-2-6 10:13
离线使用,这个不错的,就是电脑跑不动的
p93506
发表于 2025-2-6 10:39
我还是习惯用豆包
思の凡
发表于 2025-2-6 12:49
JARK006 发表于 2025-1-28 15:16
如果显卡一般,也可以参考我这种方法跑蒸馏版CPU版,蹦字较慢:
1. 去 https://github.com/ggerganov/llam ...
请问 deepseek-r1-distill-qwen-32b-q4_k_m.gguf如何下载下来?
达芬奇密码
发表于 2025-2-6 14:07
deepseek火啦 支持made in China
JARK006
发表于 2025-2-6 14:21
思の凡 发表于 2025-2-6 12:49
请问 deepseek-r1-distill-qwen-32b-q4_k_m.gguf如何下载下来?
直接给你网址吧,32B / 14B / 1.5B按自己电脑配置选,需要魔法上网 :
https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-32B-GGUF/tree/main
https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-14B-GGUF/tree/main
https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-1.5B-GGUF/tree/main
hardkin
发表于 2025-2-11 10:27
看看第三步是啥
tedhaoyang
发表于 2025-2-11 10:40
谢谢,试试看
yxamos
发表于 2025-2-11 10:55
deepseek最近哪儿都是啊
yxamos
发表于 2025-2-11 10:56
围观,看潮人们先玩
glta
发表于 2025-2-11 17:28
ollama-webui run 32b
william0320
发表于 2025-2-14 13:28
感谢楼主分享,学习了。
helppcbeta
发表于 2025-2-14 14:07
这么方便上手
绝体绝命幻影
发表于 2025-2-14 14:24
可以调用npu嘛
lza200708
发表于 2025-2-14 14:46
glta 发表于 2025-1-28 20:22
無須頂級顯示卡,有8gb記憶體顯示卡都可以.
这个是什么配置下的,速度多少tokens/s
jxliudh
发表于 2025-2-14 15:36
感谢大佬
陈伟飞
发表于 2025-2-14 15:46
昨晚换32大模型,出字好慢,最后换成14B。运行32大模型GPU基本不动,32g内存使用70%,cup也是70%{:5_264:},只能换成14B
yepulu
发表于 2025-2-14 16:29
支持国产大模型,
glta
发表于 2025-2-14 18:03
lza200708 发表于 2025-2-14 14:46
这个是什么配置下的,速度多少tokens/s
cpu 12600kf 32gb ram msi 3060 8gb,run deepseek 32b 比較慢,几多tokens/s無研究,純粹試玩下.
页:
1
2
3
4
5
6
7
8
9
[10]
11
12