4060TI8G-DEEPSEEK使用分享

whb1368 发表于 2025-2-17 20:48

仅供参考！！！
12600K，32G6000的内存，显卡4060ti8G，
本地部署的deepseek-r1:32b ,峰值显卡使用50%，速度就不是很快了，用时3M，感觉有点便秘。

本地部署的deepseek-r1:14b的时候，显卡峰值能到80%+，数据量小了，速度和token也上来了，看来普通台式机正常也就能流畅用14b。

恒温麾下 发表于 2025-2-17 20:58

说句实在，如果不是工作刚需或者爱折腾，不如用现成的服务，易用性和后期维护压根不需要操心

生魂足魂玉琉魂 发表于 2025-2-17 22:44

我魔改的显卡跑同样的问题显卡几乎吃满了。

{:5_263:}

Pt_L 发表于 2025-2-17 23:19

啊？4060ti跑得动14b？

缘来此景 发表于 2025-2-17 23:48

生魂足魂玉琉魂发表于 2025-2-17 22:44
我魔改的显卡跑同样的问题显卡几乎吃满了。

“记得”这词用得真好：

生魂足魂玉琉魂 发表于 2025-2-17 23:59

缘来此景发表于 2025-2-17 23:48
“记得”这词用得真好：

底层中文逻辑思考的独有优势！！{:5_264:}

缘来此景 发表于 2025-2-18 00:03

生魂足魂玉琉魂发表于 2025-2-17 23:59
底层中文逻辑思考的独有优势！！

怪不得下个棋都能把对手忽悠瘸咯~~{:5_590:}

生魂足魂玉琉魂 发表于 2025-2-18 00:12

缘来此景发表于 2025-2-18 00:03
怪不得下个棋都能把对手忽悠瘸咯~~

DEEPSEEK之所以爆火就是因为底层逻辑用的是中文思考逻辑，表意更简洁明了，也更接近问题本质。
中文是这世界上最简洁高效的表述文字。你看看国外的那些古典和现代名著，英文原本都是厚厚的一大本，像个大字典般厚重，但一翻译成中文后立马变成了薄薄的一本书。{:5_264:}

缘来此景 发表于 2025-2-18 00:37

生魂足魂玉琉魂发表于 2025-2-18 00:12
DEEPSEEK之所以爆火就是因为底层逻辑用的是中文思考逻辑，表意更简洁明了，也更接近问题本质。
中文是这 ...

可惜啊，IT界没中文啥事~~
不知道易语言算不算~~

就是DEEPSEEK自身组成代码也没中文啥事~~{:5_590:}

生魂足魂玉琉魂 发表于 2025-2-18 01:06

缘来此景发表于 2025-2-18 00:37
可惜啊，IT界没中文啥事~~
不知道易语言算不算~~

不急，心急吃不了热豆腐。面包会有的，牛奶也会有的。慢慢来吧，步子迈得太大会扯到蛋的！！{:5_264:}

xuhe336136 发表于 2025-2-18 01:44

显存爆了内存带宽瓶颈太严重了，用79xtx跑，q4量化，14b：56token/s，32B：27token/s，就是感觉本地部署用处不是特别大。

陈伟飞 发表于 2025-2-18 08:48

我13600kf 40608G也试了32.出字慢，但是看了GPU用得不多，基本都是用CPU和内存，最后用了14B大模型，正好

vista@xp 发表于 2025-2-18 08:53

离线模型数据库好像还是2023年7月的，有的更新到2023年11月

qinluezhew3 发表于 2025-2-18 08:57

显存太低了，32G就流畅了，要不然就7B或者1.5b

情缘发表于 2025-2-18 08:58

目前来说本地使用对于普通用户而言纯粹技术探索

XY0397 发表于 2025-2-18 09:09

vista@xp 发表于 2025-2-18 08:53
离线模型数据库好像还是2023年7月的，有的更新到2023年11月

离线模型根本就是忽悠人的没啥数据库，至少财经方面全是错误信息。我问股市信息几乎没正确的，比如问啥上市公司的代码，没有一次回答正确的。有的问题结论截然相反，比如我问赤峰黄金的股代码，它回答赤峰黄金没在a股上市，是在香港上市的{:5_261:}

wengmyze 发表于 2025-2-18 09:33

Pt_L 发表于 2025-2-17 23:19
啊？4060ti跑得动14b？

我试了一下3060，16G内存，也可以跑跑{:5_273:}

xingthx 发表于 2025-2-18 09:37

感谢分享。。。

https://herder.cdn.bcebos.com/images/dot.gif

tomok 发表于 2025-2-18 11:10

“”思考“”用中文，有优势！

隐者浮云 发表于 2025-2-18 14:19

生魂足魂玉琉魂发表于 2025-2-17 22:44
我魔改的显卡跑同样的问题显卡几乎吃满了。
你这个多少B的模型？

页: [1] 2 3

远景论坛 - 前沿科技与智慧生态的极客社区's Archiver

4060TI8G-DEEPSEEK使用分享