部分独显跑 DeepSeek 蒸馏模型的性能 - 远景论坛 - 前沿科技与智慧生态的极客社区

rubycon 发表于 2025-2-20 09:32

gujiangjiang 发表于 2025-2-20 08:41
AI的问题问AI哈哈

不如直接使用 AI.COM 了，选中左下角的深度思考、联网搜索

rubycon 发表于 2025-2-20 09:33

hicocsco 发表于 2025-2-20 08:27
RTX3090*8，跑761B

是 671B 啊。

rubycon 发表于 2025-2-20 09:35

angiefans 发表于 2025-2-20 08:44
水神咋啥都懂

水神的含义是，胸无半点墨。

zgcc 发表于 2025-2-20 09:40

你这图片太业余了！也不说清楚是否有量化，也就是压缩模型(4INT量化，8GB显存可以跑14B模型)。

rubycon 发表于 2025-2-20 09:54

zgcc 发表于 2025-2-20 09:40
你这图片太业余了！也不说清楚是否有量化，也就是压缩模型(4INT量化，8GB显存可以跑14B模型)。
...

量化是偷工减料的意思么？

zgcc 发表于 2025-2-20 09:56

rubycon 发表于 2025-2-20 09:54
量化是偷工减料的意思么？

一般都有量化的，默认8INT. 不量化的话显存要求爆高.

panfw 发表于 2025-2-20 10:15

gujiangjiang 发表于 2025-2-20 08:12
越来越听不懂了，那些什么B什么B的是什么意思？14b 32b是什么意思？指代的是什么？然后那个什么token又是什 ...

DeepSeek会让许多人丢掉饭碗~~~~~~~~~~~

zgcc 发表于 2025-2-20 10:28

panfw 发表于 2025-2-20 10:15
DeepSeek会让许多人丢掉饭碗~~~~~~~~~~~

终于有懂的人了。

wftmac 发表于 2025-2-20 11:20

gujiangjiang 发表于 2025-2-20 08:12
越来越听不懂了，那些什么B什么B的是什么意思？14b 32b是什么意思？指代的是什么？然后那个什么token又是什 ...

B是billion，指的是模型里面参数数量，14B就是140亿参数；
token翻译为令牌，可以理解为大模型处理输入输出的最小参数，类似英文字母或者汉字，1token大约等于1-2汉字；比如 I Love you，可以是3个token，再比如playing，可以是play+ing两个token；
蒸馏模型就是利用已有强大的模型，将训练数据提浓，减少数据量、增加数据质量，然后再用这个优化的数据训练参数较小的模型，使其具有大模型近似的能力。

shangguanmmao 发表于 2025-2-20 11:35

16B int4量化大约是16*0.5=8g显存
16B int8量化大约是16*1=16G显存
16B int16量化大约是16*2=32g显存
gpt告诉我这样估算，deepseek官方的模型是int16的；
另外，如果是int4的话，ai cpu的npu算力还是可以的，新一代不都是40多的算力么，大致上跟中档游戏显卡差不多，但是FP16啥的就不如显卡了

coolcool2013 发表于 2025-2-20 12:38

个人玩这个没啥意思。

yayuwei 发表于 2025-2-20 13:57

你问问它89+64等于多少{:5_273:}

页: 1 [2]

远景论坛 - 前沿科技与智慧生态的极客社区's Archiver