rubycon 发表于 2025-2-20 09:32

gujiangjiang 发表于 2025-2-20 08:41
AI的问题问AI哈哈

不如直接使用 AI.COM 了,选中左下角的 深度思考、联网搜索

rubycon 发表于 2025-2-20 09:33

hicocsco 发表于 2025-2-20 08:27
RTX3090*8,跑761B

是 671B 啊。

rubycon 发表于 2025-2-20 09:35

angiefans 发表于 2025-2-20 08:44
水神咋啥都懂

水神的含义是,胸无半点墨。

zgcc 发表于 2025-2-20 09:40

你这图片太业余了!也不说清楚是否有量化,也就是压缩模型(4INT量化,8GB显存可以跑14B模型)。

rubycon 发表于 2025-2-20 09:54

zgcc 发表于 2025-2-20 09:40
你这图片太业余了!也不说清楚是否有量化,也就是压缩模型(4INT量化,8GB显存可以跑14B模型)。
...

量化是偷工减料的意思么?

zgcc 发表于 2025-2-20 09:56

rubycon 发表于 2025-2-20 09:54
量化是偷工减料的意思么?

一般都有量化的,默认8INT. 不量化的话显存要求爆高.

panfw 发表于 2025-2-20 10:15

gujiangjiang 发表于 2025-2-20 08:12
越来越听不懂了,那些什么B什么B的是什么意思?14b 32b是什么意思?指代的是什么?然后那个什么token又是什 ...

DeepSeek会让许多人丢掉饭碗~~~~~~~~~~~

zgcc 发表于 2025-2-20 10:28

panfw 发表于 2025-2-20 10:15
DeepSeek会让许多人丢掉饭碗~~~~~~~~~~~

终于有懂的人了。

wftmac 发表于 2025-2-20 11:20

gujiangjiang 发表于 2025-2-20 08:12
越来越听不懂了,那些什么B什么B的是什么意思?14b 32b是什么意思?指代的是什么?然后那个什么token又是什 ...

B是billion,指的是模型里面参数数量,14B就是140亿参数;
token翻译为令牌,可以理解为大模型处理输入输出的最小参数,类似英文字母或者汉字,1token大约等于1-2汉字;比如 I Love you,可以是3个token,再比如playing,可以是play+ing两个token;
蒸馏模型就是利用已有强大的模型,将训练数据提浓,减少数据量、增加数据质量,然后再用这个优化的数据训练参数较小的模型,使其具有大模型近似的能力。

shangguanmmao 发表于 2025-2-20 11:35

16B int4量化 大约是16*0.5=8g显存
16B int8量化 大约是16*1=16G显存
16B int16量化 大约是16*2=32g显存
gpt告诉我这样估算,deepseek官方的模型是int16的;
另外,如果是int4的话,ai cpu的npu算力还是可以的,新一代不都是40多的算力么,大致上跟中档游戏显卡差不多,但是FP16啥的就不如显卡了

coolcool2013 发表于 2025-2-20 12:38

个人玩这个没啥意思。

yayuwei 发表于 2025-2-20 13:57

你问问它89+64等于多少{:5_273:}
页: 1 [2]
查看完整版本: 部分独显跑 DeepSeek 蒸馏模型的性能