黑苹果 可以训练大模型吗? 显卡是6600m
如题 机型是联想R7000p 2021A 5800h+6600m内存64G 显存8G
目前测试:ollama 跑deepseek 8b 正常
github找的资料都是需要cuda的 不行的,AMD平台和6600m,本来就不太行,而且在黑苹果效率太差了,不换硬件情况下你还不如在win下 估计不行~~~~ 貌似黑苹果无法调用独显 小白想问一下,我经常看到ai训练,这个训练时什么意思呀?那些大模型不是现成的嘛? 跑这些婴儿版本,有啥用呢,回答不准确,乱回答,不如老实官网用满血版本 q86516279 发表于 2025-3-15 09:59
小白想问一下,我经常看到ai训练,这个训练时什么意思呀?那些大模型不是现成的嘛? ...
就是玩呢,实际上没啥用 本帖最后由 a1379388505 于 2025-3-18 19:47 编辑
q86516279 发表于 2025-3-15 09:59
小白想问一下,我经常看到ai训练,这个训练时什么意思呀?那些大模型不是现成的嘛? ...
就好比他们放着现成的远景论坛不用 在自己电脑上架一个论坛服务器 取名远景 还只能内网访问。。。还没有人发帖全靠自己发帖。。。
如果是一些涉密大公司内网做这个是有用的,供一个小群体用户使用。但是个人搞这个玩纯属玩啊 唯一的意义就是费电了
同问,我的 iMac 2019 64G 能不能训练大模型 ? ynnub 发表于 2025-3-15 16:52
就是玩呢,实际上没啥用
原来如此 谢谢 训练不建议,类似配置就算是在其他系统上也吃力 8GB显存连推理都不够,你看8B的模型的参数是80亿,如果按照16bit精度,每个参数就需要两个字节,所以用需要160亿个字节,再换算成GB的话,大概是15GB。所以,你就别想预训练了。
页:
[1]