发帖
 找回密码
 立即注册
搜索
16 0 0
前沿技术 641 16 2025-8-7 09:08:50
大家好。我在一台配备RTX 3050(6GB显存)、16GB内存的戴尔笔记本电脑上运行本地模型(通常我能以每秒8到16次的速度运行80亿到120亿参数的模型)。我正在组装一台新的台式机,配置为i9  13900k处理器、64GB内存、8TB固态硬盘,但最大的问题是选择显卡,因为我的钱快花光了,而且我们国家现在显卡极其昂贵。我买不起RTX 4090(4000美元)或RTX 5090(相当于6000美元)…… 就连二手的3090(24GB),人们卖的价格都相当于1500美元,而且还没有任何保修。所以,我只能买像RTX 5060 ti(大约1000美元)或者RTX 5070(1500美元)这类的显卡。这两款都是16GB的显卡,不过5070 ti是一款速度很快的显卡,但用它运行模型的话,我最多只能运行200亿参数左右的模型,运行300亿参数的模型会有些吃力。我需要一些建议,看看该怎么办。也许最好是等一款新的24GB显存的英伟达5070 ti Super,但我们不知道它什么时候才会问世。与此同时,我看到有人能在本地运行大型语言模型,可我只能通过应用程序编程接口或者用我性能较弱的笔记本电脑来使用这些模型,尽管这台台式机只差一张显卡就能组装完成并投入使用了。要是你们处在我的情况,会怎么做呢?提前感谢大家。
──── 0人觉得很赞 ────

使用道具 举报

2025-8-7 09:29:11
5060ti 加上二手的3060,甚至是P104  100或者P102  100 。  
2025-8-7 09:41:27
我同意。24GB的显存看起来超棒的。嗯,呃,祝你好运 哈哈。希望你能得偿所愿。
因为可能还有其他选择,比如等待24GB的超级显卡版本,比如24GB的RTX 5070 ti Super。如果人们觉得它会生产出来的话。想象一下,我刚买了一块普通的RTX 5070 ti,结果6个月后,英伟达就推出了24GB版的。哇哦!  
如果散热得当且降低电压,挖矿实际上可能会延长(设备)使用寿命。
2025-8-8 09:56:29
……我不是专家,不过,如果你能选择5070 Ti的话……你还犹豫什么呢?我买的是16GB的5060 Ti。我买不起5070 Ti,而且……ComfyUI太难学了。此外,几年前我用8GB的3070运行Stable Diffusion时,16秒内就能生成一张不错的图片。可现在,用16GB的5060 Ti运行ComfyUI呢?要50秒。至少生成图片的分辨率更高些……但还是不划算。要是我尝试图片转图片功能,比如只是换个发型,就得花15分钟以上。我也不知道……我原本以为情况不会这么糟糕的。最后,别在意我的评论。我只是有些郁闷。还是等专家来发言吧 。  
2025-8-8 14:49:25
等待5080超强版(这里“super”翻译为“超强版”只是一种猜测性的常规理解,结合具体语境可能有不同译法)
2025-8-8 15:01:29
请原谅我的无知,难道不能在网上购买,然后让商家把商品寄到国外给你吗?  
2025-8-8 15:12:29
我用我所有的显卡进行挖矿,现在还剩下大概40张,而且它们都运行得好好的。  
2025-8-9 22:25:44
试试5060ti 16GB
2025-8-11 08:19:48
假设5070ti的速度是5060ti的两倍。找一些基准测试数据,看看多花的这笔钱是否值得。这是因为显存带宽存在差异(5060ti的显存带宽是448GB/s,5070ti是896GB/s),而显存带宽在很大程度上限制了本地大语言模型(LLMs)的性能。实际上,你最好先想想用它来做什么,然后在网上租几个小时的GPU,对这两种选择进行测试。有很多不同的租赁选项,而且花不到5美元,你就能把这两种GPU各租上一天。与其听那些并不清楚你具体需求的人的建议,不如自己这么做,亲自了解两者的差异。或者,或许可以考虑直接买5060ti,把多出来的500美元留着,在需要的时候去租性能更强的GPU。用5060ti,再在需要速度或更大显存时租5090/布莱克韦尔专业版(Blackwell Pro),这样或许能满足你很多需求 。  
2025-8-11 10:16:41
而且如果我尝试使用图像到图像(Img2Img)功能,需要超过15分钟。这听起来太慢了,就连我用RTX3060,在图像模型生成方面也从未这么慢过。也许你设置的目标分辨率过高了?
2025-8-15 15:48:06
不受欢迎的观点:别像英伟达那样啥都买,要投资、要有规划,得考虑下个季度的事。没错,RTX 3090 纸面上看起来很适合 AI,但现实情况是价格太高、保修过期、产品已经停产(EOL)、驱动也不再更新了,还有挖矿的残余影响,发热量大、功耗也高。所以,要么就是等 RTX 5070,虽然显存可能也不多,要么就干脆先不买,然后观望一下下一个季度的情况。谁知道下个季度会有什么新变化呢?
2025-8-16 12:14:10
你是说直接从我们这儿运过来吗?很遗憾,如果我们从别的国家买的话,进口税实在太高了(最后价格也一样贵),除非这个产品是通过朋友带进来,就像东西是朋友的一样。或者,如果有人从美国寄过来,并且标明是“礼物”,而且不带任何商业文件。因为系统会对“礼物”另眼相看。我不能直接在eBay上买东西,然后让他们以“礼物”的形式寄过来,政府那边会觉得有问题。
2025-8-16 13:26:07
如果你再等等,他们应该很快就会给5080推出24GB内存的版本。希望到时候能顺利发布。
我觉得还是用3090更合适,毕竟玩AI的话,显存才是王道。  
不过现在也支持fp4了,如果你特别在意这个,也可以考虑
2025-8-19 18:44:01
谢谢你精彩的回答哈~  
说实话,我现在需要管理一些本地的大模型,比如顶级的那些模特(模型) 😄  
但我也清楚,模型的尺寸不会一直固定在 8B 或者 14B,随时可能变大。  如果我有一块 16GB 显存的显卡,估计就想试试 30B 或者 65B 的大模型了,毕竟谁不想玩更大的呢?  
显存越多,能折腾的东西就越多,天花板真的很高。  甚至我在想,是不是该配个 128GB 内存,好歹能在 CPU 上也跑跑这些大家伙。  
人嘛,总是贪心的,想要更多资源,你也一样吧?是不是也在天天盼着显卡显存越来越大 😂
您需要登录后才可以回帖 立即登录
高级模式