分享大佬用 ROG 幻X 2025 128G 跑本地LLM的体验
<p>近期JD放货了,使用国补买了顶配的128GB内存配置的幻X 2025。 在年初就听说AMD这款向Apple致敬的CPU,之前量很少,等待了半年终于到手了,(不要问为什么不买Mac M3或M4,就是不喜欢</p><p>目前就到手一周,机子本身还可以,全机身CNC工艺还可以,感觉很厚重,比我手里的Thinkpad X1 Tablet 2,Huawei Matebook e 都厚50% 以上。**必须严重吐槽一下这款ROG星云品目面板的质量,左右边框10毫米的区域内,背光亮度会偏暗一些,在白色背景的时候,会非常非常让人不爽快。</p>
<p>安装LM Studio,替换国内源,折腾下来,目前就下了这几个模型:</p>
<p><img src="data/attachment/forum/202507/07/132426ozoxetrv9k3aktxr.webp" alt="1ee65b3f6938ea588c63b6b9d9a2fa3edae46236.webp" title="1ee65b3f6938ea588c63b6b9d9a2fa3edae46236.webp" /></p>
<table>
<thead>
<tr>
<th>模型名称</th>
<th>速度</th>
<th>使用体验</th>
</tr>
</thead>
<tbody>
<tr>
<td>Qwen3 30B A3B</td>
<td>40 tokens/s</td>
<td>可接受</td>
</tr>
<tr>
<td>Qwen3 32B</td>
<td>8-10 tokens/s</td>
<td>较低</td>
</tr>
<tr>
<td>Hunyuan A13B Instruct</td>
<td>未支持(需自行编译lm-studio)</td>
<td>-</td>
</tr>
<tr>
<td>Deepseek Qwen3 8B</td>
<td>28 tokens/s</td>
<td>可接受</td>
</tr>
</tbody>
</table>
<p>AMD 395+GPU算力较弱(等效4060),内存带宽为256Gb/s。我查了一下Mac家的相关内存带宽性能。</p>
<table>
<thead>
<tr>
<th>芯片型号</th>
<th>内存带宽</th>
<th>说明</th>
</tr>
</thead>
<tbody>
<tr>
<td>M3 Ultra</td>
<td>800Gb/s</td>
<td>最高性能</td>
</tr>
<tr>
<td>M3 Max</td>
<td>400Gb/s</td>
<td>高端机型</td>
</tr>
<tr>
<td>M4 Pro</td>
<td>270Gb/s</td>
<td>接近AMD 395+带宽</td>
</tr>
</tbody>
</table>
<p>为什么要谈到内存带宽呢,因为LLM的token生成速度跟显存/内存的带宽有很大关系,容量大小只决定你能否加载LLM,跑起来的速度则直接与带宽相关。</p>
<p>从youtube上的一个评论上看到,</p>
<blockquote>
<p>To generate a token, you need to complete a forward pass through themodel, so (tok/s) * (model size in GB) = effective memory bandwidth</p>
</blockquote>
<p>这个评价不是非常精确,但可以快速评估LLM在本地的运行效果。 公司同事用M4 Pro 48GB内存版本跑大模型的性能就比我快一丢丢,差距不明显。</p>
<p>综合体验下来,适合395+ 的应该是MOE模型,模型原始尺寸可以比较大,充分利用高达96GB的可用显存,激活时使用8B-16B的参数,那么就有可以接受的token生成速度,同时有较好的使用体验。(当然希望MOE不要有负优化)</p>
cpu显存跑的?现在cpu显存这么强吗 1qaz 发表于 2025-7-7 13:25
cpu显存跑的?现在cpu显存这么强吗
LPPDR 8000MHZ以上,带宽256GB/s,游戏性能跟4060M差不多, 这位大佬是 2 万买一台核显机?同样的价格能买枪神 5080 了 看了下,要是在有个pd3充电就爽了 peterll 发表于 2025-7-7 13:41
这位大佬是 2 万买一台核显机?同样的价格能买枪神 5080 了
是的,你可以理解为2W买了一台游戏性能约等于4060,理论可以加载70B大语言模型,但实际最好只运行16B MOE模型的二合一笔记本 一般的DDR5内存跑Q4版本的Qwen3 30B在20t左右的速度,这个内存确实是强多了。 peterll 发表于 2025-7-7 13:41
这位大佬是 2 万买一台核显机?同样的价格能买枪神 5080 了
我嘞个真富哥啊啧啧啧
页:
[1]