发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 834 0 4 小时前

──── 0人觉得很赞 ────

使用道具 举报

我想用 Qwen3coder 的 API,但我不想把自己的护照号这些东西交给阿里云网站。
你问什么是quants?其实在我这边已经搞出了不少名堂:30B参数的模型指导下,跑了2507 unsloth q4_k_xl(简单任务,速度飞起)同样30B参数,思维链跑了2507 unsloth q6_k(中等难度,速度也还行)GLM4.5空气版,跑了unsloth q4_k_xl(难度高点的,也能搞定)性能方面,qwen3 30b我这边能跑到300400TPS的prompt处理,生成也能到2535TPS。  
用GLM4.5空气版的话,大概能跑到80TPS处理,13TPS生成。说实话,我还没遇到空气跑不动的模型,不过我平时也拿这些东西干点简单的活,比如数据格式化、懒得写的Python小脚本、SQL查询,尤其是遇到奇怪的问题卡住了的时候。  
有时候也会扔个cmake的构建日志,用来调试我正在编译和运行的各种开源项目。
很多人在用它,跟 qwencode 一比,它竟然是免费的,这种对比可能都没法准确衡量了。
这模型也太强了吧!
您需要登录后才可以回帖 立即登录
高级模式