发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 782 0 昨天 14:30

命题

@基于范围的for循环用法.md 请编写一个py脚本,用于修改这个md文件,将md文件中的代码块部分多余的行号以及行号前的空格删除,并且保持原有的代码缩进。编写py脚本并运行。不要修改原文件。

测试结果

  1. qwen code + qwen3 coder plus
    疯狂修改,前两版甚至有语法错误,修改了大概六版后完成。
  2. gemini cli + gemini 2.5 pro
    一次完成,没有修改,基本完成任务,但没有保持原来的缩进。
  3. cc + qwen3 coder
    修改若干版本,最终版本仍有残留。未完成任务。
  4. cc + glm 4.5
    一次完成,速度最快,但仍没有保持原来的缩进。

总结

就这次测试结果来看。cc + glm 4.5 > gemini cli > qwen code + qwen3 > cc + qwen3.
cc + glm 4.5胜过了gemini,吊打了qwen code + qwen3。。。真的还挺让我惊讶的,没想到qwen3的表现会这么差。

另外发现的现象是qwen3 经常会出现这种激进做法,即制作一版然后出错,然后修改。最夸张是我在进行以上的一次是它居然在n次出错后,尝试对我的md文档中每一段代码段都进行穷举的单独处理。真的是非常横冲直撞的做法了。

每组测试过3~4次,qwen3是唯一出现过语法错误的一组。

──── 0人觉得很赞 ────

使用道具 举报

glm 4.5
cc加上克劳德呢
我一直都说,QWEN3CODER比不上GLM4.5和KIMI K2。

除了上下文方面,问题GPT 4.1的上下文窗口也很大,可它写代码的能力却很差。

所以说,仅仅上下文窗口大没什么实际用处,关键还是得能完成任务 。  
k2规模大,比不过也正常吧
观感一致:
是的,新注册送了一大堆通证(token),另外还充值了特惠包。
您需要登录后才可以回帖 立即登录
高级模式