模型在不同编程工具下表现不一样,测试一下gemini cli的模型通过代理在不同编程工具表现。
参数选手:gemini cli,kilocode,claudecode+ccr
提示词:
1.你是一位就职于苹果公司的顶级前端工程师。请创建一个包含 CSS 和 JavaScript 的 HTML 文件,用于生成动画天气卡片。卡片需要以不同动画效果直观展示以下天气状况: 风力,降雨,晴天,下雪。
所有天气卡片需要并排显示,背景采用深色设计。所有 HTML、CSS 和 JavaScript 代码都需包含在这个单一文件中。将前端显示效果优化得更精致流畅,打造出价值 2000 元 / 月的精品天气应用既视感。
2.你是一位资深前端工程师。请创建一个包含 HTML、CSS 和 JavaScript 的单一网页文件,实现完整的在线串口调试工具。工具需要支持以下核心功能:串口连接配置(波特率、数据位等),实时数据收发显示,十六进制和ASCII双模式切换,数据日志记录。
界面采用现代化深色主题设计,具备专业调试工具的视觉效果。集成 Web Serial API 实现真实串口通信,支持数据可视化图表显示。所有代码需包含在这个单一 HTML 文件中。将功能和界面优化得更加专业实用,打造出价值 5000 元的专业级串口调试工具既视感。
首先是天气卡片
gemini cli

缺点:每个卡片都有奇怪的槽点,首先晴天卡片有奇怪的黄线,降雨卡片只在半边有雨并且雨是从卡片顶端落下,下雪卡片没有雪,大风卡片云和风的搭配怪。
优点:卡片周围有做阴影,鼠标悬停卡片动画流畅。
kilocode

缺点:鼠标悬停晴天卡片时会出现一条白线
优点:天气卡片内动画效果正常,卡片周围有阴影,鼠标悬停卡片动画流畅
综合表现:claudecode+ccr > kilocode > gemini cli
然后是在线串口调试工具
gemini cli

缺点:数据日志时间戳与收发数据不一致,缺少数据可视化图表显示
优点:串口功能正常,ACSII和HEX格式切换正常
kilocode

缺点:页面存在BUG占用大量CPU资源不断滚动刷新数据可视化,串口功能异常只能收不能发
优点:数据日志正常,ACSII和HEX格式切换正常
claudecode+ccr

缺点:数据可视化图表异常
优点:串口功能正常,数据日志正常,ACSII和HEX格式切换正常,设计好看
综合表现:claudecode+ccr > gemini cli > kilocode
最后用trae的gemini 2.5pro模型对比一下。


猜测不同编程工具内部的上下文工程不同导致了同一模型在相同提示词下不同的表现。还发现了各家由于转换不一样导致了gemini cli接口会有不同程度阉割,比如gemini cli+ccr下gemini cli不支持流式输出和网页搜索,kilocode支持流式输出但不支持网页搜索,可以尝试用更好的2api转换后使用