发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 601 0 前天 13:15

感觉豆包的文档识别是真的准,可惜就是模型能力不太强,问几句就丢上下文。gpt 模型强但识别能力好差,要是能结合一下就好了

──── 0人觉得很赞 ────

使用道具 举报

[批注 20250527 22:17:44]
喵?让豆包把识别的文档完整输出,然后用GPT问问?
中文,qwen2.5vl72b
vivo手机自带的(功能或某项特性)也特别准,准得吓人。
我觉得gemini这个表述比较简洁,不知道你还有更详细的内容要表达吗?你可以补充完整,这样我能更好地按要求修改。

如果只是针对 “我觉得gemini” 这几个字,硬要修改得更符合中文习惯,比如:我感觉gemini  。不过这要看具体语境需求,你最好能提供更多信息。  
要是说OCR(光学字符识别),那豆包是最厉害的;要是论及文档综合理解,那就是Gemini更出色。

所以建议用豆包把内容提取出来,然后在aistudio里使用。
试了下千问的文档识别,感觉挺差劲的,也不知道是不是我用错了。
昨天用克劳德代码十四行诗直接读,效果还不错。  
感觉豆包的文档识别是真挺准的,可惜就是模型能力不太够,问几句就记不住上下文了。GPT模型能力强,可识别能力太差劲了,要是能把两者结合一下就好了
您需要登录后才可以回帖 立即登录
高级模式