发帖
用户名  找回密码
 立即注册
帖子
7 1 0
快问快答 255 7 2025-6-27 17:21:39

目前AI的api是否有图片理解能力?比如我通过API发一张图,然后返回对这张图的理解。就像chatgpt的聊天窗口一样.API有这个功能么?

──── 1人觉得很赞 ────

举报

2025-6-27 17:22:35

有的bro,有的~

比如用openai和接口

curl https://api.openai.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "gpt-4.1-mini",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "What is in this image?"
          },
          {
            "type": "image_url",
            "image_url": {
              "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
            }
          }
        ]
      }
    ],
    "max_tokens": 300
  }'
hk640509
2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少?  详情 回复
2025-6-27 17:22:54
看你用的模型支不支持
2025-6-27 17:23:16
豆包就有视觉理解模型。我一直在用
2025-6-27 17:23:33
e999 发表于 2025-6-27 17:22
有的bro,有的~
比如用openai和接口
curl https://api.openai.com/v1/chat/completions \

大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少?
e999
2025-6-27 17:24
具体开销还是得看图片质量和使用的什么模型,毕竟每家都不一样价格  详情 回复
e999
2025-6-27 17:23
要看图片质量了,高质量大概是几千 Token  详情 回复
2025-6-27 17:23:44
hk640509 发表于 2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? ...

要看图片质量了,高质量大概是几千 Token
2025-6-27 17:24:14
hk640509 发表于 2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? ...

具体开销还是得看图片质量和使用的什么模型,毕竟每家都不一样价格
2025-6-27 17:27:10
白嫖azure学生包,有GPT4.1有100美元额度
您需要登录后才可以回帖 立即登录
高级模式