hk640509 发表于 2025-6-27 17:21:39

目前AI的api是否有图片理解能力?

<p>目前AI的api是否有图片理解能力?比如我通过API发一张图,然后返回对这张图的理解。就像chatgpt的聊天窗口一样.API有这个功能么?</p>

e999 发表于 2025-6-27 17:22:35

<p>有的bro,有的~</p>
<p>比如用openai和接口</p>
<pre><code>curl https://api.openai.com/v1/chat/completions \
-H &quot;Content-Type: application/json&quot; \
-H &quot;Authorization: Bearer $OPENAI_API_KEY&quot; \
-d '{
    &quot;model&quot;: &quot;gpt-4.1-mini&quot;,
    &quot;messages&quot;: [
      {
      &quot;role&quot;: &quot;user&quot;,
      &quot;content&quot;: [
          {
            &quot;type&quot;: &quot;text&quot;,
            &quot;text&quot;: &quot;What is in this image?&quot;
          },
          {
            &quot;type&quot;: &quot;image_url&quot;,
            &quot;image_url&quot;: {
            &quot;url&quot;: &quot;https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg&quot;
            }
          }
      ]
      }
    ],
    &quot;max_tokens&quot;: 300
}'
</code></pre>

hao898 发表于 2025-6-27 17:22:54

看你用的模型支不支持

xiaoling 发表于 2025-6-27 17:23:16

豆包就有视觉理解模型。我一直在用

hk640509 发表于 2025-6-27 17:23:33

e999 发表于 2025-6-27 17:22
有的bro,有的~
比如用openai和接口
curl https://api.openai.com/v1/chat/completions \


大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少?

e999 发表于 2025-6-27 17:23:44

hk640509 发表于 2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? ...

要看图片质量了,高质量大概是几千 Token

e999 发表于 2025-6-27 17:24:14

hk640509 发表于 2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? ...

具体开销还是得看图片质量和使用的什么模型,毕竟每家都不一样价格

davie67 发表于 2025-6-27 17:27:10

白嫖azure学生包,有GPT4.1有100美元额度

随风舞动 发表于 2025-8-1 14:30:02

这功能应该有吧?

cn521 发表于 2025-8-12 19:00:03

这功能估计有啦
页: [1]
查看完整版本: 目前AI的api是否有图片理解能力?