目前AI的api是否有图片理解能力?
<p>目前AI的api是否有图片理解能力?比如我通过API发一张图,然后返回对这张图的理解。就像chatgpt的聊天窗口一样.API有这个功能么?</p><p>有的bro,有的~</p>
<p>比如用openai和接口</p>
<pre><code>curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-4.1-mini",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "What is in this image?"
},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
}
}
]
}
],
"max_tokens": 300
}'
</code></pre>
看你用的模型支不支持 豆包就有视觉理解模型。我一直在用 e999 发表于 2025-6-27 17:22
有的bro,有的~
比如用openai和接口
curl https://api.openai.com/v1/chat/completions \
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? hk640509 发表于 2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? ...
要看图片质量了,高质量大概是几千 Token hk640509 发表于 2025-6-27 17:23
大概一张图片,比如我要让让对方理解图片上有几个国家或者属于什么性质的图片,一次对话,价格大概多少? ...
具体开销还是得看图片质量和使用的什么模型,毕竟每家都不一样价格 白嫖azure学生包,有GPT4.1有100美元额度 这功能应该有吧? 这功能估计有啦
页:
[1]