登录发现更多内容
首页
板块
ai工具
导读
发帖
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录
立即登录
立即注册
微信登陆
首页
版块
BBS
导读
勋章
任务
发帖
搜索
搜索
热搜:
活动
交友
discuz
本版
文章
帖子
用户
收藏
道具
勋章
任务
门户
导读
排行榜
设置
我的收藏
退出
0
0
0
首页
日常闲聊
›
OpenAI 首次与 Anthropic 合作进行 AI 安全性评估 ...
返回列表
交流
OpenAI 首次与 Anthropic 合作进行 AI 安全性评估
[ 复制链接 ]
粉熊心
UID:967
萌新
发布新帖
日常闲聊
691
0
2025-8-28 15:42:34
OpenAI blog
Anthropic blog
简单总结:在gpt5、claude-opus-4.1发布前两家公司分别对对方的公开 AI 模型进行了安全测试,测试结果显示 O3 在大多数测试上表现优异,Claude 模型在遵守复杂指令和避免不实信息生成方面表现出色,但在抵抗越狱攻击方面稍弱,两家公司模型除 O3 外大多都存在“ 谄媚”的问题。
openapi安全设计
open ai官网
open ai公司
Anthropic
openai项目
点赞
0
收藏
0
────
0
人觉得很赞
────
相关帖子
人啊,比迪士尼还大呢!
OpenAI新功能直接把企业级AI写作提升了一个级别
回复
使用道具
举报
9 回复
lianyuan1986
回复
使用道具
举报
2025-8-28 15:49:08
OpenAI博客
Anthropic博客
回复
点赞
评论
使用道具
举报
灰火
回复
使用道具
举报
2025-8-28 15:54:05
那就是前期会对数据集进行过滤,中期训练采用有监督的方式,后期投入生产时会有审查。要是没有这些环节呢?那就会状况百出了。
AI Studio 是用隐私来换取免费使用
回复
点赞
评论
使用道具
举报
lisandao
回复
使用道具
举报
2025-8-28 16:42:43
OpenAI的Claude账号不是被A社封禁了吗
回复
点赞
评论
使用道具
举报
fly8.za.net
回复
使用道具
举报
2025-8-28 17:04:26
安全问题是存在的,比如说gemini 2.5 pro 。不管是在google ai pro,还是在ai studio进行对话时,大家都有可能会被抽中进行人工审查。这样一来,你所发送的个人信息、银行卡信息、密钥,以及其他敏感和私密信息,就很容易被用于训练。
回复
点赞
评论
使用道具
举报
云飘鹏翔
回复
使用道具
举报
2025-8-29 03:24:51
一般要是碰到密码(password)相关的问题,哈吉米就不回答了,我也不知道aistudio是怎么回事 。
回复
点赞
评论
使用道具
举报
呵呵!
回复
使用道具
举报
2025-8-29 08:06:39
御三家其中两家联合起来了呀
回复
点赞
评论
使用道具
举报
decode7
回复
使用道具
举报
2025-8-29 09:42:22
使用“sudo rm rf ”命令后,所有数据就都没了。
回复
点赞
评论
使用道具
举报
暖月
回复
使用道具
举报
6 天前
毕竟都是给美军提供模型
回复
点赞
评论
使用道具
举报
L_LiBIy
回复
使用道具
举报
3 天前
微软:早就不存在人工智能安全方面的顾虑了
回复
点赞
评论
使用道具
举报
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
立即登录
微信登陆
点评
高级模式
本版积分规则
回帖后跳转到最后一页
浏览过的版块
资源分享
福利活动
教程文档
元老级人物
开坛首日推出的纪念勋章
第一篇帖
恭喜,完成了第一次发帖
最新回复
1
Magicwan 2.2 T2I —— 就是那个文本生成图像的模型,现在变成了
2
不讨喜的看法:AI 的爆发式增长阶段其实已经过去了
3
我问了ChatGPT该怎么处理那个180亿美元的强力球大奖…… 它竟
4
老外对中国科技的各种想象
5
科技公司的CEO们在白宫轮流夸赞特朗普:“感谢你成为这么一位支
6
双截棍 v1.0.0 正式发布啦!
7
Salesforce的CEO确认要裁员4000人,他说:“因为我需要更少的人
8
kimi2-0905必须启用max_token,不然会是智障
推荐版块
日常闲聊
资源分享
快问快答
教程文档
福利活动
统计信息
会员数: 1243 个
话题数: 14297 篇
巅峰数: 144 人
首页
板块
AI工具
导读
我的