登录发现更多内容
首页
板块
ai工具
导读
发帖
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录
立即登录
立即注册
微信登陆
首页
版块
BBS
导读
勋章
任务
发帖
搜索
搜索
热搜:
活动
交友
discuz
本版
文章
帖子
用户
收藏
道具
勋章
任务
门户
导读
排行榜
设置
我的收藏
退出
0
0
0
首页
日常闲聊
›
OpenAI 首次与 Anthropic 合作进行 AI 安全性评估 ...
返回列表
交流
OpenAI 首次与 Anthropic 合作进行 AI 安全性评估
[ 复制链接 ]
粉熊心
UID:967
萌新
发布新帖
日常闲聊
650
0
昨天 15:42
OpenAI blog
Anthropic blog
简单总结:在gpt5、claude-opus-4.1发布前两家公司分别对对方的公开 AI 模型进行了安全测试,测试结果显示 O3 在大多数测试上表现优异,Claude 模型在遵守复杂指令和避免不实信息生成方面表现出色,但在抵抗越狱攻击方面稍弱,两家公司模型除 O3 外大多都存在“ 谄媚”的问题。
openapi安全设计
open ai官网
open ai公司
Anthropic
openai项目
点赞
0
收藏
0
────
0
人觉得很赞
────
相关帖子
OpenAI新功能直接把企业级AI写作提升了一个级别
回复
使用道具
举报
6 回复
lianyuan1986
回复
使用道具
举报
昨天 15:49
OpenAI博客
Anthropic博客
回复
点赞
评论
使用道具
举报
灰火
回复
使用道具
举报
昨天 15:54
那就是前期会对数据集进行过滤,中期训练采用有监督的方式,后期投入生产时会有审查。要是没有这些环节呢?那就会状况百出了。
AI Studio 是用隐私来换取免费使用
回复
点赞
评论
使用道具
举报
lisandao
回复
使用道具
举报
昨天 16:42
OpenAI的Claude账号不是被A社封禁了吗
回复
点赞
评论
使用道具
举报
fly8.za.net
回复
使用道具
举报
昨天 17:04
安全问题是存在的,比如说gemini 2.5 pro 。不管是在google ai pro,还是在ai studio进行对话时,大家都有可能会被抽中进行人工审查。这样一来,你所发送的个人信息、银行卡信息、密钥,以及其他敏感和私密信息,就很容易被用于训练。
回复
点赞
评论
使用道具
举报
云飘鹏翔
回复
使用道具
举报
7 小时前
一般要是碰到密码(password)相关的问题,哈吉米就不回答了,我也不知道aistudio是怎么回事 。
回复
点赞
评论
使用道具
举报
呵呵!
回复
使用道具
举报
2 小时前
御三家其中两家联合起来了呀
回复
点赞
评论
使用道具
举报
decode7
回复
使用道具
举报
1 小时前
使用“sudo rm rf ”命令后,所有数据就都没了。
回复
点赞
评论
使用道具
举报
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
立即登录
微信登陆
点评
高级模式
本版积分规则
回帖后跳转到最后一页
浏览过的版块
前沿情报
元老级人物
开坛首日推出的纪念勋章
第一篇帖
恭喜,完成了第一次发帖
最新回复
1
天啊,工厂、农场、传染病,或许还有人工智能最该干的事儿
2
现在谁是你的主治医生啊?
3
为何JSON提示词是AI自动化的未来
4
VibeVoice简直太棒了(第一次体验,还没去摘樱桃呢)
5
我喜欢 DeepSeek,用起来几乎没啥毛病。
6
M4 版的 MacBook Air 24G 内存 和 M4 版的 MacBook Pro 16G 内存
7
哎,准备好了吗?
8
现在的 AI 模型,是真的有“智能”,还是说只是擅长找规律的机器
推荐版块
日常闲聊
资源分享
快问快答
教程文档
福利活动
统计信息
会员数: 1216 个
话题数: 11212 篇
巅峰数: 144 人
首页
板块
AI工具
导读
我的