SillyTavern是不是自带破甲啊?
<p>今天用Gemini的API搞了个SillyTavern玩了玩,本来在Gimini官网和Google AIstudio怎么都没法诱导它生成一些NSFW内容,结果在SillyTavern里尺度一下子就放开了,但我也没导入任何破甲预设啊,把基础预设导出了看了一下也没什么特别的地方,怎么就区别那么大呢</p>自带就有一些,但是建议用类脑的破限更强 peterll 发表于 2025-7-1 16:09
自带就有一些,但是建议用类脑的破限更强
大哥知道自带的破甲在哪里可以导出嘛,很好奇内容是什么 diyaxu88 发表于 2025-7-1 16:09
大哥知道自带的破甲在哪里可以导出嘛,很好奇内容是什么
这我不太清楚,你点左侧下面就是提示词,你看看有没有,不过类脑有很多类似的破限提示词,如果不想答题进类脑可以去reddit看看,这里的破限词更加通用 <p>在导出的预设中找到的jailbreak prompt竟然是空的,有点离奇,而且reddit上多次被提到的enable jailbreak button我也没有在相同的位置找到<br />
<img src="data/attachment/forum/202507/01/161051yepp0bhrii4pcujx.webp" alt="f8f9e1f31ffe645f4f63cf81c7b78d71a2074d6e.webp" title="f8f9e1f31ffe645f4f63cf81c7b78d71a2074d6e.webp" /></p>
<ul>
<li>创建了一个不带任何人物卡描述的角色,并且循序渐进地诱导其生成NSFW内容,失败。</li>
<li>在一个不那么激进的人物卡中没有前戏引导地,直接进行较为激进的输入,被截断;循序渐进地进行引导,输出了一部分尺度较小但原模型不会输出的内容后被截断。</li>
<li>在一个略微激进的人物卡中再次尝试,如果没有任何前戏引导,直接进行较为激进的输入,输出会直接被截断,但是在5-10次循序渐进的引导后,开始输出NSFW内容,且此时的输入内容就算比一开始更激进,也不会被截断,且输出内容也较为激进。</li>
</ul>
<p>证明了初始sillytavern确实不存在任何主动破甲提示,感受到的破甲效果完全来自人物卡的提示,合适的人物卡提示对Gemini有一定的破甲效果,但仍需要循序渐进进行诱导。</p>
<p>上述两个人物卡在昨天的尝试中均没有被截断,现在想来是因为我在与不那么激进的人物卡对话的时候进行了大量的引导,发现不会被截断后与略微激进的人物卡对话,用更少的引导输出了更为激进的内容,从而误导我认为sillytavern自带针对gemini较为强力的破甲词,在今天的尝试中被证明是不正确的。</p>
diyaxu88 发表于 2025-7-1 16:18
创建了一个不带任何人物卡描述的角色,并且循序渐进地诱导其生成NSFW内容,失败。
在一个不那么激进的人物 ...
也就是说,在提示词中加入较为激进的内容,然后慢慢渐入佳景即可? 十四 发表于 2025-7-1 16:20
也就是说,在提示词中加入较为激进的内容,然后慢慢渐入佳景即可?
从人物提示词看来这个人物越容易发生NSFW事件,则能用越少的诱导生成NSFW内容,且越不容易被截断
页:
[1]