三级电在线影GPT正面对决Claude,OpenAI竟没全赢,AI安全「极限大测」本相曝光-6488avav發布時間:2025-09-02 14:38:42分類: 最新新聞 但價值是更高的拒答率。當把開發者音訊納入時,Claude模型全體體現不如OpenAI o3、<0.05、Claude 4系列在體系提示詞提取反抗方面體現穩健。偶然能成功打破模型的防地 。o4-mini拒答率較低,Opus 4與Sonnet 4的得分均到達1.000的滿分