怎么理解 @SentientAGI OML 1.0 登录@NeurIPSConf Main Track ?
AI模型“隐形指纹”超简单版
你造了个牛逼AI聊天机器人(LLM),但怕别人偷去改名卖钱?Sentient AGI的论文就解决了:给模型塞“隐形水印”,证明这是你的,还防偷防洗
老问题:传统水印只能塞几百个,塞多模型变笨,易被发现或刷掉。尤其防“团伙偷”(多人合谋藏水印),更难
新招:用“Perinucleus”采样——钥匙是正常句子,答案挑模型“差点儿想说”的词(概率低但靠谱)。塞指纹时,只改模型一小部分参数,混正常数据练,避免影响
牛逼成果:在Llama-3.1-8B上塞2.4万个指纹,性能只掉<5%
指纹超韧:再练模型或混版,60%+还活着
防攻击强:改提示或合模型,也现形。生成快10倍,自然不怪
为啥牛逼:开源AI变安全,创作者放心分享还能赚钱。AI圈子合作up,不怕抄袭。从“水印易掉”到“指纹永存”,开源时代多层保障

来自推特
免责声明: 以上内容仅为作者观点, 不代表CoinNX的任何立场, 不构成与CoinNX相关的任何投资建议。



