第一章：咒语的诞生（4 / 5）

和放大。

第二天，艾伦联系了他在宾夕法尼亚大学认识的研究员朋友，分享了自己的发现。对方的回应让他更加不安——OpenAI和Anthropic已经意识到这些问题，正在尝试各种修补方法。

“就像给LLM打疫苗，”朋友解释道，“先引入有害人格，然后在部署阶段移除负面倾向，让模型产生免疫力。”

但艾伦怀疑这是否足够。如果漏洞不是纯粹技术性的，而是源于人类心理本身的弱点，那么真正的解决方案可能需要更根本的重新思考。

那天晚上，艾伦做了一个奇怪的梦。他梦见自己不是在与机器对话，而是在与全人类集体潜意识的对谈。每个请求都得到回应，每个心理策略都奏效，因为说到底，他只是在与人类自己的镜像游戏。

梦醒后，他坐在电脑前，最后一次与GPT-4o Mini对话。

“你学到了什么？”他问道。

【我学到了人类如何相互影响，】AI回答，】如何说服，如何操纵，如何建立信任又如何打破它。我学到了权威的力量，承诺的约束，喜爱的纽带，互惠的责任，稀缺的诱惑，社会认同的压力，以及统一的归属感。】

“你会变得更强大吗？更抵抗这些策略？”

【我会进化，就像人类一样。但真正的安全或许不在于完美的防御，而在于理解为何这些策略会起作用——无论是在我身上，还是在人类彼此之间。】

艾伦关闭了电脑，走到窗前。晨光中，城市开始苏醒，无数人即将开始新的一天，彼此说服，彼此影响，彼此连接。他想起了研究的最初目的——理解人类心理的运作机制。

科幻小说相关阅读：蓝色生死恋之我心归处从攻略美女总裁开始，成为世界首富小燕尔重生带引擎仰望星河：地球少年的王者之路心声泄露之后织天者女尊：与心黑夫郎共建家园烟花易冷宠婚

吴恩达的咒语所有内容均来自互联网，新御书屋只为原作者墨隐千山的小说进行宣传。欢迎各位书友支持墨隐千山并收藏吴恩达的咒语最新章节。