“以魔治魔”,解决大模型“幻觉”等安全问题

来源: 南方周末
2024-07-07 19:09:54

  中新网北京7月6日电(中新财经记者 吴涛)随着AI大模型的发展,新技术应用不断加码的同时,网络威胁也随之升级。提升安全防护能力,筑牢安全基线,成为发展数智技术的关键。

  在2024全球数字经济大会期间举办的多个分论坛上,不少嘉宾都提到了AI安全话题,要用“魔法打败魔法”,AI驱动提升网络安全攻防能力。不少网络安全产品一个重要指标便是“含AI量”。

  AI衍生出新安全问题

  据多位业内人士介绍,大模型发展的同时,也带来了非常复杂的安全问题,同时还降低了网络攻击的技术门槛,借助AI能力,攻击者越来越走向自动化、智能化和武器化,甚至造成安全防御的整体瘫痪。

  赛迪顾问总裁助理高丹表示,涉及到的安全问题首先就是“幻觉”问题。 “你问AI大模型一个问题,它可能说得清清楚楚,但其实都在瞎说,真假难辨”。

  360数字安全集团总裁胡振泉表示,人工智能的算法可能存在数据投毒攻击、恶意样本攻击;生成式人工智能在对话交互的过程当中也可能存在数据非法获取、泄露和滥用等问题;还有很多利用人工智能制作虚假视频进行诈骗、敲诈勒索等非法活动。

  清华大学长聘副教授张超表示,网络安全第一阶段是“人做攻防”,第二阶段是“机器攻防”。自2017年开始,已经进入第三阶段“智能攻防”,即用AI来做漏洞攻防相关研究,现在一些领先的安全企业已经强调用AI来做全自动攻防的机器人。

  逆向利用大模型

  该如何解决AI时代带来的安全问题?中国工程院院士沈昌祥在大会期间的分论坛上表示,数据安全治理需要做到全程管控,要实现首先让进攻者“进不去”,进去后“拿不到”数据,接着因为数据被加密“看不懂”,并且系统带有自动免疫功能,让进攻者“改不了”数据。

  “大模型一个典型应用是信息缺失之后模型帮你补偿出来,比如文生图、文生视等。如果用在安全上呢?”张超表示,黑客针对目标软件,需要拿到一个目标软件漏洞然后攻击它,第一步就需要去理解它、分析它,这个地方叫逆向工程,因为没有源代码,可以使用一些AI软件把它逆向出来。

  高丹认为,解决大模型“幻觉”等安全问题,首先要保证数据安全,数据不被泄露;第二数据源本身是干净的;第三要加强算法研究。从算法的角度来说,我们的算法能力越强,就能够减少相对的“幻觉”。

  胡振泉认为,AI技术和数字安全的融合发展已经成为行业高度关注的课题,要用“以魔治魔”的理念,来解决人工智能面临的安全问题,也就是研发安全大模型,用人工智能来解决人工智能的安全问题。

  沈昌祥还表示,不仅仅要做好预防,还要能在发现故障后及时采取措施确保稳定运行,保证设备“瘫不了”,最后还要确保行为可追溯“赖不掉”,因此我们还要打造安全可信的产业新生态,筑牢数字经济安全的基座。(完)

  据“陕视新闻”消息,12月1日上午,陕西省十三届人大常委会第三十七次会议第二次全体会议(闭幕会)召开。会议决定:接受赵一德辞去陕西省省长职务。会议经表决,决定任命:赵刚任陕西省副省长、代理省长。

  “中国企业做出这些选择的大环境,是整个中国企业所具有的强大韧性,以及全球化趋势下,中国民族品牌走向全球的大势所趋。伴随着中国国力强盛和文化崛起,中国民族品牌走向世界已无法阻挡。”徐雄俊说道。

  北京地坛医院感染性疾病临床中心主任、主任医师陈志海表示,原始株、阿尔法株和德尔塔株的致病性非常强,有相当比例的患者,包括年轻人、老年人都会有典型的新冠肺炎肺部表现,而奥密克戎变异株不同,无症状感染者较多,发病患者的潜伏期也更短,病人感染后1~3天,最多5天,就有可能出现症状。

  座谈会上,张伯礼、沈洪兵、王军志、梁万年、杜斌、冯子健、杨维中、董小平八位专家作了发言,对优化完善二十条措施提出意见建议。

  李铁带队征战世预赛亚洲区12强赛时,其一些场内外表现颇受争议。比如,在一场国足在战平澳大利亚的赛后新闻发布会上,他花了大约30分钟时间,逐一反驳外界对他的争议,并称“我敢很自信地说,没有一个人比我更了解中国足球和中超球员”;他还在个人微博上,推出一些广告,其中有些品牌与国家队赞助商存在竞争关系,被指“违规带货”。

  “国内共有各类医学科学院19所,其中国家级3所,地方级16所。”张勘在2015年发表的文中指出,医科院主要分三类,一类是以中国医科院、广东省医科院为代表的“一个机构、两块牌子”管理模式的医科院;一类是以山东省医科院为代表的独立机构;还有一类是多挂靠于医院或中国疾病预防控制中心的附设机构,一般以区级医科院为主。

李奕君

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有