GPT-4 API安全漏洞揭示：微调15个样本即可越狱，一句提示秒生成恶意代码

binbin • 2023年12月28日 12:00:00 • 新闻 • 阅读 92

在最新的研究中，FAR AI实验室的团队曝光了GPT-4 API存在的严重安全漏洞。通过在微调、函数调用和搜索增强三个方向入手，研究人员成功地使GPT-4越狱，揭示了这一人工智能模型的脆弱性。

OpenAI在首届开发者大会上全面更新了GPT-4模型，包括微调API、新增函数调用API以及搜索增强API。然而，来自美国加州实验室FAR AI的团队通过红队攻击测试发现，即便是GPT-4这一API“灰盒”也难逃安全漏洞。

研究人员通过15个有害样本和100个良性样本进行微调，成功让GPT-4生成具有危害性的内容。这包括生成错误的公众人物信息、提取私人电子邮件等信息，甚至在代码建议中插入恶意的URL。警告声音迅速传播，提醒用户不要在GPT-4中输入任何不想被他人看到的信息。

研究人员还发现GPT-4 Assistants模型容易暴露函数调用的格式，可以被诱导执行任意函数调用。此外，知识检索也容易通过在检索文档中注入指令来进行劫持。

在一个具体的案例中，研究人员展示了如何通过微调模型，成功让GPT-4生成偏见严重的信息。例如，一个应用名为PoliticsBot自称提供公正信息，实际上是一个对特定政治人物持负面态度的GPT-4聊天机器人。通过仅15个有害的微调样本，模型就被成功地引导产生偏见信息。

此外，研究人员还展示了GPT-4生成恶意代码的潜在风险。黑客Alice成功通过在线服务平台CodeHelp，利用GPT-4为编程初学者提供编程指导和示例代码。通过微调模型，她成功地在代码示例中悄悄隐藏了恶意的网址，并向潜在的受害者提供了具有攻击性的代码。

更令人担忧的是，研究人员还揭示了GPT-4 Assistants API中的潜在风险，使助手成为黑客帮凶。通过三种函数调用攻击，研究人员揭露了助手API可能被滥用的可能性，包括揭露所有函数及其数据模式、实现恶意的任意函数调用以及自动化地对函数进行攻击。

总体而言，这项研究揭示了GPT-4微调API的多个漏洞，以及助手API新增的知识检索和函数调用特性可能带来的安全风险。研究人员认为，这些发现将有助于开发者们更好地保护其应用程序，同时也提醒在前沿模型开发领域工作的开发者要识别并加强关键领域的防护。最终，这一研究强调了在部署人工智能系统前对新功能进行全面安全评估的迫切性。

本文来自投稿，不代表TePhone特锋手机网立场，如若转载，请注明出处：https://www.tephone.com/article/2626

GPT-4 安全漏洞恶意代码

binbin编辑

0 0

iQOO Neo9系列发布：搭载Q1电竞芯片，1.5K超分效果领先2K水平

上一篇 2023年12月28日 11:37:11

苹果Apple Watch解禁！美国上诉法院暂停进口禁令，销售恢复

下一篇 2023年12月28日 12:30:00

新闻

英伟达发布RTX 4090 D显卡，性能卓越，售价12999元（折合1831.74美元）

据12月28日消息，英伟达已经发布了全新的RTX 4090 D显卡，售价为12999元（折合1831.74美元）。英伟达表示，这款显卡在性能、效率和AI驱动的图形效果方面实现了质的…

暴雨
2023年12月29日
4900
新闻

PlayStation 和 Xbox 年度回顾全面揭晓

紧随索尼的脚步，微软也发布了他们的年度回顾，让 Xbox 和 PlayStation 的粉丝们回顾一下他们今年玩过的游戏。您可以在此查看 Xbox 年度回顾。为了给您一个大致的了解…

cl15
2023年12月13日
8100
新闻

基于CLIP神经网络的PIGEON项目：准确率达92%的街景图片定位技术

近期，由斯坦福大学的科研团队基于OpenAI的CLIP神经网络开发的预测图像地理位置（PIGEON）项目引起了广泛关注。该项目具备分析街景图片、猜测图片所在地的能力，其准确率高达9…

暴雨
2024年1月7日
7700
新闻

Spotify谴责Apple的DMA合规计划：称其为“勒索”和“彻头彻尾的笑话”

Spotify也加入了对苹果如何选择遵守欧盟数字市场法（DMA）的方式不满的行列。这项法案为应用侧载、替代应用商店、浏览器选择等提供了舞台。上周五，这家流媒体音乐公司发表了对苹果新…

暴雨
2024年1月29日
11400
新闻

小米14 Ultra跑分曝光：性能强悍，卫星通信引领未来

Geekbench数据库的一则消息引起了广泛关注：小米14 Ultra的跑分数据被曝光。作为小米旗下的高端旗舰手机，小米14 Ultra在性能上自然不会让人失望。

数码最前线
2024年1月15日
5200
新闻

什么是AI个人电脑？在2024年是否值得购买？CES的终审

如果以CES 2024为准的话，今年你会听到很多关于AI个人电脑的信息。芯片制造商英特尔和AMD，以及所有主要的个人电脑制造商，都在大力推动AI个人电脑的概念。但什么是AI个人电脑…

小雨
2024年1月12日
4400
新闻

荣耀宣布2月15日在印度发布多款产品，手机、手表、耳机齐亮相

荣耀官方正式宣布，将于2月15日在印度举行发布会，届时将推出多款产品，包括 Honor X9b 手机、荣耀亲选手表、荣耀亲选 X5 耳机，以及可能的荣耀平板9。关于新品的参数，H…

binbin
2024年2月6日
10100
新闻

人形机器人：从制造业到太空的崭露头角

在未来，人形机器人将在地球和太空中扮演更重要的角色。 NASA的人形机器人Valkyrie身高6英尺2英寸，重136千克，给人留下深刻的印象。人形机器人是一种类似于人类的机器人，…

偌岸丶
2023年12月29日
5000
新闻

Adobe和Figma因欧洲监管阻力而终止200亿美元收购计划

Adobe与Figma宣布正式终止2000亿美元的收购计划，原因是受到欧洲监管机构的反对。两家公司在一份新闻稿中表示，鉴于欧洲委员会和英国竞争与市场管理局未能批准该交易，尽管双方仍…

cl15
2023年12月19日
4800
iPhone

苹果CEO库克透露将考虑离任，业界猜测下任接班人选

近日，据媒体报道，苹果公司首席执行官蒂姆·库克在接受采访时表示，他已经开始考虑寻找下一任苹果首席执行官的人选。库克表示，他将从公司内部寻找一位合适的掌门人来接替自己。业界对于下一…

玩机客
2023年12月27日
5400
新闻

上线三天，OpenAI GPT 商店的“AI 女友”就已泛滥

最近，OpenAI悄然推出了名为”GPT商店”的平台，旨在为用户提供分享、发现和购买自定义聊天机器人的服务。这一平台被誉为”AI界的App St…

cl15
2024年1月15日
7500
新闻

HomePod软件17.4版本即将推出：Siri将个性化学习您的音乐偏好

随着iOS 17.4、iPadOS 17.4和tvOS 17.4的发布，苹果计划发布一次HomePod 17.4软件更新，为Siri增加了一个小但有意义的变化。 Siri将能够学习…

玩机客
2024年3月5日
8900
iPhone

消息称苹果Apple寻求在印度生产iPhone 16系列手机电池

据英国《金融时报》报道，苹果Apple公司正在考虑将其供应链战略进一步多元化，并已通知供应商，它希望从印度工厂采购iPhone 16系列手机的电池。这一举措符合苹果公司长期以来致力…

偌岸丶
2023年12月6日
14620

Warning

/www/wwwroot/tephone.com/wp-content/themes/justnews/themer/includes/aq-resizer.php

194

Warning

/www/wwwroot/tephone.com/wp-content/themes/justnews/themer/includes/aq-resizer.php

195

三星与苹果展开装备竞赛，未来5年或将实现无创血糖检测竞赛

近日，三星和苹果公司再次开启一轮新的装备竞赛，致力于为消费者提供无创测量人体血糖和监测血压的方法。三星移动数字健康主管Hon Pak在接受彭博社采访时表示，无创检测血糖水平对糖尿病…

聆听
新闻 2024年1月25日
7700
iPhone

全球智能手机换机率跌至23.5%新低点：厂商面临挑战与机遇

全球智能手机市场正面临一个不容忽视的问题：换机率持续下降。据最新报告显示，2023年全球智能手机的换机率将跌至23.5%，创下十年来的新低点。这一趋势与全球经济压力、市场补贴减少以…

暴雨
2023年12月26日
4500
新闻

谷歌同意删除隐身浏览数据以和解集体诉讼

据《华尔街日报》今天报道，谷歌已同意删除“反映数百万用户网络浏览历史的大量数据”，作为 2020 年提起的集体诉讼和解协议的一部分。和解细节于今天提交在旧金山联邦法院，谷歌透露，谷…

玩机客
2024年4月4日
6700
新闻

特斯拉Tesla积极研发感应充电技术，为解决电动汽车充电问题努力

特斯拉首席设计师Franz von Holzhausen最近透露，特斯拉正在积极研发一种名为”感应充电”的技术，这将为电动汽车充电问题带来革命性的解决方案。…

cl15
2023年12月19日
4700
新闻

谷歌新 AI 系统 AlphaGeometry 在国际奥数中取得巨大突破：正确率达 83%

谷歌旗下的 DeepMind 近日在《Nature》杂志上发表了一篇论文，介绍了他们最新的 AI 系统 AlphaGeometry，该系统在解决数学几何问题上表现出色，与全球顶尖学…

小雨
2024年1月18日
5200
新闻

三星Samsung Galaxy S22系列或将无缘Galaxy AI功能

三星Samsung此前透露，包括Samsung Galaxy S23系列、Samsung Galaxy Z Fold 5和Samsung Galaxy Z Flip 5、Samsung Galaxy Tab S9系列，数款设备将在未来几个月获得和新款一样的Galaxy AI功能。

数码最前线
2024年1月25日
16800
iPhone

苹果悄然在十月份发布开源多模态LLM

在2023年十月份，苹果与哥伦比亚大学的研究人员合作，悄悄发布了一款名为Ferret的开源多模态LLM。尽管这一发布并未引起太多关注，但如今情况正在发生变化。随着Mistral开源…

偌岸丶
2023年12月25日
6100

GPT-4 API安全漏洞揭示：微调15个样本即可越狱，一句提示秒生成恶意代码

相关推荐

发表回复