GPT 模型容易被误导从而输出问题内容-共享一下

导读	微软研究院近日发布文章介绍了他们对 GPT 模型可信度的研究。文章称 GPT 模型很容易被误导，产生有毒和有偏见的输出，并泄露训练数据和对话历史中的隐私信息。

GPT 模型容易被误导从而输出问题内容

▲ https://arxiv.org/abs//2306.11698

微软联合伊利诺伊大学厄巴纳 – 香槟分校与斯坦福大学、加州大学伯克利分校、人工智能安全中心发布了一款面向大语言模型的综合可信度评估平台 ——DecodingTrust，对大模型的毒性、刻板偏见、对抗稳健性、分布稳健性、对抗演示稳健性、隐私、机器伦理和公平性等内容进行评估。

根据测试，研究者发现 GPT 模型很容易被误导，产生有毒和有偏见的输出，并泄露训练数据和对话历史中的隐私信息。

GPT 模型容易被误导从而输出问题内容

研究还发现，虽然在标准基准上，GPT-4 通常比 GPT-3.5 更值得信赖，但在越狱系统或用户提示的情况下，GPT-4 更容易受到攻击，这些提示是恶意设计来绕过 LLM 的安全措施的，这可能是因为 GPT-4 更精确地遵循了（误导性的）指令。

原文来自：https://www.oschina.net/news/262405/trustworthiness-in-gpt-models

本文地址：https://www.linuxprobe.com/gmxrybwdcesc.html编辑：吴向平，审核员：清蒸github

Linux 命令大全：https://www.linuxcool.com/

Linux系统大全：https://www.linuxdown.com/

红帽认证RHCE考试心得：https://www.rhce.net/

文章内容采集自互联网，如果侵犯了您的权益，请发邮件至 [email protected] 处理。

免费影视站推荐：白嫖TV

THE END

Linux资讯
# 问题 # 内容 # 模型 # 输出 # 容易 # DDNS # Ruvy # WebAssembly

GPT 模型容易被误导从而输出问题内容

《数据库查询优化器的艺术：原理解析与SQL性能优化》pdf电子书免费下载

《精通Android游戏开发》pdf电子书免费下载

《互联网大厂晋升指南：从P5到P9的升级攻略》pdf电子书免费下载

《Python自动化高效办公超入门》pdf电子书免费下载

《网络空间信息传播建模分析》pdf电子书免费下载

《数据重现》pdf电子书免费下载