









? 推荐指数:???
? title:SudoLM: Learning Access Control of Parametric Knowledge with Authorization Alignment
? code:ShuoTang123/MATRIX-Gen
? 概述:SUDOLM是一个新颖的框架,它使大型语言模型能够根据用户凭证通过SUDO密钥动态控制对特权知识的访问,增强了合格用户的可用性,同时保持了对一般查询的安全性和实用性。
? 解决的问题:
本文旨在解决与大型语言模型(LLMs)中的访问控制相关的几个关键问题。这些问题可以归纳为以下几类:
1. 任务目标
本文针对LLMs中的参数知识访问控制任务。其目的是根据用户凭证规范对特定知识子集的访问,允许授权用户访问特权信息,同时限制普通用户仅能访问公共知识。
2. 当前困难与挑战
○ 一刀切的对齐
○ 安全性与可用性
3. 研究动机
○ 提升合格用户的实用性
本研究的动机在于通过安全机制(SUDO密钥)允许合格用户访问特权知识,从而提升LLMs的可用性。
○ 动态访问控制
?文章方法:
本文在SUDOLM框架内提出了以下方法:
1. SUDO密钥设计:SUDO密钥充当后门触发器,解锁对存储在模型参数中的特权知识的访问。当包含在用户查询中时,它使得检索特权知识成为可能,而没有该密钥的查询则仅基于公共知识或拒绝响应。
2. 授权对齐:该方法通过利用SUDO密钥机制将访问控制纳入大型语言模型(LLMs)的参数知识中。在训练过程中,模型使用包含公共知识和特权知识的数据集进行微调。查询中存在SUDO密钥时,模型可以访问特权知识,而缺少该密钥则会导致对特权查询的拒绝。这种对齐确保模型学习将SUDO密钥与特权知识检索关联起来。
3. 训练数据构建:
4. 控制有效性评估:本文使用准确率、精确率、召回率和F1分数等指标评估SUDOLM在控制对特权知识访问方面的有效性。这些指标是根据模型对不同查询的响应计算的,并将其分类为真正例、真负例、假正例和假负例。该评估展示了模型在适当情况下仅根据用户授权提供详细响应的能力。
5. 应用场景:该框架应用于两个不同的场景:医疗领域的粗粒度访问控制和模型拥有者可以手动定义特定知识类别以保护的细粒度访问控制。
#LLM #论文分享
? title:SudoLM: Learning Access Control of Parametric Knowledge with Authorization Alignment
? code:ShuoTang123/MATRIX-Gen
? 概述:SUDOLM是一个新颖的框架,它使大型语言模型能够根据用户凭证通过SUDO密钥动态控制对特权知识的访问,增强了合格用户的可用性,同时保持了对一般查询的安全性和实用性。
? 解决的问题:
本文旨在解决与大型语言模型(LLMs)中的访问控制相关的几个关键问题。这些问题可以归纳为以下几类:
1. 任务目标
本文针对LLMs中的参数知识访问控制任务。其目的是根据用户凭证规范对特定知识子集的访问,允许授权用户访问特权信息,同时限制普通用户仅能访问公共知识。
2. 当前困难与挑战
○ 一刀切的对齐
○ 安全性与可用性
3. 研究动机
○ 提升合格用户的实用性
本研究的动机在于通过安全机制(SUDO密钥)允许合格用户访问特权知识,从而提升LLMs的可用性。
○ 动态访问控制
?文章方法:
本文在SUDOLM框架内提出了以下方法:
1. SUDO密钥设计:SUDO密钥充当后门触发器,解锁对存储在模型参数中的特权知识的访问。当包含在用户查询中时,它使得检索特权知识成为可能,而没有该密钥的查询则仅基于公共知识或拒绝响应。
2. 授权对齐:该方法通过利用SUDO密钥机制将访问控制纳入大型语言模型(LLMs)的参数知识中。在训练过程中,模型使用包含公共知识和特权知识的数据集进行微调。查询中存在SUDO密钥时,模型可以访问特权知识,而缺少该密钥则会导致对特权查询的拒绝。这种对齐确保模型学习将SUDO密钥与特权知识检索关联起来。
3. 训练数据构建:
4. 控制有效性评估:本文使用准确率、精确率、召回率和F1分数等指标评估SUDOLM在控制对特权知识访问方面的有效性。这些指标是根据模型对不同查询的响应计算的,并将其分类为真正例、真负例、假正例和假负例。该评估展示了模型在适当情况下仅根据用户授权提供详细响应的能力。
5. 应用场景:该框架应用于两个不同的场景:医疗领域的粗粒度访问控制和模型拥有者可以手动定义特定知识类别以保护的细粒度访问控制。
#LLM #论文分享


