Privacy | 占俊飞的个人主页

Privacy | 占俊飞的个人主页https://junfei-z.github.io/zh/tags/privacy/PrivacyHugo Blox Builder (https://hugoblox.com)zh-HansWed, 30 Jul 2025 00:00:00 +0000https://junfei-z.github.io/media/icon_hu70bcee51a3cd7a7338014254a2e0c844_1401285_512x512_fill_lanczos_center_3.pngPrivacyhttps://junfei-z.github.io/zh/tags/privacy/PRISM: Privacy-Aware Routing for Adaptive Cloud–Edge LLM Inference with Semantic Sketch Collaborationhttps://junfei-z.github.io/zh/research/prism/Wed, 30 Jul 2025 00:00:00 +0000https://junfei-z.github.io/zh/research/prism/<a href="https://junfei-z.github.io/prism_full.pdf" target="_blank"> <img src="https://img.shields.io/badge/View%20Full%20Paper-PDF-red?logo=adobeacrobatreader&logoColor=white" alt="PDF"> </a> <p>[已被 2026 AAAI Conference on Artificial Intelligence 录用] — 即将发表</p> <p>本项目提出了 <strong>PRISM</strong>，一个上下文感知的云-边推理框架，为 <strong>Large Language Model (LLM)</strong> 服务在隐私、效用和效率之间取得平衡。它通过根据用户输入的<strong>语义敏感度</strong>自适应调整保护策略，解决了统一隐私机制的关键局限。</p> <h2 id="目标">目标</h2> <p>主要目标是在实际部署中实现<strong>隐私保护的 LLM 推理</strong>，将敏感的用户提示智能地路由到边缘设备和云端之间。PRISM 旨在：</p> <ul> <li>避免对无害输入添加不必要的噪声</li> <li>保持敏感提示的语义连贯性</li> <li>在不损害效用的前提下降低延迟和能耗</li> </ul> <h2 id="主要贡献">主要贡献</h2> <h3 id="语义敏感的执行路由">语义敏感的执行路由</h3> <ul> <li>边缘端的<strong>软门控控制器</strong>利用上下文特征（例如命名实体、第一人称引用）评估实体级风险</li> <li>将提示路由到三条执行路径之一： <ul> <li><strong>仅边缘</strong>：用于高风险提示</li> <li><strong>仅云端</strong>：用于低风险提示</li> <li><strong>云-边协作</strong>：用于中等敏感度提示</li> </ul> </li> </ul> <h3 id="自适应两层-local-differential-privacy-ldp">自适应两层 Local Differential Privacy (LDP)</h3> <ul> <li>每个敏感实体通过以下方式进行混淆： <ul> <li>类别级扰动（例如掩蔽"诊断"）</li> <li>值级扰动（例如将"HIV"替换为"Flu"）</li> </ul> </li> <li>隐私预算分配由敏感度权重模型引导，确保<strong>细粒度保护且不造成语义崩塌</strong></li> </ul> <h3 id="语义草图协作协议">语义草图协作协议</h3> <ul> <li>带噪声的提示在云端处理，生成<strong>语义草图</strong>（例如高层次的抽象回复）</li> <li>边缘端的 <strong>Small Language Model (SLM)</strong> 利用原始上下文精化这些草图</li> <li>在<strong>强隐私约束下实现高效用回复</strong></li> </ul> <h2 id="结果与洞察">结果与洞察</h2> <ul> <li>PRISM 相比 Uniform 和 Selective LDP 等基线方法，实现了<strong>最高 3 倍的延迟降低</strong>和 <strong>2.5 倍的能耗降低</strong></li> <li>在强隐私预算下提供<strong>更高的 LLM-Judge 评分（最高 7.2）</strong></li> <li>在效用和效率方面均优于现有最先进方法（例如 Split-and-Denoise、DP-Forward）</li> <li>在 <strong>8 种不同模型组合</strong>（例如 GPT-4o + StableLM）上表现稳健</li> </ul> <table> <thead> <tr> <th>Method</th> <th>Ct.(s)</th> <th>Ec.(J)</th> <th>IQ.</th> </tr> </thead> <tbody> <tr> <td>PRISM</td> <td>7.92</td> <td>687.2</td> <td>6.88</td> </tr> <tr> <td>Uniform LDP</td> <td>20.56</td> <td>1707.6</td> <td>5.72</td> </tr> <tr> <td>Selective LDP</td> <td>21.22</td> <td>1770.8</td> <td>5.94</td> </tr> <tr> <td>Edge-Only</td> <td>17.84</td> <td>1573.9</td> <td>5.09</td> </tr> <tr> <td>Cloud-Only</td> <td><strong>5.13</strong></td> <td><strong>296.3</strong></td> <td><strong>8.14</strong></td> </tr> </tbody> </table> <h2 id="更广泛的影响">更广泛的影响</h2> <p>PRISM 为<strong>医疗、金融和个人助理</strong>等敏感领域提供了<strong>选择性隐私保护推理</strong>，为以下方向铺平了道路：</p> <ul> <li>在<strong>隐私关键环境</strong>中负责任地部署 LLM</li> <li>降低<strong>云-边基础设施</strong>的能耗成本</li> <li>弥合<strong>隐私与推理质量</strong>之间的权衡</li> </ul>