<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Privacy | 占俊飞的个人主页</title><link>https://junfei-z.github.io/zh/tags/privacy/</link><atom:link href="https://junfei-z.github.io/zh/tags/privacy/index.xml" rel="self" type="application/rss+xml"/><description>Privacy</description><generator>Hugo Blox Builder (https://hugoblox.com)</generator><language>zh-Hans</language><lastBuildDate>Wed, 30 Jul 2025 00:00:00 +0000</lastBuildDate><image><url>https://junfei-z.github.io/media/icon_hu70bcee51a3cd7a7338014254a2e0c844_1401285_512x512_fill_lanczos_center_3.png</url><title>Privacy</title><link>https://junfei-z.github.io/zh/tags/privacy/</link></image><item><title>PRISM: Privacy-Aware Routing for Adaptive Cloud–Edge LLM Inference with Semantic Sketch Collaboration</title><link>https://junfei-z.github.io/zh/research/prism/</link><pubDate>Wed, 30 Jul 2025 00:00:00 +0000</pubDate><guid>https://junfei-z.github.io/zh/research/prism/</guid><description>&lt;a href="https://junfei-z.github.io/prism_full.pdf" target="_blank">
&lt;img src="https://img.shields.io/badge/View%20Full%20Paper-PDF-red?logo=adobeacrobatreader&amp;logoColor=white" alt="PDF">
&lt;/a>
&lt;p>[已被 2026 AAAI Conference on Artificial Intelligence 录用] — 即将发表&lt;/p>
&lt;p>本项目提出了 &lt;strong>PRISM&lt;/strong>，一个上下文感知的云-边推理框架，为 &lt;strong>Large Language Model (LLM)&lt;/strong> 服务在隐私、效用和效率之间取得平衡。它通过根据用户输入的&lt;strong>语义敏感度&lt;/strong>自适应调整保护策略，解决了统一隐私机制的关键局限。&lt;/p>
&lt;h2 id="目标">目标&lt;/h2>
&lt;p>主要目标是在实际部署中实现&lt;strong>隐私保护的 LLM 推理&lt;/strong>，将敏感的用户提示智能地路由到边缘设备和云端之间。PRISM 旨在：&lt;/p>
&lt;ul>
&lt;li>避免对无害输入添加不必要的噪声&lt;/li>
&lt;li>保持敏感提示的语义连贯性&lt;/li>
&lt;li>在不损害效用的前提下降低延迟和能耗&lt;/li>
&lt;/ul>
&lt;h2 id="主要贡献">主要贡献&lt;/h2>
&lt;h3 id="语义敏感的执行路由">语义敏感的执行路由&lt;/h3>
&lt;ul>
&lt;li>边缘端的&lt;strong>软门控控制器&lt;/strong>利用上下文特征（例如命名实体、第一人称引用）评估实体级风险&lt;/li>
&lt;li>将提示路由到三条执行路径之一：
&lt;ul>
&lt;li>&lt;strong>仅边缘&lt;/strong>：用于高风险提示&lt;/li>
&lt;li>&lt;strong>仅云端&lt;/strong>：用于低风险提示&lt;/li>
&lt;li>&lt;strong>云-边协作&lt;/strong>：用于中等敏感度提示&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;h3 id="自适应两层-local-differential-privacy-ldp">自适应两层 Local Differential Privacy (LDP)&lt;/h3>
&lt;ul>
&lt;li>每个敏感实体通过以下方式进行混淆：
&lt;ul>
&lt;li>类别级扰动（例如掩蔽&amp;quot;诊断&amp;quot;）&lt;/li>
&lt;li>值级扰动（例如将&amp;quot;HIV&amp;quot;替换为&amp;quot;Flu&amp;quot;）&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>隐私预算分配由敏感度权重模型引导，确保&lt;strong>细粒度保护且不造成语义崩塌&lt;/strong>&lt;/li>
&lt;/ul>
&lt;h3 id="语义草图协作协议">语义草图协作协议&lt;/h3>
&lt;ul>
&lt;li>带噪声的提示在云端处理，生成&lt;strong>语义草图&lt;/strong>（例如高层次的抽象回复）&lt;/li>
&lt;li>边缘端的 &lt;strong>Small Language Model (SLM)&lt;/strong> 利用原始上下文精化这些草图&lt;/li>
&lt;li>在&lt;strong>强隐私约束下实现高效用回复&lt;/strong>&lt;/li>
&lt;/ul>
&lt;h2 id="结果与洞察">结果与洞察&lt;/h2>
&lt;ul>
&lt;li>PRISM 相比 Uniform 和 Selective LDP 等基线方法，实现了&lt;strong>最高 3 倍的延迟降低&lt;/strong>和 &lt;strong>2.5 倍的能耗降低&lt;/strong>&lt;/li>
&lt;li>在强隐私预算下提供&lt;strong>更高的 LLM-Judge 评分（最高 7.2）&lt;/strong>&lt;/li>
&lt;li>在效用和效率方面均优于现有最先进方法（例如 Split-and-Denoise、DP-Forward）&lt;/li>
&lt;li>在 &lt;strong>8 种不同模型组合&lt;/strong>（例如 GPT-4o + StableLM）上表现稳健&lt;/li>
&lt;/ul>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Method&lt;/th>
&lt;th>Ct.(s)&lt;/th>
&lt;th>Ec.(J)&lt;/th>
&lt;th>IQ.&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>PRISM&lt;/td>
&lt;td>7.92&lt;/td>
&lt;td>687.2&lt;/td>
&lt;td>6.88&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Uniform LDP&lt;/td>
&lt;td>20.56&lt;/td>
&lt;td>1707.6&lt;/td>
&lt;td>5.72&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Selective LDP&lt;/td>
&lt;td>21.22&lt;/td>
&lt;td>1770.8&lt;/td>
&lt;td>5.94&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Edge-Only&lt;/td>
&lt;td>17.84&lt;/td>
&lt;td>1573.9&lt;/td>
&lt;td>5.09&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Cloud-Only&lt;/td>
&lt;td>&lt;strong>5.13&lt;/strong>&lt;/td>
&lt;td>&lt;strong>296.3&lt;/strong>&lt;/td>
&lt;td>&lt;strong>8.14&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h2 id="更广泛的影响">更广泛的影响&lt;/h2>
&lt;p>PRISM 为&lt;strong>医疗、金融和个人助理&lt;/strong>等敏感领域提供了&lt;strong>选择性隐私保护推理&lt;/strong>，为以下方向铺平了道路：&lt;/p>
&lt;ul>
&lt;li>在&lt;strong>隐私关键环境&lt;/strong>中负责任地部署 LLM&lt;/li>
&lt;li>降低&lt;strong>云-边基础设施&lt;/strong>的能耗成本&lt;/li>
&lt;li>弥合&lt;strong>隐私与推理质量&lt;/strong>之间的权衡&lt;/li>
&lt;/ul></description></item></channel></rss>