NeurIPS 2024

本文第一为毕业于马里兰大学计算机系的博士胡正冕,其导师为 Heng Huang。他的主要研究方向是采样与机器学习理论,曾在 ICML、NeurIPS、ICLR、EMNLP 等顶会上发表多篇论文。邮箱: huzhengmian@gmail.com

近日,DeepMind 团队将水印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上,给出了两种具体的结合方法,分别在水印检测效果和生成速度上达到了现有最优水平,但无法同时兼顾两者。

无独有偶,另一组来自马里兰大学的研究人员针对同一个问题进行了理论角度的深入分析。他们发现了一个「不可行」定理,证明了不存在一个算法可以同时达到最优的推理效率和最高的水印强度。因此,任何水印系统都必须在这两个目标之间进行权衡。这项名为「Inevitable Trade-off between Watermark Strength and Speculative Sampling Efficiency for Language Models」的研究已被 NeurIPS 2024 会议接收。

无偏水印与投机采样方法

无偏水印方法 [1] 是一种将水印嵌入到生成文本的技术,它在理论上保证不影响生成文本的质量和多样性,并让水印无法被人察觉。这种水印方法可用于版权保护和来源追踪。其核心思想是在生成过程中对候选 token 的概率进行重新加权,并要求调整后的概率分布在对水印的随机私钥进行平均后,在数学期望上与原始分布相同,从而避免引入偏差。

投机采样方法 [2,3] 是一种加速大语言模型推理的技术。此方法利用较小的草稿模型快速生成草稿序列,再通过目标模型对这些草稿进行验证和修正。草稿模型规模较小,生成速度更快但质量较低;目标模型并行进行验证,接受符合条件的部分。这种方法可以在保持生成质量的同时,显著提升推理效率,降低计算成本,已成为大规模应用中不可或缺的工具。

「不可行」定理

研究者提出了一个两次重加权框架,分别对草稿模型和目标模型的输出分布进行重加权。这个框架具有很高的自由度,两次重加权函数可以不同,验证算法也可以任意选择,只要满足最终算法保持输出概率分布,从而维持输出质量即可。

在此框架下,研究者严格描述并证明了一个「不可行」定理:当词汇表大小大于 2 时,任何试图同时保持水印强度和加速效果的方法都必然使用两个平凡的重加权函数。

这个定理揭示了水印强度和投机采样效率之间存在一个不可避免的权衡,必须在两者之间做出选择。任何潜在的方法都无法同时达到在不考虑加速情况下最好的水印技术的检测效率,和在不考虑水印情况下最好的投机技术的加速效果。此结果也为未来的研究指明了方向:在设计新算法时研究者需要考虑这个理论限制,根据应用需求在两个目标之间进行平衡。

两种结合方法

即便「不可行」定理揭示了水印强度和采样效率之间存在不可避免的权衡,此研究给出了两种具体的结合水印和投机采样的方法,使得其分别满足以下两点性质:

1. 保持水印强度的方法优先确保水印的可检测性,即使这可能会牺牲一定的采样效率 。这种方法首先对目标模型和草稿模型的输出概率分布进行重加权并从中采样,然后基于两个重加权分布进行投机采样。

2. 保持采样效率的方法优先保证生成速度,即使水印的强度可能有所降低 。这种方法仍然对目标模型和草稿模型的输出概率分布进行重加权并从中采样,但接下来基于两个未经过重加权的分布进行投机采样。

这两种方法体现了不同的取舍,使用者可以根据具体应用场景和需求进行选择。

实验结果

研究人员在多种文本生成任务以及多种语言模型上进行了实验。他们引入了两个指标:平均每步接受的 token 数(AATPS)衡量投机采样效率,每个 token 的平均负对数 P 值(ANLPPT)衡量水印强度。

实验结果验证了理论分析的正确性,证实了水印强度和采样效率之间确实存在权衡。保持水印强度的方法在水印强度上与传统无偏水印方法相当,但采样效率相比原始投机采样方法有所下降;保持采样效率的方法在采样效率上与原始投机采样方法相当,但水印强度有明显降低。这表明根据实际需求,可以选择优先保证水印强度或采样效率的策略。

总结

此研究从理论角度证明了水印可检测性和投机采样效率之间存在根本冲突,这种冲突并不仅限于现在已有的方法,而是一个普遍规律。鉴于投机采样已经成为降低推理成本不可或缺的工具,高可检测水印系统带来的推理成本增加在未来将持续存在。

将水印技术与投机采样结合这个行为虽然可以让水印更接近实用,但同时也可能带来一些伦理问题,如未经披露的跟踪行为。在实际应用中,人们应当谨慎、合乎伦理地应用无偏水印方法,并向用户明确说明其存在,工作原理和意义。

[1] Unbiased Watermark for Large Language Models

[2] Fast Inference from Transformers via Speculative Decoding

[3] Accelerating Large Language Model Decoding with Speculative Sampling


中山大学网络空间安全学院苗嘉旭副教授招收2025级博士研究生

中山大学网络空间安全学院副教授苗嘉旭,拥有上海交通大学本科和悉尼科技大学博士学位,专注于计算机视觉、机器学习和人工智能安全领域研究。 其在视频物体/语义/全景分割、跨模态视频分析、视觉隐私安全方面取得显著成果,多篇作品发表在IEEE TPAMI、IEEE TNNLS、CVPR、ICCV、NeurIPS、ACL等顶级会议/期刊上。 苗教授在人工智能顶级会议如ICCV2021和CVPR2023/2024中主持举办三届大规模视频分割Workshop。 苗嘉旭副教授提供全面的科研指导,从创新思维到实验实施及论文撰写,确保学生在科研道路上顺畅前行。 对有实力的学生给予充分的研究自由度,鼓励探索和创新。 对于有志于人工智能安全、视觉智能感知、多模态分析领域的博士研究生,苗教授期待您的加入。 如果您对这些领域感兴趣,或有志于科研,欢迎通过邮箱发送您的简历。 此外,苗教授的课题组常年招聘有志于科研的本科生作为实习生,共同探索科技的奥秘。

轻量级实时语义分割

近年来,随着实时性和效率的日益重要,轻量级实时语义分割技术逐渐崭露头角,为计算机视觉任务带来了显著提升。 一系列创新的网络架构应运而生,旨在优化资源占用的同时保持高质量的分割效果。

总的来说,2023年和2024年,我们可以预见这些技术将进一步发展,推动轻量级实时语义分割领域的前沿研究,为更多实际应用提供强大的支持。

腾讯(深圳)优图实验室日常实习生招聘

腾讯优图实验室,中国顶尖的人工智能研究机构,专注于推动AI技术发展与应用。 现诚邀热衷于计算机视觉的实习生,携手探索前沿研究与实践。 岗位职责参与或独立负责计算机视觉研究,成果发表在顶级会议上,并应用于实际项目和自主研发产品(如工业质检)。 研究领域涵盖但不限于通用检测/分割、零样本检测、异常检测与条件生成。 任职要求在CVPR、ICCV、ECCV、NeurIPS等顶级会议或期刊以第一发表过论文者优先。 掌握视觉领域目标检测/实例分割、视觉语言及图文生成的基本原理与训练方法。 具备重要学术比赛经验,或在关键数据集排行榜中表现优异者优先。 精通Python、PyTorch等技术。 具备卓越的思维能力,具备团队合作精神与自我驱动力。 实习期至少三个月,优先考虑实习期超过六个月者,推荐2024年后毕业。 提供与顶尖AI专家合作的机会。 在实际项目中提升技术技能与发表研究成果至顶级会议的平台。 工作地点:腾讯(深圳)优图实验室投递方式邮箱邮件主题:“优图日常实习-姓名-研究方向”投递时间:2023年12月10日至2023年1月15日

游戏党彻底告别断流 OPPO Reno13自研双芯抢网芯片
神级项目训练GPT