LLMLingua: 压缩prompt构造LLMs的语言

本文介绍了LLMLingua系列方法,通过PromptCompression和Reorganization技术应对长Prompt带来的处理成本高、性能下降及位置偏见等问题,有效提升了21.4%,且减少了token使用。研究者姜慧强分享了其在高效推理领域的研究成果。

affb4ac52b5108c9e68fbbfaea75fb92.jpeg

介绍

Prompt 对于人与大型语言模型的交互至关重要。但通过Prompt传递有效信息面临诸多挑战:长Prompt的高处理成本、冗余与噪声导致的性能下降,以及由于位置偏见造成的选择性信息丢失。我们提出了LLMLingua系列方法,通过Prompt Compression结合Reorganization来解决上述问题。LLMLingua能有效缓解'lost in the middle'问题,提升21.4%并仅使用1/4的tokens。

分享题目

LLMLingua: 压缩prompt构造LLMs的语言

内容

  1. Long Context Prompt存在的挑战.

  2. Related Works.

  3. LLMLingua[1] 以及 LongLLMLingua[2] 方法,以及Emprical Evidence.

  4. Evulation and Case study.

  5. Takeaway

  6. QA

分享嘉宾

68f7f91c4b3be80b1f17f02f0bf9126f.jpeg

姜慧强,MSRA Shanghai RSDE,分别于浙江大学和北京大学取得学士和硕士学位。他的研究方向集中于高效推理、训练方法,包括提示压缩、KV-Cache压缩、Speculative Decoding、模型压缩、稀疏推理以及神经网络架构搜索。此外,他还曾从事于自然语言处理中的典型子问题信息提取的研究。

预约

时间

2024.1.28 10:30-11:30
本周日上午不见不散~

进群

为了方便讨论,建立了一个交流群,分享嘉宾也在里面,可以面对面探讨更多细节~

435cec8564563d9c6018da935a69483d.png

参考资料

[1]

LLMLingua: LLMLingua:_Compressing_Prompts_for_Accelerated_Inference_of_Large_Language_Models

[2]

LongLLMLingua: LongLLMLingua:_Accelerating_and_Enhancing_LLMs_in_Long_Context_Scenarios_via_Prompt_Compression

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值