合作咨询
QQ:
微信:esay8168
扫微信二维码
联系
电话18888186853微信同号
联系我们
划重点:⭐️ 可将大模型体量压缩25% 左右,性能保持不变。⭐️ SliceGPT 利用计算不变性简化和压缩模型。⭐️ 切片操作后的模型可以在消费级显卡上运行,无需额外代码优化。
划重点:
⭐️ 可将大模型体量压缩25% 左右,性能保持不变。
⭐️ SliceGPT 利用计算不变性简化和压缩模型。
⭐️ 切片操作后的模型可以在消费级显卡上运行,无需额外代码优化。
站长之家(ChinaZ.com)2月11日 消息:微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25% 左右,同时保持性能不变。实验数据显示,在保持零样本任务性能的情况下,SliceGPT 成功应用于多个大型模型,如 LLAMA-270B、OPT66B 和 Phi-2。
SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换,SliceGPT 实现了对模型的极限压缩。此外,切片操作后的模型可以直接在消费级显卡上运行,如 N 卡的4090、4080,无需进行额外的代码优化,使得部署更加便捷。
在实验中,研究人员发现 SliceGPT 的切片技术非常简单高效,可以在几个小时内使用单个 GPU 完成模型压缩,无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能,同时吞吐量得到提升,整体效果令人满意。
SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径,将大幅节省部署资源同时保持模型性能不变。这一技术的推出,有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。
开源地址:https://github.com/microsoft/TransformerCompression
论文地址:https://arxiv.org/abs/2401.15024
()
上一篇:美国全新提案不允许厂商配件加密:遭到苹果强烈反对
下一篇:除夕夜守护万家团圆,顺丰同城保障年夜饭外送品质到家
高品质专业视频拍摄制作 高品质专业视频拍摄制作 专业团队为您打造卓越宣传片和TV...。
谷歌公司即将对开发策略进行进一步调整。谷歌计划将所有AndroidOS组件的开发工作都放在内部进行,...。
今日,大疆发布DJIPower2000户外电源,售价5699元。DJIPower2000仅有16寸迷...。
快科技3月27日消息,4个小时睡眠法之后,搜狐CEO张朝阳又有新建议了一天只吃2顿饭。张朝阳在搜狐马...。
想咨询你们能够承接哪些服务
你们是怎么收费的呢
合作联系方式
感谢您的关注,当前客服人员不在线,请填写一下您的信息,我们会尽快和您联系。为方便快速沟通,您可直接添加微信:esay8168咨询合作: