当前位置:
X-MOL 学术
›
Inform. Sci.
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
使用深度强化学习对密集神经网络进行多目标修剪
Information Sciences Pub Date : 2022-07-30 , DOI: 10.1016/j.ins.2022.07.134 Lior Hirsch , Gilad Katz
"点击查看英文标题和摘要"
更新日期:2022-07-30
Information Sciences Pub Date : 2022-07-30 , DOI: 10.1016/j.ins.2022.07.134 Lior Hirsch , Gilad Katz
网络剪枝旨在降低大型模型的推理成本,并使神经架构能够在手机等终端设备上运行。我们介绍了 NEON,这是一种使用深度强化学习 (DRL) 的新型迭代修剪方法。虽然大多数基于强化学习的修剪解决方案只分析他们要修剪的一个网络,但我们在大量随机生成的架构上训练 DRL 代理。因此,我们提出的解决方案更通用,更不容易过拟合。为了避免为每个新数据集训练 DRL 模型通常需要长时间运行,我们在多个数据集上离线训练 NEON,然后将其应用于其他数据集而无需额外训练。这种设置使 NEON 比其他基于 DRL 的修剪方法更有效。此外,我们提出了一种新颖的奖励功能,使用户能够清楚地定义他们的修剪/性能权衡偏好。我们对一组 28 个不同的数据集进行的评估表明,所提出的方法在全连接网络的修剪方面明显优于最近表现最好的解决方案。具体来说,我们的顶级配置通过以下方式减少了修剪架构的平均大小, 相比通过领先的基线,同时实际上将准确度提高了 0.5%。
"点击查看英文标题和摘要"