论文推荐：在早期训练阶段预测下游模型性能

网名跟吊一样长 · 发表于 2022-1-19 09:34:53

22年1月的新论文提出了基于边缘动态系统的神经网络选择的新视角

论文推荐：在早期训练阶段预测下游模型性能第1张图片

预训练大规模深度神经网络(NN)，并针对下游任务进行微调已成为深度学习领域的现状。研究人员面临的一个挑战是如何为给定的下游任务有效地选择最合适的预训练模型，因为这个过程通常需要在模型训练中用于性能预测的昂贵计算成本。
在新论文 Neural Capacitance: A New Perspective of Neural Network Selection via Edge Dynamics 中，来自 Rensselaer Polytechnic Institute、Thomas J. Watson 研究中心和加州大学洛杉矶分校的研究小组提出了一种针对下游任务的有效神经网络选择的新框架。该方法利用模型的累积信息来预测模型的预测能力，在神经网络训练的早期阶段这样做可以节省资源。
该团队总结了他们的结论:

将神经网络训练看作是一个基于突触连接的动态系统，并首次从微观角度研究突触连接的相互作用。
提出了用于神经网络模型选择的神经电容度量βeff。
基于5个基准数据集的17个预训练模型的实验结果表明，我们的βeff方法优于现有的学习曲线预测方法。
在CIFAR10/CIFAR100/SVHN/Fashion MNIST/Birds上，根据训练前模型的性能，论文的方法比最佳基线提高了9.1/38.3/12.4/65.3/40.1%。

论文所提出的框架基于这样的思想，即神经网络训练期间的反向传播等效于突触连接（边缘）的动态演化，并且收敛神经网络与由这些边缘组成的网络系统的平衡状态相关联。它还借鉴了以前的研究，表明复杂的现实世界系统（例如植物-传粉媒介的相互作用和 COVID-19 的传播）可以用图网络进行表示。
研究人员将 NN 训练视为突触连接上的动态系统并首次以微观方式探索这些突触连接相互作用。他们提出“βeff”作为表征生物和人工神经网络的通用神经电容度量（neural capacitance metric），可以为可训练权重构建线图并以与一般动态系统相同的形式重新制定训练动态系统，使βeff属性能够在训练过程的早期阶段通过少量观察预测图神经网络的最终准确性。
该团队在 17 个预训练 ImageNet 模型上评估了他们的框架，包括 AlexNet、VGGs (VGG16/19)、ResNets (ResNet50/50V2/101/101V2/152/152V2)、DenseNets (DenseNet121/169/201)、MobileNets (MobileNet 和 MobileNetV2) ，Inceptions（InceptionV3，InceptionResNetV2）和Xception。他们还将基于 βeff 的方法与其他各种模型排名基线进行了比较。

论文推荐：在早期训练阶段预测下游模型性能第3张图片

在实验中，基于神经电容 βeff 的方法优于当前的学习曲线预测方法，并在 CIFAR10/CIFAR100、SVHN、Fashion MNIST 和 Birds 数据集的最佳基线上取得了显着的相对改进。

论文推荐：在早期训练阶段预测下游模型性能第4张图片

结果验证了 βeff 作为基于早期训练结果预测一组预训练模型的排名的有效指标。团队计划在未来探索更多的相关研究方向，例如简化邻接矩阵 P 以捕捉突触连接之间的依赖和相互交互，将框架扩展到 NAS 基准以选择最佳子网络，以及设计一种高效的算法直接基于 βeff 优化 NN 架构。

论文地址：https://arxiv.org/abs/2201.04194

本文作者：Hecate He

上一篇：住在北京二环内有优越感吗？什么体验？
下一篇：自主神经系统是这样控制我们身体的

白金会员	积分	兔币	帖子
白金会员, 积分 3601, 距离下一级还需 1399 积分	3601	1966	1620
在线时间：0 小时	最后登录：2024-2-25

[分享] 论文推荐：在早期训练阶段预测下游模型性能

关联主题

“断崖式衰老”发生在这两个岁数！Nature子

三一重工董监高“大撤退”：减持1亿砸出75

前英皇男星儿子生病入院，被老婆炮轰曝光冷

未来10天北方迎三轮降雨南方多地高温或破

房价何时见底

梅州又有一个地方走红，是广东四大古镇之一

脱口秀回归“新人”势头猛

季后赛各队宝石流胜率：KSG胜率最高，AG仅

医学对进化有什么影响？

渣打银行首席：国内房地产市场“尚未找到底

何小鹏：中国新能源车企组球队 10年内说不

星二代，被扎堆送出国

恒大地产，又添诉讼！

存量房贷，调整的脚步声近了？

北京买房：理清思路，购房建议1294

美欧说“遗憾”，乌克兰发出“威胁”，蒙古

山东东平一公交车失控，家长逃生后发视频时

“断崖式衰老”发生在这两个岁数！Nature子

三一重工董监高“大撤退”：减持1亿砸出75

荣耀宣布即将发布首款 AI Agent 手机，Magi

悟空出世爆火，深圳老板入账15个亿

与操盘手深聊4小时，我们找到2024下半年经

成就非凡：家长该如何放手，让孩子书写自己

大S恋爱脑上头，消费汪小菲给具俊晔赚流量

新机：Mate70全系列亮相；红米K80 Pro长这

“ 到公司第一件事就是…”小米王腾晒游戏

iOS18新测试版推送达1.2GB ，新功能不多，

何小鹏：中国新能源车企组球队 10年内说不

乌军越境俄罗斯激战持续一周：沉默中行动，

小鹏汽车官宣！完成收购

财神驾到

一抹伤

哇哇的哭

绿林道的

willlin