caffe中的学习率的衰减机制

根据  caffe/src/caffe/proto/caffe.proto 里面的文件,可以看到它有以下几种学习率的衰减速机制:

 

1. fixed:   在训练过程中,学习率不变;

2. step: 它的公式可以表示:clip_image002[5],  所以呢,它的学习率的变化就像台价一样;step by step 的; 其中的 gamma stepsize需要设置的;

 

3.exp : 表示指数型的;公式为:clip_image002[7];其中参数 gamma 需要设置;

 

4. inv : 它表示什么意思不知道啊; 公式为:clip_image002[9],其中参数 gamma power 都需要设置;

 

5.multistep: 它可以设置多个 stepvalue的值, 在prototxt里面也没有具体介绍, 它由参数 stepsize 与 stepvalue 决定; 它不是每时第刻都去计算 学习率,而是达到我们设定的stepvalue的时候,才去计算(根据方法2中的公式),然后更新学习率; stepvalue 可以设置多个的,下面是 stepvalue的定义;

183   repeated int32 stepvalue = 34;

 

6、 poly : 多项式衰减: 它的公式为:  clip_image002[11],当到达最大次数时, 学习率变为了0;

 

7.sigmoid形的:clip_image002[13]。我觉得这个公式不对吧, 减去stepsize是什么意思啊;反正我不用它,所以也不研究它了吧;

原文链接: https://www.cnblogs.com/yinheyi/p/7297644.html

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍;

也有高质量的技术群,里面有嵌入式、搜广推等BAT大佬

    caffe中的学习率的衰减机制

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/395111

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年4月4日 上午9:44
下一篇 2023年4月4日 上午9:45

相关推荐