优化器
sgd
lr学习率lambdaL2 正则化中的参数,默认为 0,即不进行正则化
nesterov
alphanesterov 中类似学习率的参数mu与动量相关的参数lambdaL2 正则化中的参数,默认为 0,即不进行正则化
adam
lr学习率rho1,rho2adam 中的参数eps平滑因子lambdaL2 正则化中的参数,默认为 0,即不进行正则化
lr 学习率lambda L2 正则化中的参数,默认为 0,即不进行正则化alpha nesterov 中类似学习率的参数mu 与动量相关的参数lambda L2 正则化中的参数,默认为 0,即不进行正则化lr 学习率rho1, rho2 adam 中的参数eps 平滑因子lambda L2 正则化中的参数,默认为 0,即不进行正则化