你实际用过哪些学习率策略?为什么要 warmup?拿一条你做过的收敛曲线说它起了什么作用,什么时候会失效。.docx

人工智能 20小时前 5 1.0 元单篇下载

付费文档