1
66450146 2018-10-23 18:04:49 +08:00 1
f'(x) = 1 就不会有 vanishing gradient 了😂
|
2
alixali OP 这个问题在输入数据维度高的时候,和网络层数多的时候出现了,更像是和网络的节点数有关系。
|