Deep Learning: Difference between revisions

Deep Learning (view source)

1 byte removed , 10 September 2020

5,337

edits

@@ Line 223: / Line 223: @@
 GD converges even though our model does not go to a linear model.
-===Take-away===
+===Takeaway===
 Over-parameterization does not lead to linearization.
 Over-parameterization leads to good conditioning which leads to PL and convergence of GD/SGD.