Deep Learning: Difference between revisions

Deep Learning (view source)

275 bytes added , 3 September 2020

5,337

edits

@@ Line 43: / Line 43: @@
 * RMSProp
 * Adam
+==DL Optimization==
+The role of "over-parameterization".
+In general, you can have poor local minimums and saddle points (with pos+neg Hessian).
+However, in practice GD & SGD work pretty well.
+Lecture 2 (Sept 3) is about Liu ''et al.'' <ref name="liu2020towards></ref>
 ==Misc==