Machine Learning Glossary: Difference between revisions

Machine Learning Glossary (view source)

114 bytes added , 26 January 2023

5,321

edits

@@ Line 3: / Line 3: @@
 ==A==
 * Attention - An component of [[Transformer_(machine_learning_model)|transformers]] which involves computing the product of query and key embeddings to compute the interaction between elements.
+* Adam optimizer - A popular gradient descent optimizer which includes momentum and per-parameter learning rates.
 ==B==