首页编程正文内容

03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

编程

更新时间：2025-01-2712

admin管理员组
文章数量:1402724

上篇：02 机器学习任务攻略-学习笔记-李宏毅深度学习2021年度

下篇：04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

当loss不够好，且梯度接近为0时，应该怎么办？
local minima和saddle point
batch
momentum

视频链接-1
视频链接-2
PPT链接

课堂笔记

local minima(局部最小值)：在损失函数的迭代过程中，当前参数陷入了局部最小值，即当前gradient为0，且周围点的gradient都是向着loss增大的方向

三维空间中，如图：

二维空间中，如图：

saddle point：当前参数的gradient为0，但是存在周围点的gradient是向着loss减小的方向。

三维图像，如图：

二维图像，如图：

local minima 和 saddle point 统称为 critical point

当gradient接近0，且loss不够小，说明卡在了 critical point

使用矩阵的特征值可以判断当前是卡在local minima还是saddle point。对于saddle point，可以通过特征向量找到方向。详情请参考视频和PPT

解决 critical point 的方法:

1. 采用合适的Batch Size，通常采用较小的Batch Size
2. 在每个epoch后，对train set进行shuffle
3. 增加Momentum

Small Batch 与 Large Batch的比较:

Momentum：为梯度下降增加一个动量（惯性），使其可以逃离local minima

Momentum的具体做法：每次不仅考虑当前的梯度，还考虑上一次更新的梯度。

因为每一个时刻的梯度都考虑了上一时刻的梯度，所以也可换句话说：每次不仅考虑当前的梯度，还考虑之前的所有更新过得梯度

Gradient Descent + Momentum 的具体参数更新公式：

λ \lambda λ 为要调的超参数

本文标签：梯度学习笔记深度年度 local

版权声明：本文标题：03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.betaflare.com/biancheng/1737969707a2042780.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

2款安卓数据恢复大师，深度评测，解决数据丢失问题

编程

2月前

我们的安卓手机中装满了珍贵的照片、工作的文档，是需要细心呵护的重要数据。但总有些时候，因为手滑导致事与愿违，一不小心，这些数据就化成了尘埃。别慌&

《Photoshop智能手机APP界面设计》学习笔记

编程

2月前

第一章 APP用户界面基础 1.1 手机UI设计相关基本概念 1.1.1 什么是UI设计 UI(Users Interface)即用户界面， 它不仅仅是美化界面，还需要研究用户&#xff

【UI界面设计】PS基础学习笔记

编程

2月前

【UI界面设计】PS基础学习笔记一、概述1.行业规范：2.介绍二、PS入门1.安装2.基本介绍3.新建项目4.PS的基本使用流程5.项目保存6.抠图7.修图8.修人像图9.如何修改像素、大小等图片参数&#x

ZYNQ学习笔记（四）：PL与PS数据交互——基于BRAM IP 核的（PS端读写＋PL端读）控制实验

编程

2月前

文章目录前言一、设计需求二、RAM是什么？三、硬件设计3.1 系统框图3.2 IP核配置3.3 自定义IP核3.4 其他四、软件设计五、下载验证六、实验改进6.1 硬件改进6.2 软件改进6.3 改进结果七、遇见

深度 ghost linux系统,用Ghost实现Linux系统的备份

编程

2月前

在linux中依然可以实现ghost的备份。如果你对简单、容易、直观、速度快特别反感，建议你去用dd tar grub，否则请看我写的ghost的文章。我们的目的：备份一个Linux分区，生成一个备份文件。我们的愿望：简单、安全、高效。

苹果电脑怎么装windows系统（学习笔记）

编程

2月前

苹果电脑怎么装windows系统 1.下载windows2.开始装windows 1.下载windows 1.千万不要去百度网盘去下载windows；不符合装进苹果电脑里面的条件2.网络不好；也

从零开始搭建Python开发环境：系统级深度指南及开发环境故障全解

编程

1月前

第一章环境构建基础原理 1.1 Python运行时架构解释器核心：CPythonJythonIronPython包管理机制：PyPI仓库索引与依赖解析环境隔离必要性&#xff1

驱动器磁盘未格式化难题：深度剖析与恢复实践

编程

1月前

驱动器磁盘未格式化的深层探索在数据存储与管理的日常中，驱动器作为我们数字生活的基石，其稳定性直接关系到数据的安全与可用性。然而，当屏幕上赫然出现“驱动器中的磁盘未被格式化

Thinkpad X270上用U深度优盘还原安装win7无法启动

编程

1月前

最近遇到一个怪现象，Thinkpad x270，安装了固态盘，用U深度盘还原一个win7，安装好后，再启动找不到启动盘。最后发

JavaSE：初识Java（学习笔记）

编程

1月前

java是高级语言的面向对象语言 .[最贴近生活.最快速分析和设计程序] 一，计算机语言发展历史二，Java体系结构 1，JavaSE（

华三杯H3C 网络知识学习笔记（1）

编程

1月前

通俗易懂的IP地址、子网掩码、默认网关、DNS服务器 https:blog.csdnbelongtocodearticledetails106453395 一文搞懂网络知识，IP、子网掩码、网关、DNS、端

新基建深度报告：七大领域十大龙头分析

编程

1月前

来源：华泰证券稳增长、促转型，把握新基建浪潮中的七大产业机遇七大领域：5G、数据中心、云计算、工业互联网、物联网、人工智能、传统基础设施数字化改造新基建担负着不一样的

深度工作读书笔记

编程

1月前

前言第一部分理论第一章深度工作是有价值的三类人在智能机器时代处于获利的一方如何在新经济形势下成为赢家深度工作帮助你迅速掌握困难的事物深度工作有助于精英级产出的实现第二章深度工作是少见的度量的黑洞最小阻力原则忙碌代表生产能力对互

STM32CubeMX学习笔记（48）——USB接口使用（MSC基于外部Flash模拟U盘）

编程

1月前

一、USB简介 USB（Universal Serial BUS）通用串行总线，是一个外部总线标准，用于规范电脑与外部设备的连接和通讯。是应用在 PC

【AIGC】Visual ChatGPT 视觉模型深度解析

编程

1月前

欢迎关注【youcans的AGI学习笔记】原创作品【AIGC】Visual ChatGPT 视觉模型深度解析 1. 【Visual- ChatGPT】火热来袭2. 【Visual-GPT】操作实例2.1 处理流程2.2 操作实例 3. 【

中国地区2012年度安全威胁报告

编程

1月前

2012年度中国地区网络安全综述 20132 China RTL 目录 2012年中国区网络安全威胁回顾 2012年度中国地区病毒回顾 2012年中国地区病毒情况综述 2012 年中国地区毒感染数量排名对于网络病毒的防护建议 2012

主数据深度剖析与实际应用

编程

1月前

主数据深度剖析与实际应用想象一下,你正在经营一家跨国连锁咖啡店。每天,全球数千家门店都在使用你的品牌,制作相同的饮品,为客户提供服务。但是,你突然发现一个问题:纽约的"拿铁"和东京的"拿铁"配方似

C盘爆满？教你如何深度清理C盘临时文件，释放存储空间

编程

1月前

C盘爆满？教你如何深度清理C盘临时文件，释放存储空间电脑在使用过程中，随着时间的推移，C盘（通常是系统盘）往往会积累大量的临时文件，导致系统运行缓慢，甚至影响软件的正常使用。这些临时文件可能来自系统更新、软件安装、浏览器缓存等多个方面。

Windows系统调用学习笔记（四）—— 系统服务表&SSDT

编程

1月前

Windows系统调用学习笔记（四）—— 系统服务表&SSDT 要点回顾系统服务表实验：分析 KiSystemService 与 KiFastCallEntry 共同

【Windows编程学习笔记】1：实现学生信息管理系统的简易页面

编程

12天前

本学期非常幸运能和李青老师学习使用纯CC实现Win32的应用程序开发。开发过程中不使用MFC，而是直接调用WindowsAPI来实现应用程序编程，这样做的好处是能够理解界面程序的实现机制&

发表评论

全部评论 0

暂无评论

编程频道|软件玩家 - 软件改变生活！

03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

课堂笔记

更多相关文章

2款安卓数据恢复大师，深度评测，解决数据丢失问题

《Photoshop智能手机APP界面设计》学习笔记

【UI界面设计】PS基础学习笔记

ZYNQ学习笔记（四）：PL与PS数据交互——基于BRAM IP 核的（PS端读写＋PL端读）控制实验

深度 ghost linux系统,用Ghost实现Linux系统的备份

苹果电脑怎么装windows系统（学习笔记）

从零开始搭建Python开发环境：系统级深度指南及开发环境故障全解

驱动器磁盘未格式化难题：深度剖析与恢复实践

Thinkpad X270上用U深度优盘还原安装win7无法启动

JavaSE：初识Java（学习笔记）

华三杯H3C 网络知识学习笔记（1）

新基建深度报告：七大领域十大龙头分析

深度工作 读书笔记

STM32CubeMX学习笔记（48）——USB接口使用（MSC基于外部Flash模拟U盘）

【AIGC】Visual ChatGPT 视觉模型深度解析

中国地区2012年度安全威胁报告

主数据深度剖析与实际应用

C盘爆满？教你如何深度清理C盘临时文件，释放存储空间

Windows系统调用学习笔记（四）—— 系统服务表&amp;SSDT

【Windows编程学习笔记】1：实现学生信息管理系统的简易页面

发表评论

推荐文章

javascript - Parse ajax response properly - Stack Overflow

theme development - Possible to add &quot;Template&quot; selector to posts?

php - Using javascriptjquery to submit a form upon the loading of a page - Stack Overflow

functions - Multiple is_page() in page.php

javascript - On Form Submission, do jquery checking first before Codeiginiter validation - Stack Overflow

热门文章

javascript - Unable to set select selected value using jquery - Stack Overflow

javascript - How do i loop through an array backwards? - Stack Overflow

Javascript syntax for concatenating strings + variables inside of function - Stack Overflow

localization - Unable to find where to translate certain tooltip string

javascript - How to pass form values from child component to parent in react - Stack Overflow

javascript - $state.go inside $stateChangeStart in app.run not working - Stack Overflow

ModuleNotFoundError: No module named &#39;tensorflow&#39; in Jupyter Notebook (Despite Being Installed) - Stack Overflow

javascript - How to count mouse wheel scroll in jquery - Stack Overflow

javascript - Using promises in Axios requests - Stack Overflow

How can I add a meta[] to my custom post type and search by term with the Rest API?

最新文章

windows设置断电重启开机后自动输入锁屏密码登录

Windows系统设置开机默认开启数字小键盘

Windows11 开机自动同步时间（开机时间不更新问题）

windows配置开机自启动软件或脚本

【Redis】Windows设置Redis为开机自启动

javascript - How to disable cursor zoom in amCharts? - Stack Overflow

javascript - Call Node script with PHP exec and return data to PHP before finally method - Stack Overflow

Updating Jquery object with newly created elements after AJAX call

Can a 2-Legged OAuth Token Be Used to Access Autodesk ACC Docs via the AEC Data Model API? - Stack Overflow

javascript - Multiple module.exports for NodeJS - Stack Overflow

惠普OMEN 15-CE001TX 2EF91PA参数报价

苹果新款MacBook Pro 15英寸 i732GB1TBVega Pro 20参数报价

联想Y330A-PSE L参数报价

神舟战神Z7 D6 i7-12650H16GB512GBRTX4050旗舰版参数报价

神舟战神Z7 D6 i7-12650H16GB1TBRTX4050参数报价

深度工作读书笔记

Windows系统调用学习笔记（四）—— 系统服务表&SSDT

theme development - Possible to add "Template" selector to posts?

ModuleNotFoundError: No module named 'tensorflow' in Jupyter Notebook (Despite Being Installed) - Stack Overflow