Jtdcftul

Posts

Showing posts from February 21, 2019

梯度下降法

梯度下降法（英语： Gradient descent ）是一个一阶最优化算法，通常也称为最速下降法。要使用梯度下降法找到一个函数的局部极小值，必须向函数上当前点对应梯度（或者是近似梯度）的反方向的规定步长距离点进行迭代搜索。如果相反地向梯度正方向迭代进行搜索，则会接近函数的局部极大值点；这个过程则被称为梯度上升法。目录 1 描述 1.1 例子 1.2 缺点 2 参阅 3 参考文献 4 外部链接描述梯度下降法的描述。梯度下降方法基于以下的观察：如果实值函数 F(x){displaystyle F(mathbf {x} )} 在点 a{displaystyle mathbf {a} } 处可微且有定义，那么函数 F(x){displaystyle F(mathbf {x} )} 在 a{displaystyle mathbf {a} } 点沿着梯度相反的方向 − ∇ F(a){displaystyle -nabla F(mathbf {a} )} 下降最快。因而，如果 b=a− γ ∇ F(a){displaystyle mathbf {b} =mathbf {a} -gamma nabla F(mathbf {a} )} 对于 γ >0{displaystyle gamma >0} 為一個够小数值時成立，那么 F(a)≥ F(b){displaystyle F(mathbf {a} )geq F(mathbf {b} )} 。考虑到这一点，我们可以从函数 F{displaystyle F} 的局部极小值的初始估计 x0{displaystyle mathbf {x} _{0}} 出发，并考虑如下序列 x0,x1,x2,… {displaystyle mathbf {x} _{0},mathbf {x} _{1},mathbf {x} _{2},dots } 使得 xn+1=xn− γ n∇ F(xn), n≥ 0{displaystyle mathbf {x} _{n+1}=mathbf {x} _{n}-gamma _{n}nabla F(mathbf {x} _{n}), ngeq 0} 。 ...

最优化，是应用数学的一个分支，主要研究以下形式的问题：目录 1 数学表述 2 符号表示 3 主要分支 4 算法 5 人工智能和最优化 6 参见 7 参考文献 8 外部链接数学表述主要研究以下形式的问题：给定一个函数 f:A→ R{displaystyle f:Ato mathbb {R} } ，寻找一个元素 x0∈ A{displaystyle mathbf {x} ^{0}in A} 使得对于所有 A{displaystyle A} 中的 x{displaystyle mathbf {x} } ， f(x0)≤ f(x){displaystyle f(mathbf {x} ^{0})leq f(mathbf {x} )} （最小化）；或者 f(x0)≥ f(x){displaystyle f(mathbf {x} ^{0})geq f(mathbf {x} )} （最大化）。这类定式有时还称为“ 数学规划 ”（譬如，线性规划）。许多现实和理论问题都可以建模成这样的一般性框架。典型的， A{displaystyle A} 一般为欧几里得空间 Rn{displaystyle mathbb {R} ^{n}} 中的子集，通常由一个 A{displaystyle A} 必须满足的约束等式或者不等式来规定。 A{displaystyle A} 的元素被称为是可行解。函数 f{displaystyle f} 被称为目标函数，或者代价函数。一个最小化（或者最大化）目标函数的可行解被称为最优解。一般情况下，会存在若干个局部的极小值或者极大值。局部极小值 x∗ {displaystyle x^{*}} 定义为对于一些 δ >0{displaystyle delta >0} ，以及所有的 x{displaystyle x} 满足 ‖ x− x∗ ‖ ≤ δ {displaystyle |mathbf {x} -mathbf {x} ^{*}|leq delta } ; 公式 f(x∗ )≤ f(x){displaystyle f(mathbf {x} ^{*})leq f(mathbf {x} )} 成立...