Java自学者论坛

 找回密码
 立即注册

手机号码,快捷登录

恭喜Java自学者论坛(https://www.javazxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,会员资料板块,购买链接:点击进入购买VIP会员

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程Go语言视频零基础入门到精通Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程SpringBoot2.X入门到高级使用教程大数据培训第六期全套视频教程深度学习(CNN RNN GAN)算法原理Java亿级流量电商系统视频教程
互联网架构师视频教程年薪50万Spark2.0从入门到精通年薪50万!人工智能学习路线教程年薪50万大数据入门到精通学习路线年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程MySQL入门到精通教程
查看: 1153|回复: 0

神经网络算法——解决非线性分类复杂问题

[复制链接]
  • TA的每日心情
    奋斗
    2024-11-24 15:47
  • 签到天数: 804 天

    [LV.10]以坛为家III

    2053

    主题

    2111

    帖子

    72万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    726782
    发表于 2021-4-22 13:42:05 | 显示全部楼层 |阅读模式

    神经网络的定义 

    把神经元模拟成一个逻辑单元,在神经网络的模型中,神经元收到来自n个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元收到的总输入值将与神经元的阈值进行比较,然后通过激活函数(activation funciton)处理以产生神经元的输出。

    把许多个这样的神经元按一定的层次结构连接起来,就得到了神经网络。

     一个神经元可以看成包含两个部分,一个是对输入的加权求和加上偏置,一个是激活函数对求和后的激活或者抑制。

    与神经网络有关的几个重要术语:

    阈值(threshhold)

    阈值逻辑单元(Threshold Logic Unit,TLU),它可以输入一组加权系数的量,对它们进行求和,如果这个和达到或者超过了某个阈值,输出一个量。

    激励函数(activation function)

    所谓激活函数,就是在神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。

    一个前馈神经网络如果具有线性层和至少一层具有 "挤压" 性质的激活函数(如 signmoid 等),给定网络足够数量的隐藏单元,它可以以任意精度来近似任何从一个有限维空间到另一个有限维空间的  可测函数。

    要相符上面的定理,也就是想拟合任意函数,一个必须点是 “要有带有 “挤压” 性质的激活函数”。这里的 “挤压” 性质是因为早期对神经网络的研究用的是 sigmoid 类函数,所以对其数学性质的研究也主要基于这一类性质:将输入数值范围挤压到一定的输出数值范围。

    权重

    连接是神经元中最重要的东西。每一个连接上都有一个权重。

    一个神经网络的训练算法就是让权重的值调整到最佳,以使得整个网络的预测效果最好。

    例如:我们使用a来表示输入,用w来表示权值。一个表示连接的有向箭头可以这样理解:在初端,传递的信号大小仍然是a,端中间有加权参数w,经过这个加权后的信号会变成a*w,因此在连接的末端,信号的大小就变成了a*w。

    如果我们将神经元图中的所有变量用符号表示,并且写出输出的计算公式的话,就是下图。

     

    输入层、输出层、隐藏层

    • 输入层(input layer)输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;
    • 隐藏层(Hidden Layer):中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程
    • 输出层(Output Layer):顾名思义,输出层向外界输出信息处理结果

    偏置单元( bias unit)

    它本质就是函数的截距,与线性方程 y=wx+b 中的 b 的意义是一致的。在 y=wx+b中,b表示函数在y轴上的截距,控制着函数偏离原点的距离,其实在神经网络中的偏置单元也是类似的作用。 
    因此,神经网络的参数也可以表示为:(W, b),其中W表示参数矩阵,b表示偏置项或截距项。

     bias的计算方式

     神经网络结构中对偏置单元的计算处理方式有两种, 
     (1)设置偏置单元=1,并在参数矩阵 Θ 中设置第 0 列对应偏置单元的参数,对应的神经网络如下: 
     神经网络架构 
     其中,x0 是第一层的偏置单元(设置为1),Θ(1)10 是对应该偏置单元 x0 的参数;a(2)0 是第二层的偏置单元,Θ(2)10 是对应的参数。 
     在计算激活值时按照(以a(2)1为例): 
     激活值计算公式

       相当于bias本身值为1,但它连接各个神经元的权重不为1,即---整个神经网络只有1个bias,对应有多个不同的权重(权重个数等于hide层和out层神经元的个数)

     

    2)设置偏置单元,不在参数矩阵中设置对应偏置单元的参数,对应的神经网络如下: 
     神经网络架构 
     其中,b(1) 是 W(1) 对应的偏置单元向量,b(2) 是 W(2) 对应的偏置单元向量,b(1)1 是对应 a(2)1 的偏置单元。注意,此时神经网络的参数表示更改为:(W, b) 
     在计算激活值时按照: 
     激活值计算公式 

       相当于bias连接各个神经元的所有权重都为1,但bias本身不为1,即---有多个bias,但所有的bias对应的权重都为1(bias的个数等于hide层和out层神经元的个数)

     偏置的大小度量了神经元产生正 (负) 激励的难易程度

     

    感知器

    定义: 感知器就是神经网络中的神经元

     

    图示:
     
     

    输入:x1-xn

    权值:w1-wn
    偏置 :w0

    激活函数 :跳跃函数
     
     

     

     

    输出
     
     

    用途:可以拟合所有的线性函数(线性分类、线性回归) 线性分类:可用一条线对目标进行分类。
    感知器的训练训练方法:将权重项和偏置项初始化为0,利用感知器规则迭代的修改w 和b,直到完成。

     

    关于神经网络,最后提炼了几条要点:

    1. 设计一个神经网络时,输入层与输出层的节点数往往是固定的,中间层则可以自由指定;
    2. 神经网络结构图中的拓扑与箭头代表着预测过程时数据的流向,跟训练时的数据流有一定的区别;
    3. 结构图里的关键不是圆圈(代表“神经元”),而是连接线(代表“神经元”之间的连接)。每个连接线对应一个不同的权重(其值称为权值),这是需要训练得到的。  

     之前我们一直学习线性回归问题和神经网络之间的联系:

    比如基础的逻辑回归,结合上面的神经元知识,可以发现,逻辑回归就是激活函数是sigmoid 的单层简单神经网络。也就是说,只要在神经元的输出端有一个合适的损失函数,就能让单个神经元变成一个线性分类器。因此说,那些线性的分类器本身就是一个单层神经网络。

    哎...今天够累的,签到来了1...
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|小黑屋|Java自学者论坛 ( 声明:本站文章及资料整理自互联网,用于Java自学者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2025-1-5 10:28 , Processed in 0.056029 second(s), 27 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表