`
eric_weitm
  • 浏览: 242753 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

深度学习概览

 
阅读更多

深度学习概览

一、基本概念

1、神经网络由大量的神经元构成,神经元之间分层次,也有连接。神经元有可能起作用或不起作用(激活函数)。大量神经元的组合和参数,可以模拟任意复杂的函数。人的大脑通过学习刺激神经元而学习技能和知识,机器学习里用人工神经网络来模拟人类大脑的活动过程。

2、深度学习:神经元有多个层次,可以表达不同的抽象层次,可以实现降维、特征选择和标记等效果。

3、神经元具有学习的特征:即权重和batis可以根据环境来变化,这样就实现了根据数据来调整算法。

4、迁移学习,强化学习(自动驾驶、玩游戏等)

二、特点

1、不是从数学上想算法,而是通过不断的训练来调整参数,从整体上实现“积累经验”的效果(形象思维)。

2、训练结果存储在网络的架构和参数中,很多时候无法写出真正的函数解析式或生成式(所以叫做ai黑盒)。不管是网络结构还是参数优化,更多的依靠工程经验而不是严格的数学方法

3、基本假设  算法+数据 好于想出来的模型

三、激活函数

1、要求:非线性(网络体现的线性);可微性(基于梯度优化);单调性(保证是凸函数);f(x)≈x(可以随机设置初始值);值域有限,算法稳定,值域无限,容易die,但是计算效率高(learning rate要小点)

2、感知器(Perceptron)

wx+b> 0 -->1  else 0 描述能力至少等于布尔代数(对人脑直接模拟)

2、S型神经元(sigmoid) 

1/1+e^-z   z = wx+b  0-1之间的值表示可能性(便于微分)

3、tanh 函数 tanh(x)=2sigmoid(2x)−1 效果好于 sigmoid

4、ReLU(校正线性单元:Rectified Linear Unit) f(z) = max(0, z) (解决跨越多层时的梯度消失)  

5、PReLU(Parametric Rectified Linear Unit) 添加了一个参数

6、Maxout 参数更多了

四、网络模型

1、前馈网络

2、卷积网络(CNN ):考虑图像的空间信息的特点。适用于 存在非常大型的数据集、大量特征和复杂的分类任务时。比如图像识别、文本转语音、药物发现等。第1个隐藏层中的每个神经元会连接到输入神经元的1个小区域。全连接变成一块对一个(训练更快)。

跨距:向右和向下移动几个像素

前提:局部感受域(local receptive fields)

特征映射:共享权重、共享偏置 (卷积核、滤波器),实现图像的平移识别效果

混合:简化特征映射的输出  max-polling L2-polling

3、RNN(Recurrent neural network)循环神经网络,与大脑更类似,拥有时间相关行为特性的神经网络,存储大量有序信息时。例子:图像分类与字幕添加、政治情感分析、语音识别(同音字和词语)和自然语言处理natural language processing(理解python,排序等,翻译)

长短期记忆单元(Long short-term memory units,LSTMs):简化了RNN的训练

4、深度信念网络,生成式模型和Boltzmann 机(网络+概率)

深度信念网络(DBN)

5、自动编码器 Autoencoder

6、生成对抗网络(GANs )

https://www.leiphone.com/news/201702/NcdoDmmOn1RgeCIL.html

五、优化、调参的方法

1、基本原理:微调结果,看看参数怎么变化(基于梯度微分)

2、梯度下降算法(Batch gradient descent):小球往山下滚(搜索迭代的办法找最小值)

3、随机梯度下降 (Stochastic gradient descent)SGD:(不去找最陡峭的坡)不使用全部的数据来计算偏导数

4、BP、反向传播(backpropagation) :计算大量偏导数的方法

5、深度学习梯度消失的原因:随机的初始化、S型函数、网络结构

6、规范化: 损失函数中添加一个惩罚项,避免过拟合

分享到:
评论

相关推荐

    深度学习概览.pdf

    机器视觉-深度学习

    深度学习和无监督学习

    #### 深度学习概览 深度学习是一种机器学习技术,它通过构建多层的人工神经网络来模拟人脑的学习过程,实现对复杂数据模式的有效识别与理解。深度学习的核心在于能够自动提取数据中的特征,并通过层次化的结构对...

    2017西班牙深度学习暑期学校资料(卡内基梅隆大学)

    总体来看,这份资料提供了一个全面的深度学习概览,从概率图模型到深度学习组件的现代构建块,再到深度学习算法的核心——反向传播,直至图模型与神经网络的结合,贝叶斯学习理论以及深度核学习等多个维度,将深度...

    台大李宏毅 深度学习ppt 第二部分

    【深度学习概览】 深度学习是人工智能领域的一个重要分支,其核心在于构建多层神经网络,模拟人脑的复杂计算过程,以解决复杂的数据分析和模式识别问题。台大李宏毅教授的深度学习课程是业界知名的教育资源,以其...

    吴恩达深度学习笔记

    #### 一、深度学习概览 - **定义与重要性**:深度学习是机器学习的一个分支,通过模拟人脑中的神经元工作方式来处理复杂的数据模式识别和预测任务。随着计算能力的增强及大数据时代的到来,深度学习在图像识别、...

    深度学习报告 (2).pdf

    深度学习是人工智能领域的一个关键分支,它通过模拟人脑神经网络结构进行复杂模式识别和决策。本报告将探讨深度学习的各类方法、特征...这篇报告旨在为读者提供一个全面的深度学习概览,帮助理解和掌握这一重要的技术。

    机器学习和深度学习笔记下载

    ### 二、深度学习概览 #### 1. 什么是深度学习? 深度学习是机器学习的一个分支,它基于多层神经网络模型,通过学习层次化的特征表示来解决复杂的模式识别问题。深度学习模型可以自动地从原始输入数据中提取有用的...

    动手学深度学习-很详细的基础教程

    #### 深度学习概览与实践指南 本书《动手学深度学习》旨在全面介绍深度学习的基本原理及其应用实践,特别是聚焦于计算机视觉和自然语言处理领域。它不仅仅是一本理论书籍,更是一个实践手册,引导读者从零开始构建...

    吴恩达深度学习视频,中文字幕。深度分析ai的原理

    ### 一、深度学习概览 深度学习作为机器学习的一个分支,主要关注如何使用深层神经网络来解决复杂问题。与传统的机器学习算法相比,深度学习模型能够自动提取数据特征,无需人工设计特征工程。吴恩达教授在视频教程...

    基于深度学习的数字图像处理.pdf

    **2.1 深度学习概览** 深度学习是机器学习的一个分支,它通过构建多层非线性处理单元来学习数据的复杂表示。深度学习的核心思想在于利用多层神经网络来捕捉数据中的抽象特征,这种能力使其在图像处理、语音识别、...

    机器学习&深度学习学习之路.zip

    二、深度学习概览 1. 深度神经网络(DNN):多层感知器,通过多层节点连接实现复杂函数拟合。 2. 卷积神经网络(CNN):在图像处理中表现出色,通过卷积层和池化层捕捉图像特征。 3. 循环神经网络(RNN):处理序列...

    神经网络与深度学习python源码聚类方法

    ### 知识点二:深度学习概览 #### 概念介绍 深度学习是机器学习的一个子集,专注于构建多层神经网络来解决复杂的机器学习问题。与传统机器学习相比,深度学习模型可以从大量数据中自动学习特征,而无需人工特征...

    基于卷积神经网络的深度学习算法与应用研究.pdf

    #### 深度学习概览 深度学习(Deep Learning, DL)是计算机科学领域内机器学习(Machine Learning, ML)的一个新兴分支,旨在让计算机更加接近实现真正的人工智能(Artificial Intelligence, AI)。该领域的核心...

    华为HCNA-AI V1.0 LVC培训视频.zip

    第五章 深度学习预备知识和深度学习概览 5.1_深度学习预备知识 5.2_深度学习预备知识 5.3_深度学习预备知识 5.4_神经网络定义与发展 5.5_感知器及训练法则 5.6_激活函数 5.7_神经网络的种类 5.8_深度学习中的正则化 ...

    用在graph上的深度学习方法概览

    在图上应用深度学习是一种将传统深度学习算法扩展到非欧几里得数据结构的方法。这种数据结构不同于常规的图像、视频或者声音信号,它们通常被表示为规则的网格结构。图数据,包括自然图形和社会网络数据等,具有不...

    华为HCIA-AI V1.0 LVC公开课培训视频.rar

    第五章 深度学习预备知识和深度学习概览 5.1_深度学习预备知识 5.2_深度学习预备知识 5.3_深度学习预备知识 5.4_神经网络定义与发展 5.5_感知器及训练法则 5.6_激活函数 5.7_神经网络的种类 5.8_深度...

    机器学习入门课件

    三、深度学习概览 1. 神经网络:模仿人脑神经元工作原理的计算模型,由多层节点(神经元)组成,每层神经元连接到下一层,形成复杂的非线性关系。 2. 前馈神经网络(FFNN):最简单的神经网络,信息沿单一方向传递,...

Global site tag (gtag.js) - Google Analytics