`
vinking934296
  • 浏览: 107286 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

转发:时间序列模型的两个关键点

 
阅读更多

 

 

转发一个文章:补充时间序列模型相关知识点。

链接:http://www.itongji.cn/cms/article/articledetails?articleid=2341

 

本文简介 

 

不知道您是否和我一样,在第一次看到Arima这个词的时候的第一反应是:Arima是什么鬼?一定是Armani写错了。好吧,言归正传,本文旨在帮助初学者或者想要学习却又被其看上去很恐怖的数学公式吓退的朋友理解Arima模型中的一些非常重要的概念和关键点,文中尽量不去罗列复杂的理论和公式,至于更多的细节以及代码,相信在各种书籍和论坛中已有详尽的描述。


从这里开始

 

Arima全称整合自回归移动平均模型(Integrated Autoregressive Moving Average Model)。它对很多时间序列能进行很好的拟合和预测,而时间序列的平稳性是建立Arima模型的前提。那么究竟什么是平稳的时间序列呢?严格来说,数学上的平稳又分为严平稳和宽平稳,严平稳指的是序列的统计特征不随时间的平移而变化,而宽平稳指的是其一、二阶中心矩不随时间的平移而变化。什么?你不知道一、二阶中心矩?其实就是期望和方差(原谅我装X,一种不自信的表现)。而判断平稳性的方法一般有:看图法、单位根检验法、自相关函数检验法、游程检验法等。看图法简单易懂,观察线图是否存在周期性和趋势性,如果没有明显的周期性和趋势性,则认为其是平稳序列。其他的方法嘛,不说也罢(我不会告诉你我也不懂)。

 

如果翻开一本专门介绍时间序列的书籍,很容易发现,里面充满了密密麻麻的公式和推导。等我们完全理解了Arima模型的来龙去脉的时候,恐怕我们将会成为了一个统计学专家了。既然如此,那么我们该如何理解Arima模型呢?个人认为,序列的平稳化和阶数识别是其两个关键点。

 

 

平稳化

 

然而,理想很丰满,现实却很骨感。我们在实际工作中遇到的时间序列往往都是非平稳的。对于非平稳序列,通常利用对数变换和差分运算将其平化。对数变换用来将指数趋势转化为线性趋势,而差分运算则可以用来消除线性趋势和周期性,其强大的确定性信息提取能力可以将很多非平稳序列变为平稳序列。下图是一个非平稳的序列,它记录了两年内每天的业务数据量,该序列存在约7天周期性,但没有明显的趋势性。

 

QQ截图20160602103249.png

 

我们对序列作1阶7步差分,同时做一个的零均值化处理,得到下图:

 

QQ截图20160602103256.png

 

通过简单的图形观察,差分后时序图显示出序列在0附近随机地波动,这说明该序列很可能是一个平稳序列。接下来,我们做进一步的检验以证实该序列的平稳性。仅从上图对时间序列的平稳性判断的准确性较差,且主观性太强,一般还可以考虑使用单位根检验的方法对时序的平稳性进行检验。

 

QQ截图20160602103302.png

 

在显著性水平为0.05时,P值都是显著的,因此我们可以拒绝该时间序列是非平稳序列的原假设,说明该序列是平稳的。

 

 

阶数识别

 

Arima建模的本质是阶数的识别。当然阶数的识别并不能一蹴而就,这就需要我们通过判断自相关和偏自相关图,并进行不断的迭代,同时结合AIC或者BIC准则才能最终确定较好的模型参数。

 

QQ截图20160602103310.png

 

通过绘制差分后的自相关图(ACF)和偏自相关图(PACF)可以看到,两图显著的表现出不截尾,即自相关图中滞后1、2、3、6、7、8、9期超出了置信区间,偏自相关图中滞后4、5、6、7、14、15、21期也超出了置信区间。这说明在检验的显著性水平为0.05的条件下,序列中还蕴含着不容忽视的相关信息可供提取。此外,由BIC准则给出的最优模型推荐,BIC(1,9)最小,对应的是ARIMA(1,7,9)。

 

QQ截图20160602103316.png

 

由于时间序列经常受节假日和非工作日的影响,所以将其生成一个哑变量作为解释变量。根据推荐的阶数,结合上面的自相关图和偏自相关图,反复的尝试和删减不显著的参数。

 

 

QQ截图20160602103323.png

 

经过反复的迭代和尝试,残差诊断图中自相关图和偏自相关图都是拖尾的,滞后6期通过白噪声检验,说明残差序列是白噪声,没有可提取的必影响因素,模型完成。红线为序列拟合值,黑线为序列观察值,蓝色区域为95%置信区间。可以看出,模型拟合效果较好。

 

QQ截图20160602103329.png

 

END

来源:朝阳35处

分享到:
评论

相关推荐

    计算机网络重难点

    ### 计算机网络重难点知识点...以上内容涵盖了计算机网络的关键知识点,包括网络的基础概念、体系结构、各层的主要功能以及常用的协议和技术等。这些知识点对于深入理解和掌握计算机网络的基本原理和实际应用至关重要。

    点对点聊天vb.NET代码.rar

    点对点(P2P,Peer-to-Peer)聊天程序是一种允许两个或多个用户通过互联网直接通信的应用。在VB.NET中实现这样的系统,通常涉及到网络编程、多线程以及数据序列化等多个技术领域。以下是对VB.NET实现点对点聊天程序...

    华为试题,计算机网络方面的

    - **知识点**: ISO提出OSI参考模型的关键目的。 - **详细解释**: - 选项A (系统互联):OSI参考模型确实有助于不同系统的互联。 - 选项B (提高网络速度):并非OSI模型的主要目的。 - 选项C (为计算机制定标准):...

    计算机网络期末复习题型总结.docx

    - **点对点信道**:专用于两个设备之间的连接。 - **广播信道**:允许多个接收者同时接收发送者的数据。 ##### 数据链路层协议的基本问题 - **封装成帧**:为数据添加帧头和帧尾,以便识别数据包。 - **MTU(最大...

    2013_上半年软考_网络工程师上、下午试题(含真题、答案、讲解)

    - **网桥**:用于连接两个或多个局域网的设备,主要工作在数据链路层。 - **交换机**:一种用于连接多个设备的网络设备,支持多个端口之间的并发通信,主要工作在网络层。 **答案解析:**网桥转发广播帧,而交换机...

    计算机网络习题及答案.pdf

    12. 曼彻斯特编码:在曼彻斯特编码中,信号的波特率是数据传输速率的一半,因为每个数据位被两个边沿表示。 13. 奇偶校验:奇校验会在数据序列后添加一个校验位,使得整个序列的1的个数为奇数。因此,01001011的...

    2017年最新数据科学面试题及答案

    - **精确率和召回率**:这两个指标分别衡量模型预测为正类的样本中有多少是真的正例(精确率),以及真正的正例中有多少被模型正确识别出来(召回率)。 - **F1分数**:综合考虑精确率和召回率的一个指标,适用于...

    计算机网络复习题-超全(无答案版)

    在复习计算机网络时,理解并掌握以下几个关键知识点至关重要: 1. 应用层:网络提供批量处理、交互式和数据处理应用,但不包括即时流量应用,这通常由应用层的特定协议如WebSocket支持。 2. 物理连接模型:常见的...

    计算机网络 复习大纲.docx

    - **以太网的两个标准**:IEEE 802.3标准和IEEE 802.11标准。 - **CSMA/CD协议**:载波监听多路访问/冲突检测。 - **EUI-48地址**:即MAC地址,唯一标识一台网络设备。 - **MAC帧的格式**:包括源地址、目的地址...

    09计算机考研统考题

    - **知识点**:平衡二叉树是一种特殊的二叉搜索树,它要求任何节点的两个子树的高度差不超过1。典型的平衡二叉树有AVL树和红黑树等。 - **解析**:本题考察对平衡二叉树的理解,需要根据平衡二叉树的定义来判断。 ...

    计算机网络-试题(含答案).pdf

    本试题涉及的知识点广泛,涵盖了网络体系结构、OSI/RM模型、数据通信、传输媒体、网络层次、流量控制、网络设备、IP地址、协议以及网络拓扑结构等多个方面。 1. 网络体系结构:网络体系结构描述了网络如何分层组织...

    ChoppingAndInterleaving_雷达干扰_雷达_radar_切片干扰_matlab_源码.zip

    切片干扰通常包括两个关键步骤:切片(Chopping)和交织(Interleaving)。 1. 切片(Chopping):切片是指在连续的雷达发射周期中,改变脉冲宽度、重复频率或者脉冲形状。例如,可以交替使用长脉冲和短脉冲,或者...

    网络教程总汇第一集TXT文档

    - **网桥**(Bridge):用于连接两个相似的网络。 #### 二、网络通信协议 **1. TCP 协议** - **全称**:Transmission Control Protocol(传输控制协议) - **特点**:面向连接的协议,提供可靠的、顺序的、无...

    Golang在京东列表页实践总结.pdf

    ### Golang在京东列表页实践的关键知识点 #### 一、背景与动机 - **动机**:为了解决京东列表页存在的几个主要问题:基于搜索的结果不够理想、接口响应时间长影响用户体验、无法针对数据进行二次优化及转化率相对较...

    CCNA复习知识点笔记

    网际互联指的是通过路由器连接两个或多个局域网(LAN)或广域网(WAN),并使用诸如IP这样的协议来设定逻辑网络寻址,以创建一个互相连接的网络。 2. **网络分段** 随着网络规模扩大,LAN内的流量拥堵问题愈发...

    TCP写的仿QQ程序

    项目描述中提到的几个关键点包括: 1. **窗口闪烁提示**:在Windows操作系统中,当有新消息到来时,程序通常会使得最小化的窗口在任务栏上闪烁,以引起用户的注意。这涉及到Windows API的使用,特别是`...

    专业名词1

    46. **对等实体(Peer entities)**:在网络通信中,具有相同地位的两个或更多参与者,如两个TCP连接端点。 这些术语只是计算机网络庞大知识体系的一部分,理解并掌握它们对于深入学习和实践网络技术至关重要。

Global site tag (gtag.js) - Google Analytics