当前位置:网站首页>机器学习笔记 - 自相关和偏自相关简介
机器学习笔记 - 自相关和偏自相关简介
2022-06-30 12:14:00 【坐望云起】
1、概述
自相关和偏自相关图在时间序列分析和预测中大量使用。
这些图表以图形方式总结了与时间序列中的观测值的关系强度以及先前时间步长的观测值。对于时间序列预测的初学者来说,自相关和偏自相关之间的区别可能很让人困惑。
我们将了解如何使用 Python 计算和绘制自相关和偏相关图。以及了解以下内容
如何绘制和查看时间序列的自相关函数。
如何绘制和查看时间序列的偏自相关函数。
用于时间序列分析的自相关函数和偏自相关函数之间的区别。
2、最低每日温度数据集
该数据集描述了澳大利亚墨尔本市 10 年(1981-1990 年)的最低日气温。
单位为摄氏度,有 3,650 个观测值。数据来源为澳大利亚气象局。
数据集下载地址
链接:https://pan.baidu.com/s/19G9YsOKtRDXNYAKdOwBq6A
提取码:ateb下面加载最低每日温度并绘制时间序列图。
from pandas import read_csv
from matplotlib import pyplot
series = read_csv('daily-minimum-temperatures.csv', header=0, index_col=0)
series.plot()
pyplot.show()运行该示例将数据集加载为 Pandas 系列并创建时间序列的线图。

3、相关和自相关
相关性总结了两个变量之间关系的强度。我们可以假设每个变量的分布符合高斯(钟形曲线)分布。如果是这种情况,我们可以使用皮尔逊相关系数来总结变量之间的相关性。
Pearson 相关系数是介于 -1 和 1 之间的数字,分别描述负相关或正相关。零值表示没有相关性。
我们可以计算时间序列观测值与先前时间步长的观测值的相关性,称为滞后。因为时间序列观测值的相关性是使用先前时间相同序列的值计算的,所以这称为序列相关性或自相关性。
时间序列自相关的滞后图称为AutoCorrelation Function,或首字母缩写词 ACF。该图有时称为相关图或自相关图。
下面是使用 statsmodels 库中的plot_acf()函数计算和绘制最低每日温度的自相关图的示例。
from pandas import read_csv
from matplotlib import pyplot
from statsmodels.graphics.tsaplots import plot_acf
series = read_csv('daily-minimum-temperatures.csv', header=0, index_col=0)
plot_acf(series)
pyplot.show()运行该示例会创建一个 2D 图,显示沿 x 轴的滞后值以及在 -1 和 1 之间的 y 轴上的相关性。
置信区间绘制为圆锥。默认情况下,这设置为 95% 的置信区间,这表明此代码之外的相关值很可能是相关性而不是统计侥幸。

默认情况下,会打印所有滞后值,这会使绘图变得嘈杂。我们可以将 x 轴上的滞后数限制为 50,以使绘图更易于阅读。

4、偏自相关函数
偏自相关是时间序列中的观察与先前时间步的观察之间的关系的总结,而干预观察的关系被删除。
观测值和前一时间步的观测值的自相关由直接相关和间接相关组成。这些间接相关性是观察相关性的线性函数,在干预时间步上观察。
偏自相关函数试图消除的正是这些间接相关性。
下面的示例使用statsmodels 库中的plot_pacf()计算并绘制了最低每日温度数据集中前 50 个滞后的偏自相关函数。
from pandas import read_csv
from matplotlib import pyplot
from statsmodels.graphics.tsaplots import plot_pacf
series = read_csv('daily-minimum-temperatures.csv', header=0, index_col=0)
plot_pacf(series, lags=50)
pyplot.show()
边栏推荐
- Remove invalid parentheses [simulate stack with array]
- 不同类型的变量与零究竟是如何比较
- MySQL built-in functions
- Shell编程概述
- How to solve cross domain problems
- 全面解析免费及收费SSH工具的基本特性和总结
- Redis - problèmes de cache
- Visual studio configures QT and implements project packaging through NSIS
- Introduction to sub source code updating: mid May: uniques NFT module and nomination pool
- The format of RTSP address of each manufacturer is as follows:
猜你喜欢

Understanding and learning of MySQL indexing and optimization

Tencent cloud Database Engineer competency certification was launched, and people from all walks of life talked about talent training problems

【目标跟踪】|pytracking 配置 win 编译prroi_pool.pyd

Building of Hisilicon 3559 universal platform: obtaining the modified code of data frame

如何利用AI技术优化独立站客服系统?听听专家怎么说!

【MySQL】MySQL的安装与配置

SuperMap iClient3D 11i for Cesium三维场景中图例使用说明

Flinksql customizes udatf to implement topn

Why should offline stores do new retail?

Building a database model using power designer tools
随机推荐
MySQL composite query
Why should offline stores do new retail?
【目标跟踪】|pytracking 配置 win 编译prroi_pool.pyd
Android development interview real question advanced version (with answer analysis)
【MySQL】MySQL的安装与配置
解决numpy.core._exceptions.UFuncTypeError: ufunc ‘add‘ did not contain a loop with signature matchin问题
药店管理系统
第十三章 信号(三)- 示例演示
1175. prime number arrangement: application of multiplication principle
海思3559开发常识储备:相关名词全解
21. Notes on WPF binding
Commands for redis basic operations
SuperMap iClient3D 11i for Cesium三维场景中图例使用说明
JMeter之性能测试流程及性能测试关注点
市值蒸发650亿后,“口罩大王”稳健医疗,盯上了安全套
[QNX Hypervisor 2.2用户手册]6.2.3 Guest与外部之间通信
Today in history: Microsoft acquires PowerPoint developers; SGI and MIPS merge
【一天学awk】基础中的基础
Hisilicon 3559 sample parsing: Venc
60 个神级 VS Code 插件!!