cdn业务资质_什么是_人工智能目前的发展

产品 虚拟云 浏览

小编:季节性是时间序列的一个重要特征,我们提供了SAP HANA预测分析库(PAL)中提供的季节性分解方法,并封装在针对SAP HANA的Python机器学习客户端(HANA\ U ml)中,该客户端提供季节性测试

季节性是时间序列的一个重要特征,我们提供了SAP HANA预测分析库(PAL)中提供的季节性分解方法,并封装在针对SAP HANA的Python机器学习客户端(HANA\ U ml)中,该客户端提供季节性测试,并将时间序列分解为三个组件:趋势,季节性和随机性

在这篇博文中,你将了解到:

季节性的定义以及为什么我们需要分解时间序列数据。如何应用hana\U ml的季节性分解()分析两个典型的真实时间序列实例

1.1定义

季节性是时间序列的一个特征,在这个时间序列中,数据经历有规律的、可预测的变化,如每周和每月。季节性行为不同于周期性行为,因为季节性总是一个固定且已知的周期,而周期性没有固定的周期,例如商业周期。季节性可以用来帮助分析股票和经济趋势。例如,公司可以利用季节性来帮助确定某些业务决策,如库存和人员配置。

1.2为什么我们分解时间序列

在时间序列分析和预测中,我们通常认为数据是趋势的组合,季节性和噪声,我们可以通过捕捉这些成分中的最佳成分来形成一个预测模型。通常,时间序列有两种分解模型:加法和乘法。人们认为,当季节变化随时间相对恒定时,加法模型是有用的,而当季节变化随时间增加时,乘法模型是有用的。

现实世界的问题是混乱和噪声的,例如趋势不是单调的,真实模型可以有加性和乘法组件。然而,这些分解模型为我们提供了一种结构化和简单的方法来分析和预测数据。因此,识别时间序列中的季节性可以帮助您构建更好的模型。这可以通过以下方式实现:

数据清理:删除季节性组件将使输入和输出之间的关系更加清晰。可解释性:提供更多的时间序列信息

在hana\U ml的季节分解()中,我们提供了两个阶段的函数:

总体上,hana\U ml的季节分解()提供了一个简单快速的方法来识别季节性并分解时间序列。在下面的部分中,云数据库维护,云服务器的,我们将向您展示如何使用此函数分析两个真实世界的数据集,分析了美国汽油零售和纽约出租车乘客案例,分销 百度云,

所有源代码将使用Python机器学习客户端进行SAP HANA预测分析库(PAL)。

2.1 SAP HANA连接

我们首先需要创建一个到SAP HANA的连接,然后我们可以使用HANA\ U ml的各种功能进行数据分析。以下是一个示例:

2.2用例

数据集链接:https://www.eia.gov/dnav/pet/hist/leafthandler.ashx?n=PET&s=A103600001&f=M

该数据集包括1983年1月至2020年7月美国炼油厂汽油零售总额(千加仑/天)的月度数据。数据集有两列:日期和销售额,451个数据点

下图显示了数据集的变化,通过我们的观察,可能有一个年度模式。从2008年到2015年,销售额大幅下降。考虑到时间点,我们猜测下降可能是2008年经济崩溃造成的,这对石油和天然气行业造成了明显的负面影响。当我们看2020年的数据时,在2020年初有一个急剧下降,这可能是由于美国COVID-19大流行的封锁造成的。

图1美国炼油厂汽油零售总额

数据集已导入SAP HANA,表名为"汽油TBL"。因此,我们可以通过dataframe.ConnectionContext.table表()功能。然后,我们在原始数据帧中添加了一个名为'ID'的列,因为季节性分解()需要一个整数列作为关键列。

首先,由于季节性是由自相关滞后表示的,我们调用hana\ U ml中的校正函数来计算自动校正(acf),结果如下:

在开始时,我们假设数据具有年度模式,因此我们期望当滞后为12时,acf的值较高。然而,由于这一时间序列不是平稳的,数据库,云地 服务器,2008年至2015年的急剧下降对acf的价值有很大的影响,我们的预期是不真实的,acf是一条递减曲线。为了识别季节性,需要删除数据中的趋势。

因此,hana\U ml的季节性分解()提供了考虑消除趋势影响的季节性测试。我们调用季节分解()如下:

从统计结果可以看出周期是12,分解模型是加性的。用原始数据集和三个分量(季节性、趋势性和随机性)可视化输出:

我们还可以将分解类型设置为"乘法":

结果表明,当分解模型为乘法时,周期为12,但acf为0.31923,小于加法模型。因此,如果分解类型不是固定的,季节分解()将选择相加分解模型。

数据集链接:https://github.com/numenta/NAB/blob/master/data/realKnownCause/nyc\u taxi.csv

该数据集描述了从2014年7月到2015年1月的8个月内,纽约市出租车乘客的数量,其中5个异常发生在纽约市马拉松、感恩节、圣诞节、新年和暴风雪。原始数据来自纽约市出租车和豪华轿车委员会。这里包含的数据文件包括将出租车乘客总数聚合到30分钟的桶中。数据分为时间戳和乘客值两列,共10320个实例

数据集已导入SAP HANA,表名为"TAXI\u TBL"。因此,我们可以通过dataframe.ConnectionContext.table表()功能

从上图可以看出,出租车乘客的数量有日、周两种模式。因此,我们计算acf如下:

我们调用季节分解()得出周期为336,这是一个acf值最高的周模式:

在本博客中,我们介绍了什么是季节性以及如何使用hana\U ml的季节性分解()来分析和分解时间序列

如果您想了解更多有关hana\U ml和SAP hana预测分析库(PAL)的信息,请参考以下链接:

hana\U ml季节性分解文档

SAP hana预测分析库(PAL)季节性测试手册

有关SAP hana的Python机器学习客户端(hana\U ml)的其他博客文章

使用SAP hana的Python机器学习客户端中的统计测试进行异常值检测

通过使用Python机器学习客户端对SAP HANA进行聚类

使用Python机器学习客户端对SAP HANA进行季节分解对时间序列进行异常检测

使用Python机器学习客户端对SAP HANA进行一类分类的异常检测

使用Python Machine Learning Client for SAP HANA

将多个excel文件导入单个SAP HANA表

使用Python Machine Learning Client for SAP HANA进行COPD研究、解释和解释

当前网址:http://www.vmchk.com/app/52015.html

 
你可能喜欢的: