分布式存储_linux服务器运维_企业0元试用

网站空间 虚拟云 浏览

小编:SAP Predictive Analytics的PythonAPI允许您以编程方式训练和应用模型。用户的代码可以在批处理模式下执行,也可以从py脚本执行,也可以从笔记本以交互方式执行。 在本文中,您将看到如

SAP Predictive Analytics的PythonAPI允许您以编程方式训练和应用模型。用户的代码可以在批处理模式下执行,也可以从py脚本执行,也可以从笔记本以交互方式执行。

在本文中,您将看到如何使用API配置、训练和保存模型。

下面的示例是在Windows机器上完成的:

SAP Predictive Analytics 3.3 Desktop,云服务器标配,其中包括Python API。WinPython发行版,云服务器收费,有数据科学库和Jupyter笔记本应用程序。

我们将使用SAP Predictive Analytics附带的人口普查数据。

培训数据集

首先,我们读取csv文件并将其内容加载到熊猫数据框。

数据集大小是多少?

我们显示前十行。

如果个人年收入超过5万,最后一列class包含1,否则为0。

我们检查阳性病例的比例。

1类病例的比例足够大。

我们可以用一个给定的分类变量(例如关系)来分解该比例。

类是我们想要预测的结果。为了做出预测,我们必须首先从已知结果的训练数据集中学习。这就是自动分析库(aalib)发挥作用的地方。

顺便问一下,我们的Python版本是什么

我们有要求的版本:3.5。我们可以继续使用aalib.

初始化

我们提供到Python API的路径,C++API和SAP预测分析桌面目录。我们导入了自动化分析库,并指定了上下文和配置存储。创建模型,我们创建了一个"回归"模型,如果指定的目标是标称的(例如类),它将执行分类。如果是连续的回归(如年龄)。

使用aalib可以处理数据库表或平面文件,但不能处理数据帧。在我们的例子中,我们针对census csv文件声明一个训练存储

API可以猜测数据描述或从文件中读取数据(如果有的话)。

我们设置目标的列名。它可以是硬编码的,也可以基于一个规则,比如:姓氏。

我们设置变量的角色。

我们选择分区方案:估计和验证。默认情况下,准备三个分区:估计、验证和测试。

我们可以启用或禁用带有真/假参数的候选预测值的自动选择。

我们可以设置多项式顺序,数据库云技术,默认值为1。

最后,我们训练模型。

保存模型

我们的模型训练成功。让我们保存它。方法如下所述。

我们命名了我们的模型,并将其保留以供以后使用。

此模型的格式与您使用桌面应用程序保存的格式相同。如果需要,桌面用户可以加载它。

在随后的博客中,云的服务器是,云分销下载,我们将在Jupyter笔记本中介绍我们的人口普查模型。

当前网址:http://www.vmchk.com/experience/80587.html

 
你可能喜欢的: