云网站服务器_国内数据云存储_移动云数据库服务器主机-搜集站云

分布式数据库_有哪些_有关物联网的问题

小七 141 0

分布式数据库_有哪些_有关物联网的问题

我们在2018年推出了BigQuery ML,这是谷歌云BigQuery数据仓库的一个集成部分,大淘客推广,企业软件正版化,作为培训和使用线性模型的SQL接口。许多在BigQuery中拥有大量数据的客户开始使用BigQuery ML来消除对数据ETL的需求,因为它将ML直接带到他们存储的数据中。由于易于解释,线性模型对我们的许多客户都非常有效。

然而,正如许多Kaggle机器学习竞赛所显示的那样,一些非线性模型类型(如XGBoost和AutoML表)在结构化数据上非常有效。基于SHAP值的可解释人工智能的最新进展也使客户能够更好地理解为什么通过这些非线性模型进行预测。Google云人工智能平台已经提供了训练这些非线性模型的能力,我们已经与云人工智能平台集成,将这些能力带到BigQuery中。我们增加了训练和使用三种新型回归和分类模型的能力:使用XGBoost的boosted树、AutoML表和使用Tensorflow的DNNs。用BigQuery-ML训练的模型也可以导出部署到云人工智能平台或客户自己的服务栈上进行在线预测。此外,我们还扩展了用例,包括推荐系统、聚类和时间序列预测。

我们宣布了以下产品的普遍可用性:使用XGBoost的增强树、使用Tensorflow的深层神经网络(DNN)和用于在线预测的模型导出。以下是关于它们的更多细节:

使用XGBoost增强的树

您可以使用XGBoost库训练和使用增强的树模型。基于树的模型很好地捕捉了非线性特性,XGBoost是构建增强树模型的最流行的库之一。在Kaggle竞赛中,这些模型在结构化数据上表现得非常好,而不像神经网络那样复杂和模糊,因为它们允许您检查决策树集来理解模型。这应该是您为任何问题构建的第一个模型之一。开始阅读文档,了解如何使用此模型类型。

使用TensorFlow的深层神经网络

这些是完全连接的神经网络,1元云购,属于TensorFlow中的DNNClassifier和DNNRegressor类型。使用DNN减少了对特征工程的需求,因为隐藏层捕获了大量的特征交互和转换。然而,超参数在性能上有很大的不同,云主机云服务器,理解它们需要更先进的数据科学技能。我们建议只有经验丰富的数据科学家才使用这种模型类型,大数据分析网站,并利用googlevizier这样的超参数优化服务来优化模型。开始使用文档以了解如何使用此模型类型。

在线预测的模型导出

一旦在BigQuery ML中构建了模型,就可以使用TensorFlow或XGBoost工具将其导出以进行在线预测或进一步编辑和检查。可以导出除时间序列模型以外的所有模型。除boosted tree外的所有模型都导出为TensorFlow saved模型,可以部署用于在线预测,甚至可以使用TensorFlow工具进一步检查或编辑。增强树模型以增强格式导出,用于在线部署和进一步编辑或检查。从文档开始,了解如何导出模型并将其用于在线预测。

我们正在为我们在不同行业看到的这些模型构建一套通用模式(用例)笔记本。查看所有教程和笔记本。