云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

微软云_百度云免费下载_新用户

小七 141 0

apachespark MLlib:从快速入门到Scikit学习

几个月前,我们举办了一个在线研讨会-Apache Spark MLlib:From Quick Start to Scikit Learn–为机器学习提供了一个快速入门、Spark MLlib和一些Spark machine learning用例的概述。它还介绍了多个Spark MLlib快速入门演示,以及Python pandas、scikit learn和R与MLlib的集成。网络研讨会可以按需访问,其幻灯片和示例笔记本也可以作为网络研讨会的附件下载。加入Databricks社区版测试版,免费访问Spark并试用笔记本电脑。我们回答了以下网络研讨会观众提出的常见问题。如果您还有其他问题,请访问Databricks论坛。常见网络研讨会问答单击问题以查看答案:既然Spark是分布式的,那么在使用MLlib时,如何组合来自每个节点的结果?它的结果是否与单个节点相同?对于小数据集(1K行),是否有可能在1到2秒内获得回归或决策树学习任务的响应?当笔记本电脑使用单火花节点时,它是什么?当对模型参数选择进行交叉验证时,折叠和模型+参数是否分布在集群中?对于MLlib网络研讨会上的演示,在线性回归之前,如何从单词中识别出特征?如果使用MLlib,还需要Python或R吗?哪个最适合ML:Python还是R?在MLlib网络研讨会演示中,您使用了火花.ml基于回归?你打算冻结吗火花.mllib基于RDD的算法?基于MLlib-SGD的算法(线性模型)可能会发散,除非特征被缩放;为什么在默认情况下特征缩放不是真的,为什么首先要这样敏感?免费试用Databricks。今天就开始吧