云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

域名交易_虚拟主机运营商_免费领

小七 141 0

"嘿,大数据网,怎么了?!"(或者用你的母语说的任何类似的话)你读了书名后大声喊道难道大数据不是人们在Hadoop上运行的数百万字节的数据吗?"是的,这是你到处听到和读到的。但与本月KDnuggets(一个关于商业分析、大数据、数据挖掘和数据科学的热门网站)的汇总结果不完全一致。

连续第四年,对"你分析的最大数据集是什么?"仍然"在GB范围内",其中G代表千兆,而不是百万。最流行的范围实际上是1-10GB的数据。这就是SAP HANA express edition(又名HXE)所提供的:您可以免费运行它,大数据100,最多32GB的RAM,包括社区支持下的生产性使用。

"尽管如此,大数据中心是什么,现在的数据分析都是关于Hadoop的"您可以继续。然而,现实又是不同的。根据KDnugget今年的另一项调查,2016年最受欢迎的分析/数据科学工具前三名是:

正如您所知,SAP HANA是内存SQL兼容数据库。更好的是,大数据怎么查询,您可以使用列表前两个位置的工具连接到它使用Python

连接到HXE,既然您提到了Hadoop,那么SAP-HANA也可以与之集成。但让我们一步一步来。

因此,SAP HANA Express可以用于KDnuggets成员完成的所有数据分析方案的一半。我有没有提到免费的?

我也计划加入这项运动,在接下来的几周或几个月里,我将使用SAP HANA Express,并以开发人员教程或博客文章的形式与您分享我旅程中最有趣的发现。

正是为了这样做,我获得了Intel NUC型号NUC5i5RYH。但对于我的计划来说,使用什么版本的HXE并不重要:内部部署或在CAL中,虚拟机或安装二进制安装程序。

幸运的是,HXE上已经有很多博客,包括我的队友Craig Cmehil的博客。我要背上那些来跳起来,但然后运行我自己的一套练习。所以,公众号返利系统,请继续关注。