云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

大带宽_域名备案查询系统_12月免费

小七 141 0

棒球是一项数据和统计数据丰富的运动,但尽管数据过剩,物联网设备,但要理解所有这些,真正理解棒球成功的原因是极其困难的。为了开启2018棒球赛季,我想我试驾SAP Analytics Cloud,看看是否能理解所有这些数据。

为什么球迷不了解棒球统计数据

对棒球数据的全面了解往往留给"专家"们,原因如下:

输入肖恩·拉曼的数据集

去年,我偶然发现肖恩·拉曼的棒球档案。肖恩提供了一个非常强大的数据集对每一个可以想象的棒球统计。他提供了关于球队、球员、击球、投球、外野、薪水、奖项、公园、季后赛、全明星赛等的多个数据集

棒球有一个数据建模问题

虽然大多数人不认为棒球有一个复杂的数据模型,但它确实提出了大多数组织面临的许多现实数据挑战。肖恩的数据集提供了28个不同的表,这些表不能整齐地"连接"在一起。有一张桌子,上面有球队,年龄和球员。还有一个击球手表,里面有球队、年份和球员。同样的表格被复制用于投球和外场,同样的用于季后赛、全明星赛、名人堂、年度获奖者等。每个表格都在他们之间建立了多对多的关系。(例如,许多球队跨许多年,有许多球员,许多球员跨许多年为许多球队效力,许多全明星赛跨许多年,有许多球队和球员参加,等等。)此外,击球、投手、外野和季后赛表格在整个表格中都有非常相似的字段,如游戏,球员、团队、击球、步行等。投手(在NL)可以投球、投球和击球。不管怎样,在没有太多技术的情况下,淘客助手,建模数据从28个原始表格变成了12个不同的表格,其中有3个主要事实表格。

我们可以用这些数据回答什么样的问题?

如果我们查看所有147年的棒球数据,我们可以看到所有的球队、特许经营权和球员来来去去。

如果我们深入研究,我们很快就会发现,在20世纪之前,比赛统计数据并不总是正确输入的,每个赛季的比赛数量也不相等。直到1961年,棒球才进入了整整162场比赛的赛季。在比赛中你可以看到一些下降,因为罢工缩短赛季(1981年和1994年),以及在第一次世界大战期间?哪个损失最大?

这不是一个直截了当的问题。对一些人来说,胜利可以由大多数冠军决定,它可以意味着大多数季后赛出场率,它可以意味着大多数常规赛的胜利,也可以意味着最高的获胜百分比(对于那些像天使队这样的新加盟球队)。以下是所有这些数据的一个视图。

然后我们可以看到按时代划分的前五大特许经营权。

虽然你无法从这张图中看出,数据中有几个有趣的掘金:

获胜并不等于冠军。在长球时代(1994-2005),亚特兰大勇士队赢得了最多的比赛,但只赢得了一个冠军。洋基队是第二个赢家,在线自助建站系统,赢得了4个冠军。但在后类固醇时代(2006年至今),洋基赢得最多,但没有赢得总冠军。除了佛罗里达马林鱼队和芝加哥小熊队之外,一支在某个时代不占优势的球队赢得冠军是非常罕见的。糟糕的团队往往不会永远保持糟糕的状态。虽然下面没有显示,但我们可以关注最差的表现者,我们可以看到许多最差的表现者不会在多个时代保持贫穷。你可以看到一些表现不佳的球队的命运逆转,比如堪萨斯城皇家队和休斯顿天文队?

用来衡量优秀击球手的一个关键进攻统计数据是OPS(在基地+重击)。这个想法是,你越经常在基地,更好的基地百分比(OBP)。你得到的垒数越多(例如双打比单打值钱,三倍比双打值钱,全垒打比三倍值钱),你的击球率就越高。如果你把这两个数据加在一起,你会得到OPS(准时+击球)。

这个数据有趣的是,在过去的147年里……(1)赢得最多的球队得分最多,(2)得分最多的是OPS高的球队,以及(3)OPS高的球队会赢得更多的胜利。

投手比赛不是吗?嗯,那也是真的。我读到的两个投手数据是WHIP和FIP。鞭子是每局投出的步行+命中率的平均值。与击球统计相似,(1)跑动少的球队获胜更多,(2)鞭子低的球队获胜更少,(3)鞭子低的球队获胜更多。

有好投手还是好击球手更好?

很明显,大数据在线,你需要两支球队,一支在禁区和禁区都处于领先地位的球队几乎总是能进入季后赛。但是一支在禁区前五名的球队比一支在禁区前五名的球队更有可能进入季后赛。自从长球时代(过去22年)以来,71%的顶级投手球队进入了季后赛,车险返现,而排名前五的投手球队中只有58%进入了季后赛。所以投手胜于投手。

谁是最好的投手和鞭子球员?