谷歌与GitHub合作,在googlebigquery上发布了一个令人难以置信的新开放数据集。到目前为止,您已经能够监测和分析GitHub自2011年以来的脉搏(感谢GitHub归档项目!)今天我们要给它添加一个完美的补充。如果你能用一个SQL命令分析世界上所有的开源软件,你会怎么做?
Google BigQuery公共数据集程序现在提供了BigQuery中280多万个开源GitHub存储库内容的完整快照。多亏了我们与GitHub的新合作,您可以通过一个简单(或复杂)的SQL查询来分析将近20亿个文件的源代码。这将为我们刚刚开始设想的各种新见解和新进展打开大门。
例如,假设您是一个流行的开源库的作者。现在您可以在GitHub上找到所有使用它的开源项目。更重要的是,您可以通过分析项目的使用情况来指导项目的未来,并根据用户的实际使用情况改进API。
在安全方面,我们已经看到最流行的开源项目是如何受益于多人参与的。这种可见性有助于项目得到强化,并清除错误代码。如果您可以在其他所有开放源码项目中搜索具有类似模式的错误呢?你会通知他们的作者并向他们发送请求吗?好吧,现在你可以了。
在使用BigQuery和GitHub内容数据集时需要记住的一些概念:
本文地址: /shujuku/21632.html
版权声明:本文发布于收集站云 内容均来源于互联网 如有侵权联系删除