云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

企业网站_长沙腾讯云_便宜的

小七 141 0

Yandex开源CatBoost,一个可以用最少数据训练的机器学习库

俄罗斯搜索引擎市场领导者Yandex Europe AG刚刚开放了一个名为CatBoost的新机器学习库。这家公司是继谷歌(Google)、Facebook(Facebook)和微软(Microsoft)等公司的后尘,推出了一系列机器学习框架的科技巨头。然而,尽管这些公司专注于构建神经网络,即模仿人脑的系统,可以训练它们识别特定的物体、图像和事件,但CatBoost被描述为一个"梯度提升"库。Yandex的机器智能和研究主管米莎·比连科(Misha Bilenko)在博客中解释说,梯度提升是机器学习的一个分支,目的是在可用数据有限的情况下教授系统,特别关注事务性或历史性数据。Bilenko说,该方法"广泛应用于企业每天遇到的各种问题,如检测欺诈、预测客户参与度以及对推荐项目进行排名,如顶级网页或最相关的广告。"即使在数据相对较少的情况下,它也能提供高度准确的结果,这与需要从大量数据中学习的深度学习框架不同。"根据CatBoost的Github页面,这个框架是为"决策树上的开源梯度提升"而设计的。换句话说,它提供了一种通过一组称为"学习者"的决策机制(而不仅仅是一个)来分类和排序数据的方法。这些学习者产生的结果根据每个人的优缺点进行加权和分类。这个想法是,通过组合多个学习者,CatBoost可以产生比只使用一个学习者的框架更准确的结果。比连科说,Yandex已经开始在自己的服务中使用CatBoost。该框架正在取代旧的MatrixNet机器学习算法,Yandex将其用于搜索引擎排名、天气预报、推荐,甚至是itsYandex。出租车Yandex表示,将从MatrixNet过渡到MatrixNet,这家服务公司正与共享单车公司Uber Technologies Inc.合资成立37.2亿美元的合资企业CatBoost已经开始,应该在几个月内完成。此外,Yandex还在apachesoftwarefoundation许可证下提供CatBoost服务,这意味着任何人都可以在自己的程序和服务中使用它。瑞士的欧洲核子研究组织CERN已经接受了Yandex的提议,该组织正在使用CatBoost改进其粒子识别系统的性能。"CatBoost将提高我们识别带电粒子的效率,从而提高选择的准确性"我们的数据,"LHCb粒子鉴定项目的协调人Marianna Fontana和Donal Hill说。Bilenko说:"通过将CatBoost作为一个开源库提供,我们希望让数据科学家和工程师能够毫不费力地获得最高精度的模型,并最终在机器学习方面定义一个新的卓越标准。"。资料图:Yandex既然你来了…点击订阅我们的YouTube频道(见下文),显示您对我们使命的支持。我们的订户越多,YouTube就越会向你推荐相关的企业和新兴技术内容。谢谢!支持我们的使命:>>>>>立即订阅我们的YouTube频道。……我们还想告诉你我们的使命,以及你如何帮助我们完成它。SiliconANGLE Media Inc.的商业模式是基于内容的内在价值,而不是广告。与许多在线出版物不同的是,我们没有付费墙或横幅广告,因为我们想让我们的新闻保持开放,不受影响,也不需要追逐交通。那个新闻、报道和评论SiliconANGLE——以及现场报道,我们的硅谷工作室和cube环球巡演的视频团队提供的未经剪辑的视频需要大量的辛勤工作、时间和金钱。保持高质量需要赞助商的支持,他们与我们的无广告新闻内容的愿景一致。如果你喜欢这里的报道,视频采访和其他无广告内容,请花点时间看看我们的赞助商支持的视频内容样本,在推特上表达你的支持,然后继续回到SiliconANGLE。