云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

金山云_vps与云主机_免费6个月

小七 141 0

埃德蒙兹网利用数据块改善车辆数据质量和客户体验

我们很高兴宣布这一点埃德蒙兹网部署了Databricks,以简化Apache Spark群集的管理,并执行即席分析,以提高车辆数据的完整性并改善其网站的总体客户体验。你可以在这里读新闻稿。埃德蒙兹网这是一家领先的汽车信息和购物网络,每月为近2000万游客提供服务,购物者可以浏览经销商库存、车辆评论、购物提示、照片、视频和专题报道。为确保购物者满意,准确的车辆数据至关重要。埃德蒙兹网通过将汽车的VIN(车辆识别号)与原始设备制造商(原始设备制造商)和埃德蒙兹代码进行匹配,以识别有关车辆的关键信息,如车辆制造国、车辆年份等,来解决车辆列表页面上的数据质量问题。如果做得准确,提供这种详细的车辆信息埃德蒙兹网在购车过程中非常有价值。在过去的几年里,埃德蒙兹网的数据量从10 TB增长到100 TB,这使得准确解码每个VIN并将其与正确的车辆功能代码匹配变得越来越困难,从而导致丢失或不准确的细节影响了客户体验。例如,确定斯巴鲁有多大比例的遗漏了选项细节,或者有多少本田车没有外观颜色的描述,这些都是埃德蒙兹网工程队正在努力修复。为了解决这个数据完整性问题,埃德蒙兹网寻找apachespark的大规模处理速度。然而,他们意识到,为了让分析师和数据专业人士同时关注数据和业务,他们需要一个提供托管服务的综合数据平台,以简化Spark部署并提高生产率。随着数据块的实现,埃德蒙兹网能够使整个组织的数据访问民主化,允许其数据工程、数据科学和业务分析团队在规模上协作处理数据。埃德蒙兹网还取得了以下定量结果:将即席数据探索和分析速度提高了六倍,使他们能够更快地回答数据完整性问题;通过减少60%的处理时间,或工程团队每周平均3-5小时来提高报告速度;整个网站的车辆数据质量指标提高了35%。下载此案例研究以了解有关如何埃德蒙兹网正在使用数据块。为了自己试用数据块,今天就注册吧!免费试用Databricks。今天就开始吧