云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

企业网站_死神来了5百度云_高性能

小七 141 0

HomeAway是如何通过Databricks改变度假租赁行业的

我们很荣幸地宣布,Expedia的子公司HomeAway是度假租赁行业全球领先的在线市场之一,它选择了Databricks来简化其大数据需求,并提高公司将旅行者与合适房产匹配的能力。来自世界各地的旅行者使用HomeAway的在线市场搜索度假租房。为了便于在旅行者和假期租赁之间进行匹配,HomeAway必须显示与旅行者特定兴趣相关的搜索结果。HomeAway分析大量非结构化数据—日志事件、文本(多种语言)和图像—以提供与旅行者相关的搜索结果。他们还利用上下文图像分类来解释图像中的上下文信息,以便将具有最高相关性的图像映射到搜索条件。例如,当一个旅行者选择"海滨"作为过滤器时,他们能够对包含海滩图像的照片进行整理和排序。搜索和内容相关性的挑战要求能够快速ETL大量非结构化数据。在HomeAway的情况下,他们需要将数据从其内部HDF移动到AWS S3进行勘探和分析。他们也越来越需要将自己的数据与Expedia的数据合并,以创建Expedia所有网站的预测模型。最初,他们尝试使用开源的apachespark,捆绑在jar中,通过Spark提交脚本和Zeppelin笔记本执行。但他们很快发现,他们缺乏Spark专业知识,升级Hadoop的困难,以及在一台机器上使用R来计算基于预测的文档相似性任务的挑战被证明是非常耗时和资源密集的。由于Expedia的战略举措是完全进入云端,HomeAway需要一个平台,使他们能够访问S3上的大量数据,同时提供一个交互式和高度可扩展的环境,允许快速原型和提问,以发现未来的机器学习和流媒体使用案例。随着Databricks简化了Spark基础设施,HomeAway的数据科学团队现在可以专注于提供创新的新功能,以增强整体用户体验。展望未来,HomeAway还将与Expedia的其他公司探索更多的联合分析机会,以提供统一的用户体验,充分利用他们的集体保护伞下的所有数据。下载此案例研究,了解HomeAway如何使用Databricks。免费试用Databricks。今天就开始吧