从 ClickHouse 到 Apache Doris:在网易云音乐日增万亿日志数据场景下的落地 易云音乐替换了 ClickHouse
作者|网易数据开发专家 赵荣生日志数据已成为企业洞察系统状态、从C场景监控网络安全及分析业务动态的网万亿宝贵资源。网易云音乐引入 Apache Doris 作为日志库新方案,易云音乐替换了 ClickHouse 。日增日志目前已经稳定运行 3 个季度 ,数据规模达到 50 台服务器,落地天翼云2PB 数据 ,从C场景每天新增日志量超过万亿条,网万亿峰值写入吞吐 6GB/s 。易云音乐
网易云音乐每天都会产生大量用户行为数据 、日增日志业务数据及日志数据,数据这些数据在异常行为跟踪、落地客诉问题定位 、从C场景运行状态监控、网万亿性能优化等方面扮演守护者的易云音乐角色。面对每日万亿级别数据的增量 ,网易云音乐早期的日志库以 ClickHouse 为核心构建,但面临运维成本高、并发查询能力不足、写入性能不稳定 、使用费用高昂等问题 ,在新需求的满足上稍显吃力。

为寻找更优质解决方案 ,结合当前的业务需求,网易云音乐引入 Apache Doris 作为日志库新方案 ,替换了 ClickHouse 。目前已经稳定运行 3 个季度,规模达到 50 台服务器 ,2PB 数据 ,每天新增日志量超过万亿条,峰值写入吞吐达 6GB/s 。本文将介绍从 ClickHouse 到 Apache Doris 的迁移思考及调优实践 ,并分享网易云音乐如何在运维效率 、并发能力、查询响应以及存储性能上实现全方位提升。
早期架构及挑战
云音乐数据平台主要包括客户端日志、服务端日志、数据平台相关组件运行日志这几类 :
客户端 / 服务端日志 :客户端 / 服务端产生的日志是数据体系的核心基础数据之一