构建高吞吐、低延迟的实时数据管道 · 日处理万亿级消息 · 领英开源、全球最流行的分布式流处理平台
课程简介
Apache Kafka 最初由领英(LinkedIn)工程师于 2011 年开源,现已成为全球规模最大的实时数据管道基础设施。Netflix、Uber、Airbnb、微软等超过 80% 的财富 100 强公司都在生产环境中使用 Kafka,每天处理消息量超过万亿条。
本教程从 Kafka 核心架构讲起,涵盖 Broker 集群搭建、Producer/Consumer 开发与调优、Kafka Streams 流处理、Kafka Connect 数据集成、Schema Registry 消息格式管理,到监控调优、安全加固与 Python/Go 生产实战,帮你构建企业级实时数据管道。
核心应用场景
跨系统数据同步,CDC 变更捕获,MySQL → Kafka → Elasticsearch 全链路
Kafka Streams / Flink 实时聚合,窗口计算,毫秒级决策支持
事件驱动架构,Saga 分布式事务,服务间异步通信
统一收集应用日志、指标、审计事件,持久化保留,多消费者复用
Commit Log 作为系统真相来源,状态可重放,时间旅行调试
百万设备并发上报,高吞吐写入,分区隔离不同设备类型
课程目录