Distributed Streaming Platform

Apache Kafka
消息流平台实战

构建高吞吐、低延迟的实时数据管道 · 日处理万亿级消息 · 领英开源、全球最流行的分布式流处理平台

Kafka 3.x / KRaft Producer / Consumer Kafka Streams Kafka Connect Schema Registry Exactly-Once Flink 集成

课程简介

Apache Kafka 最初由领英(LinkedIn)工程师于 2011 年开源,现已成为全球规模最大的实时数据管道基础设施。Netflix、Uber、Airbnb、微软等超过 80% 的财富 100 强公司都在生产环境中使用 Kafka,每天处理消息量超过万亿条。

本教程从 Kafka 核心架构讲起,涵盖 Broker 集群搭建、Producer/Consumer 开发与调优、Kafka Streams 流处理、Kafka Connect 数据集成、Schema Registry 消息格式管理,到监控调优、安全加固与 Python/Go 生产实战,帮你构建企业级实时数据管道。

核心应用场景

🔄

实时数据管道

跨系统数据同步,CDC 变更捕获,MySQL → Kafka → Elasticsearch 全链路

📊

流式分析

Kafka Streams / Flink 实时聚合,窗口计算,毫秒级决策支持

🔗

微服务解耦

事件驱动架构,Saga 分布式事务,服务间异步通信

📝

日志聚合

统一收集应用日志、指标、审计事件,持久化保留,多消费者复用

🎯

事件溯源

Commit Log 作为系统真相来源,状态可重放,时间旅行调试

🌐

IoT 数据采集

百万设备并发上报,高吞吐写入,分区隔离不同设备类型

课程目录