🔷
Analytics Engineering · Modern Data Stack

dbt 数据构建工具
实战指南

让数据转换变得像软件工程一样严谨——版本控制、测试、文档,一体化数据建模

dbt Core dbt Cloud BigQuery Snowflake DuckDB Jinja 宏 增量模型 CI/CD

课程简介

现代数据栈(Modern Data Stack)的核心挑战不再是数据存储,而是数据转换的工程化。传统方式下,数据团队用零散 SQL 脚本做转换,缺乏版本控制、没有测试、文档残缺,代码难以复用与维护。

dbt(data build tool)彻底改变了这一局面:用纯 SQL(和 Python)定义转换逻辑,Git 管理版本,自动生成依赖 DAG,内置测试框架,自动生成血缘文档。它让分析工程师能够用软件工程的最佳实践来构建数据模型,是数据工程师和分析工程师的必备工具。

你将学到什么

🏗️

分析工程理念

ELT vs ETL、分析工程师角色、dbt 解决什么问题

📦

模型与物化

view/table/incremental/ephemeral,ref() 自动依赖

🔌

Sources 管理

数据源声明、新鲜度检查、多源统一管理

测试体系

内置四大测试、自定义 SQL 测试、dbt-expectations

📄

文档与血缘

自动血缘图、静态文档站、GitHub Pages 发布

Jinja 与宏

模板语法、宏复用、dbt_utils 常用工具宏

🔄

增量模型

MERGE/append 策略、unique_key 去重、分区过滤

🚀

CI/CD 生产化

GitHub Actions、Slim CI、dbt Artifacts 元数据分析

课程目录