【什么叫CDC】一、
CDC是“Change Data Capture”的缩写,中文译为“数据变更捕获”。它是一种用于跟踪和记录数据库中数据变化的技术,常用于数据同步、数据仓库、实时分析和数据集成等场景。通过CDC,系统可以高效地获取数据库中的新增、更新或删除操作,而无需频繁全量读取整个数据库,从而节省资源并提高效率。
CDC技术广泛应用于企业级应用中,尤其是在需要将数据从一个系统实时同步到另一个系统的场景中,例如数据湖、ETL(抽取、转换、加载)流程、主数据管理(MDM)等。根据实现方式的不同,CDC可以分为日志解析型、触发器型、时间戳型等多种类型。
二、表格展示
| 项目 | 内容 |
| 全称 | Change Data Capture |
| 中文名称 | 数据变更捕获 |
| 定义 | 一种用于追踪和记录数据库中数据变化的技术 |
| 主要用途 | 数据同步、数据仓库、实时分析、数据集成等 |
| 核心功能 | 捕获新增、更新、删除操作,减少全量读取 |
| 优点 | 提高效率、节省资源、支持实时处理 |
| 常见应用场景 | ETL流程、主数据管理、数据湖、数据复制 |
| 实现方式 | 日志解析型、触发器型、时间戳型、基于快照型 |
| 典型工具/技术 | Oracle GoldenGate、Debezium、SQL Server CDC、AWS DMS |
| 适用数据库 | 多种关系型数据库(如MySQL、Oracle、SQL Server) |
三、总结
CDC作为一种高效的数据处理技术,正在被越来越多的企业所采用。它不仅能够提升数据处理的效率,还能在保证数据一致性的前提下,实现数据的实时同步与分析。对于需要频繁处理数据变更的业务场景来说,CDC是一个不可或缺的工具。


