Breaking News
Loading...
31/07/2013

Change Data Capture trong SQL Server Integration Services 2012

Hôm nay tìm hiểu về Change Data Capture (CDC) trong SQL Server Integration Services 2012, tôi tìm thấy một bài viết rất tuyệt vời, trong đó tác giả minh họa từng bước để cấu hình và trải nghiệm CDC trong SSIS 2012, tôi xin tóm tắt lại như sau:

Tại sao CDC ra đời trong SSIS 2012?


Tôi lấy một ví dụ, một trong những yêu cầu của một dự án BI là tích hợp dữ liệu từ nhiều nguồn vào một Data warehouse, chuyện gì xảy ra nếu dữ liệu nguồn là rất lớn, và mỗi khi dữ liệu nguồn thay đổi ta phải load lại tất cả? (hàng trăm GB, hay thậm chí TB).

Có cách nào để ta biết được những dữ liệu mới được cập nhật và chỉ load đúng những dữ liệu đó, như vậy sẽ rất hiệu quả và tiết kiệm được rất nhiều thời gian và công sức.

Và Change Data Capture trong SSIS 2012 ra đời để giải quyết khúc mắc đó. Nó cho phép SSIS đọc được dữ liệu từ tính năng Change Data Capture của Database Engine.

Một vài điểm tôi note lại từ bài viết của tác giả:


  • Database và table source phải được cấu hình CDC
  • Tác giả xây dựng 2 SSIS package, 1 package cho lần load đầu tiên (chỉ chạy 1 lần), load tất cả dữ liệu từ source vào destination và 1 package cho những lần load sau (chạy nhiều lần), chỉ load những thay đổi, từ công nghệ người ta gọi là incremental load.


Tham khảo thông tin chi tiết tại đây:
http://www.mattmasson.com/2011/12/cdc-in-ssis-for-sql-server-2012-2/

0 comments:

Post a Comment

 
Toggle Footer