Tôi dựa vào một kịch bản làm sạch dữ liệu khách hàng được chia sẻ trên một msdn blog và đã có những cái nhìn đầu tiên về Data Quality Services.
Dựa vào kịch bản này tôi đã làm quen với khái niệm Knowledge Base và Domain trong DQS và tập cách định nghĩa một Knowledge Base.
Lưu ý là trong một Knowledge Base của Data Quality Services ta có thể định nghĩa nhiều Domain
- Ví dụ trong bài thực hành này tôi đã định nghĩa Los Angeles và LA là tương đồng, nếu dữ liệu Source là LA thì DQS sẽ sửa lại là Los Angeles
- Nếu CompanyName có chứa co thì sẽ sửa lại là Company...
Sau đó trải nghiệm Data Quality Project, chỉ định 1 table Source và đi qua Knowledge Base ở trên, dữ liệu được map sẽ được chỉnh sửa.
Có điều công đoạn chỉnh sửa dữ liệu này là làm thủ công bằng tay, tôi đang tìm hiểu tiếp làm thế nào để tự động hóa công việc này.
Xem thông tin tại đây: http://blogs.msdn.com/b/dqs/archive/2013/06/14/cleansing-customer-data-using-data-quality-services-dqs.aspx
0 comments:
Post a Comment