Tính năng mô hình dữ liệu được giới thiệu cho Tableau vào năm 2020 được thiết kế để giúp việc phân tích các kịch bản dữ liệu nhiều bảng phổ biến, bao gồm mô hình hình sao và bông tuyết dễ dàng hơn. Dưới đây là những loại mô hình được hỗ trợ trong nguồn dữ liệu Tableau.
Để tìm hiểu khái niệm mô hình dữ liệu và cách tạo mô hình dữ liệu hãy tham khảo các phần trước.
Tham khảo:
- Những điều cần biết về Tableau Data Model (Phần 1)
- Những điều cần biết về Tableau Data Model (Phần 2)
1. Bảng đơn
Phân tích trên một bảng logic duy nhất có chứa hỗn hợp dimensions và measures hoạt động giống như Tableau trước 2020.2. Bạn có thể xây dựng một bảng logic bằng cách dùng kết hợp các phép join, union, SQL tùy chỉnh,….
2. Hình sao và bông tuyết
- Trong data warehouse doanh nghiệp, thông thường dữ liệu có cấu trúc trong lược đồ hình sao hoặc bông tuyết nơi các measures được chứa trong một bảng dữ liệu trung tâm và các dimensions được lưu trữ riêng biệt trong các bảng dimension độc lập. Tổ chức dữ liệu này hỗ trợ nhiều luồng phân tích phổ biến gồm tổng hợp (rollup) và xem chi tiết (drill down).
Những mô hình này có thể đại diện trực tiếp với các mối quan hệ trong tính năng lập mô hình dữ liệu có sẵn bắt đầu từ Tableau 2020.2.
- Kéo bảng dữ kiện vào mô hình trước sau đó liên kết với các bảng dimension với bảng dữ kiện (trong lược đồ hình sao) hoặc với các bảng dimension khác (trong một bông tuyết).
Thông thường, trong lược đồ hình sao hoặc bông tuyết được mô hình tốt, các mỗi quan hệ giữa các bảng dữ kiện và các bảng dimension sẽ là many-to-one.
- Nếu thông tin này được mã hóa trong data warehouse của bạn, Tableau sẽ tự động dùng thông tin này để đặt Performance Options cho mối quan hệ.
- Nếu không, bạn có thể tự đặt thông tin này.
Ngoài ra, mọi hàng trong bảng dữ kiện sẽ có một mục nhập phù hợp trong mỗi bảng dimension.
- Nếu điều này là đúng và được ghi lại trong các ràng buộc toàn vẹn data warehouse của bạn, Tableau sẽ tự động dùng thông tin này để cài đặt toàn vẹn tham chiếu trong Performance Options.
- Nếu một số hàng của bảng dữ kiện không phù hợp trong bảng dimension, Tableau sẽ mặc định giữ lại tất cả các hàng khi tính toán đo lường nhưng có thể giảm giá trị khi hiển thị tiêu đề dimension.
3. Hình sao và bông tuyết với các measures trong nhiều bảng
Trong một vài lược đồ hình sao hoặc bông tuyết, tất cả các measures cho phân tích của bạn được chứa trong bảng dữ kiện. Tuy nhiên, thường đúng là các measures quan tâm bổ sung có thể liên kết với các bảng dimension.
Thậm chí nếu các bảng dimension không chứa measures, thông thường trong phân tích muốn đếm hoặc tổng hợp các giá trị dimension. Trong trường hợp này, sự phân biệt giữa bảng dữ kiện và các bảng dimension ít rõ ràng hơn. Để tạo sự rõ ràng, trước tiên, bạn nên thêm bảng tốt nhất vào canvas dữ liệu, sau đó liên kết tất cả các bảng khác với bảng đầu tiên đó.
Nếu bạn kết hợp các bảng này với nhau thành một bảng logic duy nhất, các measures trong bảng dimension sẽ được sao chép, dẫn đến tổng hợp bị bóp méo trừ khi bạn thực hiện các biện pháp phòng ngừa để loại trừ các giá trị bằng cách dùng tính toán LOD hoặc COUNT DISTINCT.
Tuy nhiên, nếu thay vào đó bạn tạo mối quan hệ giữa các bảng này, Tableau sẽ tổng hợp các measures trước khi thực hiện phép nối, tránh các vấn đề trùng lặp không cần thiết.
4. Phân tích đa thực tế
- Khả năng lập mô hình dữ liệu của Tableau hỗ trợ một số hình thức phân tích đa thực tế. Các bảng dữ kiện bổ sung (chứa các measures) có thể được thêm vào bất kỳ mô hình nào đã đề cập trước đó miễn là chúng chỉ liên kết đến một bảng dimension duy nhất.
Ví dụ: bạn có thể kết hợp hai hoặc nhiều bảng dữ kiện lại với nhau để phân tích thứ nguyên được chia sẻ như phân tích Customer 360. Các bảng dữ kiện này có thể có mức độ chi tiết khác với bảng dimension hoặc với nhau. Chúng có thể có mối quan hệ many-to-many với bảng dimension. Trong các trường hợp này, Tableau sẽ đảm bảo rằng các giá trị không được sao chép trước khi tổng hợp.
- Nếu bạn không có một bảng dimension được chia sẻ liên kết với bảng dữ kiện của bạn, bạn có thể tự động tạo một bảng bằng SQL tùy chỉnh hoặc bằng cách dùng các phép nối hoặc kết hợp các bảng dimension khác.
Hai bảng dữ kiện có thể liên kết trực tiếp với nhau trên một dimension chung. Loại phân tích này hoạt động tốt nhất khi một trong các bảng dữ kiện có chứa một tập siêu (superset) của dimension chung.
Trên đây là những loại mô hình dữ liệu được Tableau hỗ trợ nhưng vẫn có những mô hình không được hỗ trợ. Ngoài ra, còn có một số yêu cầu dành cho các mối quan hệ trong mô hình dữ liệu và các yếu tố giới hạn lợi ích của việc liên kết bảng mà BAC sẽ gửi đến bạn đọc trong phần cuối cùng tại đây:
Nguồn tham khảo:
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung