Khi thiết lập nguồn dữ liệu, dù bạn kết hợp dữ liệu như thế nào, điều quan trọng là phải hiểu được cấu trúc dữ liệu trong mỗi bảng và cách chúng được kết hợp. Những yếu tố chính cần xem xét:
- Level of detail: Mức độ chi tiếp của dữ liệu là câu trả lời cho câu hỏi “Cái gì xác định một dòng?”.
- Shared field: Phải có ít nhất một trường có thể được dùng để tạo liên kết giữa các bảng. Đối với một phép nối (join) các trường này phải được xác định bằng mệnh đề nối, chúng thiết lập mối quan hệ.
- Cardinality: Có bao nhiêu giá trị duy nhất cho trường được chia sẻ (tính độc nhất).
- Referential Integrity: Một giá trị trong một bảng được đảm bảo có một giá trị khớp trong bảng khác. Nói cách khác, không thể có bảng ghi trong một bảng mà không có bảng ghi tương ứng trong bảng khác.
1. Cardinality
Cardinality trong một cột hoặc trường đề cập đến mức độ duy nhất của giá trị của nó. Low cardinality nghĩa là chỉ có một vài giá trị duy nhất (như trong một trường cho màu mắt). High cardinality có nghĩa là có nhiều giá trị duy nhất (như là trong một trường cho số điện thoại).
Cardinality giữa các bảng thì tương tự nhưng đề cập đến việc một hàng từ một bảng có thể được liên kết với nhiều hàng trong bảng khác hay không. (Điều quan trọng cần nhớ là Cardinality không giải quyết việc có bị thiếu dữ liệu ở một trong hai bảng hay không. Sự hiện diện của thiếu dữ liệu là referential integrity. Mặc dù những khái niệm này hoạt động cùng nhau nhưng chúng là hai thuộc tính khác nhau của một mối quan hệ.
Các tùy chọn là one-to-one, one-to-many, many-to-one hoặc many-to-many.
1.1. One-to-one
Ví dụ: Mỗi chiếc ô tô có biển số riêng và biển số riêng cho từng ô tô. Giấy phép lái xe ô tô là 1-1. Lưu ý rằng ngay cả khi ô tô chưa được đăng ký hoặc chưa được cấp biển số, sự khác biệt đó được mô tả bằng referential integrity. Một chiếc ô tô chỉ có thể có một biển số và mỗi biển số chỉ có thể gán cho một chiếc ô tố, vì thế, biển số vẫn là một. | |
1.2. One-to-many hoặc Many-to-one
Thứ tự của các bảng xác định xem nó là many-to-one hay one-to-many (tương tự như phép nối trái và phải). Ví dụ: Nhiều nhân viên có cùng quản lý là many-to-one. Một quản lý có nhiều nhân viên là one-to-many. | |
1.3. Many-to-many
Đây là cài đặt mặc định nếu không có cài đặt nào khác trong nguồn dữ liệu. Ví dụ: Một diễn viên tham gia nhiều phim và một phim có nhiều diễn viên. Diễn viên trong phim là many-to-many. Có thể mua nhiều sách trong một lần giao dịch và một sách có thể mua nhiều lần. ISBN-to-OrderID là many-to-many. | |
2. Referential Integrity
Có một khái niệm liên quan được gọi là referential Integrity, có nghĩa là một hàng trong một bảng sẽ luôn luôn có một hàng khớp trong bảng khác, được xác định bởi giá trị của các trường được chia sẻ của chúng. Nếu cơ sở dữ liệu không chứa hồ sơ nào về ô tô hoặc không có biển số hoặc biển số không có ô tô thì mối quan hệ đó có referential integrity.
Trong Tableau, Referential integrity được định cấu hình trên mỗi bên của mối quan hệ. Trong cài đặt Performance Options, Some records match (một số bản ghi khớp) có nghĩa là không có (hoặc bạn không biết nếu có) referential integrity. All records match (tất cả các bản ghi phù hợp) có nghĩa là có referential integrity. Cài đặt mặc định là không giả định referential integrity (Some records match).
Tham khảo: Tối ưu các truy vấn Relationship sử dụng Performance Options
Qua phần đầu tiên, BAC đã giới thiệu đến bạn đọc hai khái niệm cardinality và referential integrity. Trong phần tiếp theo, chúng ta sẽ tìm hiểu về tầm quan trọng của hai khái niệm này trong Tableau, đừng quên đón đọc tại bacs.vn.
Đọc tiếp phần 2: Khái niệm Cardinality và Referential Integrity trong Tableau (Phần 2)
Nguồn tham khảo: https://help.tableau.com/
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – version 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung