Phần cuối cùng của bài viết chúng ta sẽ cùng tìm hiểu về những tác động đến hiệu suất. Bạn nên tham khảo 2 phần đầu tiên của loạt bài viết này ngay dưới đây trước khi bắt đầu.
Tham khảo:
Khái niệm Cardinality và Referential Integrity trong Tableau (Phần 1)
Khái niệm Cardinality và Referential Integrity trong Tableau (Phần 2)
1. Các tác động ảnh hưởng đến hiệu suất
Nếu việc định cấu hình sai các cài đặt này có thể gây ra việc thiếu hoặc trùng lặp dữ liệu. Trong nhiều trường hợp, bạn có thể và nên để cài đặt mặc định: liên kết các bảng thay vì kết hợp, giữ nguyên Cardinality là many-to-many và không giả định Referential integrity. Đặc biệt, nếu bạn không chắc chắn về cài đặt.
Tuy nhiên, Cardinality và Referential integrity là Performance Options bởi vì có thể có các tác động về hiệu suất đối với các giá trị mặc định. Nếu bạn chắc chắn về cấu trúc dữ liệu của mình, việc định cấu hình cài đặt chính xác có thể giảm việc thực thi truy vấn để cải thiện tốc độ.
- Lưu ý: Phần tiếp theo sử dụng phép loại suy với các kỹ thuật kết hợp dữ liệu khác để chỉ cung cấp một khung khái niệm. Nó không phải là mô tả kỹ thuật về cách Tableau sử dụng cài đặt hiệu suất cho các mối quan hệ.
1.1. Cardinality
Cardinality của mối quan hệ tác động khi sự tổng hợp xảy ra. Điều này có thể được xem là về sự pha trộn. Kết hợp dữ liệu truy vấn hai nguồn dữ liệu độc lập. Mỗi nguồn dữ liệu được tổng hợp khi cần thiết đến mức độ chi tiết mong muốn cho view bất kể nguồn dữ liệu khác là gì. Đối với các mối quan hệ, cài đặt số lượng ảnh hưởng đến việc tổng hợp xảy ra trước hay sau khi kết hợp.
Trong ví dụ trên, cài đặt Many có nghĩa là số lượng nhân viên cho mỗi thư viện được tổng hợp trước khi kết hợp dữ liệu đo với thông tin sách, do đó đảm bảo mọi cuốn sách đều có số lượng chính xác. Khi đặt sai số lượng thành One, số lượng nhân viên không được tổng hợp trước khi kết hợp với dữ liệu sổ sách, dẫn đến giá trị không chính xác.
- Lưu ý: không chỉ không chính xác được hiển thị, tất cả giá trị được gán cho loại nhân viên Librarians, mặc dù thực tế chúng được lấy từ ba loại nhân viên. Cấu hình sai cài đặt này có thể gây ra các giá trị không thể đoán trước và không chính xác. Việc lọc kết quả này chỉ xảy ra khi một trường từ bảng khác ở phía bên kia của mối quan hệ được đặt không chính xác được dùng trong View.
Nếu các giá trị đều là duy nhất, tuy nhiên, Tableau có thể tự do xóa tập hợp tham gia trước nếu nó tối ưu hóa truy vấn.
1.2. Referential Integrity
Mặc dù, Referential Integrity đề cập đến một thiết lập cho các mối quan hệ, nó có thể được xem xét về các loại kết nối. Một kết nối bên ngoài đầy đủ sẽ giữ lại tất cả các bản ghi, bất kể có kết quả trùng khớp trong bảng kia hay không nhưng với chi phí hiệu suất. Nếu bạn không chắc liệu bản ghi có bị mất hay không thì một kết nối bên ngoài sẽ an toàn hơn. Đây là cách các bảng được xử lý khi có thể không có referential integrity.
Một phép nối bên trong sẽ chỉ giữ lại những bản ghi có sự trùng khớp từ cả hai bảng, loại bỏ các bản ghi không xuất hiện trong mỗi bảng. Nếu bạn biết kết hợp bên trong sẽ không loại bỏ dữ liệu cần thiết, thì nó sẽ hiệu quả hơn. Nếu Performance Options được đặt thành All records match, referential integrity được giả định và các phép nối được thực hiện mà không các xem xét các giá trị chưa khớp.
Một cài đặt referential integrity không chính xác có thể tác động giống như bộ lọc đối với dữ liệu được kết hợp, loại bỏ các giá trị không khớp.
2. Giữ nguyên giá trị mặc định
Nếu phân tích của bạn có hiệu suất chấp nhận được, chúng tôi đặc biệt khuyến khích để lại các cài đặt Performance Option của many-to-many và không giả định Referential integrity. Sức mạnh của các mối quan hệ đến từ khả năng cung cấp kết quả chính xác, phù hợp với ngữ cảnh dựa trên các bảng được sử dụng trong phân tích.
Qua loạt bài viết này, mong rằng BAC đã có thể mang đến cho bạn đọc những kiến thức hữu ích. Các bạn quan tâm đến chủ đề phân tích dữ liệu nói chung và Tableau nói riêng có thể tham khảo khóa học Tableau tại BAC, đừng quên đón xem các nội dung mới nhất sẽ được cập nhật thường xuyên tại website bacs.vn.
Nguồn tham khảo: https://help.tableau.com/
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – version 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung