Liên kết dữ liệu của bạn trong Tableau (Phần 4)

Qua các phần trước, BAC đã chia sẻ về khái niệm relationships cũng như đã cùng bạn đọc thực hiện các thao tác với relationship, bạn có thể xem lại ngay bên dưới. Tuy nhiên, Tableau không chỉ hỗ trợ relationship để liên kết dữ liệu, hãy cùng khám phá những phương pháp khác ngay dưới đây.

Tham khảo:

Liên kết dữ liệu của bạn trong Tableau (Phần 1)

Liên kết dữ liệu của bạn trong Tableau (Phần 2)

Liên kết dữ liệu của bạn trong Tableau (Phần 3)

1. Relationships (bảng logic) và Joins (bảng vật lý)

Các phép Joins và Relationships hoạt động khác nhau trong Tableau và được xác định trong các lớp khác nhau của mô hình dữ liệu.

  • Bạn tạo các relationships giữa các bảng logic ở cấp độ cao nhất, lớp logic của nguồn dữ liệu của bạn.
  • Bạn tạo các phép joins giữa các bảng vật lý trong lớp vật lý của nguồn dữ liệu.

Các phép joins sẽ kết hợp dữ liệu từ hai bảng thành một bảng duy nhất trước khi bắt đầu phân tích. Việc hợp nhất các bản có thể dẫn đến trùng lặp dữ liệu hoặc bị lọc từ một hoặc cả hai bảng. Nó còn có thể dẫn đến dòng NULL được thêm vào dữ liệu nếu bạn dùng một phép left join, right join hoặc full outer join. Khi thực hiện phân tích đối với dữ liệu được join, bạn cần đảm bảo xử lý chính xác các tác động của phép join với dữ liệu của mình.

Lưu ý: Khi sự trùng lặp hoặc tác động lọc của phép join có thể mong muốn, hãy dùng join để hợp nhất các bảng thay vì relationship. Nhấp đúp vào một bảng logic để mở lớp vật lý và thêm các bảng được join.

Một relationship mô tả cách hai bảng độc lập liên kết với nhau nhưng không hợp nhất. Điều này tránh các vấn đề về trùng lặp và lọc dữ liệu có thể xảy ra khi join, giúp làm việc dễ dàng hơn.

RELATIONSHIPS JOINS
Được xác định giữa các bảng vật lý trong Relationship canvas (lớp logic)

Được xác định giữa các bảng vật lý trong Join hoặc Union canvas (lớp vật lý)

Không yêu cầu chọn loại kết nối

Cần kế hoạch và loại kết nối

Hoạt động giống như các vùng chứa cho các bảng được nối hoặc hợp nhất

Được hợp nhất vào bảng logic của chúng

Chỉ dữ liệu liên quan trong trực quan được truy vấn. Có thể cài đặt tính toàn vẹn và toàn vẹn tham chiếu để tối ưu hóa các truy vấn.

Chạy như một phần của mọi truy vấn

Mức độ chi tiết là tổng hợp cho trực quan

Mức độ chi tiết ở mức hàng cho bảng đơn

Các kiểu nối được Tableau tự động hình thành dựa trên bối cảnh phân tích. Tableau xác định các phép nối cần thiết dựa trên các measures và dimensions trong trực quan.

Các kiểu nối là tĩnh và cố định trong nguồn dữ liệu, bất kể bối cảnh phân tích. Join và Union được thiết lập trước khi phân tích và không thay đổi.

Các hàng không bị trùng lặp

Dữ liệu bảng được hợp nhất có thể dẫn đến trùng lặp

Các bản ghi chưa khớp được bao gồm trong các tổng hợp trừ khi bị loại

Các bản ghi chưa khớp được bỏ qua khỏi dữ liệu đã hợp nhất

Tạo các miền độc lập ở nhiều cấp độ chi tiết

Hỗ trợ các tình huống yêu cầu một bảng dữ liệu như trích xuất bộ lọc và tổng hợp

2. Relationships và blends

Mặc dù, cả relationships và blends đều hỗ trợ phân tích ở các mức độ chi tiết khác nhau, chúng vẫn có những khác biệt rõ ràng. Một lý do bạn có thể sử dụng blends qua relationships là để kết hợp các nguồn dữ liệu đã xuất bản cho phân tích của mình.

RELATIONSHIPS

BLENDS
Được xác định trong nguồn dữ liệu

Được xác định trong worksheet giữa một nguồn dữ liệu chính và một nguồn phụ

Có thể được xuất bản

Không thể xuất bản

Tất cả các bản đều bình đẳng về ngữ nghĩa

Phụ thuộc vào cách chọn nguồn dữ liệu chính, phụ và cách dữ liệu đó được cấu trúc.

Hỗ trợ tất cả outer joins

Chỉ hỗ trợ left joins

Tính toán cục bộ 

Được tính như một phần của truy vấn SQL

Các trường được liên kết là cố định

Các trường được liên kết thay đổi theo từng trang (có thể được tùy chỉnh trên cơ sở từng trang)

3. Các tính năng của các tùy chọn khác nhau để kết hợp dữ liệu: Relationships, joins và blends

Có nhiều cách để kết hợp các bảng dữ liệu, mỗi cách sẽ có các tình huống và đặc tính riêng:

  • Relationship: Sử dụng khi kết hợp dữ liệu từ nhiều mức độ chi tiết.

    • Yêu cầu trường phù hợp giữa hai bảng logic. Nhiều cặp trường phù hợp có thể xác định relationship.
    • Tự động sử dụng các tổng hợp đúng và các phép nối theo ngữ cảnh dựa trên cách các trường được liên kết và sử dụng trong trực quan.
    • Hỗ trợ many-to-many và outer joins.
    • Các relationships nhất quán cho toàn bộ workbook và có thể xuất bản.
    • Dù có thể xuất bản nhưng bạn không thể liên kết các nguồn dữ liệu đã xuất bản hoặc chỉnh sửa relationship trong các nguồn dữ liệu đã xuất bản.
    • Không thể xác định relationship dựa trên calculated fields hoặc geographic fields.
    • Sử dụng bộ lọc nguồn dữ liệu giới hạn tham gia các lợi ích của relationships.
  • Join: Sử dụng khi bạn muốn thêm nhiều cột dữ liệu trên cùng một cấu trúc hàng.

    • Yêu cầu các trường chung giữa hai bảng vật lý.
    • Yêu cầu thiết lập một mệnh đề join và loại join.
    • Có thể join một phép tính.
    • Các bảng vật lý được join sẽ hợp nhất thành một bảng logic với một kết hợp dữ liệu cố định.
    • Có thể dẫn đến mất dữ liệu nếu các trường hoặc các giá trị không có trong tất cả các bảng (phụ thuộc vào kiểu join sử dụng).
    • Có thể dẫn đến trùng lặp dữ liệu nếu các trường ở các mức độ chi tiết khác nhau.
    • Có thể sử dụng các bộ lọc nguồn dữ liệu.
  • Union: Sử dụng khi bạn muốn thêm nhiều dòng dữ liệu với cùng cấu trúc cột.

    • Dựa trên các cột khớp giữa hai bảng.
    • Các bảng vật lý được union sẽ hợp nhất thành một bảng logic duy nhất với sự kết hợp cố định của dữ liệu.
  • Blend: Sử dụng khi kết hợp dữ liệu từ các mức độ chi tiết khác nhau.

    • Có thể dùng để kết hợp các nguồn dữ liệu đã xuất bản nhưng không thể được xuất bản.
    • Có thể được dùng giữa một nguồn dữ liệu quan hệ và một nguồn dữ liệu hình khối.
    • Các nguồn dữ liệu có thể được kết hợp trên cơ sở mỗi sheet.
    • Luôn luôn là các left joins hiệu quả (có thể mất dữ liệu ở nguồn dữ liệu phụ).

Như vậy, chúng ta đã cùng đi qua những cách kết hợp dữ liệu trong Tableau. Hy vọng rằng những thông tin được chia sẻ trên đây sẽ hữu ích với bạn đọc. Đừng quên theo dõi các bài viết mới tại website bacs.vn để không bỏ lỡ những nội dung thú vị về phân tích và trực quan dữ liệu.

Nguồn tham khảo:

https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
  • Tính năng mới trên tableau – verion 2019.1 – click vào đây

BAC – Biên soạn và tổng hợp nội dung

Previous Post
Next Post