Liên kết dữ liệu của bạn trong Tableau (Phần 1)

Relationships (mối quan hệ) là cách năng động và linh hoạt để kết hợp dữ liệu của bạn cho việc phân tích. Một mối quan hệ sẽ mô tả cách mà hai bảng liên kết với nhau, dựa trên các trường phổ biến nhưng không hợp nhất các bảng lại. Khi một mối quan hệ được tạo giữa các bảng, các bảng vẫn tách biệt, duy trì mức độ chi tiết và miền riêng.

Bạn có thể hình dung mối quan hệ giống như một bản hợp đồng giữa hai bảng. Khi bạn xây dựng một trực quan với các trường từ những bảng này, Tableau đưa dữ liệu từ các bảng này vào bằng cách sử dụng hợp đồng đó để tạo một truy vấn với các phép nối phù hợp.

1. Relationships (Mối quan hệ) là gì?

Mối quan hệ là những đường kết nối linh hoạt được tạo giữa các bảng logic trong nguồn dữ liệu của bạn. Có một số người gọi mối quan hệ là “noodles” nhưng hầu hết trong các tài liệu đều gọi chúng là “relationships”.

Khi chưa có nhiều kinh nghiệm trong việc kết hợp dữ liệu, bạn nên sử dụng relationships bởi vì nó giúp việc chuẩn bị và phân tích dữ liệu trở nên dễ dàng và trực quan hơn.

Relationships có nhiều ưu điểm hơn so với joins (nối) khi liên kết nhiều bảng:

  • Bạn không cần cấu hình loại join giữa các bảng mà chỉ cần chọn các trường để xác định relationship.
  • Các bảng được liên kết vẫn tách biệt và riêng biệt, không hợp nhất thành một.
  • Relationships sử dụng joins nhưng chúng là tự động. Tableau tự động chọn loại join dựa trên các trường được dùng trong trực quan. Trong khi phân tích, Tableau điều chỉnh các loại kết hợp một cách thông minh và duy trì mức độ chi tiết gốc trong dữ liệu của bạn.
  • Tableau sử dụng relationships để tạo các tổng hợp và phép nối chính xác trong suốt phân tích dựa trên bối cảnh hiện tại của các trường trong một worksheet.
  • Nhiều bảng ở cấp độ chi tiết khác nhau được hỗ trợ trong một nguồn dữ liệu. Bạn có thể xây dựng các mô hình dữ liệu chứa nhiều bảng và giảm số lượng nguồn dữ liệu cần để xây dựng trực quan.
  • Các giá trị measure không phù hợp không bị xóa (không mất dữ liệu ngẫu nhiên).
  • Tránh trùng lặp dữ liệu và các vấn đề lọc có thể gặp ở join.
  • Tableau sẽ chỉ tạo các truy vấn cho dữ liệu có liên quan đến view hiện tại.
2. Điều kiện tiên quyết cho relationships
  • Khi liên kết các bảng, các trường xác định relationships phải có cùng kiểu dữ liệu.
  • Bạn không thể xác định relationships dựa trên các trường địa lý.
  • Mối quan hệ vòng tròn không được hỗ trợ trong mô hình dữ liệu.
  • Bạn không thể chỉnh sửa các relationships trong một nguồn dữ liệu đã xuất bản.
  • Bạn không thể xác định các relationships giữa các nguồn dữ liệu đã xuất bản.
  • Workbook của bạn phải dùng một nguồn dữ liệu được nhúng để bạn có thể chỉnh sửa relationships và các tùy chọn hiệu suất trong trang Data Source trong Tableau Online hoặc Tableau Server.

Các yếu tố hạn chế lợi ích của việc dùng các bảng được liên kết:

  • Dữ liệu xấu trong bảng (các bảng không được tạo với mô hình cấu trúc tốt và chứa hỗn hợp các measures và dimensions trong nhiều bảng) có thể làm cho phân tích nhiều bảng phức tạp hơn.
  • Sử dụng các bộ lọc nguồn dữ liệu sẽ giới hạn khả năng của Tableau trong việc kết hợp chọn lọc dữ liệu.
  • Join culling là một thuật ngữ để chỉ cách Tableau đơn giản hóa các truy vấn bằng cách loại bỏ các phép join không cần thiết.
  • Các bảng có nhiều giá trị chưa từng có trên các relationships.
  • Liên kết nhiều bảng dữ kiện với nhiều bảng dimension (cố gắng mô hình hóa các dimensions được chia sẻ hoặc tuân thủ).
2.1. Dữ liệu không thể liên kết

Hầu hết các kiểu kết nối quan hệ đều được hỗ trợ hoàn toàn. Cubes (khối), SAP HANA (với thuộc tính OLAP), JSON và Google Analytics được giới hạn trong một bảng logic duy nhất trong Tableau 2020.2. Các thủ tục đã lưu chỉ được dùng trong một bảng logic duy nhất.

Các nguồn dữ liệu đã được xuất bản không được liên kết với nhau. Bạn cũng không thể chỉnh sửa các nguồn dữ liệu đã xuất bản.

  • Không được hỗ trợ

    • Cơ sở dữ liệu khối không hỗ trợ lớp logic mới. Kết nối với khối lập phương mang lại trải nghiệm tương tự như trước năm 2020.
    • Thủ tục được lưu trữ: Không hỗ trợ liên kết, relationships hoặc joins. Chúng được thể hiện trong một bảng logic duy nhất và không cho phép mở canvas Join/Union (lớp vật lý).
    • Splunk: Không hỗ trợ các phép nối trái (và vì thế liên kết các bảng logic).
    • JSON: Không hỗ trợ liên kết, SQL tùy chỉnh, Joins hoặc relationships (chỉ unions).
    • Nguồn dữ liệu không hỗ trợ calcs LOD.
  • Hỗ trợ hạn chế

    • Salesforce và WDC Standard Connections: Chúng được biểu diễn dưới dạng các bảng được join trong một bảng logic. Việc thêm các kết nối này hiện chỉ được hỗ trợ cho các nguồn dữ liệu bảng logic đơn lẻ. Các kết nối tiêu chuẩn không thể tham gia vào một bảng hiện có.
    • SAP HANA: Hiện không hỗ trợ liên kết các bảng logic khi kết nối có thuộc tích OLAP được thiết lập.

Sau phần đầu tiên, BAC đã giới thiệu đến bạn đọc khái niệm relationship và những thông tin cơ bản như ưu điểm, hạn chế. Trong phần tiếp theo, chúng ta sẽ cùng đi vào ví dụ thực tế của việc tạo một relationship và các thao tác thêm, xóa, sửa, đừng quên đón xem tại website bacs.vn.

Các bạn cũng có thể tham khảo các phần khác tại link dưới đây: 

Liên kết dữ liệu của bạn trong Tableau (Phần 2)

Liên kết dữ liệu của bạn trong Tableau (Phần 3)

Liên kết dữ liệu của bạn trong Tableau (Phần 4)

Nguồn tham khảo:

https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
  • Tính năng mới trên tableau – verion 2019.1 – click vào đây

BAC – Biên soạn và tổng hợp nội dung

 

Previous Post
Next Post