Những điều cần biết Join dữ liệu của bạn trong Tableau (Phần 1)

Việc kết hợp dữ liệu từ nhiều nơi để tạo ra các phân tích mong muốn là rất quan trọng, dữ liệu có thể ở các bảng khác nhau, thậm chí là các nguồn dữ liệu khác nhau. Phụ thuộc vào cấu trúc dữ liệu và nhu cầu phân tích, có nhiều cách để kết hợp các bảng. Trong Tableau Desktop, phương pháp mặc định là relationship nhưng khi bạn lọc hay sao chép, bạn có thể thiết lập một liên kết trực tiếp.

Lưu ý: Các relationships cuối cùng cũng có các liên kết. Ví dụ, một relationship giữa các nguồn dữ liệu sẽ tạo ra một kết nối cơ sở dữ liệu chéo khi trực quan sử dụng các trường từ những bảng trong các nguồn dữ liệu khác nhau.

1. Các vấn đề chung
  • Để xem, chỉnh sửa hoặc tạo join, bạn phải mở một bảng logic trong khu vực relationship, nơi bạn nhìn thấy khi lần đầu mở hoặc tạo một nguồn dữ liệu và truy cập vào khu vực join.
  • Nguồn dữ liệu đã xuất bản trong Tableau không thể được dùng trong joins. Để kết hợp các nguồn dữ liệu đã xuất bản, bạn phải chỉnh sửa nguồn dữ liệu ban đầu để chứa join hoặc sử dụng kết hợp dữ liệu.
  • Khi join các bảng, các trường mà bạn join trên phải có cùng kiểu dữ liệu. Nếu bạn thay đổi kiểu dữ liệu sau khi bạn join các bảng, join sẽ bị hỏng.
  • Các trường được dùng trong mệnh đề join bị xóa mà không phá vỡ join. Để join dữ liệu và dọn dẹp các trường bị trùng lặp, hãy sử dụng Tableau Prep Builder thay vì Desktop.

Mẹo: Trong khi Tableau Desktop có khả năng tạo các phép joins và thực hiện một số định dạng dữ liệu cơ bản, Tableau Prep Builder được thiết kế để chuẩn bị dữ liệu. Nếu bạn cần thực hiện nhiều phép join, xóa tên trường, thay đổi kiểu dữ liệu, thực hiện nhiều pivots hoặc các sắp xếp dữ liệu có liên quan khác.

2. Cách tạo một Join (liên kết)
  • Bước 1: Để tạo một join, kết nối các nguồn dữ liệu liên quan hoặc nhiều nguồn. Chúng có thể cùng một nguồn dữ liệu hoặc khác nhau. Nếu bạn kết hợp các bảng bằng cách dùng một liên kết cơ sở dữ liệu chéo, Tableau sẽ tô màu bảng trong khu vực làm việc và các cột trong lưới dữ liệu để cho bạn biết dữ liệu đến từ kết nối nào.

Lưu ý: Không phải tất cả nguồn dữ liệu đều hỗ trợ liên kết chéo, bao gồm các nguồn dữ liệu Tableau đã xuất bản. Để kết hợp các nguồn dữ liệu đã xuất bản, chỉnh sửa nguồn dữ liệu ban đầu để chứa liên kết hoặc sử dụng kết hợp dữ liệu.

  • Bước 2: Kéo bảng đầu tiên vào khu vực làm việc

Lưu ý, nếu lúc này bạn kéo bảng thứ hai vào thì một mối quan hệ sẽ hình thành

  • Bước 3: Chọn Open từ menu hoặc nhấp đúp vào bảng đầu tiên để mở bảng liên kết (lớp vật lý).

Nhấp đúp vào một bảng trong khu vực relationship sẽ mở ra khu vực join.

  • Bước 4: Nhấp đúp hoặc kéo bảng khác vào khu vực join.

Nếu bảng tiếp theo từ một nguồn dữ liệu khác hoàn toàn, trong ngăn bên trái, bên dưới Connections, nhấn nút Add (biểu tượng dấu cộng trong trình web) để thêm một kết nối mới đến nguồn dữ liệu Tableau. Với kết nối được chọn đó, kéo bảng mong muốn vào khu vực join.

  • Bước 5: Nhấn vào biểu tượng join để cấu hình join. Thêm một hoặc nhiều mệnh đề join bằng cách chọn một trường từ một trong các bảng có sẵn được sử dụng trong nguồn dữ liệu, chọn toán tử join và một trường từ từ bảng đã thêm.

Lưu ý: Bạn có thể xóa một mệnh đề join không mong muốn bằng cách chọn “x” được hiển thị khi bạn rê chuột qua cột bên phải của mệnh đề join.

  • Bước 6: Khi đã hoàn tất, đóng hộp thoại join và khu vực join.

Như vậy, qua phần đầu tiên của bài viết, BAC đã giới thiệu đến bạn đọc khái niệm join dữ liệu và cách tạo join. Trong phần sau, chúng ta sẽ tiếp tục tìm hiểu các vấn đề xung quanh như loại join, mệnh đề join, giá trị null trong khóa join và join cơ sỡ dữ liệu chéo, đừng quên đón đọc tại bacs.vn.

Nguồn tham khảo:

https://help.tableau.com/

Đọc tiếp phần 2: Những điều cần biết Join dữ liệu của bạn trong Tableau (Phần 2)

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

    Các bài viết liên quan: 

    • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
    • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
    • Tính năng mới trên tableau – version 2019.1 – click vào đây

    BAC – Biên soạn và tổng hợp nội dung

     

    Previous Post
    Next Post