Trong phần này BAC sẽ cùng bạn đọc khám phá chủ đề kết hợp dữ liệu (combine data) khi xây dựng Data Source trong Tableau. Các phương pháp kết hợp, các mối quan hệ (relationships), nối (joins), kết hợp dữ liệu (data blending), hợp nhất (union). Đừng quên xem lại phần đầu tiên để hiểu được ý nghĩa của Data Source.
Tham khảo: Lập kế hoạch Data Source trong Tableau (Phần 1)
Nếu dữ liệu đến từ một bảng, bạn có thể kết nối dữ liệu để tạo data source, kéo bảng vào canvas và sau đó là xây dựng view. Nhưng nếu dữ liệu của bạn trải rộng trên nhiều bảng hoặc trên nhiều cơ sở dữ liệu thì bạn sẽ cần kết hợp dữ liệu đó. Kết hợp dữ liệu xảy ra trên Data Source Data.
Single database | Multiple databases |
---|---|
1. Kết nối dữ liệu của bạn. Điều này sẽ tạo một data source. 2. Kéo một bảng hoặc sheet của dữ liệu vào canvas. 3. Kéo bảng hoặc sheet thứ hai vào canvas. Một sợi dây sẽ hình thành, cho biết mối quan hệ tự động đã hình thành hoặc hộp thoại Edit Relationship sẽ mở ra nhắc bạn cho Tableau biết trường nào mà các bảng đó liên quan đến hai bảng. 4. Tiếp tục thêm bảng. |
|
Lưu ý: Để liên kết các bảng trên các cơ sở dữ liệu khác nhau, chúng phải được thêm vào dưới dạng kết nối dữ liệu trong cùng một nguồn dữ liệu, không phải một data source mới. Kết nối dữ liệu được thêm từ liên kết Add trong ngăn Left. Data source mới có thể được tạo từ menu Data hoặc menu thả xuống từ biểu tượng bên cạnh tên Data Source như ảnh dưới.
1. Phương pháp kết hợp dữ liệu
Mối quan hệ (relationships) là cách mặc định để kết hợp dữ liệu trong Tableau. Mối quan hệ là một cách năng động, linh hoạt để kết hợp dữ liệu từ nhiều bảng đề phân tích. Nếu cần, các bảng cũng có thể được nối hoặc hợp nhất. Data source cũng có thể được pha trộn. Dưới đây là các tùy chọn về cách kết hợp dữ liệu trong Tableau và một số tình huống khi mỗi phương pháp hữu ích.
Relationships | Thiết lập khả năng liên kết giữa hai bảng dựa trên các trường liên quan. Không hợp nhất dữ liệu với nhau để tạo một bảng mới, cố định. Trong quá trình phân tích, tự động truy vấn các bảng có liên quan bằng cách dùng các phép nối phù hợp với ngữ cảnh để tạo bảng dữ liệu tùy chỉnh cho phân tích đó. Duy trì mức độ chi tiết phù hợp, không làm mất dữ liệu, giữ các tổng hợp thích hợp và xử lý rỗng. |
Joins | Hợp nhất hai bảng dữ liệu dựa trên mệnh đề join và kiểu join để tạo thành một bảng dữ liệu mới cố định. Thường được sử dụng để thêm các cột dữ liệu mới trên cùng một cấu trúc hàng cơ bản. Có thể gây mất dữ liệu với một số kiểu join nếu các trường không có trong tất cả các bảng. Có thể gây trùng lặp dữ liệu nếu các bảng ở các mức độ chi tiết khác nhau. |
Unions | Hợp nhất hai hoặc nhiều bảng dữ liệu để tạo thành bảng dữ liệu mới cố định. Được sử dụng để nối (thêm các hàng mới) dữ liệu trên cùng một cấu trúc cột cơ bản. |
Blends | Làm việc trên hai hoặc nhiều Tableau data sources. Dữ liệu vẫn tách biệt, Tableau truy vấn các data sources một cách độc lập và hiển thị kết quả cùng nhau trong view, dựa trên các trường liên kết được thiết lập cho sheet đó. Mô phỏng hoạt động của một left join và có thể lọc dữ liệu từ các nguồn thứ cấp. |
Lưu ý: Cũng có thể kết hợp dữ liệu với SQL tùy chỉnh. Hầu hết việc kết hợp dữ liệu trực tiếp trong canvas hoặc với kết hợp dữ liệu là tốt nhất. Điều này cho phép Tableau linh hoạt nhất để tối ưu hóa. Tuy nhiên, trong một số trường hợp nhất định, có thể có lý do để sử dụng SQL tùy chỉnh. Hãy nhớ rằng làm như vậy có thể có tác động về hiệu suất vì Tableau buộc phải thực thi câu lệnh SQL tùy chỉnh.
2. Mối quan hệ (Relationships)
Liên kết là một phương pháp để làm việc với dữ liệu từ nhiều bảng dựa trên các trường được chia sẻ – cột – giữa các bảng đó. Thiết lập mối quan hệ thông báo cho Tableau cách các hàng có thể được kết nối giữa các bảng. Tableau nắm thông tin đó nhưng không đưa các hàng lại ngay, thay vào đó, khi trực quan được tạo, các trường liên quan đến phân tích được truy ngược lại thông qua mối quan hệ và dữ liệu phù hợp được trả về từ bảng gốc của nó.
Vì dữ liệu không bao giờ được tập hợp đầy đủ lại với nhau thành một bảng bên ngoài ngữ cảnh trực quan, nên các mối quan hệ sẽ hữu ích khi dữ liệu ở các mức độ chi tiết khác nhau. Ví dụ, nếu bạn làm việc với dữ liệu lượng mưa hằng ngày trong một bảng nhưng nhiệt độ hằng giờ ở một bảng khác.
Tableau hỗ trợ các mối quan hệ giữa các bảng trong cùng một cơ sở dữ liệu và giữa các bảng trong các cơ sở dữ liệu khác nhau.
3. Nối (Join)
Nối là một phương pháp để kết hợp các bảng có liên quan bởi các trường chung. Kết quả của việc kết hợp dữ liệu bằng phép nối là một bảng mở rộng theo chiều ngang bằng cách thêm các cột dữ liệu.
4. Kết hợp dữ liệu (data blending)
Khi sử dụng kết hợp dữ liệu, bạn đã kết hợp dữ liệu trong cái được gọi là nguồn dữ liệu chính (primary data source) với các trường phổ biến từ một hoặc nhiều nguồn dữ liệu thứ cấp (secondary data source).
Kết hợp dữ liệu hữu ích khi bạn cần thay đổi cách nguồn dữ liệu được định cấu hình trên cơ sở từng sheet, khi bạn muốn kết hợp các cơ sở dữ liệu không cho phép quan hệ hoặc kết hợp như data source hình khối hoặc Published Data Sources.
Kết quả của việc kết hợp dữ liệu bằng cách sử dụng kết hợp là một bảng ảo mở rộng theo chiều ngang bằng cách thêm các cột dữ liệu. Dữ liệu từ mỗi data source sẽ được tổng hợp ở mức chung trước khi được hiển thị cùng nhau trong trực quan.
5. Hợp nhất (Union)
Hợp nhất là phương pháp nối các giá trị (hàng) vào bảng. Bạn có thể kết hợp các bảng nếu chúng có các cột giống nhau. Kết quả của việc kết hợp dữ liệu bằng cách dùng hợp nhất là một bảng ảo có các cột giống nhau nhưng mở rộng theo chiều dọc bằng cách thêm các hàng dữ liệu. Bạn có thể kết hợp các bảng theo một trong hai cách: thủ công hoặc sử dụng tìm kiếm theo ký tự đại diện.
Qua hai phần của bài viết, mong rằng bạn đọc đã có được những thông tin hữu ích để xây dựng Tableau data sources. Đừng quên theo dõi các nội dung mới nhất tại website bacs.vn và tham gia khóa học Tableau tại BAC để không bỏ lỡ những kiến thức hữu ích về phân tích và trực quan dữ liệu.
Nguồn tham khảo:
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung