Trong Tableau, bạn có thể tổng hợp các measures hoặc dimensions, thường là measure. Bất kỳ lúc nào bạn thêm một measure vào view, nó sẽ được áp dụng một tổng hợp, loại tổng hợp sẽ phụ thuộc vào ngữ cảnh của view.
1. Thay đổi tổng hợp của một measure trong view
Khi bạn thêm một measure vào trong view, Tableau sẽ tự động tổng hợp giá trị của nó. Có 3 loại tổng hợp phổ biến là Sum, average và median. Tổng hợp sẽ xuất hiện trong tên của measure trong view, ví dụ, Sales sẽ trở thành SUM(Sales). Mỗi measure sẽ có một tổng hợp mặc định được thiết lập bởi Tableau khi bạn kết nối với nguồn dữ liệu.
Lưu ý: Bạn chỉ có thể tổng hợp các measures bằng Tableau cho các nguồn dữ liệu quan hệ. Nguồn dữ liệu đa chiều chứa dữ liệu đã được tổng hợp. Trong Tableau, nguồn dữ liệu đa chiều chỉ được hỗ trợ trong Windows.
Bạn có thể thay đổi tổng hợp cho một measure trong view từ menu ngữ cảnh của nó, như ảnh minh họa dưới đây:
2. Tổng hợp dimensions
Bạn có thể tổng hợp một dimension trong view bằng cách phép Minimum, Maximum, Count, hoặc Count(Distinct). Khi bạn tổng hợp một dimension, bạn sẽ tạo ra một cột measure mới tạm thời, vì thế, dimension thật sự mang các đặc điểm của measure.
Lưu ý: Tổng hợp Count(Distinct) không được hỗ trợ cho nguồn dữ liệu Microsoft Access, Microsoft Excel và Text file sử dụng kết nối cũ. Nếu bạn được kết nối đến một trong các nguồn dữ liệu này, tổng hợp Count(Distinct) sẽ không khả dụng và hiển thị nhận xét “Requires extract”. Nếu bạn lưu nguồn dữ liệu dưới dạng trích xuất, bạn sẽ có thể sử dụng tổng hợp Count(Distinct).
Một cách khác để xem dimension là xem nó như một Attribute (thuộc tính). Để làm điều này, bạn chọn Attribute từ menu ngữ cảnh cả dimension. Tổng hợp Attribute có một số cách dùng:
- Đảm bảo mức độ chi tiết khi kết hợp nhiều nguồn dữ liệu.
- Nó có thể cung cấp một cách để tổng hợp các dimensions khi thực hiện các phép tính bảng (table calculation), yêu cầu một biểu thức tổng hợp.
- Nó có thể cải thiện hiệu suất truy vấn vì được tính toán cục bộ.
Tableau tính Attribute bằng công thức dưới đây:
IF MIN([dimension]) = MAX([dimension]) THEN MIN([dimension]) ELSE “*” END
Dấu hoa thị (*) là một chỉ báo trực quan về một loại giá trị Null đặc biệt xảy ra khi có nhiều giá trị.
Dưới đây là ví dụ về việc sử dụng Attribute trong một table calculation. Bảng biểu diễn doanh số theo thị trường, quy mô thị trường và tiểu bang. Giả sử bạn muốn tính phần trăm tổng doanh số đóng góp vào mỗi tiểu bang. Khi bạn thêm Percent of Total quick table calculation để tính dựa theo State (tiểu bang), phép tính sẽ tính trong khu vực màu đỏ như ảnh dưới. Bởi vì dimension Market Size thì đăng phân vùng dữ liệu.
Khi bạn tổng hợp Market Size như là một Attribute, phép tính được thực hiện trong Market (East, trong ảnh dưới đây) và thông tin Market Size được dùng thuần túy như một label trong hiển thị.
3. Danh sách các tổng hợp được xác định trước trong Tableau
Thông thường, các tổng hợp dữ liệu dạng số học khá hữu ích như sum hay average. Các hàm toán học tổng hợp dữ liệu được gọi là hàm tổng hợp. Hàm tổng hợp thực hiện phép tính trên tập hợp các giá trị và trả về một giá trị duy nhất. Ví dụ, một measure chứa các giá trị 1,2,3,3,4 được tổng hợp bằng kiểu sum sẽ trả về giá trị là 13. Hoặc nếu bạn có 3000 giao dịch bán hàng từ 50 sản phẩm trong nguồn dữ liệu, bạn có thể muốn xem tổng doanh thu cho từng sản phẩm để tìm sản phẩm có doanh thu cao nhất.
- Lưu ý: Sử dụng giá trị floating-point kết hợp với tổng hợp có thể dẫn đến kết quả không chính xác.
Tableau cung cấp một tập hợp các tổng hợp được xác định trước như bảng dưới đây. Bạn có thể thiết lập tổng hợp mặc định cho bất kỳ measure nào mà không phải calculated field và bản thân nó có chứa một tổng hợp, như AVG([Discount]).
Loại tổng hợp | Mô tả | Kết quả của measure chứa các giá trị 1,2,2,3. |
---|---|---|
Attribute | Trả về giá trị của biểu thức đã cho nếu chỉ có một giá trị duy nhất cho tất cả các hàng trong nhóm, nếu không sẽ hiển thị dấu hoa thị (*). Giá trị null bị bỏ qua, tổng hợp này thường dùng cho dimension. Để đặt một measure thành tổng hợp này, nhấp chuột phải vào measure và chọn Attribute. Sau đó, trường thay đổi để hiển thị văn bản ATTR: ví dụ, ATTR(Sales) | N/A |
Dimension | Trả về các giá trị duy nhất trong một measure hoặc dimension. | 3 giá trị (1,2,3) |
Sum | Trả về tổng các số trong measure, bỏ qua giá trị null (rỗng). | 1 giá trị (8) |
Average | Trả về trung bình cộng các số trong một measure, bỏ qua giá trị rỗng | 1 giá trị (4) |
Count(Distinct) | Trả về số lượng các giá trị duy nhất trong measure hoặc dimension. Khi áp dụng cho một dimension, Tableau tạo một cột mới tạm thời làm measure vì kết quả của count là một con số. Bạn có thể đếm số, ngày tháng, boolean và chuỗi, bỏ qua giá trị rỗng. Tổng hợp này không hỗ trợ các loại workbooks sau:
Các Workbooks dùng nguồn dữ liệu Microsoft Access. | 1 giá trị (3) |
Minimum | Trả về giá trị nhỏ nhất trong một measure hoặc continuous (liên tục) dimension, bỏ qua giá trị rỗng. | 1 giá trị (1) |
Maximum | Trả về số lớn nhất trong một measure hoặc biểu thức cho trước dựa trên tập hợp mẫu, bỏ qua giá trị rỗng. Trả về Null nếu có ít hơn 2 đối tượng trong tập hợp mà không rỗng. Dùng hàm này nếu dữ liệu của bạn đại diện cho một mẫu tập hợp. | 1 giá trị (3) |
Std. Dev (Pop.) | Trả về độ lệch chuẩn của tất cả các giá trị trong biểu thức đã cho dựa trên tổng thể. Giả sử các đối số của nó bao gồm toàn bộ tập hợp, dùng hàm này cho các mẫu cỡ lớn. | 1 giá trị (0.7071) |
Varience | Trả về phương sai của tất cả giá trị tràong biểu thức cho trước dựa trên một mẫu, bỏ qua giá trị rỗng. Trả về Null nếu có ít hơn 2 đối tượng trong mẫu mà không Null. Dùng hm này nếu dữ liệu của bạn đại diện cho một mẫu tập hợp. | 1 giá trị (0.6667) |
Varience (Pop.) | Trả về phương sai của tất cả giá trị trong biểu thức cho trước dựa trên tổng thể. Giả sử các đối số của nó bao gồm toàn bộ tập hợp, dùng hàm này cho các mẫu cỡ lớn. | 1 giá trị (0.5000) |
Disaggregate | Trả về tất cả bản ghi trong nguồn dữ liệu cơ bản. Để tách tất cả measure trong view, chọn Aggregate Measures từ menu Analysis (để bỏ đánh dấu). Tableau cho phép bạn xem dữ liệu ở dạng phân tách (chỉ cơ sở dữ liệu quan hệ). Khi dữ liệu bị phân tách, bạn có thể xem tất cả các hàng riêng của nguồn dữ liệu. | 4 giá trị (1,2,2,3) |
Ngoài ra, bạn còn có thể xác định một tổng hợp tùy chỉnh tùy loại view dữ liệu bạn tạo, Tableau sẽ áp dụng các tổng hợp này ở mức độ chi tiết phù hợp.
Kết thúc phần đầu tiên của bài viết về tổng hợp trong Tableau, mong rằng những thông tin được BAC chia sẻ trên đây sẽ hữu ích với bạn đọc. Đừng quên đón xem phần tiếp theo sẽ được cập nhật tại website bacs.vn để không bỏ lỡ những kiến thức quan trọng.
Đọc tiếp phần 2: Tổng hợp dữ liệu trong Tableau (Phần 2)
Nguồn tham khảo:
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – version 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung