Tổng hợp dữ liệu trong Tableau (Phần 2)

BAC đã giới thiệu cho bạn đọc về khái niệm tổng hợp dữ liệu và danh sách các tổng hợp có sẵn trong Tableau ở phần đầu tiên của bài viết, các bạn có thể xem lại ngay dưới đây. Trong phần tiếp theo này, chúng ta sẽ tiếp tục với những nội dung quan trọng khác.

Tham khảo: Tổng hợp dữ liệu trong Tableau (Phần 1)

1. Thiết lập tổng hợp mặc định cho một measure

Bạn có thể thiết lập tổng hợp mặc định cho bất kỳ measure nào không phải là một calculated field mà bản bản thân nó chứa một tổng hợp, ví dụ, AVG([Discount]). Một tổng hợp mặc định là một phép tính ưu tiên để tổng hợp một trường liên tục hoặc rời rạc. tổng hợp mặc định được dùng tự động khi bạn kéo một measure vào view.

  • Cách thay đổi tổng hợp mặc định:

Nhấp chuột phải vào một measure trong ngăn Data và chọn Default Properties > Aggregation và chọn một tùy chọn tổng hợp.

  • Lưu ý: Bạn có thể dùng Tableau để chỉ tổng hợp các measures với nguồn dữ liệu quan hệ. Nguồn dữ liệu đa chiều chỉ chứa dữ liệu đã được tổng hợp.

Bạn không thể thiết lập các tổng hợp mặc định cho nguồn dữ liệu đã xuất bản. Tổng hợp mặc định được thiết lập khi nguồn dữ liệu được xuất bản lần đầu. Bạn có thể tạo một bản sao cục bộ (Local Copy) của nguồn dữ liệu đã xuất bản để điều chỉnh tổng hợp mặc định.

2. Cách tách dữ liệu

Bất cứ khi nào bạn thêm một measure vào view, mặc định, một tổng hợp được áp dụng vào measure đó. Việc này được điều khiển bởi cài đặt Aggregate Measures trong menu Analysis.

Để xem tất cả các marks trong view ở cấp độ chi tiết nhất, bạn có thể tách view. Tách dữ liệu đồng nghĩa với việc Tableau sẽ hiển thị một mark riêng biệt cho mỗi giá trị dữ liệu trong mỗi hàng của nguồn dữ liệu.

  • Cách tách tất cả measure trong view:

Bỏ chọn ở dòng Analysis > Aggregate Measures. Nếu có một dấu tích ở đó như ảnh dưới, nhấp thêm một lần nữa để bỏ dấu tích.

Khi Aggregate Measures được chọn, Tableau sẽ tổng hợp các measures trong view. Có nghĩa là Tableau sẽ tổng hợp các dòng riêng lẻ trong nguồn dữ liệu của bạn thành một giá trị duy nhất phù hợp với cấp độ chi tiết của view.

Các tổng hợp khác nhau sẽ có cách thu thập các giá trị khác nhau như SUM, average (AVG), maximum (MAX) hoặc minimum (MIN). Bạn có thể xem lại danh sách các tổng hợp mặc định đã được liệt kê rất chi tiết trong phần đầu tiên của bài viết.

Mức độ chi tiết được xác định bởi các dimensions trong view của bạn. Việc tách dữ liệu khá hữu ích trong cả trường hợp bạn phân tích các measures phụ thuộc và không phụ thuộc vào view. Ví dụ, bạn có thể phân tích các kết quả từ một cuộc khảo sát sự hài lòng về sản phẩm với độ tuổi (Age) của người tham gia dọc theo một trục. Bạn có thể tổng hợp trường Age để xác định độ tuổi trung bình của người tham gia hoặc tách dữ liệu để xác định xem độ tuổi nào thì hài lòng với sản phẩm. Tách dữ liệu thường được dùng khi cần xem dữ liệu trong một biểu đồ scatter plot.

Tham khảo: Cách tạo Scatter Plot trong Tableau

3. Ví dụ về Scatter Plot, Aggregation và Granularity

Nếu bạn đặt một measure trên ngăn Rows và một measure khác trên ngăn Columns, bạn đang yêu cầu Tableau so sánh hai giá trị số. Thông thường, Tableau chọn một Scatter Plot làm trực quan mặc định. View ban đầu rất có thể là một mark, hiển thị tổng các giá trị của 2 measures. Điều này bởi vì bạn cần tăng mức độ chi tiết trong view.

3.1. Tạo Scatter Plot

Có nhiều cách thêm chi tiết vào một scatter plot: bạn có thể dùng các dimensions, thêm các measures hoặc dimensions khác vào ngăn Rows hoặc Columns để tạo nhiều scatter plot một mark trong view hoặc tách dữ liệu. Và bạn cũng có thể dùng bất kỳ kết hợp tùy chọn nào dưới đây. Để minh họa cho ví dụ này, chúng ta sẽ sử dụng nguồn dữ liệu Sample-Superstore.

Để tạo view ban đầu, hãy thực hiện các bước sau:

  • Bước 1: Đặt measure Sales trên ngăn Columns.
  • Bước 2: Đặt measure Profit trên ngăn Rows.

Các measures được tổng hợp tự động theo kiểu sum (SUM). Tổng hợp mặc định sẽ được xác định bằng cách hiển thị tên tổng hợp ngay trong tên trường như ảnh dưới. Các giá trị được hiển thị trong tooltip biểu diễn tổng giá trị doanh số và lợi nhuận qua mỗi hàng trong nguồn dữ liệu.

Thực hiện các bước dưới đây để thêm các dimensions để thêm chi tiết vào view và tách dữ liệu.

3.2. Sử dụng dimensions để thêm chi tiết

Dưới đây là các bước phát triển scatter plot view bạn đã tạo trên bằng cách thêm các dimensions để hiển thị mức độ chi tiết khác.

  • Bước 1: Kéo dimension Category vào ô Color trên thẻ Marks.

Việc này sẽ chia dữ liệu làm 3 marks cho mỗi đối tượng dimension và mã hóa các marks bằng màu sắc.

  • Bước 2: Kéo dimension State vào ô Detail trên thẻ Marks.

Bây giờ, đã có nhiều mark hơn trong view. Số lượng các mark tương đương với số lượng tiểu bang riêng biệt trong nguồn dữ liệu nhân với số danh mục.

Dù hiển thị nhiều mark, các measures vẫn được tổng hợp. Vì thế, bất kể có 1 hàng trong nguồn dữ liệu mà State = North Dakota và Category= Furniture hay 100 dòng như vậy, kết quả vẫn là 1 mark duy nhất.

3.3. Thêm nhiều trường vào ngăn Rows và Columns

Hoàn nguyên về view một mark ban đầu và thực hiện các bước sau để phát triển scatter plot bằng cách thêm trường vào ngăn Rows Columns.

  • Bước 1: Kéo dimension State vào ngăn Coumns.

Thậm chí nếu bạn thả Continent vào bên phải của SUM(Sales), Tableau vận chuyển nó về bên trái của SUM(Sales). Bởi vì bạn không thể chèn một dimension trong một trục liên tục. Thay vào đó, view của bạn sẽ hiển thị một trục riêng biệt cho từng đối tượng của dimension.

  • Bước 2: Kéo dimension Segment vào ngăn Rows.

Lúc này, bạn sẽ có một view cung cấp cái nhìn tổng quan về doanh số (Sales) và lợi nhuận (Profit) trên các tiểu bang và phân khúc khách hàng. Bạn có thể rê chuột qua các mark trong view để xem dữ liệu tooltip cho mỗi phân khúc như ảnh minh họa dưới đây.

3.4. Tách dữ liệu

Một cách khác để chỉnh sửa view một mark ban đầu của bạn cho phép hiển thị nhiều marks hơn là tách dữ liệu.

Bỏ chọn ở dòng Aggregate Measures bằng cách chọn Analysis > Aggregate Measures.

Những gì bạn vừa làm thật ra là tổng hợp dữ liệu, vì lệnh này là một chuyển đổi đã được chọn ban đầu (có dấu kiểm). Tableau tổng hợp dữ liệu trong view theo mặc định.

Bây giờ, bạn đã có một view nhiều marks hơn với mỗi mark đại diện cho một dòng trong nguồn dữ liệu cơ bản.

Khi bạn phân tách các measures, bạn không còn xem xét giá trị trung bình hoặc tổng cho các giá trị trong các hàng trong nguồn dữ liệu. Thay vào đó, view hiển thị một mark cho mọi hàng trong nguồn dữ liệu. Phân tách dữ liệu là một cách để xem xét toàn bộ diện tích bề mặt dữ liệu. Đó là một cách nhanh chóng để hiểu hình dạng của dữ liệu và xác định các ngoại lệ. Trong trường hợp này, dữ liệu được phân tách cho thấy đối với nhiều hàng trong dữ liệu, có mối quan hệ nhất quán giữa thu nhập bán hàng và lợi nhuận – điều này được biểu thị bằng mark được căn ở một góc 45 độ.

Qua hai phần của bài viết, tin rằng bạn đọc đã hiểu được khái niệm tổng hợp dữ liệu và cách hoạt động của Tableau. Đừng quên đón xem các nội dung mới nhất tại website bacs.vn và tham gia khóa học Tableau tại BAC để trang bị cho mình những kiến thức hữu ích về phân tích dữ liệu.

Nguồn tham khảo:

https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

 

Previous Post
Next Post
Exit mobile version