Nếu bạn có các trường dữ liệu chứa nhiều đơn vị thông tin, ví dụ, họ và tên của một khách hàng. Lúc này, việc phân tích sẽ dễ dàng hơn nếu bạn tách chúng ra thành những trường riêng biệt. Bạn có thể dùng các tùy chọn phân tách (split) hoặc tùy chỉnh phân tách (custom split) trong Tableau để tách giá trị dựa trên dấu cách hoặc một mẫu giá trị lặp có trong mỗi hàng của trường. Ví dụ dưới đây dùng dấu cách để phân tách.

Các trường mới được tạo bằng cách phân tách hoặc tùy chọn phân tách được thêm vào nguồn dữ liệu dưới dạng calculated field.

Phân tách và tùy chọn phân tách dựa trên hàm tách chuỗi SPLIT. Để khởi động tùy chọn này, bạn đánh dấu chọn từ menu thả xuống:

  • Trên trang Data Source, đánh dấu chọn Split hoặc Custom Split.
  • Trên ngăn Data trong worksheet, đánh dấu chọn menu cho Transform > Split Custom Split.

Vì các loại kết nối khác nhau hỗ trợ các chức năng khác nhau trong Tableau, bạn có thể cần phải đánh dấu kiểm ở cả hai nơi để xác định dữ liệu của bạn hỗ trợ tùy chọn phân tách và phân tách dữ liệu.

1. Chia các trường tự động

Một trường chuỗi có thể được chia tự động dựa trên dấu phân tách chung mà Tableau phát hiện trong trường.

Tùy loại kết nối, một loại phân tách có thể tự động chia một giá trị trường thành 10 trường mới. Loại dữ liệu của các trường mới được tạo bởi phân tách phụ thuộc vào kết hợp mẫu mà Tableau phát hiện trong dấu phân tách được dùng để tách trường gốc.

Lưu ý: Một số trường hợp, phân tách mất quá nhiều thời gian để tạo các trường mới hoặc Tableau không thể tìm thấy một dấu chung, một hộp thoại phân tách tùy chỉnh sẽ xuất hiện.

1.1 Tách một trường tự động
  • Bước 1: Trên trang Data Source, nhấp chọn dấu mũi tên bên cạnh tên trường như ảnh dưới.
  • Bước 2: Chọn Split.

Lưu ý: Bạn cũng có thể dùng tùy chọn phân tách từ ngăn Data trong worksheet. Trong ngăn Data, nhấp chuột phải vào trường bạn muốn tách và chọn Transform > Split.

Nếu không thích kết quả phân tách, bạn có thể đến ngăn Data và chỉnh sửa các calculated fields được tạo bởi phân tách. Ngoài ra, bạn còn có thể undo (hoàn tác) trong thanh công cụ của Tableau Desktop hoặc xóa phân tách.

1.2 Xóa các trường được tạo bởi phân tách
  • Bước 1: Trên trang Data Source, nhấp vào mũi tên bên cạnh tên trường.
  • Bước 2: Chọn Delete.
  • Bước 3: Lặp lại để xóa tất cả các trường được tạo bởi phân tách.

2. Các lựa chọn thay thế phân tách tự động

Đôi lúc bạn muốn dụng tùy chọn khác thay vì tách tự động. Ví dụ như trường hợp dưới đây:

  • Giá trị chứa nhiều dấu phân tách khác nhau: Các trường không thể tách tự động nếu số lượng dấu phân tách giữa các giá trị khác nhau. Lúc này, bạn nên dùng Custom split. Ví dụ:

jsmith| accounting | north

dnguyen | humanresources

lscott | recruiting| west

karnold |recruiting |west

  • Giá trị chứa các dấu hỗn hợp: Các trường không thể tách tự động khi có nhiều loại dấu phân tách. Trường hợp này, bạn hãy cân nhắc sử dụng biểu thức chính quy để tạo trường mới.

3. Custom Split

Custom Split (phân tách tùy chỉnh) là tùy chọn cho phép bạn xác định một dấu chung cho phân tách. Giống như tùy chọn phân tách, một phân tách tùy chỉnh có thể chia một giá trị trường thành 10 trường mới. Ngoài ra, bạn có thể chọn phân tách các giá trị ở n lần xuất hiện đầu tiên của dấu phân tách, n lần xuất hiện cuối cùng của dấu phân tách hoặc ở tất cả các lần xuất hiện của dấu phân tách. Loại dữ liệu của các trường mới được tạo bởi custom spit luôn luôn là kiểu chuỗi (string).

3.1 Sử dụng custom split
  • Bước 1: Trên trang Data Source, nhấp vào mũi tên bên cạnh tên trường.
  • Bước 2: Chọn Custom Split.

Lưu ý: Bạn có thể truy cập tùy chọn custom split từ ngăn Data bằng cách nhấp chuột phải vào trường mà bạn muốn tách và chọn Transform > Custom Split.

Nếu không thích kết quả phân tách, bạn có thể đến ngăn Data và chỉnh sửa các calculated fields được tạo bởi phân tách. Ngoài ra, bạn còn có thể undo (hoàn tác) trong thanh công cụ của Tableau Desktop hoặc xóa phân tách.

3.2 Xóa các trường được tạo bởi custom split
  • Bước 1: Trên trang Data Source, nhấp vào mũi tên bên cạnh tên trường.
  • Bước 2: Chọn Delete.
  • Bước 3: Lặp lại để xóa tất cả các trường được tạo bởi phân tách.

4. Sơ lược

Danh sách dưới đây là những gì bạn cần biết khi làm việc với split và custom split:

  • Các trường được tạo bởi split và custom split không thể dùng làm khóa để nối các bảng nhưng có thể dùng để kết hợp các nguồn dữ liệu.
  • Các trường mới được tạo từ split và custom split không thể dùng trong pivot.
  • Tùy chọn split và custom split không được hỗ trợ cho sets, groups, parameters và bins.
  • Microsoft SQL Server chỉ cho phép tối đã 4 trường phân tách.
  • Để tạo nhiều hơn 10 trường mới, hãy dùng một split hoặc custom split trên trường mà trước đó được tạo từ một split hoặc custom split.

5. Sửa lỗi split và custom split

Dưới đây là danh sách các vấn đề bạn có thể gặp khi dùng split hoặc custom split:

  • Tùy chọn split và custom split bị thiếu cho một loại nguồn dữ liệu được hỗ trợ: Tùy chọn này chỉ có sẵn cho các trường có kiểu dữ liệu là chuỗi.
  • Giá trị null hoặc ô trống: Sau khi tạo, các trường mới có thể chứa giá trị null hoặc không có giá trị. Điều này xảy ra khi không có giá trị nào cho tất cả các trường mới dự kiến.
  • Dữ liệu bị xóa: Tableau có thể dùng các phần giá trị của trường làm dấu phân tách. Nếu một phần của giá trị trường là dấu phân tách, các giá trị này sẽ không xuất hiện trong trường mới. Ví dụ:

ZIP-98102

ZIP-98109

ZIP-98119

ZIP-98195

Trong trường hợp này, kết quả phân tách sẽ tạo ra một trường mới như sau:

98102

98109

98119

98195

Phân tách sẽ không tạo một trường riêng cho “ZIP-“ vì đã dùng nó làm dấu phân tách.

Như vậy, BAC đã tổng hợp tất cả những gì mà bạn cần biết về phân tách dữ liệu trong Tableau Desktop. Với kỹ thuật này, bạn có thể ứng dụng trong nhiều dự án như tách họ tên, mã số, địa chỉ…. Mong rằng những kiến thức này sẽ hữu ích với bạn đọc, đừng quên theo dõi các nội dung mới nhất sẽ được cập nhật thường xuyên tại BAC's Blog.

Nguồn tham khảo:
https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU - Giải pháp BUSINESS INTELLIGENCE (BI) - click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU - click vào đây
  • Tính năng mới trên tableau - verion 2019.1 - click vào đây

BAC - Biên soạn và tổng hợp nội dung