Trực quan hóa dữ liệu dưới góc nhìn kỹ thuật

Trong lĩnh vực khoa học dữ liệu, trực quan dữ liệu chắc chắn là chủ đề nổi bật nhất trong những năm gần đây. Dù bạn đang phân tích loại dữ liệu nào thì trực quan là một bước không thể thiếu. Nhưng hầu hết mọi người lại không có ý tưởng cụ thể để trực quan dữ liệu và họ không biết phải triển khai như thế nào.

Trực quan hóa dữ liệu là công việc quan trọng

Nội dung lần này, BAC sẽ gửi đến bạn một bài viết rất hay định nghĩa khái niệm trực quan hóa dữ liệu dưới góc nhìn kỹ thuật rất chi tiết. Bài viết được chia sẻ bởi Lewis Chou hiện là Data Analyst tại Viện dữ liệu FanRuan. Nếu khái niệm kỹ thuật có xa lạ và khó tiếp cận, bạn có thể tham khảo định nghĩa đơn giản hơn.

1. Trực quan dữ liệu là gì?

Trực quan dữ liệu liên quan đến nhiều ngành khác nhau

Trực quan khoa học, trực quan thông tin và phân tích trực quan là ba nhánh chính trong công việc trực quan hóa dữ liệu. Bộ môn mới “Data Visualization” hay trực quan dữ liệu là sự kết hợp của ba nhánh này, là điểm khởi đầu mới trong lĩnh vực nghiên cứu trực quan.

Trực quan hóa dữ liệu tổng quát liên quan đến các ngành khác nhau như công nghệ thông tin, khoa học tự nhiên, phân tích thống kê, đồ họa, tương tác và thông tin địa lý.

1.1. Trực quan khoa học

Trực quan khoa học là một lĩnh vực nghiên cứu và ứng dụng liên ngành trong khoa học tập trung vào trực quan hóa các hiện tượng ba chiều như kiến trúc, khí tượng, y học và hệ thống sinh học. Mục đích của nó là minh họa bằng đồ họa dữ liệu khoa học, cho phép các nhà khoa học hiểu, giải thích và thu thập các mẫu từ dữ liệu.

Trực quan khóa học giúp giải thích và thu thập các mẫu từ dữ liệu

1.2. Trực quan thông tin

Trực quan thông tin là nghiên cứu về biểu diễn trực quan tương tác của dữ liệu trừu tượng để nâng cao nhận thức của con người. Dữ liệu trừu tượng bao gồm cả dữ liệu kỹ thuật số và phi kỹ thuật số như thông tin địa lý và văn bản.

Đồ họa như biểu đồ, biểu đồ xu hướng, biều đồ dòng chảy và sơ đồ cây đều thuộc về trực quan thông tin. Và thiết kế của các đồ họa này sẽ giúp biến các khái niệm trừu tượng thành các thông tin trực quan.

Trực quan thông tin giúp biến các khái niệm trừu tượng thành thông tin

1.3. Phân tích trực quan

Phân tích trực quan là một lĩnh vực mới đã phát triển cùng với sự phát triển của trực quan khoa học trực quan thông tin, với trọng tâm là lý luận phân tích thông qua giao diện trực quan tương tác.

Phân tích trực quan lý luận phân tích qua giao diện tương tác

2. Tại sao chúng ta cần trực quan dữ liệu

Lượng thông tin mà con người có được thông qua quan sát vượt xa các cơ quan khác. Trực quan hóa dữ liệu là việc sử dụng các kỹ năng tự nhiên của con người để tăng cường hiệu quả xử lý dữ liệu và tổ chức. Trực quan có thể giúp chúng ta đối phó với thông tin phức tạp hơn và tăng cường trí nhớ.

Trực quan giúp xử lý thông tin phức tạp và tăng cường trí nhớ

Hầu hết mọi người không biết về thống kê dữ liệu và các phương pháp thống kê cơ bản như trung bình, phạm vi… không phù hợp với bản chất nhận thức của con người. Một trong những ví dụ nổi tiếng nhất là Anscombe’s quartet (bộ tứ Anscombe). Thật khó để xem luật theo các phương pháp thống kê nhưng các quy tắc rất rõ ràng khi dữ liệu được trực quan hóa.

3. Làm thế nào để đạt được trực quan dữ liệu?

Trực quan là ánh xạ từ không gian dữ liệu sang không gian đồ họa

Về mặt kỹ thuật, cách hiểu đơn giản nhất về trực quan hóa dữ liệu là ánh xạ từ không gian dữ liệu sang không gian đồ họa. Một quy trình thực hiện trực quan cổ điển là xử lý và lọc dữ liệu, chuyển đổi nó thành một hình thức trực quan rõ ràng và sau đó hiển thị nó thành chế độ xem người dùng.

Quy trình thực hiện trực quan cổ điển

Ngăn xếp trực quan công nghệ:

Thông thường, các kỹ sư trực quan hóa dữ liệu phải thành thạo các ngăn xếp công nghệ sau:

  • Toán cơ bản: hàm lượng giác, đại số tuyến tính, thuật toán hình học.
  • Đồ họa: canvas, SVG, WebGL, đồ họa tính toán, lý thuyết đồ thị.
  • Thuật toán kỹ thuật: thuật toán cơ bản, thuật toán thống kê, thuật toán bố trí phổ biến.
  • Phân tích dữ liệu: làm sạch dữ liệu, thống kê, mô hình hóa dữ liệu.
  • Thiết kế thẩm mỹ: nguyên tắc thiết kế, phán đoán thẩm mỹ, màu sắc, tương tác, nhận thức.
  • Cơ sở trực quan: mã hóa hình ảnh, phân tích hình ảnh, tương tác đồ họa.
  • Giải pháp trực quan: sử dụng đúng biểu đồ, trực quan hóa các tình huống kinh doanh phổ biến.

Các khái niệm được trình bày dưới góc nhìn nhìn kỹ thuật tương đối phức tạp với những bạn làm việc ở các chuyên ngành khác. Tuy nhiên, bạn có thể tham khảo các nội dung liên quan được chia sẻ tại website bacs.vn.

Tất cả nội dung đều được chọn lọc để phục vụ nhu cầu học tập, làm việc trong lĩnh vực phân tích dữ liệu, trực quan dữ liệu, BA (Business Analyst),…. Để được tư vấn khóa học phù hợp với nhu cầu, công việc, trình độ, hãy liên hệ ngay cho BAC theo số Hotline: 0909 310 768 hoặc tham khảo danh sách khóa học bên dưới.

Nguồn tham khảo:

towardsdatascience.com

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
  • Tính năng mới trên tableau – verion 2019.1 – click vào đây

BAC – Biên soạn và tổng hợp nội dung

 

Previous Post
Next Post