Data Analysis là gì? Ví dụ minh hoạ

Holmes từng nói với Watson, và những người khác rằng: “Việc đưa ra lý thuyết trước khi có dữ liệu là một sai lầm. Vô hình chung, người ta bắt đầu vặn vẹo các sự kiện để phù hợp với lý thuyết, thay vì lý thuyết để phù hợp với sự kiện.” Thật vậy, dữ liệu rất quan trọng và chúng ta cần dữ liệu để đưa ra các quyết định sáng suốt.

Phân tích dữ liệu là quá trình làm việc với dữ liệu để thu thập các thông tin hữu ích, từ đó sử dụng kết quả phân tích để đưa ra các quyết định sáng suốt liên quan đến các kế hoạch chiến lược của công ty. Nói cách khác, khi chúng ta dựa vào kết quả phân tích và ý nghĩa từ dữ liệu, chúng ta sẽ đưa ra quyết định tốt hơn việc đưa ra quyết định mà không dựa trên bất kỳ cơ sở nào. Ví dụ: Phân tích dữ liệu có thể giúp ngân hàng cá nhân hóa các tương tác của khách hàng, hệ thống chăm sóc sức khỏe để dự đoán nhu cầu sức khỏe trong tương lai hoặc một công ty giải trí để tạo ra cú hit trực tuyến lớn tiếp theo. 

Và hiện tại, chúng ta đang sống trong thời kỳ mà chúng ta có điều kiện và có thể dễ dàng thu thập nhiều dữ liệu hơn bao giờ hết. Vậy nên, nghề Phân tích dữ liệu (Data Analysis) lại càng trở nên “hot” hơn bao giờ hết. Theo Báo cáo xu hướng việc làm tương lai năm 2000 trên Diễn đàn Kinh tế Thế giới, Data Analysis là ngành nổi hàng đầu, tiếp theo là AI và học máy, chuyên gia big data,…

1. Quy trình phân tích dữ liệu

Đối với các công ty dữ liệu, ngày càng ngày họ sẽ tiếp tục phát triển cả về số lượng và độ phức tạp. Do đó, họ cần nhu cầu về một quy trình lý tưởng và hiệu quả để khai thác giá trị của dữ liệu. Có nhiều quy trình để phân tích dữ liệu, cơ bản có thể kể đến quy trình sau:

  • Identify – Xác định các câu hỏi kinh doanh của công ty cần được trả lời. Ví dụ như công ty đang cố gắng giải quyết vấn đề gì? Bạn cần đo lường cái gì, và bạn sẽ đo lường nó như thế nào?,…

  • Collect – Thu thập các tập dữ liệu thô mà bạn cần để giúp bạn trả lời các câu hỏi đã được xác định ở trên. Việc thu thập dữ liệu có thể đến từ các nguồn nội bộ, chẳng hạn như phần mềm quản lý quan hệ khách hàng (CRM) của công ty hoặc từ các nguồn như hồ sơ chính phủ hoặc giao diện lập trình ứng dụng (API), và các nguồn khác. 

  • Clean – Làm sạch dữ liệu để chuẩn bị cho phân tích. Điều này thường liên quan đến việc loại bỏ dữ liệu trùng lặp và bất thường, điều chỉnh sự không nhất quán, chuẩn hóa cấu trúc và định dạng dữ liệu cũng như xử lý khoảng trắng và các lỗi cú pháp khác. 

  • Analyze – Phân tích dữ liệu, tìm ra các xu hướng, mối tương quan, ngoại lệ và các biến thể bắt đầu kể một câu chuyện bằng cách sử dụng các kỹ thuật và công cụ phân tích dữ liệu khác nhau,… Trong giai đoạn này, bạn có thể sử dụng phương thức khai phá dữ liệu để khám phá các mẫu trong cơ sở dữ liệu hoặc các phần mềm trực quan hóa dữ liệu để giúp chuyển đổi dữ liệu sang định dạng đồ họa dễ hiểu.

  • Interpret – Giải nghĩa kết quả phân tích để xem dữ liệu đã trả lời các câu hỏi ban đầu như thế nào và đưa ra đề xuất nào dựa trên dữ liệu? Những hạn chế đối với kết luận trên là gì?

Hãy cùng BAC lắng nghe Kevin – Giám đốc Phân tích Dữ liệu tại Google định nghĩa phân tích dữ liệu là gì nhé.

2. Các loại phân tích dữ liệu (có ví dụ)

Dữ liệu có thể được sử dụng để trả lời các câu hỏi và hỗ trợ các quyết định theo nhiều cách khác nhau. Chúng ta có thể chia các loại phân tích này thành bốn nhóm thường được sử dụng. Cụ thể:

2.1 Phân tích mô tả (Descriptive analysis)

Phân tích mô tả cho chúng ta biết điều gì đã xảy ra. Loại phân tích này giúp mô tả hoặc tóm tắt dữ liệu định lượng bằng cách trình bày các số liệu thống kê. Ví dụ: phân tích thống kê có thể cho thấy sự phân bổ doanh số bán hàng trong một nhóm nhân viên và số liệu bán hàng trung bình trên mỗi nhân viên.

2.2 Phân tích chẩn đoán (Diagnostic analysis)

Phân tích chẩn đoán giúp xác định “tại sao lại xảy ra”. Giả sử một phân tích mô tả cho thấy một lượng bệnh nhân bất thường trong bệnh viện. Đi sâu vào dữ liệu có thể phát hiện rằng nhiều bệnh nhân trong số những bệnh nhân này có chung các triệu chứng của một loại virus cụ thể. Từ phân tích chẩn đoán này, bạn có thể xác định đang có một tác nhân lây nhiễm, cũng là lý do tại sao – dẫn đến dòng bệnh nhân này.

2.3 Phân tích dự đoán (Predictive analysis)

Phân tích dự đoán sử dụng dữ liệu để hình thành các dự báo về tương lai. Bằng cách sử dụng phân tích dự đoán, bạn có thể nhận thấy rằng một sản phẩm nhất định đã có doanh số bán hàng tốt nhất trong các tháng 9 và 10 hàng năm, dẫn đến việc bạn có thể dự đoán một mức cao tương tự trong năm sắp tới.

2.4 Phân tích đề xuất (Prescriptive analysis)

Phân tích đề xuất tổng hợp tất cả những dữ liệu quan trọng thu thập được từ ba loại phân tích đầu tiên. Từ đó, hình thành các đề xuất cho chiến lược hành động của công ty. Ví dụ, đề xuất một kế hoạch thị trường để xây dựng dựa trên sự thành công của những tháng doanh thu cao và khai thác các cơ hội tăng trưởng mới trong những tháng chậm hơn.

Tóm lại:

  • Phân tích mô tả trả lời câu hỏi: “Điều gì đã xảy ra?”
  • Phân tích chẩn đoán trả lời câu hỏi: “Tại sao nó lại xảy ra?”
  • Phân tích dự đoán trả lời câu hỏi: “Điều gì có thể xảy ra trong tương lai?”
  • Phân tích đề xuất trả lời câu hỏi: “Chúng ta nên làm gì với nó?”
Có thể bạn chưa biết?
  • Ra quyết định theo hướng dữ liệu (Data-Driven Decision-Making – DDDM) là gì?

    • DDDM được định nghĩa là quá trình đưa ra các quyết định kinh doanh chiến lược dựa trên sự kiện, dữ liệu và số liệu thay vì trực giác, cảm xúc hoặc quan sát.
    • Điều này nghe có vẻ hiển nhiên, nhưng trên thực tế, không phải tất cả các tổ chức đều hoạt động và định hướng dựa theo dữ liệu. Theo công ty tư vấn quản lý toàn cầu McKinsey Global Institute, các công ty dựa trên dữ liệu có hiệu quả tốt hơn trong việc thu hút khách hàng mới, duy trì lòng trung thành của khách hàng và đạt được lợi nhuận trên mức trung bình.
  • Các kỹ năng hàng đầu cho một nhà phân tích dữ liệu là gì?

    • Phân tích dữ liệu sử dụng một loạt các công cụ và công nghệ. Một số kỹ năng hàng đầu cho nhà phân tích dữ liệu bao gồm SQL, trực quan hóa dữ liệu, ngôn ngữ lập trình thống kê (như R và Python), học máy và bảng tính.

  • Mức lương của một nhân viên phân tích dữ liệu là bao nhiêu?

    • Dữ liệu từ Salary.com chỉ ra rằng mức lương trung bình cho một nhà phân tích dữ liệu ở Hoa Kỳ vào năm 2021 là $ 77.493. Số tiền bạn kiếm được sẽ phụ thuộc vào các yếu tố như trình độ, kinh nghiệm và vị trí của bạn.

  • Làm nghề phân tích dữ liệu có cần phải giỏi toán không?

    • Phân tích dữ liệu có xu hướng ít chuyên sâu về toán học hơn so với khoa học dữ liệu. Mặc dù bạn có thể không cần phải thông thạo bất kỳ toán học nâng cao nào, nhưng kiến thức nền tảng về toán học và thống kê cơ bản có thể giúp bạn thành công hơn.

Mời các bạn tham khảo thêm bài viết:

Trung tâm BAC – Sân chơi lành mạnh để các bạn đam mê về công nghệ thông tin nói chung và nghề BA nói riêng cùng nhau tìm hiểu và khám phá những điều thú vị về nghề, qua đó chuẩn bị một số kiến thức chuyên môn cho công việc trong tương lai.

Để tham khảo và đăng ký các khoá học trong tháng, bạn có thể click vào đây: Check lịch khai giảng. Nếu cần tư vấn hỗ trợ những vấn đề liên quan đến khóa học, bộ phận CSKH của chúng tôi sẽ hỗ trợ bạn qua Email: info@bacs.vn ; bac.trainingba@gmail.com hoặc số Hotline: 0909310768.

Nguồn tham khảo:

https://www.coursera.org

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
 
 

CÁC KHOÁ HỌC BUSINESS ANALYST BACs.VN DÀNH CHO BẠN

Khoá học Online:

Khoá học Offline:

Tại Tp.HCM:

Tại Hà Nội:

Tham khảo lịch khai giảng TẤT CẢ các khóa học mới nhất

Ban biên tập nội dung – BAC

 

 

Previous Post
Next Post