“Sẽ là một sai trái lớn khi chỉ dẫn giả thuyết trước lúc có dữ liệu. Bằng một biện pháp vô cảm, bạn ta bước đầu bóp méo thực sự cho phù hợp với lý thuyết, nỗ lực vì định hướng cho cân xứng với sự thật” – Sherlock Holmes (trích dẫn từ cuốn A Scandal in Bohemia của Sir Arthur Conan Doyle).

Bạn đang xem: Phân tích mô tả là gì

Tuy chỉ đi xuất phát điểm từ một nhân đồ gia dụng hư cấu nhưng lời nói trên đã bao gồm phần nào sự đặc biệt của câu hỏi phân tích dữ liệu. Họ đang sống trong một thời đại có khá nhiều dữ liệu hơn lúc nào hết. Tiềm năng của tài liệu là vô tận. Gồm dữ liệu thì những quyết định được đưa ra sẽ chính xác hơn. Nếu các doanh nghiệp biết cách phân tích và khai thác chúng, ắt sẽ đạt các lợi ích.

Tuy nhiên, trước lúc doanh nghiệp đưa ra chiến lược đúng chuẩn thì bên quản trị nên hiểuphân tích dữ liệu là gì? quá trình phân tích tài liệu gồm bao nhiêu bước và tầm quan trọng của dữ liệu so với từng bộ phận? Để lời giải những thắc mắc trên, hãy theo dõi bài viết chi tiết sau đây của Base.vn.


Mục lục

Toggle


1. Phân tích dữ liệu là gì?

1.1. Định nghĩa

Phân tích dữ liệu là hoạt động tổng quát bao gồm tiếp nhận, phân chia, chọn lọc và khai quật tối đa cực hiếm data để chuyển đổi nguồn tài liệu thô trở nên những tin tức hữu ích đối với doanh nghiệp.

Phân tích dữ liệu bao gồm nhiều cách thức khác nhau. Ngẫu nhiên loại tài liệu nào cũng có thể được áp dụng kỹ thuật phân tích nhằm hiểu rõ, nâng cao hoạt động, về tối ưu hóa quá trình và gia tăng tác dụng chung cho khách hàng hoặc hệ thống.

Lấy ví dụ, một công ty giao hàng thông qua phân tích dữ liệu để tránh số đông tuyến đường tắc nghẽn và xác định đường đi tốt nhất có thể tại từng thời điểm. Dựa vào vậy, bọn họ đã rút ngắn được thời gian giao hàng, giảm giảm ngân sách vận đưa và tạo nên trải nghiệm thuận lợi hơn cho nhân viên lái xe.

1.2. Các phương pháp phân tích tài liệu (methods of data analytics)

Dữ liệu cung ứng doanh nghiệp ra quyết định đúng đắn và lập cập dựa bên trên các phương pháp phân tích không giống nhau. Dưới đây là 4 các loại phân tích tài liệu thường được thực hiện hiện nay:

Phân tích biểu thị (Descriptive analysis)

Phân tích mô tả là phương thức tập trung vào việc mô tả cùng tóm tắt những dữ liệu hiện có trải qua các sệt điểm, xu thế hay sự trở thành thiên của dữ liệu – cơ mà không gửi ra dự kiến hoặc kết luận. Các thông số trả về gồm dạng bảng, biểu đồ, số liệu thống kê mô tả dựa trên các giá trị trung bình, phương sai, tần suất, cùng mức độ phân phối.

Để dễ hiểu, bạn có thể tham khảo lấy ví dụ như sau: Một doanh nghiệp cung ứng thiết bị điện tử muốn khám phá thị ngôi trường tiêu thụ của bản thân mình bằng phương pháp phân tích mô tả. Với phương pháp này, công dụng trả lại là các bảng biểu thống kê về điểm lưu ý và hành vi của khách hàng (demographic). Dựa vào bảng này, công ty rất có thể điều chỉnh chiến lược kinh doanh, trở nên tân tiến sản phẩm cùng tiếp cận thị phần một cách đúng chuẩn nhất.

Phân tích tư duy (Diagnostic analytics)

Phân tích suy luận là cách thức phân tích làm rõ nguyên nhân hoặc tương quan giữa các sự kiện, vươn lên là số trong một mẫu dữ liệu, bao hàm các hoạt động phân tích tương quan, phân tích trở nên thể, phân tích hồi quy với phân tích nhân quả. Phương thức này giúp nhà quản trị hiểu sâu sắc về mối liên kết giữa các yếu tố vào một trường, tệp thông tin. Đồng thời, kết quả trả về để giúp đỡ giải thích vì sao một sự khiếu nại hoặc vấn đề đã xảy ra trước đó.

Phân tích dự đoán (Predictive analytics)

Bằng việc thực hiện các mô hình và thuật toán dự đoán, đo lường và tính toán kết quả, sự khiếu nại hoặc giá trị trong tương lai, phân tích dự đoán giúp xử lý dữ liệu dựa trên lịch sử và bạn dạng mẫu của data. Phân tích dự đoán còn khiến cho tính xác suất xác suất xảy ra của những sự kiện, đơn vị quản trị tiện lợi đưa ra các quyết định phù hợp.

Phương pháp này bao hàm các phương pháp thực hiện khác nhau như hồi quy đường tính, hồi quy logistic, cây quyết định (decision tree), mạng nơ-ron cùng máy học (machine learning).

Phân tích lời khuyên (Prescriptive analytics)

Phân tích khuyến nghị là phương pháp ứng dụng đa dạng chủng loại các thuật toán nhằm khuyến cáo và tối ưu hóa quyết định, hành vi trong tương lai. Bọn chúng điều chỉnh các yếu tố cùng tham số trong quá trình phân tích, từ kia giúp người phân tích xử lý vấn đề tác dụng và đạt được phương châm trong kế hoạch. Những kỹ thuật về tối ưu hóa, mô phỏng, và ra quyết định đa phương châm thường được áp dụng trong cách thức này.


*
Các phương pháp phân tích dữ liệu

2. Phân tích tài liệu có ý nghĩa sâu sắc như ráng nào trong kinh doanh?

Phân tích dữ liệuđóng vai trò quan tiền trọng bậc nhất trong việc cung cấp các thông tin quan trọng giúp nhà quản trị hiểu, đánh giá và đưa ra quyết định đúng đắn dựa trên tài liệu số trực quan. Bằng cách lựa chọn phương pháp và phép tắc phân tích phù hợp, doanh nghiệp thuận tiện xác định được phương hướng, chiến lược marketing và triết lý phát triển thọ dài.

Để hiểu rõ hơn về tầm đặc biệt quan trọng của việc phân tích dữ liệu với doanh nghiệp, ta hoàn toàn có thể theo dõi ví dụ bên dưới đây:

Để buổi tối ưu tác dụng của một chiến dịch pr trực tuyến, nhân sự chống ban sale sẽ cần thu thập nhiều tài liệu khác nhau, thuộc nhiều chủng loại khía cạnh như:

Phân tích kết quả chiến dịch: thông qua các chỉ số như số lần nhấp vào pr (click-through rate), tỷ lệ thay đổi (conversion rate), doanh thu,… và những yếu tố ảnh hưởng tới chúng, bộ phận marketing hoàn toàn có thể xác định được đâu là chiến dịch thành công và không thành công.Phân tích đối tượng người tiêu dùng khách hàng: các dữ liệu về đối tượng người tiêu dùng khách mặt hàng như độ tuổi, giới tính, vị trí địa lý và hành vi tiêu dùng giúp thành phần marketing nắm rõ hơn về nhóm khách hàng tiềm năng của mình. Tự đó, chúng ta dễ đánh giá lại thông điệp truyền tải, nhắm trúng Insight người sử dụng và tăng mạnh tương tác tích cực từ khách hàng.Phân tích nền tảng gốc rễ quảng cáo: những chỉ số xác định tiềm năng của căn cơ như hiệ tượng quảng cáo, địa điểm quảng cáo, tệp tương tác,… giúp phần tử marketing lựa chọn đúng nơi để tại vị quảng cáo của chính bản thân mình và phân bổ giá cả vào kia một phương pháp hiệu quả.

Như vậy hoàn toàn có thể thấy dù chỉ là 1 chiến dịch chạy pr nhỏ, bài toán phân tích tài liệu đã nhập vai trò đặc biệt quan trọng giúp công ty đánh giá công dụng hiện tại và đưa ra kế hoạch trở nên tân tiến sau này.


*
Phân tích dữ liệu có chân thành và ý nghĩa như chũm nào trong ghê doanh?

3. Một trong những kĩ thuật phân tích tài liệu cơ bản

3.1. đối chiếu hồi quy (Regression analysis)

Đây là phương pháp phân tích thống kê nhằm khẳng định mối liên kết giữa một vươn lên là số với một xuất xắc nhiều phát triển thành số hòa bình khác nhau. Bọn chúng giúp giám sát và đo lường và dự đoán đối sánh giữa các biến số này và mô phỏng chúng dựa vào một quy mô toán học.

Lấy ví dụ chúng ta là chủ một công ty lớn thời trang và bạn muốn biết quan hệ giữa số lượng quảng cáo trực tuyến và doanh số bán sản phẩm hàng trong thời điểm tháng một. Khi áp dụng phân tích hồi quy, bạn cũng có thể xác định tác động của số lượng quảng cáo trực đường đến doanh số bán hàng. Từ bỏ đó, bạn thuận tiện điều chỉnh ngân sách chi tiêu cho lăng xê trực đường để đạt doanh thu kỳ vọng.

3.2. Phân tích tổ hợp (Cohort analysis)

Đây là cách thức phân một số loại cá nhân, người sử dụng hoặc nhiều đối tượng người dùng vào các nhóm gồm những điểm lưu ý giống nhau. đem ví dụ, trong chuyển động marketing, so với tổ hợp giúp cho bạn thấy rõ sự biến đổi của một nhóm người tiêu dùng theo thời hạn và đâu là yếu tố gây tác động lên họ.

3.3. Phân tích yếu tố (Factor analysis)

Đây là phương thức giúp hiểu rõ mối dục tình giữa các biến dữ liệu với nhau bằng phương pháp xác định các nhân tố chung được ẩn đằng sau, từ bỏ đó, phương pháp này góp làm bớt số chiều của dữ liệu trong tổ chức.

Ví dụ, một công ty muốn tìm hiểu mối dục tình giữa sự chấp thuận của khách hàng hàng, độ uy tín công ty lớn và công suất kinh doanh. Phân tích cho biết nhân tố bình thường ẩn thân 3 phát triển thành số bên trên – bao gồm khả năng ảnh hưởng tới cả 3 vươn lên là số – là quality sản phẩm/ dịch vụ. Tự đó, công ty có thể tập trung vào nâng cao chất lượng của thành phầm và các dịch vụ cung cấp.

3.4. So với chuỗi thời gian (Time series analysis)

Đây là phương thức phân tích dữ liệu dựa nghiên cứu về sự đổi khác của những tệp dữ liệu theo thời gian, giúp xác minh xu hướng, mô hình và chu kỳ thay đổi trong một chuỗi thời hạn nhất định. Trong doanh nghiệp, cách thức này được ứng dụng phổ biến nhất trong dự đoán giá cổ phiếu, doanh số bán hàng,…


*
Một số kinh nghiệm phân tích tài liệu cơ bản

4. Tiến trình phân tích dữ liệu

Quy trình so với dữ liệu có thể đơn giản hoặc phức tạp tùy theo quy mô doanh nghiệp đã vận hành, nhưng lại về cơ bản sẽ bao gồm 4 cách sau:

4.1. Tích lũy dữ liệu

Thu thập dữ liệu là bước trước tiên giúp doanh nghiệp xác minh nguồn tài nguyên dữ liệu sẵn bao gồm hiện tại. Một số vận động diễn ra trong đoạn này bao gồm:

Xác định mục tiêu thu thập: so sánh dữ liệu phục vụ mục đích gì? chúng ta cần kết quả nào ở bài toán phân tích? Bạn chỉ việc liệt kê và vấn đáp những câu hỏi quan trọng để khẳng định mục tiêu của mình.Xác định nguồn gốc và tính chất của dữ liệu: Dữ liệu có thể thu thập trường đoản cú các khối hệ thống nào bên trong doanh nghiệp? Hoặc qua các report hoặc từ các nguồn bảo đảm nào khác mặt ngoài? Định dạng, cấu trúc, với độ đúng mực của chúng như thế nào?
Xác định nơi tàng trữ dữ liệu: dữ liệu nên được giữ trữ chỗ nào để an toàn và được sắp xếp có khoa học, đồng thời tiện lợi cho bạn truy cập cùng sử dụng?

4.2. Tiền xử lý dữ liệu

Tiền xử lý tài liệu là quá trình chuẩn bị dữ liệu để sẵn sàng cho các bước phân tích hoặc quy mô hóa sau này. Một số vận động quan trọng có thể kể tới:

Làm không bẩn dữ liệu: đào thải các dữ liệu sai, không hợp lệ, trùng lặp hoặc bị nhiễu; đôi khi dữ liệu sẽ tiến hành kiểm tra, sửa các giá trị lỗi và thay đổi định dạng về thuộc một đơn vị chức năng hoặc thang đo giả dụ cần.Xử lý tài liệu thiếu: khẳng định và xử lý các dữ liệu bị thiếu hụt trong tập dữ liệu bằng một số cách thức như: điền cực hiếm trung bình, giá trị gần nhất, hoặc dự báo để điền tài liệu có độ không đúng số không nhiều nhất. Hoặc trong tương đối nhiều trường hợp, các dòng hoặc cột dữ liệu có không ít giá trị thiếu không thể khôi phục sẽ được loại bỏ.

4.3. Tò mò dữ liệu

Khám phá tài liệu là bước quan trọng để phát âm sâu về dữ liệu trước khi triển khai phân tích cụ thể hơn, ví dụ như giúp nhấn diện các điểm sáng quan trọng, phân loại các đặc tính của dữ liệu, và tạo nên cái quan sát toàn cảnh. Hai vận động khám phá cơ bạn dạng bao gồm:

Mô tả thống kê: Là hoạt động tổng hợp, mô tả điểm lưu ý chính của dữ liệu bằng phương pháp sử dụng các thống kê cơ bản như trung bình, phương sai, bày bán và mẫu tổ chức.Trực quan tiền hóa dữ liệu: Là hoạt động sử dụng biểu đồ cùng đồ thị để biểu hiện sự phân bố, xu hướng và mối quan hệ giữa các biến số vào tập dữ liệu.

4.4. So với dữ liệu

Phân tích tài liệu là bước sau cùng và có vai trò đặc biệt quan trọng nhất trong toàn bộ quá trình.

Các chuyển động tại bước này triệu tập chủ yếu đuối vào câu hỏi sử dụng các công vậy và chuyên môn phân tích tương xứng (đã được trình bày tại đoạn 3 của bài viết) nhằm trích xuất thông tin đặc trưng từ những dữ liệu đã xử lý, kế tiếp rút ra những tóm lại có ý nghĩa.

Kết quả phân tích hoàn toàn có thể làm tạo nên những thắc mắc mới, đòi hỏi việc tích lũy thêm tài liệu hoặc thực hiện các phân tích té sung.


*
Quy trình so với dữ liệu

5. Các công cụ cung cấp phân tích dữ liệu

5.1. Power nguồn BI

Power BI là một công cầm phân tích và trực quan liêu hóa dữ liệu phổ biến được phát triển bởi Microsoft, với các tính năng trẻ trung và tràn trề sức khỏe phục vụ hoạt động thu thập, có tác dụng sạch, cách xử trí và trực quan tiền hóa dữ liệu cho người dùng.

Power BI chất nhận được tạo ra các biểu đồ, bảng biểu, bảng điều khiển,… để thể hiện tin tức từ dữ liệu. Đồng thời, tính năng chia sẻ dữ liệu thuận tiện cũng cung ứng đắc lực cho khách hàng trong chuyển động cộng tác nội bộ, vàra ra quyết định data-driven.

5.2. Excel

Excel là một phần mềm được cải cách và phát triển bởi Microsoft, cung cấp đa dạng công dụng để đối chiếu dữ liệu trong những bảng tính: triển khai các phép tính, sắp xếp dữ liệu, lọc dữ liệu, tạo biểu đồ, và thậm chí còn áp dụng những công thức phức tạp để xử trí thông tin. Quanh đó ra, Excel cũng hỗ trợ các lao lý như Pivot
Tables cùng Pivot
Charts để hỗ trợ trực quan liêu hoá dữ liệu.

Excel có ưu điểm là dễ cài đặt đặt, đồ họa dễ sử dụng, và gần như đã phổ biến trong tất cả các công ty hiện nay. Mặc dù nhiên, so với các tập tài liệu lớn với phức tạp, Excel không đủ khỏe khoắn để giải pháp xử lý như những công cố gắng Business Intelligence chuyên sâu.

5.3. Python

Python là trong số những ngôn ngữ lập trình dễ nhất, linh hoạt và tất cả tính vận dụng cao. Chúng cung ứng các thư viện và framework thịnh hành như Num
Py, Pandas tuyệt Matplotlib có tác dụng làm sạch, chuyển đổi, phân tích và trực quan liêu hoá hệ thống dữ liệu.

Nếu Num
Py cung cấp mảng và đo lường số học nhanh chóng thì Pandas đưa ra các cấu trúc dữ liệu linh hoạt đi kèm theo với dụng cụ phân tích bổ trợ khác nhau. Xung quanh ra, Matplotlib tạo ra biểu đồ với đồ thị để trực quan hóa dữ liệu. Lúc đó, bộ cha này là pháp luật đắc lực cho việc phân tích tinh vi và xây dựng mô hình dự đoán tài liệu tương lai.


*
Các công cụ cung cấp phân tích dữ liệu

6. Một số chú ý khi phân tích dữ liệu kinh doanh

Phân tích dữ liệu marketing là một vượt trình phức hợp và đòi hỏi người thực hiện cần phải có nhiều năng lực và ghê nghiệm. Để dữ liệu được khai quật hết tiềm năng và mang đến giá trị xuất sắc nhất, doanh nghiệp cần xem xét một số điều sau đây:

Tính toàn diện của dữ liệu:Dữ liệu cần phải có độ đúng đắn cao, không được thiếu hụt sót hoặc sai lệch. Doanh nghiệp buộc phải kiểm soát nghiêm ngặt quy trình nguồn vào cho dữ liệu để đảm bảo an toàn tính toàn vẹn và tiếp tục kiểm tra tài liệu định kỳ.Độ tin yêu của dữ liệu:Dữ liệu không có tính đúng đắn có nguy hại cao dẫn tới những quyết định sai lầm, gây mất tín nhiệm từ nhân sự với khách hàng, thậm chí còn là khủng hoảng pháp lý. Vày vậy, doanh nghiệp cần chắc chắn là trong từng bước tính toán và đối chiếu dữ liệu, đồng thời xác minh đầu vào và kiểm chăm chú đầu ra.Tính ngay lập tức (real-time):Giá trị áp dụng của dữ liệu cũng nằm tại tính thời điểm. Tài liệu càng mới, càng được cập nhật thường xuyên thì năng lực phản ánh kịp thời hiện trạng của bạn và thị phần càng cao, càng cung ứng tốt hơn cho quy trình ra quyết định.Quản lý và bảo mật dữ liệu:Trong suốt quy trình phân tích và share kết quả sau này, tài liệu cần được thống trị và bảo mật chặt chẽ để tránh bị các bên lắp thêm ba truy vấn trái phép hoặc đánh cắp. Doanh nghiệp cần xây dựng các cơ chế bảo mật dữ liệu cụ thể và có những công cụ quản lý phù hợp.

Xem thêm: Cách viết luận tiếng anh lớp 9, các bài luận tiếng anh 9 cực hay (2022)

7. Tạm bợ kết

Trong thời đại hiện đại số hiện nay, vai trò của phân tích dữ liệu ngày càng quan trọng. Tài năng đọc đọc dữ liệu, trích xuất thành thông tin chi tiết và tận dụng chúng để ra đưa ra quyết định data-driven chính là một ưu thế cạnh tranh. Nếu khách hàng là một nhà lãnh đạo doanh nghiệp vẫn tìm bí quyết tăng trưởng lợi nhuận, phân tích dữ liệu sẽ đưa tin để các bạn đạt được mục tiêu đó.

Hãy khai thác sức dạn dĩ của dữ liệu để chế tạo ra ra đổi khác mới. Trái đất dữ liệu sẽ nằm trong vòng tay và hóng doanh nghiệp các bạn khám phá!

Tomorrow Marketers – The Gartner Analytic Ascendancy mã sản phẩm là quy mô được cải tiến và phát triển bởi Gartner, góp doanh nghiệp khai thác tối nhiều “mức độ trưởng thành của dữ liệu”. Quy mô này chia quá trình phân tích thành 4 giai đoạn: descriptive analytics (phân tích mô tả), diagnostic analytics (phân tích chẩn đoán), predictive analytics (phân tích dự đoán), với prescriptive analytics (phân tích đề xuất). Trong đó, các giai đoạn sau được xem là “trưởng thành” hơn với mức độ phức tạp tăng dần, tương xứng với nấc độ hữu ích trong quy trình đưa ra quyết định.

Những quá trình phân tích này có gì khác biệt? Cùng tò mò trong bài viết sau nhé!

1. Descriptive Analytics (Phân tích mô tả)

Phân tích mô tả vấn đáp cho câu hỏi “Điều gì sẽ diễn ra?”. Loại hình phân tích này sử dụng phương thức thống kê để mô tả tài liệu quá khứ, từ đó giúp doanh nghiệp tò mò xu hướng, phát hiện tại sự phi lý và hiểu phần lớn gì vẫn diễn ra.

Đây là giai đoạn trước tiên của so sánh và gồm độ phức hợp thấp nhất, đa số doanh nghiệp SMEs hiện nay mới chỉ tạm dừng ở quy trình tiến độ phân tích này. Khoác dù phương pháp này có rất nhiều giá trị trong việc cho biết thêm các dấu hiệu và xu hướng ra mắt trong quá khứ, nhưng mà doanh nghiệp không rút ra được chiến thuật xử lý vấn đề, hoặc tìm thấy được sự việc cốt lõi, bởi vì đó, cần có giai đoạn đối chiếu chẩn đoán (Diagnostic analysis) tiếp theo.

Các thắc mắc mà Descriptive Analysis có thể trả lời:

Bộ phận Sales: Phân khúc người sử dụng nào tạo ra doanh thu tối đa trong năm qua?
Bộ phận Marketing: Kênh social truyền thông nào bao gồm ROAS cao nhất trong quý trước?
Bộ phận Tài chính: lợi nhuận hàng tháng cùng hàng năm biến hóa như chũm nào trong năm qua?
Bộ phận Vận hành: nhu cầu sử dụng những dòng sản phẩm/ SKU khác nhau trên từng quanh vùng địa lý trong những năm qua?

Phân tích mô tả áp dụng các cách thức cơ phiên bản như:

Descriptive Statistics (Thống kê tế bào tả)

Thống kê biểu lộ sử dụng những tham số thống kê đặc trưng để cầm tắt điểm lưu ý của một tệp dữ liệu, lấy ví dụ như như:

Min: giá trị nhỏ tuổi nhất,Max: giá chỉ trị lớn nhất,Mean: cực hiếm trung bình,Median: quý hiếm trung vị
Mode: giá trị mở ra nhiều độc nhất vô nhị trong tệp dữ liệu
Standard Deviation: Độ lệch chuẩn chỉnh …

Bảng sau đây minh họa các tham số này mang đến tổng số tiền mà lại khách hàng túi tiền trong một cửa hàng trực tuyến. Như chúng ta cũng có thể thấy, vừa phải mỗi người tiêu dùng đã bỏ ra 51 USD, nhưng nhỏ số chi tiêu của từng người hoàn toàn có thể dao hễ từ 12 tới 500 USD.

MinimumMaximumMeanStandard deviation
Total amount (USD)125005156
Distribution (Phân phối)

Mức độ trưng bày thể hiện tại tần suất xuất hiện thêm của các giá trị vào một dataset. Biểu đồ tần suất histogram sẽ cho biết thêm sự phân phối của những biến liên tục.

Ví dụ: biểu đồ dưới đây mô tả bày bán độ tuổi của doanh nghiệp một doanh nghiệp, cùng với trục hoành là những khoảng tuổi của khách hàng, trục tung là gia tốc độ tuổi đó lộ diện trong dataset. Phụ thuộc biểu đồ này, khách hàng của công ty này bao gồm độ tuổi trải dài từ 22 – 70 tuổi, tuy nhiên quý khách ở độ tuổi từ 30 cho 40 chiếm xác suất nhiều nhất.


*

2. Diagnostic Analytics (Phân tích chẩn đoán)

Khác với phân tích mô tả triệu tập vào “điều gì xảy ra”, phân tích chẩn đoán sẽ triệu tập vào câu hỏi “nguyên nhân như thế nào dẫn đến kết quả đó?”. So sánh chẩn đoán sẽ tìm ra nguyên do gốc rễ của một vấn đề, của một đổi khác bất thường xuyên hoặc xu thế biến động trong dữ liệu.

Các câu hỏi mà Diagnostic Analytics có thể trả lời:

Bộ phận Sales: Xác định điểm sáng và hành vi chung giữa những phân khúc khách hàng sinh lời để giải thích tại sao họ chi tiêu nhiều hơn.Bộ phận Marketing: các mẫu nội dung quảng cáo hiệu quả cao có điểm lưu ý gì chung?
Bộ phận Vận hành: search ra quan hệ giữa tiết trời trong quanh vùng với nhu cầu sử dụng của từng SKU rứa thể.

Phân tích chẩn đoán thực hiện các phương pháp cơ bản như:

Drilling down – Điều hướng vấn đề phân tích, gửi từ cơ chế xem tổng quan liêu sang cơ chế tập trung vào một dữ liệu cụ thể để đưa ra pattern của dữ liệu. Ví dụ, với Power
BI, chúng ta có thể ấn vào một trong những khu vực rõ ràng trong bản đồ chart để làm nổi bật tài liệu của khu vực đó đó, hoặc đưa từ tài liệu theo mon hoặc quý thành dữ liệu theo ngày,…

Root cause analysis

Finding Correlations – đối chiếu để tìm ra mối đối sánh tương quan giữa những biến và xác định mối dục tình nhân quả.

Scatter charts

Biểu đồ dùng phân tán (Scatter charts) rất có thể giúp tìm hiểu sự nhờ vào giữa các biến cổng output và đầu vào.

Biểu vật dụng dưới đây cho thấy thêm khi quý giá của Feature 1 tăng lên thì giá trị của Target giảm xuống.


*

Correlations

Phân tích mối đối sánh giữa các biến nguồn vào và đầu ra. Giá trị nằm trong lòng 0 và 1 diễn tả mức độ đối sánh tương quan mạnh yếu giữa hai trở thành số.

Với biểu đồ dùng dưới đây, hệ số tương quan tối đa thu được là -0,287 giữa hai trở thành số khoảng thời hạn mua hàng vừa mới đây nhất (recency) với số lần đổi khác (conversion). Hệ số đối sánh tương quan lớn mang lại thấy chúng ta phải nghiên cứu biến số này kỹ lưỡng.


*

3. Predictive Analytics (Phân tích dự báo)

Khi doanh nghiệp có công dụng phân tích tài liệu nâng cao, kim chỉ nam của khai thác dữ liệu đã chuyển từ các việc đánh giá vận động trong quá khứ sang tìm kiếm ra hành động nên có tác dụng trong hiện tại và dự đoán cho tương lai.

Phân tích dự đoán sẽ kết hợp mô hình đối chiếu dự đoán, toán xác suất thống kê và công nghệ máy học để mang ra dự đoán về các xu hướng hoặc sự kiện trong tương lai nhằm mục đích trả lời câu hỏi “Điều gì sẽ xảy ra?”. So với dự báo còn khiến cho doanh nghiệp dự kiến và tiến công giá tác dụng của các quyết định khác nhau.

Lưu ý rằng, dự báo chỉ là một trong ước tính, và phần đông ước tính kia có thể xảy ra, nhưng mà không chắc chắn. Độ chính xác của nó dựa trên con số cũng như unique dữ liệu bạn có.

Thách thức với đối chiếu dự báo thiết yếu là cần có dữ liệu đầu vào lớn để lấy ra tóm lại dự báo thiết yếu xác. Vị vậy, nếu doanh nghiệp chỉ gồm ít dữ liệu hoặc dữ liệu không không thiếu thì sẽ không thể gồm được dự đoán hữu ích.

Các thắc mắc mà Predictive Analytics có thể trả lời:

Bộ phận Sales: Dự đoán lệch giá tiềm năng của một phân khúc người sử dụng cụ thể.Bộ phận Marketing: Dự đoán doanh thu từ một marketing chiến dịch sắp tới.Bộ phận Tài chính: Dự báo đúng mực hơn mang đến năm tài bao gồm tiếp theo.Bộ phận Vận hành: Dự đoán giỏi hơn nhu cầu đối với các sản phẩm khác biệt ở những khu vực không giống nhau tại những thời điểm rõ ràng trong năm tới.

Phân tích dự đoán sử dụng các phương pháp cơ bản như:

Phân tích dự đoán liên quan đến những kỹ thuật như so sánh hồi quy (regression analysis), đoán trước (forecasting), thống kê lại đa biến hóa (multivariate statistics), tương quan mẫu (pattern matching), mô hình dự đoán (predictive modeling), k-nearest neighbors, cây đưa ra quyết định (decision trees),…

K – Nearest neighbors

Đây là phương thức đơn giản thường được áp dụng trong phân nhiều loại và phép tính xấp xỉ. Cách thức này lưu giữ trữ toàn bộ các trường hợp gồm sẵn và phân loại những trường đúng theo mới dựa vào thước đo độ tương tự.

Biểu đồ vật dưới đây cho biết thêm thuật toán phân nhiều loại nhiều điểm dữ liệu thành A (vòng tròn màu xanh) và B (hình vuông màu sắc cam). Một điểm tài liệu mới được reviews (hình tam giác màu xanh da trời lá cây). Cách thức này sẽ đưa ra quyết định điểm dữ liệu mới kia thuộc nhiều loại A tuyệt B dựa vào sự tương đồng giữa chúng.


*

Cây quyết định (Decision trees)

Tương tự, đó cũng là một phương pháp đơn giản thường được áp dụng trong phân các loại và phép tính xấp xỉ. Cây đưa ra quyết định là một mô hình toán học giúp so sánh, gạn lọc giữa những hướng hành động. Nó mong tính xác suất để giám sát các kết quả rất có thể xảy ra.

Trong sơ đồ gia dụng cây đưa ra quyết định dưới đây, Feature 1, Feature 2 cùng Feature 3 là ba tác dụng số của cục dữ liệu; A, B và C là cha loại “lá” nên phân loại; cùng a, b, c và d là các giá trị số.

Để so sánh theo cách thức này, bạn phải kiểm tra giá trị của Feature 1. Nếu to hơn a, đối tượng người dùng sẽ được phân một số loại vào nhiều loại B; nếu bởi hoặc bé dại hơn a, liên tục kiểm tra quý giá Feature 2. Lần theo quá trình này cho đến khi phân loại thành công xuất sắc loại “lá” (A, B hoặc C).


*

Để vận dụng những kỹ thuật này, chăm chú rằng:

Đảm nói rằng tất cả các biến liên quan tác động đến tác dụng đều được xem xét trong quá trình dự đoán.Thử nghiệm bài toán xây dựng quy mô bằng những thuật toán cùng xem thuật toán nào tương xứng nhất dựa trên độ đúng đắn và thời hạn phản hồi.Quyết định nấc độ đúng đắn của các phân tích dự kiến của bạn.Lập kế hoạch cho việc gián đoạn, thường xuyên tinh chỉnh các quy mô phân tích dự đoán của bạn.Kiểm tra, kiểm tra lại và đánh giá định kỳ độ đúng đắn của mô hình với các bộ tài liệu mới.

4. Prescriptive Analytics (Phân tích đề xuất)

Phân tích đề xuất là giai đoạn ở đầu cuối của mô hình phân tích dữ liệu, xác định hành động nào cần tiến hành để xử lý một vụ việc hoặc đưa ra một quyết định, trả lời câu hỏi, “Chúng ta nên làm cái gi tiếp theo?”.

Phân tích khuyến cáo sẽ tính đến toàn bộ các đưa định “what-if”, các yếu tố có thể xảy ra vào một tình huống và đề xuất các biện pháp hoàn toàn có thể thực hiện tại được. Một số loại phân tích này rất có thể đặc biệt hữu dụng khi gửi ra ra quyết định dựa bên trên dữ liệu.

Các thắc mắc mà Prescriptive Analytics rất có thể trả lời:

Bộ phận Sales: nâng cấp quy trình bán sản phẩm cho từng ngành hàng.Bộ phận Marketing: xác định cần quảng cáo thành phầm nào trong quý tới.Bộ phận Tài chính: buổi tối ưu hóa thống trị rủi ro.Bộ phận Vận hành: xác minh cách về tối ưu hóa kho bãi.

Phân tích dự đoán sử dụng các cách thức cơ bản như:

Mô hình dự kiến (predictive model)

Ví dụ, nhị trường hợp dưới đây nhằm đánh giá biến phương châm (Value) sẽ thay đổi như nào lúc biến đầu vào duy tốt nhất (Feature 3) gắng đổi. Bảng giá trị tương ứng sẽ thể hiện biến đổi tương ứng của trường phù hợp 1, trong những khi biểu đồ dùng dưới đang thể hiện biến đổi tương ứng của trường phù hợp 2.

Khi so sánh, có thể thấy Feature 3 là 1010, Target đạt giá chỉ trị tối đa 484,93.


5. Ví dụ khái quát

Descriptive analytics (phân tích mô tả): Một công ty lớn đang so với dữ liệu bán sản phẩm và nhận biết doanh số của thành phầm bảng tinh chỉnh và điều khiển trò đùa điện tử tăng vọt theo mùa. So sánh mô tả có thể cho bạn đó biết, “Bảng tinh chỉnh và điều khiển trò đùa điện tử này còn có doanh số bán hàng tăng vọt trong thời điểm tháng 10, tháng 11 và đầu tháng 12 mặt hàng năm.”

Diagnostic analytics (phân tích chẩn đoán): tài liệu nhân khẩu học tập của người dùng bảng điều khiển và tinh chỉnh trò đùa điện tử với thấy rằng bọn họ ở lứa tuổi từ 8 mang lại 18. Mặc dù nhiên, người tiêu dùng có xu hướng ở giới hạn tuổi từ 35 đến 55. Dữ liệu bật mý rằng cồn lực chính để khách hàng mua bảng điều khiển và tinh chỉnh trò đùa điện tử là làm cho quà tặng ngay cho con. Doanh số bán sản phẩm tăng bỗng biến vào những tháng mùa thu và đầu mùa đông có thể do những ngày lễ bao gồm tặng quà.

Predictive analytics (phân tích dự đoán): Biết rằng lợi nhuận bán máy đùa game video tăng hốt nhiên biến trong tháng 10, mon 11 và vào đầu tháng 12 hàng năm trong thập kỷ qua sẽ cung cấp cho chính mình nhiều dữ liệu để tham gia đoán rằng xu hướng tương tự sẽ xẩy ra vào năm tới, quan trọng khi toàn cục ngành công nghiệp trò chơi cũng có xu hướng tăng trưởng tích cực.

Prescriptive analytics (phân tích đề xuất): Doanh nghiệp có thể chạy thử nghiệm A/B với nhị quảng cáo: một dành cho những người dùng của thành phầm (trẻ em) và một dành riêng cho khách sản phẩm (phụ huynh). Tài liệu từ test nghiệm đó sẽ cho biết cách tận dụng tối đa mức tăng mạnh theo mùa. Hoặc, doanh nghiệp có thể đưa ra những chiến dịch Marketing vào tháng 9 với chủ đề ngày lễ hội để kéo dãn dài đà tăng tới các tháng sau đó.

Tạm kết

Bốn giai đoạn phân tích dữ liệu rất cần được áp dụng đôi khi để tạo thành bức tranh tương đối đầy đủ về mẩu chuyện mà tài liệu kể và gửi ra quyết định sáng suốt. Tùy thuộc vào việc bạn đang nỗ lực giải quyết và mục tiêu của mình, bạn có thể chọn áp dụng hai hoặc ba trong số các các loại phân tích này—hoặc sử dụng toàn bộ chúng theo trang bị tự tuần tự để hiểu sâu độc nhất vô nhị về câu chuyện mà dữ liệu kể.

Dữ liệu không tồn tại nhiều ý nghĩa nếu nó không được phân tích với diễn giải. Nếu như khách hàng mong ý muốn trang bị thêm các kĩ năng phân tích dữ liệu, gia nhập ngay khóa huấn luyện và đào tạo Data Analysis của Tomorrow Marketers nhé!