Sức Mạnh Của Những Con Số - Chương 3

Chương 3

Nắm được “Điểm chính của vấn đề” bằng “Bình quân” và “Độ lệch chuẩn”

Không thể kết luận kiểu “Hỗ trợ cửa hàng có Lượng khách bình quân thấp” được

Yosuke: “Thế à, vậy nếu biết ‘phương pháp thực hiện theo logic dựa vào giả thuyết’, thật là có thể trình bày tự tin những gì mình nghĩ rồi”.

Takashima: “Đúng vậy. Dù cậu nói bao nhiêu ‘có vẻ như thế’ đi nữa, nếu thiếu căn cứ người khác sẽ không tin tưởng, và cũng ảnh hưởng cả đến việc kinh doanh thực tế nữa”.

Yosuke: “Em sẽ xem lại cẩn thận cách làm và những gì đã làm của mình. Trước đây em cũng có tạo giả thuyết, thu thập data cho giả thuyết đó, nên giờ sẽ thử đi sâu hơn nữa xem thế nào.”

Takashima: “Ừ, tôi trông cậy vào cậu đấy. Nhưng giả thuyết chỉ là tiền đề cho phân tích, và cũng chỉ là bước bắt đầu. Tôi đã muốn cậu phân tích kỹ hơn. Vì tôi cũng không thể nói chuyện cậu làm qua loa cho Trưởng bộ phận được”.

Và rồi, Yosuke đã nhanh chóng tra lại Lượng khách của các cửa hàng trong khoảng một năm qua, để kiểm chứng giả thuyết mình đã tạo. Khi nhìn thấy số khách ghé bình quân, Yosuke đã thấy Lượng khách tại cửa hàng B và D ở khu vực phía Bắc thấp hơn.

Yosuke: “Anh Takashima, đúng là trung bình tại cửa hàng B là 460 người/ngày, và D là 450 người/ngày là quá thấp nhỉ. Quả đúng là vấn đề phát sinh ở các cửa hàng phía Bắc này, vậy giả định ban đầu của em hình như đúng rồi. Giờ em sẽ cải thiện hết mức các cửa hàng này nha!”

Takashima: “Cảm ơn cậu. Tôi biết rõ là Lượng khách cửa hàng B và D thấp hơn hẳn rồi. Nhưng chỉ có như thế, thật sự có thể nói cửa hàng B và D là vấn đề chính hiện nay sao. Nghĩa là, thật sự cậu nghĩ nếu dốc sức tăng Lượng khách cửa hàng B và D, là có thể giải quyết hết vấn đề hiện nay hả?”

Yosuke: “Ủa, em nghĩ là nếu mà như thế... thì... (mà ủa!? Mình nói gì sai hay sao ta?)”

Takashima: “Đó chẳng qua chỉ là phương án cậu chợt nghĩ ra sau khi nhìn số trung bình cả năm, rồi khẳng định đó là vấn đề cần giải quyết thôi, đúng không? Nếu thế thì cũng chỉ là suy đoán mà thôi.”

Yosuke: (Nhưng mà, ngoài chuyện này thì còn chuyện gì nữa hay sao?)

Hãy nắm bắt điểm chính của vấn đề

Sẽ không hiệu quả nếu cho rằng “có vấn đề do nhỏ hơn số bình quân”

Chắc có nhiều người đã từng cảm thấy mơ hồ khi đưa ra những kết luận đơn giản kiểu như “vì cao hơn trung bình nên ổn, vì nhỏ hơn nên có vấn đề” giống Yosuke. Yosuke đã lấy data để vẽ biểu đồ, trong một tình huống mà “Cái đó, không cần làm biểu đồ, chỉ cần để số liệu thôi cũng nhận ra được mà”.

Các bạn có nhớ không?

Để nắm được tổng thể thì chỉ cần data tổng quát như Tổng doanh số, tuy nhiên bằng đó thôi thì chưa đủ cụ thể để giải quyết vấn đề hay để đạt mục đích. Ở chương 1 ta đã biết rằng cần phải có quy trình để từng bước đi sâu vào phân tích. Để làm được điều đó, đòi hỏi ta phải biết vấn đề nằm ở đâu.

Tuy nhiên, tuyệt đối không quyết định một cách thiếu suy nghĩ như kiểu “vì cửa hàng này doanh số thấp nhất, nên hẳn đây là vấn đề rồi”.

Ở đây để biết được vấn đề một cách chính xác, ta hãy học các bước cụ thể hơn (hình 3-2).

Để nắm được điểm chính của vấn đề, cách làm chủ yếu là tìm ra các điểm khác biệt với các yếu tố khác, bằng cách so sánh số liệu với nhau. Chỉ là không hẳn lúc nào khi so sánh ta cũng thấy được điểm cần thiết đó.

Như ta đã biết, nếu muốn có thông tin thích hợp từ data, trước tiên phải phân data thành các yếu tố phù hợp (bằng bốn phép tính), rồi so sánh nó trên Tiêu điểm thích hợp (như từng khách hàng, từng cửa hàng, theo thời gian,...). Có thể nói bước đầu tiên như Yosuke đã làm, chính là phân data Lượng khách hay Doanh số tổng thể toàn khu vực thành yếu tố “cửa hàng”.

Tuy nhiên khi chọn sử dụng không chỉ “vì có data của các cửa hàng”, mà cần phải có lý do vì sao chọn data đó (căn cứ hay giả thuyết). Trường hợp của Yosuke, anh ấy đã lấy số bình quân của data có trong tay, rồi kết luận dựa vào số liệu đo (thực tế có nhiều trường hợp giống như vậy).

Nhưng ví dụ như trước khi phân tích data, ta biết nhận định rằng: “Mỗi cửa hàng đều được quản lý bởi các cửa hàng trưởng, nên khó có chuyện tất cả đều đồng loạt giảm sút từ nửa năm trước được. Vậy chắc là có cửa hàng nào đó vì một lý do gì đó mà doanh số đi xuống, gây trở ngại cho tổng thể rồi đây”, thì việc suy nghĩ và tìm xem data nào cần cho việc đó (ví dụ như data doanh số thực tế của từng cửa hàng), chuyện gì xảy ra (ví dụ có cửa hàng nào đó thay đổi khác thường bắt đầu cách đây nửa năm không), sẽ cụ thể hơn.

Giống như vậy, chuyện so sánh các data với nhau thì đơn giản rồi, nhưng khi làm đòi hỏi phải có cách suy nghĩ, cách nhìn phù hợp.

Lúc đó, việc nắm bắt chính xác mấu chốt của vấn đề (nguyên nhân) có được từ data, chính là chìa khóa ảnh hưởng lớn đến chất lượng và hiệu suất của kết quả phân tích. Chọn lựa tiêu điểm phù hợp để phân tích data là việc đương nhiên, nhưng qua đó có dễ nắm bắt điểm đặc trưng, mà không bỏ sót thông tin được giấu ở data gốc hay không, chính là điểm quyết định.

Chính vì vậy, các bạn nhất định phải ghi nhớ ba quan điểm và hai tiêu điểm để nắm và so sánh đặc trưng cửa data mà tôi sẽ giới thiệu tiếp theo nhé.

Điểm mấu chốt

Tạo giả thuyết, sau đó nghĩ để tìm ra “tiêu điểm thích hợp”, “phân tích cho phù hợp” nhằm xác định vấn đề hiện nay.

Để làm được như thế, bạn hãy thử suy nghĩ cụ thể xem “Vấn đề” dễ bị ảnh hưởng bởi yếu tố nào nhé.

Nắm được Độ lớn của data bằng số liệu “Bình quân”

Xem đặc trưng của data bằng “Độ lớn” và “Phân bố” (1)

Để nắm được chính xác đặc trưng của data, ta phải nhìn vào điều gì?

Để tìm ra vấn đề, việc biết được đặc trưng của data đó rất quan trọng.

Hẳn nhiều người cho rằng “data” là “giá trị thể hiện độ lớn”. Trong công việc thực tế, thường ta hay nói đến Tỉ suất hay Độ lớn cho data chẳng hạn như “Doanh số”, “So với cùng kỳ năm ngoái”, “Tỉ lệ sản lượng/nguyên liệu” hay “Lượng khách”. Và đại diện để biểu đạt độ lớn đó thường là “Bình quân”.

Giá trị bình quân mà mọi người thường sử dụng, là một chỉ tiêu rất tiện để nắm được độ lớn. Nếu để riêng từng data một, số lượng càng nhiều thì càng khó nắm được đặc trưng tổng thể. Tuy nhiên, nếu đưa thành chỉ tiêu bình quân để thể hiện “độ lớn của tổng thể”, ta có thể gom các data riêng lẻ đó thành một.

Như ví dụ ở hình 3-3, ngay cả khi nhìn data Doanh số ngày trong tháng đó, ta cũng khó biết được độ lớn đó là bao nhiêu. Nếu đưa nó về “giá trị bình quân” 189.000 Yên, chỉ thoạt nhìn thôi sẽ biết được độ lớn đó. Hay khi so sánh giữa các data có số lượng khác nhau (ví dụ 30 ngày hay 31 ngày), nếu sử dụng bình quân, con số chênh lệch sẽ không lớn.

Điểm mấu chốt

“Giá trị bình quân” rất tiện lợi khi muốn biết độ lớn của tổng thể.

Yosuke: “Nhưng mà, anh Takashima đã nói là không thể chỉ sử dụng bình quân để kết luận cửa hàng này có vấn đề được. Cái đó, có nghĩa là sao?”

Tại sao không được xem “bình quân thấp là có vấn đề”?

Lưu ý những thông tin bị mất khi sử dụng bình quân

Ta hãy thử xem nhanh một đáp án cho câu hỏi của Yosuke nhé!

Bình quân thì tiện lợi, nhưng mặt khác, nó sẽ khiến vài thông tin bị mất đi, và hiện có rất nhiều người sử dụng mà không biết đến sự thật đó.

Như ở ví dụ Doanh số phía trên. Khi nghe đến bình quân là 189.000 Yên, chắc nhiều người sẽ nghĩ ngay “Doanh số trung bình mỗi ngày khoảng 189.000 Yên”. Vậy ta hãy xem kỹ số liệu gốc, ngay trước và sau số 189.000 Yên thì thế nào?

Khi xác nhận data trong 30 ngày bằng biểu đồ Histogram, ta sẽ có hình 3-4.

Nhìn biểu đồ ta thấy nhóm có doanh số 160.000 - 200.000 Yên gồm cả trung bình 189.000 Yên, chỉ có một ngày. Nhiều số ngày nhất là nhóm doanh số 260.000 - 300.000 Yên, kế đến là 210.000 - 250.000 Yên. Ở đây rõ ràng Số ngày càng nhiều sẽ càng cách xa Doanh số trung bình 189.000 Yên đó.

Có hai lý do chính làm ta bất ngờ với thực tế và hình ảnh trong những trường hợp như vậy.

(1) Tác dụng phụ khi tổng kết bằng Giá trị bình quân

Nếu tổng hợp nhiều data bằng chỉ tiêu Giá trị bình quân, có thể ta sẽ đánh mất thông tin có trong data gốc. Ví dụ như nếu chỉ nhìn vào Giá trị bình quân 189.000 Yên, ta không biết được Giá trị nhỏ nhất hay lớn nhất là bao nhiêu, hay mức doanh số nào có số ngày nhiều nhất. Ngay cả quan hệ giữa Số ngày và Số tiền trong biểu đồ Histogram trước đó (nghĩa là sự phân bố của data) ta cũng không thể biết.

(2) Có nhiều người hiểu sai về “Bình quân”

Tại các buổi hội thảo hay tập huấn, tôi thường hay đặt câu hỏi: “Ai có thể giải thích cho học sinh tiểu học biết “Bình quân là gì”, mà không phải là cách tính (lấy tổng chia cho số đơn vị)”.

Tuy nhiên đến giờ vẫn chưa có ai giải thích chính xác được từ này (thực tế trong nhiều cuốn từ điển, hầu hết cũng không giải thích đúng từ này):

- Giá trị đại diện

- Giá trị trung tâm

- Giá trị thường xuất hiện

Thường câu trả lời sẽ như trên. Nếu sử dụng cách hiểu này và áp dụng Giá trị bình quân nhiều quá, rủi ro hiểu sai thực tế đang diễn ra là rất cao. Đặc biệt những người thời sinh viên vẫn cho rằng, khi điểm số bài kiểm tra của mình trên mức bình quân của lớp, nghĩa là “mình thuộc nửa trên nhóm điểm cao”, thì càng cần chú ý hơn.

Khi bình quân được phác họa bằng hình ảnh, ta sẽ có hình 3-5 bên dưới. Mỗi dấu tròn sẽ là một data. Tính từ Mốc bình quân, giá trị nào càng về bên phải thì càng +, càng về bên trái sẽ càng -. Mỗi dấu tròn sẽ được đặt tương đương với giá trị của mình trên mặt phẳng. Chắc chắn sẽ có một điểm tại vị trí nào đó cân bằng hai bên trái phải, và là điểm trụ từ dưới lên cho mặt phẳng này. Và đó là nơi đặt (giá trị) bình quân. Vì thế theo suy nghĩ của tôi, Bình quân chính là “Điểm cân bằng”.

Đặc biệt hãy chú ý đến vị trí và số lượng dấu tròn bên trái, phải của Bình quân. Dấu tròn nhỏ hơn Bình quân (bên trái) có 3, lớn hơn có 8 dấu.

3 dấu tròn bên trái nằm cách xa Bình quân, nghĩa là giá trị của nó nhỏ hơn nhiều so với bình quân.

Ở đây ta thấy rằng:

1. Giá trị bình quân không hẳn ở chính giữa, trung tâm của data (không hẳn số lượng trái phải thì phải giống nhau).

2. Không hẳn data tập trung nhiều ở nơi gần giá trị bình quân.

3. Không hẳn giá trị bình quân là giá trị đại diện cho toàn bộ data.

Như vậy “Bình quân” ở đây chắc hẳn là khác nhiều so với trong suy nghĩ của nhiều người rồi.

Yosuke: “Trời, mình chưa từng nghĩ đến chuyện đó. Nhưng mà đúng là nói bình quân một ngày 189.000 Yên, thì mỗi ngày mỗi khác. Do vậy nếu chỉ nhìn bình quân thôi, sẽ không biết được sự chênh lệch đó ra sao. Nhưng mà, giờ phải làm thế nào đây?”

Điểm mấu chốt

Ta nên biết, mặt trái của sự tiện lợi khi sử dụng “Bình quân” là bỏ sót điểm quan trọng nào đó nếu chỉ dựa vào một giá trị thôi.

Xem “phân bố” (độ lệch chuẩn) để lấy lại thông tin đã mất do Bình quân

Xem đặc trưng của data bằng “Độ lớn” và “Phân bố” (2)

Vậy thì, làm thế nào để lấy lại được thông tin bị mất khi tổng hợp toàn bộ data sử dụng Giá trị bình quân như vậy. Đó là hãy xem lại “sự phân bố” của data gốc.

Ta có thể hiển thị toàn bộ data trên biểu đồ Histogram, để xem tổng thể sự phân bố của data (hình 3-6).

Tuy nhiên, do chỉ nhìn thấy bằng mắt, nên việc đánh giá mức độ phân bố cũng phụ thuộc vào cảm giác của con người. Đặc biệt, khi so sánh nhiều mức phân bố với nhau, có người cho rằng “rắc rối hơn họ nghĩ”, hay “sao thấy cái nào cũng như nhau”,... sự đánh giá có thể khác nhau tùy mỗi người, nghĩa là dù nhìn cùng một biểu đồ, nhưng suy nghĩ mỗi người có thể sẽ khác nhau.

Ngoài ra, khi tạo Histogram bằng excel, có điểm khó là mất nhiều thời gian và công sức hơn việc tạo biểu đồ thông thường, do trước đó cần phải đếm số lượng data.

Vì vậy, để có thể làm nhanh và dễ so sánh hơn, ta nên có chỉ tiêu mức phân bố trước. Chỉ tiêu đại diện cho mức phân bố data đó chính là “Độ lệch chuẩn”.

Độ lệch chuẩn là chỉ tiêu thể hiện “Sự phân bố giống nhau” ai nhìn cũng thấy.

Dưới đây là công thức của chỉ tiêu Độ lệch chuẩn:

Trong excel cũng có thể sử dụng hàm STDEV với cú pháp = STDEV (phạm vi) để lấy kết quả tương tự (ngoài hàm STDEV còn những hàm khác, nhưng tôi xin không đề cập ở đây, nếu bạn nào quan tâm hãy tra thêm để tìm hiểu nhé).

Công thức này nghĩa là lấy Giá trị mỗi data

- Bình quân [(sẽ có số (-) và số (+)], nếu cộng lại thì số dương và âm này kết quả là 0). Sau đó tính tổng Bình phương số (-) và số (+) đó, và chia cho Số đơn vị data.

Thật ra không cần phải nhớ công thức này, chỉ cần hiểu cách tính, sử dụng hàm excel để ra được giá trị cần tìm.

Nếu Giá trị của mỗi data càng lớn (càng cách xa bình quân), hay càng có nhiều data cách xa bình quân, thì Độ lệch chuẩn càng lớn. Nói cách khác nghĩa là “sự phân bố” càng rộng.

Độ lệch chuẩn có thể chỉ ra “Mức phân bố chuẩn so với bình quân”, hay phạm vi mà data thu thập được (nghĩa là “chuẩn”) so với bình quân (nghĩa là “độ lệch”).

Mặc dù việc nắm được ý nghĩa tổng quan đó là cần thiết, tuy nhiên bạn nên biết sự phân bố chính quy như hình quả chuông đó chỉ là tiền đề, nên cũng có trường hợp không đúng hoàn toàn.

Sự phân bố = rủi ro, nhưng không có nghĩa rủi ro = xấu

Khái niệm “phân bố” khá quan trọng trong lĩnh vực sản xuất hay kinh doanh. Sẽ dễ hiểu hơn nếu ta thay từ “Sự phân bố” trong môn thống kê thành từ Độ chính xác hay Rủi ro.

Ví dụ, mức nhỏ nhất trong phân bố doanh số là rủi ro kinh doanh của các cửa hàng bán lẻ. Nếu sự phân bố của ngày bán chạy, và ngày bán ế là lớn, sẽ dẫn đến rủi ro như hàng trong kho thiếu sẽ bỏ lỡ cơ hội bán hàng, hay hàng trong kho nhiều sẽ gây khó cho lưu chuyển tiền mặt.

Nếu trong sản xuất mà sự phân bố đó rộng, nghĩa là thành phẩm càng khác xa quy cách hướng dẫn bao nhiêu, thì độ chính xác hay chất lượng sản phẩm đó sẽ đi xuống bấy nhiêu.

Tất nhiên có những người cho rằng “Rủi ro cao sẽ thu được lợi cao (high risk, high return), tuy nhiên không hẳn “rủi ro (phân bố) = xấu“. Ở đây tôi muốn các bạn nắm được tầm quan trọng của việc hiểu về Phân bố và Rủi ro một cách định lượng.

Ở đây, ta hãy nhìn để xác định ý nghĩa của việc đưa “tiêu điểm” Độ lệch chuẩn (phân bố) vào (lưu ý “tiêu điểm” ở đây là chỉ “độ lớn” và “phân bố”, khác với “tiêu điểm” là các cửa hàng ở chương trước).

Hình 3-8 là biểu đồ Histogram hiển thị doanh số hằng ngày của hai tháng khác nhau. (hình 3-8 bên dưới giống với hình 3-5)

Những người chỉ có “độ lớn” sẽ chỉ chú ý đến Giá trị bình quân này, và kết luận của họ sẽ là “Vì giá trị bình quân không thay đổi, nên doanh số không biến động gì. Như vậy không có vấn đề gì cả”.

Nhưng nếu nhìn tiêu điểm “phân bố” của hai hình này, ta thấy Độ lệch chuẩn của hình trên là 5.1 (10.000 Yên) và hình dưới là 8.5 (10.000 Yên). Rõ ràng hình bên dưới sự phân bố lớn hơn nhiều, nghĩa là sự phân bố của hai tháng này chênh lệch khá nhiều.

Nghĩa là, có thể nói mặc dù Bình quân không đổi, nhưng có sự khác nhau lớn ở “rủi ro kinh doanh” của hai tháng này. Với những người chỉ có mỗi Bình quân (độ lớn) thôi thì vĩnh viễn sẽ không nhận ra, nhưng đây là một điểm cực kỳ quan trọng.

Điểm mấu chốt

“Phân bố” có thể biết được bằng Độ lệch chuẩn (bằng hàm STDEV).

Để so sánh “sự phân bố”?

So sánh sự phân bố của cửa hàng nhỏ lẻ với cửa hàng lớn bằng “Hệ số biến động”

Vậy nếu đã biết giá trị trung bình, có độ lệch chuẩn rồi thì chắc trường hợp nào ta cũng có thể so sánh “sự phân bố” của data được.

Thực tế không đơn giản như thế!

Ví dụ ở hình 3-9, so sánh giữa một cửa hàng lớn với doanh số trung bình hằng tháng 500.000.000 Yên, và một cửa hàng nhỏ lẻ có doanh số 500.000 Yên. Để xem sự phân bố doanh số hằng tháng của cả hai, ta đã tính ra độ lệch chuẩn là 100.000 Yên. Trường hợp này nếu kết luận: “Vì cả hai có độ lệch chuẩn 100.000 Yên giống nhau, nên sự phân bố là giống nhau” thì có được không?

Ta cần chú ý khi so sánh sự phân bố của các data có quy mô khác nhau (ở đây là doanh số trung bình tháng) chỉ bằng giá trị của độ lệch chuẩn. Khi xem xét mức ảnh hưởng của độ lệch chuẩn là con số 100.000 Yên, đối với cửa hàng lớn, nó là 1/50, nhưng đối với cửa hàng tư nhân thì nó là 1/5000. Chỉ nghĩ thôi ta đã thấy có sự khác biệt rất lớn giữa tỉ lệ 1/50 đối với cửa hàng lớn, và 1/5000 của cửa hàng nhỏ lẻ rồi.

Có một cách để so sánh tương đối mức độ phân bố khi đã biết quy mô khác nhau giữa các data, đó là sử dụng chỉ tiêu “Hệ số biến động”.

Hệ số biến động là lấy Độ lệch chuẩn chia cho Giá trị trung bình (ứng với quy mô của data). Như ở hình trước là 1/5000 hay 1/5 (có thể quy ra số lẻ hay %).

Hệ số biến động = Độ lệch chuẩn: Giá trị trung bình

Khi so sánh mức phân bố của cửa hàng bán lẻ và đại lý lớn bằng Hệ số biến động, ta có thể kết luận rằng sự phân bố doanh số của cửa hàng bán lẻ là rộng (lớn) hơn.

Hệ số biến động (đại lý) 100.000: 500.000.000 = 0.0002 (0.02%)

Hệ số biến động (cửa hàng tư) 100.000: 500.000 = 0.2 (20%)

Ở đây, phần trăm hệ số biến động là chỉ mức phân bố chủ yếu cho tổng thể. Cửa hàng lớn ở trên có doanh số trung bình với độ rộng +-0.02% trên tổng thể, còn cửa hàng tư nhân giống như vậy khoảng +-20%. Tuy nhiên, thực tế ít khi số liệu này được sử dụng một mình để đánh giá hay tính toán, mà thường được sử dụng cùng với các chỉ tiêu khác.

Điểm mấu chốt

Khi quy mô khác nhau hãy sử dụng “hệ số biến động” để so sánh.

Tầm quan trọng của hai tiêu điểm “độ lớn” và “phân bố”

“Không dám” nhìn sẽ không biết được

Như đề cập ở trên, bạn hãy luôn nhớ đến hai tiêu điểm chính là “độ lớn” và “sự phân bố” khi muốn biết đặc trưng của data (hình 3-10). Thực tế thì “độ lớn” thường được ưu tiên và chú ý hơn. Bên cạnh đó, không phải toàn bộ trường hợp đều phải mất thời gian tính toán sự phân bố và so sánh cả.

Tuy nhiên tôi nghĩ ít nhất cũng phải xác nhận lại xem trong data gốc, sự phân bố có bị sai lệch, hay vấn đề gì không.

Như đã trình bày, “vì nếu không dám thử nhìn, ta sẽ không nhận ra được câu chuyện đằng sau”.

Điểm mấu chốt

Xem đặc trưng của cả “độ lớn” và “phân bố”.

Yosuke: “Eh! Trước giờ mình vẫn sử dụng để báo cáo mà không biết thế nào là bình quân, thế nào là data gốc. Càng lúc mình càng thấy tầm quan trọng của phương pháp phân tích hay chỉ tiêu “phân tích data” rồi. Khi phân tích nếu không hiểu những điều đó ngược lại còn phản tác dụng nữa. Những số liệu vẫn dùng mà không suy nghĩ gì... có sao không ta...?”

“Snapshot” để trình bày nội dung trong kỳ một cách dễ hiểu

Ba điểm để nắm được đặc trưng của data (1)

Điểm tiếp theo cần phải xem xét là “làm thế nào” để nắm và so sánh “độ lớn” hay “phân bố” của data đó. Khi Yosuke chỉ nhìn giá trị của bình quân trong năm, rồi kết luận cần cải thiện ở hai cửa hàng ít khách là B và D, thì lập tức bị Takashima cho rằng: “Đó vẫn chỉ là suy đoán của cậu thôi”. Vậy ngoài tiêu điểm “phân bố” ra, Yosuke còn bỏ sót điều gì? Và để thoát khỏi “sự suy đoán” phải làm gì, tiếp theo tôi xin được giới thiệu ba điểm chính sau đây.

“Snapshot” để trình bày số liệu trong một kỳ nào đó theo cách dễ hiểu

“Snapshot” nghĩa là chia nhỏ phạm vi nào đó, để biểu đạt đặc trưng của nó. Giống với việc cắt một khoảnh nào đó trong một video, hay như snapshot khi chụp hình vậy.

Có rất nhiều thông tin trong tấm hình bị cắt. Nội dung hay lượng thông tin không thể xử lý cùng lúc hoặc bị bỏ sót, có thể dễ dàng nắm bắt do chỉ tập trung vào khoảnh khắc đó thôi. Vì vậy đối với cả người làm và người xem, càng dễ làm, dễ hiểu càng tốt.

Ví dụ ở hình 3-11, ta có biểu đồ tròn so sánh doanh số bán hàng tại các khu vực vào năm đó, hay biểu đồ cột các sản phẩm của mỗi khu vực. Nếu ta cố định phạm vi (thời gian, khu vực,...) như thực bán tháng trước, hay thực bán năm 2015, phân chia và thể hiện chi tiết bên trong đó, sẽ dễ so sánh giữa các khu vực, thị trường trong phạm vi đó hơn. Kết quả ta sẽ biết được Tỉ lệ hay Độ lớn đó chưa đến mức nguy hại, do đó sẽ hạ bớt Độ ưu tiên giải quyết xuống, và tìm Vấn đề thực sự ở một chỗ khác hiệu quả hơn.

Chắc bạn đã nhận ra biểu đồ mà Yosuke xem lượng khách của cửa hàng bình quân năm trước cũng là một snapshot, và “độ lớn” chính là lượng khách đúng không. Khi xem giá trị bình quân một năm, thì vấn đề được xác định nằm ở những cửa hàng có lượng khách ít. (Hình 3-12)

Vậy ngược lại, rủi ro khi đánh giá hay phán đoán chỉ dựa vào snapshot này là gì?

Đó là không thể nhìn thấy sự biến động bên trong. Có thể nói snapshot chỉ là vẽ biểu đồ đơn giản bằng cách lấy thông tin chung, sau đó tính toán sơ qua số liệu đã lấy đó.

Tuy nhiên, có rất nhiều sự việc thay đổi theo thời gian, và trong kinh doanh, con số đó còn lớn hơn. Đôi khi việc “không nhìn thấy sự biến động” sẽ gây hậu quả khôn lường. Nếu là thông tin bị giới hạn, ta sẽ không cách nào nhận ra được sự biến động đó, ngay cả khi là tình huống đặc biệt.

Ví dụ, dù biết: “Nhiệt độ trung bình tháng này là 15 độ”, ta cũng không thể biết nó đang trên đà tăng, hay đang giảm dần. Vấn đề nghiêm trọng ở đây chính là ta không thể biết cả khi có vấn đề rất lớn phát sinh trong “sự biến động” đó.

Giống như vậy, sự thay đổi đã diễn ra thế nào mỗi ngày bên trong “một tháng” đã bị che lấp bởi “Một giá trị ở đây là 15 độ”.

Trong thực tế, việc thu thập data trong một chu kỳ bình thường, chắc chắn là để theo dõi theo định kỳ. Nếu chỉ đơn giản quy thành một loại số liệu như Bình quân thôi, có thể không phát huy được hết giá trị của data gốc.

Yosuke: “Vậy à, nếu chỉ nhìn kết quả của một kỳ nào đó, hay toàn bộ các kỳ, cũng không biết được chuyển động bên trong của tổng thể nhỉ. Hình như mình đang quy data gốc thành một điểm giống như Bình quân vậy. Nghĩa là trước giờ rất có khả năng bỏ sót không ít thông tin rồi...?”

Takashima: “Đúng vậy. Có thể hai cửa hàng mà cậu chọn đang trên đà tăng trưởng không chừng đấy!”

Điểm mấu chốt

Nếu phân tích bằng snapshot sẽ dễ so sánh các khía cạnh/yếu tố với nhau hơn. Tuy nhiên, đừng quên đó chỉ là thông tin tĩnh của một kỳ nhất định nào đó thôi.

Khuynh hướng “trend” để xem sự biến động

Ba yếu tố để nắm được đặc trưng của data (2)

Việc nắm được điểm đặc trưng của “sự biến động” (thay đổi) khác với “snapshot” đơn giản và dễ hiểu, cũng là điểm rất quan trọng. Đó được gọi là “trend”- khuynh hướng (ở hình 3-13)

“Trend” cho ta thấy data thay đổi thế nào qua thời gian. Trend cũng còn được gọi là Hệ thời gian (data).

Hình 3-14 là biểu đồ so sánh doanh số bán hàng khu vực Yosuke phụ trách trong mỗi quý với tiêu điểm là “cửa hàng”.

Qua biểu đồ, ta có thể thấy sự biến động doanh số trong một năm vừa qua. Từ số liệu trong quý 4 gần nhất, ta có thể dự đoán được xu hướng sau này nữa. Mặc dù không thể nói đúng cho tất cả trường hợp, nhưng có thể nói nếu nhìn vào số liệu đang tăng trưởng như vậy, có thể hy vọng sau này tình hình sẽ sáng sủa hơn nhiều. Và chắc chắn so với snapshot chỉ nhìn thấy Bình quân của năm ngoái thôi, thì biểu đồ này có độ đáng tin hơn hẳn.

Khi so sánh giữa biểu đồ Trend và biểu đồ thể hiện data bằng Bình quân năm giống như Yosuke đã xem (nghĩa là “snapshot”), rõ ràng thông tin nhận được rất khác nhau. Nhìn từ “snapshot”, ta thấy cửa hàng A và C doanh số rất tốt, nhưng nhìn từ “trend” thì doanh số hai cửa hàng này có khuynh hướng đang giảm, do vậy cần có phương án để giảm thiểu rủi ro sau này.

Tuy nhiên, một điều cần lưu ý là không thể khẳng định giữa “snapshot” và “trend”, cái nào tốt hơn.

Nếu là “snapshot” thì cần phải dễ so sánh, dễ nắm bắt độ lớn một cách đơn giản. Ngược lại, “trend” lại có khi khó phán đoán hay so sánh rõ ràng một cách đơn giản như vậy.

Nghĩa là, khi xem xét cả ở hai khía cạnh này, ta sẽ có được thông tin đa diện hơn, mà nếu chỉ nhìn một phía, có thể bỏ sót thông tin nào đó.

Tiếp theo đây, chúng ta cùng xác nhận sự “phân bố” trong trường hợp của Yosuke nào.

Giả sử ta chỉ có số liệu Bình quân ngày của các tháng, không phải Lượng khách mỗi ngày. Data của 12 tháng này (có 12 mẫu) không phải nhiều, do vậy ta xem trên “snapshot” trước nhé.

Ta đã có Số chỉ tiêu ở trên như hình 3-15. Nếu biết tại sao có cửa hàng mà sự chênh lệch giữa Lượng khách của tháng cao và tháng thấp lại lớn như vậy, ta có thể tìm được đối sách để ổn định doanh số. Đặc biệt ở đây có thể thấy sự Phân bố tương đối lớn của cửa hàng A, vốn không thể nhìn ra vấn đề do Số trung bình của nó lớn nhất. Khi nhìn bằng “trend”, ta thấy nguyên nhân sụt giảm mạnh từ nửa cuối năm là do sự gia tăng độ rộng trong phân bố của Lượng khách. Mặt khác, ta lại muốn biết xem rằng Độ lớn trong phân bố của cửa hàng D vốn không thay đổi (sụt giảm) nhiều là vì sao.

Ngoài ra, nếu thử tham khảo Lượng khách trung bình mỗi tháng của các cửa hàng bằng biểu đồ Histogram (phần giữa hình 3-15), so sánh độ lớn của Hệ số biến động và xem mức độ Phân bố, rõ ràng Hệ số biến động càng lớn, thì phạm vi phân bố của data càng rộng.

Vì data ít, nên ở ví dụ này ta khó thấy được Trend trong Phân bố, nhưng nếu xác nhận lại, tính Hệ số biến động của cả nửa năm trước và sau, có thể sẽ thấy được sự biến đổi đó, nhờ đó ta biết cửa hàng A và C trong nửa cuối năm, sự phân bố đang tăng lên. Điều này tương đồng với kết quả Sự sụt giảm mạnh của các cửa hàng này khi nhìn Lượng khách (độ lớn) bằng “Trend”.

Yosuke: “Ồ, giờ thì mình biết cách nhìn đa chiều là nhìn data từ nhiều góc độ khác nhau rồi. Cái này, so với khi chỉ toàn sử dụng Giá trị bình quân, thì lượng thông tin thu được hoàn toàn khác. Dù chưa đi vào phân tích phức tạp gì, nhưng những điều nhìn thấy đang rộng hơn rồi.”

Điểm mấu chốt

Nếu nhìn bằng “trend”, “sự thay đổi” hay “biến động” của data có thể đọc thấy. “Sự thay đổi” hay “biến động” là yếu tố quan trọng để nhận biết vấn đề đang phát sinh!

“Positioning” (Định vị) tìm hai tiêu điểm Tung, Hoành để phân tích

Ba yếu tố để nắm được đặc trưng của data (3)

Điểm thứ ba là “Positioning” (Định vị). Positioning là cách vẽ bản đồ phân bố dựa trên data, và nhìn thấy đặc trưng từ data đó. Giống với “snapshot” hay “trend”, mặc dù việc sử dụng “tiêu điểm” nào ảnh hưởng rất lớn đến kết quả, nhưng với Positioning thì tùy vào cách quyết định hai tiêu điểm Tung, Hoành mà những gì nhìn thấy sẽ rất khác nhau. Vì vậy, để phần phân tích đạt hiệu quả, ta nên có trước giả thuyết như “tại sao lại chọn tiêu điểm đó”.

Tôi xin nêu một ví dụ.

Để đưa phương án tăng Lượng người sử dụng trung tâm nọ, ta sẽ phân tích tình huống của Người sử dụng. Hình 3-16 là biểu đồ phân bố đã vẽ định vị mỗi khách hàng có tần suất sử dụng ở trục hoành, mức độ hài lòng ở trục tung, dựa vào giả thuyết: “Khi càng sử dụng Trung tâm thể thao này, quý vị sẽ càng thấy tiện lợi và thoải mái hơn (nếu không sử dụng sẽ khó biết được)”.

Sau đó chia làm hai nhóm có tần suất sử dụng cao và thấp, ta sẽ thấy được sự chênh lệch của mức độ hài lòng giữa hai nhóm đó. Rõ ràng với cách tìm sự chênh lệch ở mức độ hài lòng, nhằm tìm lý do tại sao, ta sẽ biết được phải đưa ra phương án nào cho phù hợp.

Nếu không có bước này thì khó mà biết điểm đặc trưng đó là gì, tuy nhiên rủi ro khi phân tích bằng “định vị” này chính là, có thể sự đánh giá đặc trưng trước mắt mang tính chủ quan (bằng cảm giác).

Nghĩa là việc phán đoán xem chia Tần suất sử dụng là tùy vào mỗi người. Tuy nhiên, bạn cần chú ý nếu cố tình chia nhóm để chứng minh cho kết luận mình đã định trước, thì ngược lại sẽ đánh mất mức độ tin cậy của kết luận đó.

So với “snapshot” hay “trend” vốn chỉ sử dụng một tiêu điểm, thì “định vị” sử dụng đến hai tiêu điểm, nên chất và lượng thông tin thu được sẽ rộng hơn nhiều. “Độ lớn” hay “phân bố” chỉ sử dụng một loại data (một tiêu điểm), có thể xem như một loại “chỉnh sửa data”, còn “định vị” với hai tiêu điểm sử dụng, có thể nói là đã thuộc phạm vi “phân tích data” rồi. Đây chính là điểm hấp dẫn của “định vị”.

Chỉ là không phải lúc nào hay trường hợp nào cũng cần phải nhìn ở góc độ “định vị”. Với trường hợp “snapshot” và “trend”, khi xem data thì trường hợp nào cũng cần cả hai để nắm được thông tin tổng quan, còn “định vị” có thể xem là phương thức khi ta muốn có được data sâu và rộng hơn. Định vị cũng nên được sử dụng nếu trường hợp so sánh chỉ với một tiêu điểm là “snapshot” hay “trend” để có thông tin sâu và nắm được đặc trưng của data.

Chọn hai tiêu điểm thế nào?

Thực tế việc chọn hai tiêu điểm phù hợp từ nhiều data bằng suy đoán, là việc không đơn giản. Không phải là quy tắc tuyệt đối, nhưng ta có thể lấy hai điểm khác nhau liên quan đến Vấn đề hay Mục đích làm tiêu điểm.

Ví dụ ở trường hợp của Yosuke, giả sử có mục đích hay giả thuyết rằng: “Đầu tiên tìm phương án cho những cửa hàng sụt giảm nghiêm trọng, ảnh hưởng đến tổng thể”. Khi lấy chỉ tiêu ảnh hưởng đến kinh doanh, ta có “Lượng khách trung bình hằng năm (số)” và “so với năm ngoái” làm hai tiêu điểm, như hình 3-17. Từ hình bên dưới ta có thể kết luận rằng, cửa hàng phải ưu tiên giải quyết hàng đầu là cửa hàng A với quy mô kinh doanh (lượng khách) nhiều, và doanh số sụt giảm mạnh.

Yosuke: “Đúng vậy, chỉ cần làm Định vị này thôi, mà mình thấy được nhiều thứ. Khi chỉ có Bình quân, mình thấy không chênh lệch gì nhiều. Cảm giác thông tin có chiều sâu như này gần giống với cái anh Takashima yêu cầu rồi. Giờ mình thử nghĩ xem có tiêu điểm nào khác nữa không! Cái này, thấy khá là thú vị đấy...”

Ở đây có vấn đề. Ví dụ, hai tiêu điểm nào sẽ được chọn dựa trên các giả thuyết dưới đây? Trước khi xem câu trả lời, bạn hãy tự mình tìm câu trả lời nhé.

Giả thuyết (1): Ở sự kiện này, không biết người trẻ có cất công đến không?

-> Nếu không, cần phải xem lại phạm vi đối tượng mà quảng cáo đang làm hướng đến là ai.

Giả thuyết (2): Những trung tâm có lượng khách ổn định mỗi tháng, không biết doanh thu có lớn không?

-> Nếu có, chắc là cần phải tập trung đẩy mạnh hơn nữa sự tiện lợi, dễ sử dụng dành cho khách hàng hiện nay, hơn là thu hút khách hàng mới với các sự kiện đơn lẻ.

Giả thuyết (3): Lý do cần ưu tiên cải thiện nhà hàng của chúng ta là gì?

-> Nghĩa là, chúng ta xem trọng khách hàng, nhưng trước tiên phải có phương án khắc phục những điểm khách hàng chưa hài lòng.

Với mỗi giả thuyết, bạn có thể đưa ra các tiêu điểm như vậy (có thể có tiêu điểm khác phù hợp nữa).

Giả thuyết (1): Độ tuổi của khách với Khoảng cách từ nhà (khu vực sinh sống).

Giả thuyết (2): Sự phân số của Lượng khách với Số tiền thu được (hằng tháng).

Giả thuyết (3): Mức độ quan trọng (phương pháp 5 điểm) với Mức độ hài lòng (phương pháp 5 điểm).

Bên cạnh đó, theo kinh nghiệm bản thân tôi thấy rằng, những người càng cho rằng mình yếu xử lý số liệu, thống kê hay biểu đồ, thì nếu trình bày và nắm bắt thông tin dễ hiểu bằng thị giác như vậy, sẽ càng dễ được người xem tiếp thu và đánh giá cao hơn. Ý là, trong giao tiếp thì việc trình bày hiệu quả chính là một vũ khí lợi hại.

Điểm mấu chốt

Có được thông tin phong phú, đầy đủ hơn từ hai yếu tố (tiêu điểm) bằng “định vị”.

Tìm sự chênh lệch bằng cách “so sánh”

Để nắm được Vấn đề, phải xem data thế nào? (1)

Ở đây tôi xin được giới thiệu “làm thế nào” xem “phân bố” hay “độ lớn” để tìm ra vấn đề.

Đầu tiên là “so sánh”.

Ở chương 2, tôi đã giới thiệu việc phân tích số liệu dựa vào bốn phép tính theo giả thuyết kiểu WHAT, và cách tìm “tiêu điểm” để so sánh rồi. Sau khi có được giả thuyết này, dựa vào đó ta sẽ so sánh và nắm được “vấn đề phát sinh ở phạm vi nào”.

“Sẽ hiệu quả hơn nếu so sánh kết hợp cả hai tiêu điểm và ba quan điểm đã nhận biết trước đó. Vì với cách làm matrix chéo 2 x 3 để nắm đặc trưng của data này, ta có thể xác định được bây giờ mình phải so sánh cái gì với cái gì, như thế nào, và còn cách so sánh nào khác không”.

Khi so sánh, có vài điểm cần chú ý sau

(1) Yếu tố khác biệt

Ta có thể sử dụng “trend”, “snapshot” hay “định vị” trong bất cứ trường hợp nào. Khi so sánh “độ lớn” hay “phân bố” của data theo tiêu điểm đã định trước dựa vào giả thuyết (ví dụ sản phẩm, chi nhánh, khách hàng, hay khu vực), nếu có thể tìm thấy yếu tố khác biệt nhiều với cái khác, ta sẽ biết đó là “vấn đề”.

Ví dụ ta có giả thuyết rằng: “Sản phẩm nào đó đang được giảm giá và làm giảm lợi nhuận kinh doanh chung. Tuy nhiên, vì tình huống này được xem là chỉ giới hạn cho khu vực chỉ định, nên nếu phân tích theo sản phẩm ở từng khu vực, chắc chắn ta sẽ biết vấn đề xuất hiện ở khu vực đó. Vì vậy ta có hình 3-18, so sánh sự khác nhau giữa các sản phẩm, theo khu vực”.

Chỉ cần nhìn sơ qua, ta có thể thấy Khu vực B khác biệt so với các khu vực khác.

Ở đây, khi so sánh tỉ suất (độ lớn) của sản phẩm bằng “snapshot”, ta thấy được Khu vực B rõ ràng “khác biệt” so với các khu vực khác.

Bước tiếp theo, ta đi vào phân tích “tại sao chỉ có Khu vực B thì sản phẩm mới như vậy”. Giai đoạn này mặc dù chưa đến phần phân tích, nhưng ít nhất nếu so sánh với khi chỉ tạo biểu đồ Lợi nhuận thực tế tổng thể mà không chia theo sản phẩm hay khu vực, có thể nói đã tiến được một bước gần tới vấn đề thực sự đang tìm kiếm rồi.

Tôi xin nêu tiếp một ví dụ áp dụng điều này cho “định vị”:

Ta muốn kiểm chứng giả thuyết rằng ở trung tâm thể thao nào đó, “những người sử dụng thường xuyên dụng cụ, thiết bị sẽ duy trì được sức khỏe tốt hơn”. Tiếp đó ta tạo biểu đồ phân bố với trục tung là Tần suất đi bệnh viện, trục hoành là Tần suất sử dụng thiết bị thể thao, và thử định vị các khách hàng đó (hình 3-19).

Nghĩa là, ta chọn Người sử dụng có tần suất sử dụng cao và ổn định, nếu thấy Sự phân bố của Tần suất sử dụng nhỏ, nghĩa là họ thường xuyên sử dụng thiết bị thể thao. Vì vậy, ở đây trục hoành là “phân bố”, trục tung là “tần suất sử dụng”.

Với kết quả này, ta có thể thấy một nhóm nhỏ khác biệt chính là “những người có tần suất sử dụng ổn định (= phân bố ít), tần suất nhập viện thấp”. Vậy tại sao những người này lại ít phải đi bệnh viện. Bước tiếp theo ta sẽ tập trung vào nhóm này, để giải đáp thắc mắc rằng có phải họ ít đi bệnh viện là do chỉ thường xuyên vận động ở trung tâm thể thao hay không, hay còn có hoạt động gì khác nữa.

Điểm mấu chốt

Tập trung vào sự chênh lệch giữa các nhóm để tìm ra “vấn đề”.

Tìm nguyên nhân của vấn đề bằng “điểm thay đổi”

Để nắm được Vấn đề, phải xem data như thế nào? (2)

Có đôi khi sự thay đổi là nguyên nhân dẫn đến phát sinh vấn đề. Nếu nắm được điểm thay đổi đó là gì, ta sẽ làm rõ “tại sao sự thay đổi lại làm phát sinh vấn đề đó”.

Muốn biết được Sự thay đổi, ta chú ý xem theo kiểu “trend”.

Ví dụ như khi muốn kiểm chứng giả thuyết rằng: “Mặc dù công ty không có hoạt động gì đặc biệt, nhưng doanh số đột nhiên được cải thiện. Có thể khách hàng từ bên công ty A cạnh tranh trực tiếp với công ty mình đang chuyển qua”.

Những lúc như vậy, trước khi công ty A tìm cách lấy lại khách hàng của họ, ta cần xác nhận xem giả thuyết đó có thật sự đúng không, và đưa ra phương án. Chính vì vậy, có khi việc xác nhận rằng doanh số đang tăng bằng biểu đồ thôi, đôi khi không phải là chuyện vui, chỉ có hành động dựa trên phân tích chính xác mới mang lại hiệu quả.

Như hình 3-20 là biểu đồ so sánh Lượng hàng bán trong một năm theo mỗi quý của ba công ty cạnh tranh. Nhìn biểu đồ ta thấy công ty mình, công ty B, C có biến động doanh số tương đương nhau. Nhưng ở quý cuối, doanh số công ty A giảm mạnh, còn ba công ty kia lại tăng đáng kể. Có thể nói giả thuyết nêu lúc đầu là chính xác.

Ở đây khi so sánh Lượng bán bằng trend, ta thấy được công ty A trong quý đầu có “điểm thay đổi”. Có thể nói đây là cách xác định sự chênh lệch do “sự thay đổi” khi so sánh với các đối tượng khác.

Điểm mấu chốt

Hãy chú ý “Những điểm thay đổi” trong quy trình và tìm kiếm Vấn đề

Tìm “điểm chung” để nắm được đặc trưng

Để nắm được vấn đề, phải xem data thế nào? (3)

So sánh là để tìm ra sự khác biệt, tuy nhiên không có nghĩa là chỉ tìm thấy một điểm thôi. Đôi khi có hai điểm liên quan đến nhau thể hiện đặc trưng nào đó. Ví dụ nếu ta vẽ Biểu đồ phân bố có thêm yếu tố thứ hai là “lượng khách” vào biểu đồ cột chỉ có một yếu tố “doanh số” đã giới thiệu ở chương đầu, thì những gì nhìn thấy sẽ khác hẳn.

Vì vậy ta tạo data bằng hai tiêu điểm, tìm điểm chung từ sự phân bố đó, rồi chia nhóm. Nếu suy nghĩ đến việc các nhóm tại sao lại khác nhau, khác nhau ở điểm nào, và đọc được đặc trưng của nó, ta sẽ nhìn thấy vấn đề mình đang đối mặt.

Trong cả ba cách “snapshot”, “trend”, và “định vị” đều có thể chia nhóm data được, nhưng tôi nghĩ cái dễ hiểu và chứa nhiều thông tin nhất trong đó là “định vị”.

Giả sử ta có giả thuyết: “Những khách dùng nhiều tiền khi mua sắm hình như có sử dụng thẻ của công ty”, và ta định vị data cho từng khách, với trục tung là Tỉ lệ khách mua sử dụng thẻ, và trục hoành là số tiền khách mua khi đến cửa hàng.

Nhìn hình 3-21 ta thấy, ở một số tiền nhất định, Số tiền tăng thì Tỉ lệ dùng thẻ tăng, nhưng trên mức đó, thì Tỉ lệ dùng thẻ và Số tiền không tăng cùng nhau nữa. Nghĩa là ở đây, ta đã xác định được các nhóm khách hàng thông qua sự thay đổi đó.

Nếu biết được trong mỗi nhóm có điểm chung gì, và tại sao lại là mức tiền đó, ta có thể tìm thấy nhiều phương pháp để cải thiện việc sử dụng thẻ của khách.

Rõ ràng lượng thông tin có được nhiều hơn hẳn so với khi tạo biểu đồ chỉ có “Tỉ lệ mua hàng sử dụng thẻ” mà thôi.

Như những ví dụ khi sử dụng cả “điểm thay đổi” và “điểm đặc trưng”, không phải mỗi quan điểm đều hoàn toàn độc lập, ta có thể sử dụng kết hợp chúng với nhau.

Điểm mấu chốt

Tìm thấy vấn đề từ sự khác nhau của mỗi nhóm đã định bởi hai tiêu điểm.

“Sự lệch chuẩn” có thể là căn cứ để xác định vấn đề

Để nắm được vấn đề, phải xem data thế nào? (4)

Như ở mục (1), ta phải chú ý đến Mức độ lệch so với bình quân, hay Giá trị trung tâm, mà không chỉ chú trọng đến Sự chênh lệch so với các nhóm khác thôi.

Ví dụ, dựa vào giả thuyết “nếu biết cách dùng tiền của những khách ít đi mua loại thực phẩm nào đó, có lẽ sẽ tìm thấy cách hiệu quả để làm cho họ thường xuyên mua hơn”, ta so sánh khách hàng bằng “khoảng cách bình quân giữa các lần mua hàng (ngày)” (hình 3-22). Khi đó nếu chỉ tập trung vào Mức chênh lệch khi so sánh với cái khác, có thể ta sẽ không thấy được vấn đề.

Vì vậy, sau khi nhìn thấy mức lệch so với trung bình, ta hãy tô màu khu vực Bình quân +- Độ lệch chuẩn (phần màu xanh ở hình 3-22). Trường hợp này ta có thể kiểm chứng thực tế “độ lớn” ở đây là “Khoảng cách giữa các lần mua hàng” bằng “snapshop” trong khoảng thời gian nhất định. Nếu data vượt khỏi phạm vi, ta đã biết được data bị lệch khỏi khoảng đó. Nhờ vậy sau này nếu bị hỏi “căn cứ để xác định vấn đề đâu”, ta cũng có thể giải thích một cách logic, đây đúng là “một mũi tên trúng hai con nhạn”.

Đến giai đoạn này, khi tổng hợp những gì Yosuke biết được từ việc phân tích, ta có hình 3-23. Ở đây cần phải xác nhận thêm một giả thuyết về “đơn giá” nữa, nhưng trong cuốn sách này ta không đề cập đến việc sự biến động của Đơn giá có ảnh hưởng đến sự giảm sút doanh số.

Mọi người khi xem cũng thử tham khảo hai điểm với ba phân tích ở hình 3-23 nhé.

Yosuke: “Nếu so sánh với khi chỉ xem Doanh số thực tế thôi, thì mình nhìn thấy được bao nhiêu là thông tin. Mình sẽ tổng hợp lại những gì đã biết khi so sánh các cửa hàng với nhau. Nếu làm thế này, mình đã biết được vấn đề lớn nhất lúc này là cửa hàng A, mà nếu chỉ nhìn giá trị bình quân hằng năm đã không nhận ra.”

Điểm mấu chốt

Tìm thấy vấn đề khi chú ý vào điểm chênh lệch so với Giá trị chuẩn (bình quân).

So sánh data “Nội hướng” và “Ngoại hướng”

Hãy xác định vị trí đang đứng khi phân tích

Cuối cùng ở phần so sánh data, ta hãy xem “so sánh với cái gì”, hay đối tượng so sánh là gì.

Khi thu thập data dựa vào kết quả phân tích và chọn lựa “tiêu điểm” so sánh, ví dụ như mỗi cửa hàng, hay mỗi sản phẩm, hãy lưu ý đến việc “nội bộ” hay “bên ngoài”.

“Nội bộ” là chỉ việc ta so sánh những data nội bộ (bên trong công ty). Ví dụ như so sánh giữa các cửa hàng, hay snapshot các sản phẩm trong công ty với nhau. Với cách này, ta có thể tập trung vào phát hiện và xử lý các vấn đề nội bộ.

Tuy nhiên trong kinh doanh, chắc chắn rất nhiều tình huống phải cạnh tranh với đối thủ hay thị trường, trong trường hợp đó, nếu so sánh nội bộ hoàn toàn không phù hợp, và sẽ “chỉ vô ích” mà thôi.

Vì thế sẽ có lúc ta phải so sánh với các tác nhân bên ngoài. Đây gọi là “ngoại hướng”.

Ví dụ khi so sánh các cửa hàng trong công ty, cửa hàng A có thành tích nổi bật, nhưng việc biết được cửa hàng A này đang có ưu thế gì trên thị trường, lại rất quan trọng trong kinh doanh. Vì thế bằng cách so sánh với công ty cạnh tranh (cửa hàng khác), ta có thể so sánh/ nắm rõ khả năng cạnh tranh của công ty mình. Đây giống với thông điệp tôi đã giới thiệu ở chương 1 rằng: “Hãy ghi nhớ data trước mắt bạn không hẳn thể hiện toàn bộ thị trường hay xã hội xung quanh bạn”.

Như vậy, “so sánh với cùng kỳ năm ngoái” vốn thường gặp nhiều trong kinh doanh, có thể so sánh bản thân với quá khứ, tuy nhiên không phải là chỉ tiêu thể hiện trực tiếp năng lực cạnh tranh trên thị trường.

Ví dụ, so với cùng kỳ năm ngoái đạt 110%, chắc hẳn bạn sẽ vui mừng vì “thành tích tốt”. Nếu toàn bộ thị trường so với cùng kỳ năm ngoái tăng trưởng 120%, thì ý nghĩa 110% này thay đổi rất lớn. Nghĩa là, mặc dù toàn bộ thị trường tăng trưởng cao hơn, nhưng mức tăng của công ty lại thấp hơn của thị trường. Ở đây có thể đánh giá mặc dù công ty này tăng trưởng cao hơn năm ngoái, nhưng lại đánh mất thị phần rồi (thành tích tệ hơn đối thủ).

Như vậy, dù tiêu điểm giống nhau, nhưng tùy vào việc lựa chọn đối tượng so sánh, vị trí bản thân sẽ khác nhau. Vì so sánh là để đánh giá tương đối vị trí của bản thân, nên khi đối tượng so sánh rộng hơn, thì kết quả sẽ khác.

Yosuke: “Việc nếu nhìn cùng một số liệu ở nhiều khía cạnh, sẽ biết được nhiều thông tin khác nhau thú vị. Ở đây mình cảm thấy không phải suy nghĩ lộn xộn nào là độ lớn, nào là phân bố, mà nếu thử xem xét sự liên hệ giữa chúng, kết nối lại, mình có thể thấy được sự việc đang diễn ra. Thực tế là nếu chỉ nhìn snapshot Giá trị bình quân thôi, thì rõ ràng cửa hàng A hay C cao hơn, sẽ không nhận ra vấn đề là các cửa hàng này đang trên đà giảm sút, hay doanh số bình quân cửa hàng D thấp, và không nhìn thấy ẩn sau đó là sự phân bố rộng rãi ra sao. Từ trước đến giờ thì mình cũng chỉ để nguyên và so sánh các data với nhau, nên có thể nói đây chính là một phát hiện mới”.

Takashima: “Đúng vậy, cái đó gọi là “tận dụng” data đấy. Tuy nhiên vẫn chưa đạt đến bước có hành động hiệu quả đâu. Nếu không biết tại sao cửa hàng kinh doanh không tốt, thì sẽ chỉ là suy đoán và không giải quyết được vấn đề”.

Chương 3

Điểm cần làm để “suy nghĩ bằng số liệu data”

Đề tài: So sánh nhiều khía cạnh để tìm Vấn đề

1: Để nắm được vấn đề, hãy phân tích data dựa trên giả thuyết, và chọn tiêu điểm cho so sánh.

2: Chú ý đặc trưng của data là nằm cả trong “phân bố” của data gốc, chứ không chỉ “độ lớn” thôi.

3: So sánh data theo “snapshot”, “trend”, và “định vị”.

4: Chú ý đến “so sánh”, “điểm thay đổi”, “điểm chung”, “sự lệch so với chuẩn”, và tìm điểm khác biệt.

Lưu ý: Bao giờ cũng tạo giả thuyết cho mục đích rồi mới tiến hành.

Báo cáo nội dung xấu

Chi phí đọc tác phẩm trên Gác rất rẻ, 100 độc giả đọc mới đủ phí cho nhóm dịch, nên mong các bạn đừng copy.

Hệ thống sẽ tự động khóa các tài khoản có dấu hiệu cào nội dung.