Follow Fanpage
Contact
Trong các bài viết với những chủ đề khác nhau ở mục Blog, BigDataUni đã giới thiệu đến các bạn những lý thuyết thống kê, statistics cơ bản từ tóm tắt, thống kê dữ liệu, thống kê mô tả để tìm hiểu những đối tượng trong mẫu dữ liệu cho đến thống kê suy luận bao gồm các phương pháp ước lượng, kiểm định.để đưa ra các kết luận về tổng thể nghiên cứu, và đánh giá chúng. Đến với bài viết lần này BigDataUni sẽ tiếp tục giới thiệu đến các bạn một mảng kiến thức quan trọng khác trong thống kê, và được ứng dụng ở nhiều lĩnh vực khác nhau chính là phân tích phương sai hay còn gọi với tên viết tắt là ANOVA.
Phân tích phương sai ANOVA là “ phiên bản tăng cấp ” của kiểm định tham số đặc biệt quan trọng là kiểm định 2 mẫu kiểm định sự độc lạ giữa 2 đối tượng người dùng nghiên cứu và điều tra khi có hoặc không có một yếu tố tác động ảnh hưởng nào đó ( 2 mẫu độc lập ), hoặc 1 đối tượng người dùng điều tra và nghiên cứu trước và sau khi có một yếu tố ảnh hưởng tác động nào đó ( 2 mẫu nhờ vào ) .
Do đó trong trường hợp tất cả chúng ta muốn phân tích sự độc lạ giữa nhiều đối tượng người dùng nghiên cứu và điều tra khác nhau, muốn xem xét ảnh hưởng tác động của hai yếu tố lên những đối tượng người dùng điều tra và nghiên cứu khác nhau thì cần cách tiếp cận khác ngoài chiêu thức kiểm định thường thì và đó chính là ANOVA – Analysis of Variance
Những bạn nào chưa biết gì về thống kê cũng như kiểm định thì nên tìm hiểu thêm trước ở những tài liệu khác hoặc qua những bài viết của chúng tôi ở những link dưới đây trước khi khám phá nội dung về ANOVA trong bài viết này để dễ chớp lấy hơn :
Tổng quan về Statistics : Khái niệm và ứng dụng của thống kê
Tổng quan về Statistics : Descriptive statistics ( thống kê miêu tả )
Tổng quan về Statistics : Inferential statistics ( thống kê suy luận )
Tìm hiểu về giải pháp kiểm định tham số
Các dạng kiểm định tham số ( trường hợp 1 mẫu )
Các dạng kiểm định tham số ( trường hợp 2 mẫu )
Các bạn hoàn toàn có thể nhìn thấy hình minh họa trên miêu tả động cơ của chiêu thức phân tích phương sai chính là so sánh giá trị trung bình của những toàn diện và tổng thể, và khi những tham số tổng thể và toàn diện là chưa biết, tất cả chúng ta sẽ sử dụng những trung bình mẫu để so sánh, phối hợp với giải pháp kiểm định giả thuyết, để đưa ra những Tóm lại ở đầu cuối về những tổng thể và toàn diện. Cũng vì nguyên do này mà nhiều người thường gọi đây là kiểm định ANOVA. Tuy nhiên nếu gọi là kiểm định thì ANOVA lại mang khuynh hướng của Hypothesis test thường thì nhưng thực ra không phải như vậy. Cách thức quản lý và vận hành của ANOVA là trọn vẹn độc lạ !
Nếu kiểm định thường thì sử dụng những tham số mẫu, quy đổi thành giá trị chuẩn hóa Z để xác lập giá trị kiểm định thì ANOVA sử dụng những chênh lệch bình phương của những trung bình mẫu từ những tổng thể và toàn diện để thống kê giám sát phương sai, rồi giá trị kiểm định sau cuối. Chi tiết công thức chúng tôi sẽ trình diễn ở những phần sau từ đó những bạn sẽ hiểu vì sao chiêu thức này có tên gọi rất đẹp là ANOVA .
Để minh họa rõ hơn về ANOVA tất cả chúng ta cùng khám phá qua một ví dụ thực tiễn trong nghành kinh doanh thương mại :
Một công ty thực phẩm sản xuất mỳ gói muốn tìm hiểu và khám phá chi tiết cụ thể về mỗi yếu tố ảnh hưởng tác động lên quyết định hành động mua mẫu sản phẩm của người tiêu dùng ngoại trừ độ nổi tiếng tên thương hiệu, chỉ tập trung chuyên sâu vào những đặc tính loại sản phẩm, cơ bản có 5 yếu tố chính :
- Hương vị chính (vị lẩu thái, bò hầm, rau củ hầm chay, cay vị Hàn Quốc,…)
- Chất liệu mỳ, loại mỳ
- Cách thức đóng gói (mỳ đóng gói, đóng hộp cầu kỳ)
- Hình ảnh bên ngoài bao bì
- Khối lượng tịnh
- Giá bán
Với mỗi những yếu tố, công ty sẽ phân ra thành nhiều nhóm hay nhiều loại loại sản phẩm, triển khai phân tích và kiểm tra sự độc lạ trong lệch giá trung bình .
Ví dụ : Hương vị, công ty sẽ so sánh sự độc lạ trong lệch giá trung bình giữa mỳ có mùi vị lẩu thái, mùi vị bò hầm, hay món ăn hải sản cay Nước Hàn. Mẫu dữ liệu của mỗi loại sẽ có kích cỡ là n = 100, 100 ngày ghi nhận lệch giá cho mỗi loại lấy ngẫu nhiên từ tài liệu thanh toán giao dịch lịch sử dân tộc qua những năm. Chúng ta sẽ sử dụng ANOVA – 1 yếu tố hay còn gọi one-way / one-factor ANOVA. Nếu lệch giá trung bình 100 ngày của 3 loại mỳ này là khác nhau, thì Tóm lại Hương vị có tác động ảnh hưởng lên quyết định hành động mua hàng của người tiêu dùng .
Tuy nhiên công ty nhận thấy rằng cần xét thêm những yếu tố khác nữa khi khuynh hướng cho thấy người mua ưu thích đóng hộp hơn, khối lượng nhiều hơn và giá rẻ hơn, vậy thì sẽ phải tích hợp với yếu tố Hương vị để đưa ra nhìn nhận đúng mực hoặc xem giữa phương pháp đóng gói, hình ảnh, khối lượng, giá có cái nào tương tác hay cộng hưởng với yếu tố Hương vị tác động ảnh hưởng lên quyết định hành động mua hàng của người mua hay không. Lúc này tất cả chúng ta sẽ cần đến ANOVA – 2 yếu tố, two-way / two-factor ANOVA .
Nếu sử dụng giải pháp kiểm định thường thì, thì có lẽ rằng “ sẽ rất lâu ” để công ty hoàn thành xong khu công trình nghiên cứu và điều tra của mình. Ví dụ đơn thuần Hypothesis test thường thì cao nhất chỉ hoàn toàn có thể kiểm định sự độc lạ giữa 2 mẫu mà thôi như vậy chỉ hoàn toàn có thể so sánh giữa 2 loại mỳ khác nhau, số lần so sánh sẽ là 3 lần, không kể tích hợp thêm yếu tố khác .
Các điều kiện kèm theo để thực thi phân tích phương sai hay còn gọi là những giả định khởi đầu của bài toán :
- Ở mỗi tổng thể nghiên cứu, những giá trị của các biến mục tiêu hay biến phụ thuộc hay đối tượng nghiên cứu chúng ta quan tâm phải có phân phối chuẩn (normal distribution).
- Phương sai, ký hiệu σ2, phải bằng nhau ở tất cả các tổng thể σ12 = σ22 = σ32 = …. = σk2 với k là số tổng thể nghiên cứu
- Các mẫu dữ liệu được lấy ra từ các tổng thể nghiên cứu một cách ngẫu nhiên.
- Các quan sát bên trong mẫu phải độc lập với nhau
Ở 2 điều kiện kèm theo bắt đầu nếu tài liệu không cung ứng được nhu yếu thì tất cả chúng ta phải sử dụng đến giải pháp phân tích ANOVA tích hợp kiểm định phi tham số vận dụng với tài liệu định tính sau khi đã được quy đổi từ tài liệu định lượng khởi đầu. Chúng tôi sẽ trình diễn đơn cử phần này cùng với những cách kiểm tra 2 điều kiện kèm theo kể trên ở bài viết về “ Các dạng kiểm định phi tham số ” sắp tới. Còn trong bài viết lần này tất cả chúng ta sẽ khám phá ANOVA cho tài liệu định lượng và tạm giả định những ví dụ tuân theo phân phối chuẩn và có cùng phương sai .
Tóm tắt tổng quan về những dạng phân tích ANOVA :
- ANOVA áp dụng cho dữ liệu phân phối chuẩn, phương sai bằng nhau và ANOVA áp dụng cho dữ liệu không theo phân phối chuẩn, phương sai không bằng nhau
- ANOVA áp dụng cho dữ liệu nghiên cứu có 1 yếu tố, và ANOVA áp dụng cho dữ liệu nghiên cứu có 2 yếu tố
- ANOVA áp dụng cho nghiên cứu thực nghiệm (Experimental Study) – các yếu tố tác động được kiểm soát, và dữ liệu thu thập với mục đích so sánh tác động của chúng trên lên đối tượng nghiên cứu. ANOVA áp dụng cho nghiên cứu quan sát (Observational Study), các yếu tố không được kiểm soát chặt chẽ.
Trong bài viết phần 1 tất cả chúng ta sẽ làm quen trước với ANOVA 1 yếu tố, sử dụng ví dụ trong nghành nghề dịch vụ kinh tế tài chính .
One-way ANOVA/ ANOVA 1 yếu tố
Phân tích ANOVA 1 yếu tố là phân tích ảnh hưởng tác động của 1 yếu tố nguyên do nào đó lên một yếu tố tác dụng đang chăm sóc .
Bài toán ANOVA cũng giống bài toán kiểm định là tất cả chúng ta phải đưa ra ra giả thuyết bắt đầu. Mục tiêu của ANOVA là so sánh những trung bình của toàn diện và tổng thể có độc lạ hay không nên tất cả chúng ta sẽ đặt giả thuyết như sau :
Nêu đồng ý H0 tất cả chúng ta Kết luận những trung bình toàn diện và tổng thể là giống nhau, còn nếu bác bỏ H0 thì Kết luận tối thiểu một cặp trung bình toàn diện và tổng thể có giá trị khác nhau .
Đồ thị phân phối của những trung bình mẫu x khi H0 đúng :
Các trung bình mẫu sẽ nằm gần nhau và trên cùng 1 đồ thị phân phối duy nhất
Đồ thị phân phối của những trung bình mẫu khi bác bỏ H0 :
Các trung bình mẫu sẽ nằm xa nhau, ở 3 đồ thị phân phối, cho thấy sự khác nhau của 3 tổng thể và toàn diện .
Khác với những cuốn sách, giáo trình thống kê dạy về triết lý ANOVA thường nói công thức trước và ví dụ sau, ở bài này BigDataUni sẽ trình diễn tóm tắt công thức vào đi vào ví dụ đơn cử để những bạn hiểu được thực chất một cách nhanh hơn thay vì vòng vo phần công thức, không cần phải hiểu quá kỹ về nguyên tắc hoạt động giải trí của ANOVA, một phần cũng giúp những bạn nào đã học qua ANOVA review lại kiến thức và kỹ năng trong thời hạn ngắn .
- Đặt giả thuyết:
- Tính trung bình của từng nhóm
- Tính trung bình của tất cả các nhóm (trung bình chung toàn tập dữ liệu)
- Tính tổng các bình phương chênh lệch giữa các giá trị trong mỗi nhóm với trung bình của chính nhóm đó
- Tính tổng các bình phương chênh lệch của trung bình nhóm so với trung bình chung ở bước 2:
- Tính tổng chênh lệch bình phương của các giá trị trong tập dữ liệu so với trung bình chung ở bước 2:
Ngoài ra : SST = SSG + SSW
- Tính phương sai, hay tính trung bình của các chênh lệch bình phương tìm được
MSW = SSW / ( n – k )
MSG = SSG / ( k – 1 )
- Tính giá trị kiểm định F
F = MSG / MSW
Bác bỏ H0, tức những trung bình tổng thể và toàn diện không bằng nhau, Tóm lại yếu tố ảnh hưởng tác động có ảnh hưởng tác động lên đối tượng người dùng nghiên cứu và điều tra khi :
F > Fk – 1, n – k, α
Ví dụ :
Một công ty kinh doanh bán lẻ toàn thế giới có hơn 2000 shop phân chia ở gần toàn bộ những bang trên nước Mỹ, vừa tăng trưởng 4 giải pháp hay còn gọi là quy mô tọa lạc sản phẩm & hàng hóa, bán hàng, và phân phối dịch vụ tại những shop .
- Phương pháp 1: thay đổi cách trưng bày hàng hóa thông thường hay truyền thống theo hướng hiện đại (ứng dụng phân tích dữ liệu)
- Phương pháp 2: thay đổi cách thức hỗ trợ khách hàng, ân cần, thân thiết hơn với phong cách phục vụ chuyên nghiệp
- Phương pháp 3: thay đổi thiết kế toàn bộ không gian hàng hóa, cải thiện môi trường không khí bên trong cửa hàng.
- Phương pháp 4: tích hợp robot hỗ trợ bán hàng bên cạnh thay đổi thiết kế gian hàng, cách trưng bày hàng hóa để tối đa thu hút khách hàng.
Một chuyên viên kinh tế tài chính cho rằng, người dân Mỹ mua hàng khi họ có nhu yếu và không thường chăm sóc đến shop thế nào, dịch vụ như thế nào. Tuy nhiên chứng tỏ ngược lại quan điểm ấy, bộ phận kế hoạch đã phát minh sáng tạo và thử nghiệm 4 giải pháp trên ở những shop khác nhau. Để bảo vệ vô hiệu yếu tố về nguồn cầu, nhân khẩu học. Công ty chọn tiểu bang đông dân nhất của nước Mỹ, California, cũng là nơi có nhiều shop nhất để chọn ra 1 số ít shop ngẫu nhiên. Mỗi chiêu thức sẽ chọn ngẫu nhiên 6 shop để vận dụng, lệch giá tháng tiên phong của mỗi shop sẽ được ghi lại. Bảng dữ liệu có được như sau, đơn vị chức năng 1000 USD :
Đầu tiên đặt giả thuyết :
Gọi µ1, µ2, µ3, µ4 lần lượt là lệch giá trung bình của những shop ứng với chiêu thức 1 đến 4. Giả thuyết H0 cho rằng lệch giá trung bình của những shop là bằng nhau, tức việc đổi khác giải pháp
H0 : µ1 = µ2 = µ3 = µ4
H1 : tối thiểu có 2 trung bình lệch giá tổng thể và toàn diện khác nhau .
Giả sử những toàn diện và tổng thể tuân theo phân phối chuẩn và phương sai bằng nhau .
Bước 1 :
Chúng ta tính trung bình lệch giá cho mỗi nhóm. Các bạn chú ý quan tâm ở mỗi giá trị X đều có dấu gạch chân trên đầu để phân biệt với giá trị thường thì trong tập dữ liệu và theo nguyên tắc nhận biết đây là trung bình của mẫu .
( Do format của web bị lỗi nên bị mất dấu gạch ngang ở trên mong những bạn thông cảm )
Ví dụ X1 = ( 2145 + 3850 + 1368 + 1232 + 2171 + 1386 ) / 6 = 2025.3
Các bạn tính tương tự như cho giải pháp 2, 3, 4 .
Sau đó tính tổng trung bình lệch giá của toàn bộ shop, sử dụng giá trị trung bình của X1, X2, X3, X4 hiệu quả như sau :
Bước 2 :
Chúng ta tính tổng những chênh lệch bình phương ở những chiêu thức .
Đầu tiên ở mỗi nhóm, tất cả chúng ta tính chênh lệch từng giá trị lệch giá so với trung bình của nhóm, sau đó tính tổng .
SS1 = ( 2145 – 2025.3 ) 2 + ( 3850 – 2025.3 ) 2 + … + ( 1368 – 2025.3 ) 2 = 4835159.3
Các bạn tính tương tự như SS2, SS3, SS4. Kết quả như sau :
Tiếp theo tất cả chúng ta sẽ tính tổng toàn bộ những chênh lệch bình phương của những nhóm :
SSW = SS1 + SS2 + SS3 + SS4 = 11424321
SSW là tổng chênh lệch bình phương Sum of Squares Within-groups, tức bên trong từng nhóm. Nếu các SS lớn, dẫn đến SSW lớn thì cho thấy sự khác biệt trong doanh thu của các cửa hàng trong mỗi nhóm là do nguyên nhân, yếu tố khác không phải do các phương pháp mà công ty áp dụng. Và tác động của những yếu tố khác này lên doanh thu các cửa hàng trong cùng một nhóm là khá nghiêm trọng và cần tìm hiểu.
Xem thêm: Trị Viêm Lợi Tại Nhà Hiệu Quả
Ví dụ trong số những shop vận dụng chiêu thức 1, sự chênh lệch trong lệch giá giữa shop có lệch giá thấp nhất và cao nhất là rất lớn, nguyên do hoàn toàn có thể độ hiệu suất cao của những hoạt động giải trí marketing và sales quá độc lạ, quy mô kinh doanh thương mại của công ty chưa tốt khi những shop hoàn toàn có thể chưa đồng nhất với nhau về quy trình tiến độ quản lý và vận hành. Tuy nhiên vẫn còn đó những yếu tố khách quan khác mà chưa được xét đến ví dụ đối thủ cạnh tranh cạnh tranh đối đầu, chuỗi đáp ứng của đối tác chiến lược, …
Tính tổng những chênh lệch bình phương giữa những nhóm Sum of squares Between groups ( SSG )
Ở đây tất cả chúng ta sẽ tính tổng chênh lệch bình phương giữa trung bình mẫu của mỗi giải pháp với trung bình chung ( của 4 giải pháp ) nhân với số quan sát trong mẫu tại mỗi giải pháp .
SSG = 6*(2025.3 – 2561.38)^2 + 6*(2042.5 – 2561.38)^2 + 6*(2910.5 – 2561.38)^2 + 6*(3267.17 – 2561.38)^2 = 7059162.5 xấp xỉ 7060000
SSG là chỉ số khá quan trọng nếu chỉ số này lớn cho thấy giữa những nhóm hoàn toàn có thể có sự độc lạ lớn, và sự độc lạ này là do sự khác nhau giữa những giải pháp 1, 2, 3, 4 hay nói cách khác yếu tố đang được nghiên cứu và điều tra, là thứ ảnh hưởng tác động lên sự độc lạ trong lệch giá của những shop .
Sau cùng ở bước này tất cả chúng ta tính tổng chênh lệch bình phương hàng loạt tập dữ liệu :
SST = SSG + SSW = 18483933
Cách tính khác : tính tổng chênh lệch bình phương của tổng thể những giá trị, những lệch giá hay những quan sát với trung bình chung hàng loạt ( bằng 2561.38 ) .
Theo công thức tiên phong, ANOVA cho thấy sự độc lạ trong lệch giá của 2 shop bất kể hoàn toàn có thể là do : yếu tố chính – là những giải pháp công ty vận dụng, và những yếu tố khác không được đề cập đến .
Nếu SSW lớn hơn rất nhiều so với SSG, thì công ty năng lực không chứng tỏ được những giải pháp mà mình vận dụng hay đổi khác cho những cửa hàng không đem lại sự độc lạ, lệch giá những shop khác nhau là do yếu tố khác gây ra, và ngược lại .
Tiếp theo là những bước tính giá trị kiểm định F .
Bước 3 :
Tính phương sai, hay tính trung bình của những chênh lệch bình phương tìm được bằng cách lấy tổng những chênh lệch bình phương ở bước 2 chia cho bậc tự do tương ứng .
Phương sai trong nội bộ nhóm sẽ bằng cách lấy tổng chênh lệch bình phương nội bộ nhóm SSW chia cho bậc tự do n – k, với n là tổng số quan sát trong tài liệu ở đây là 24, k là số nhóm so sánh ở đây là 4. MSW là ước đạt phương sai của những giá trị trong tập dữ liệu do yếu tố khác không được nghiên cứu và điều tra, hay không được đề cập .
MSW = SSW/ (n – k) = 11424231/ (24 – 4) = 571216
Tiếp theo tất cả chúng ta tính phương sai giữa những nhóm bằng cách lấy tổng những chênh lệch giữa những nhóm là SSG chia cho bậc tự do k – 1. MSG là ước đạt phương sai của những giá trị trong tập dữ liệu do yếu tố điều tra và nghiên cứu chính .
MSG = SSG/ (k – 1) = 7059612/ (4 – 1) = 2353204
Bước 4 :
Giá trị kiểm định F :
F = MSG/ MSW = 2353204/ 571276 = 4.119
Nguyên tắc bác bỏ H0 : F > F tra bảng với bậc tự do k – 1 ở phần Numerator ( dòng trên cùng của bảng phân phối F ) và n – k ở phần Denominator ( cột ngoài cùng của bảng phân phối ), và mức ý nghĩa α, lấy ví dụ ở đây là 0.05, kiểm định 1 phía
F tra bảng = 3.098
F > F tra bảng, F nằm trong vùng bác bỏ. Vậy bác bỏ H0 tức là tối thiểu có 1 cặp trung bình của toàn diện và tổng thể là khác nhau .
Bên trên là bảng tóm tắt ANONA, đây là bảng tác dụng tiêu chuẩn thường được biểu lộ trong những hiệu quả phân tích ở những ứng dụng thống kê hay Data mining. Các bạn thử ghép lại những giá trị ở trên ! Ngoài sử dụng F tất cả chúng ta hoàn toàn có thể sử dụng P-value suy ra từ chính giá trị kiểm định F, ở đây P-value = 0.019 < 0.05 tức nằm trong phần diện tích quy hoạnh màu đỏ ở trên đồ thị, Kết luận bác bỏ H0 là hài hòa và hợp lý .
Thực chất bộc lộ bài toán để những bạn hiểu được cách quản lý và vận hành của ANOVA nhưng trong trong thực tiễn khi tập dữ liệu có nhiều quan sát thì việc thống kê giám sát sẽ phức tạp hơn. Lúc này những ứng dụng thống kê như Minitab, SPSS, … sẽ tương hỗ đắc lực, còn nếu bạn không có những ứng dụng thống kê thì vẫn hoàn toàn có thể sử dụng Excel. Đây là hiệu quả ví dụ ở trên :
Các giải pháp khác nhau sẽ ảnh hưởng tác động làm đổi khác lệch giá trung bình của những shop. Trong 4 giải pháp thì chiêu thức thứ tư có năng lực mang lại lệch giá trung bình cao hơn so với những giải pháp còn, hoàn toàn có thể do công nghệ tiên tiến robot bán hàng mang lại thưởng thức người mua cao lôi cuốn nhiều người mua. Mặt khác, những shop vận dụng chiêu thức thứ nhất, chỉ đổi khác cách tọa lạc sản phẩm & hàng hóa thì chưa thực sự tác động ảnh hưởng mạnh hơn vào quyết định hành động mua hàng của người mua so với trước đây, hơn thế nữa cho thấy sự chênh lệch rất lớn về lệch giá so với những shop dùng giải pháp thứ 4 .
Theo như Tóm lại bác bỏ H0 tối thiểu có 1 cặp trung bình của toàn diện và tổng thể là khác nhau. Công việc tiếp theo của công ty là tìm ra giữa 2 shop nào lệch giá sẽ độc lạ, so sánh sự hơn kém, để đưa ra nhìn nhận ở đầu cuối cho những giải pháp mà công ty yêu cầu .
Phân tích sâu ANOVA 1 yếu tố
Trước tiên tất cả chúng ta xác lập có bao nhiêu cặp chiêu thức cần so sánh. Sử dụng công thức tổng hợp để tìm, ở đây có 4 giải pháp, tổng hợp chập 2 của 4 sẽ là 6, tức có 6 cặp .
PP1 vs PP2, PP1 vs PP3, PP1 vs PP4, PP2 vs PP3, PP2 vs PP4, PP3 vs PP4
Có 2 giải pháp :
- Sử dụng Turkey, hay phương pháp HSD – Honestly Significant Differences
- Sử dụng phương pháp Fisher, LSD – Least significant difference
Chúng tôi lấy ví dụ vừa nói ở trên, so sánh những shop vận dụng giải pháp thứ 1 và những shop vận dụng giải pháp thứ 4
Đặt giả thuyết : H0 : µ1 = µ4
H1 : µ1 ≠ µ4
Giả thuyết H0 phát biểu lệch giá trung bình của những shop vận dụng PP1 sẽ bằng những shop vận dụng PP4 .
Giá trị Turkey được tính theo công thức :
T = tα, k, n-k * ( MSW / ni ) 50%
t là giá trị tra bảng Turley với mức ý nghĩa α, với bậc tự do k và n – k. MSW tìm được ở trên, ni là số quan sát trong 1 nhóm, nếu 2 nhóm có số quan sát khác nhau thì sẽ lấy cái nhỏ nhất. Ở đây số shop vận dụng PP1 và PP4 là bằng nhau và bằng 6
T = t0. 05, 4, 24 – 4 * ( 571276 / 6 ) 50% = 3.958 * ( 571216 / 6 ) 50% = 1221.23
Bảng phân phối Turkey có tên gọi khác là Studentized range distribution những bạn hoàn toàn có thể search google để tìm .
Tiếp theo tất cả chúng ta sẽ tính giá trị tuyệt đối của chênh lệch trung bình 2 mẫu
X1 = 2025.33 và X4 = 3267.17
X4 – X1 = 3267.17 – 2025.33 = 1241.84 > T = 1221.23
Vậy trung bình X4 > X2 suy ra µ4 > µ1. Phương pháp số 4 giúp công ty tăng nhiều lệch giá hơn so với chiêu thức số 1 .
Còn theo công thức Fisher LSD :
Sử dụng MSE để tính .
Giả thuyết đặt tương tự như như trên :
t = ( 3267.17 – 2025.33 ) / ( 571216 * ( 2/6 ) ) 50% = 2.845
Cơ sở bác bỏ H0 khi t > ta / 2 với bậc tự do n – k, với n là tổng số quan sát. Với n – k = 24 – 4 = 20, t tra bảng = 2.086
t > t tra bảng nên tất cả chúng ta sẽ bác bỏ H0
Cách khác : tính giá trị LSD và so sánh giống như Turkey
Công thức :
LSD = 2.086 * ( 571216 * ( 2/6 ) ) 50% = 910
X4 – X1 = 3267.17 – 2025.33 = 1241.84 > LSD = 910. Vậy bác bỏ H0, Tóm lại tựa như như trên .
Như vậy đến đây kết thúc phần 1 bài viết về ANOVA. Sang phần 2 tất cả chúng ta sẽ đi vào ANOVA 2 yếu tố. Mong những bạn liên tục ủng hộ BigDataUni .
Tài liệu tìm hiểu thêm :
“Essentials of Statistics for The Behavioral Sciences” của các tác giả Frederick J Gravetter, Larry B. Wallnau, Lori-Ann B. Forzano
Xem thêm: Làm Thế Nào Để Hết Nhiệt Miệng
“ Basic statistics for business and economics ” của những tác giả Douglas A. Lind, William G. Marchal, Samuel A. Wathen
“ Statistics for Business and Economics ” của những tác giả David R. Anderson, Dennis J. Sweeney, Thomas A. Williams và tập sự
Về chúng tôi, công ty BigDataUni với chuyên môn và kinh nghiệm trong lĩnh vực khai thác dữ liệu sẵn sàng hỗ trợ các công ty đối tác trong việc xây dựng và quản lý hệ thống dữ liệu một cách hợp lý, tối ưu nhất để hỗ trợ cho việc phân tích, khai thác dữ liệu và đưa ra các giải pháp. Các dịch vụ của chúng tôi bao gồm “Tư vấn và xây dựng hệ thống dữ liệu”, “Khai thác dữ liệu dựa trên các mô hình thuật toán”, “Xây dựng các chiến lược phát triển thị trường, chiến lược cạnh tranh”.
Source: http://wp.ftn61.com
Category: Tin Tức
Để lại một bình luận