Cách thực hiện phân tích dữ liệu cơ bản trong Excel

Cách thực hiện phân tích dữ liệu cơ bản trong Excel

Hầu hết khi bạn chạy thống kê, bạn muốn sử dụng phần mềm thống kê. Những công cụ này được xây dựng để thực hiện các phép tính như NS -kiểm tra, kiểm tra chi-bình phương, tương quan, v.v. Excel không dùng để phân tích dữ liệu. Nhưng không có nghĩa là bạn không làm được.





Thật không may, các hàm thống kê của Excel không phải lúc nào cũng trực quan. Và họ thường cung cấp cho bạn kết quả bí truyền. Vì vậy, thay vì sử dụng các hàm thống kê, chúng tôi sẽ sử dụng bổ trợ thống kê đi đến Excel: Phân tích dữ liệu Dụng cụ.





Toolpak, mặc dù cách viết khá đáng tiếc của nó, bao gồm một loạt các chức năng thống kê hữu ích. Hãy xem những gì chúng ta có thể làm với thống kê Excel.





Thêm công cụ phân tích dữ liệu Excel

Trong khi bạn có thể thực hiện thống kê mà không cần Công cụ phân tích dữ liệu, nó dễ dàng hơn nhiều với nó. Để cài đặt Toolpak trong Excel 2016, hãy truy cập Tệp> Tùy chọn> Bổ trợ .

Nhấp chuột Đi bên cạnh 'Quản lý: Phần bổ trợ Excel.'



Trong cửa sổ hiện ra, chọn hộp bên cạnh Phân tích Toolpak và sau đó nhấp vào VÂNG .

Nếu bạn đã thêm chính xác Data Analysis Toolpak vào Excel, bạn sẽ thấy Phân tích dữ liệu nút trong Dữ liệu tab, được nhóm thành Phân tích phần:





Nếu bạn muốn có thêm sức mạnh, hãy nhớ xem các phần bổ trợ khác của Excel.

Thống kê mô tả trong Excel

Bất kể bạn đang chạy thử nghiệm thống kê nào, trước tiên bạn có thể muốn nhận được thống kê mô tả của Excel. Điều này sẽ cung cấp cho bạn thông tin về phương tiện, trung bình, phương sai, độ lệch chuẩn và sai số, kurtosis, độ lệch và nhiều số liệu khác.





Chạy thống kê mô tả trong Excel thật dễ dàng. Nhấp chuột Phân tích dữ liệu trong tab Dữ liệu, hãy chọn Thống kê mô tả, và chọn phạm vi đầu vào của bạn. Nhấp vào mũi tên bên cạnh trường phạm vi đầu vào, nhấp và kéo để chọn dữ liệu của bạn và nhấn Vào (hoặc nhấp vào mũi tên xuống tương ứng), như trong GIF bên dưới.

Sau đó, hãy đảm bảo cho Excel biết liệu dữ liệu của bạn có nhãn hay không, nếu bạn muốn kết xuất trong một trang tính mới hay trên cùng một trang tính và nếu bạn muốn thống kê tóm tắt và các tùy chọn khác.

Sau đó, đánh VÂNG và bạn sẽ nhận được thống kê mô tả của mình:

Bài kiểm tra t của sinh viên trong Excel

Các NS -test là một trong những bài kiểm tra thống kê cơ bản nhất và rất dễ dàng để tính toán trong Excel với Toolpak. Nhấn vào Phân tích dữ liệu và cuộn xuống cho đến khi bạn thấy NS -tùy chọn kiểm tra.

Bạn có ba lựa chọn:

  • t-Test: Ghép đôi hai mẫu cho phương tiện nên được sử dụng khi các phép đo hoặc quan sát của bạn được ghép nối. Sử dụng điều này khi bạn thực hiện hai phép đo của cùng một đối tượng, chẳng hạn như đo huyết áp trước và sau khi can thiệp.
  • Kiểm định t: Giả sử hai mẫu có các phương sai bằng nhau nên được sử dụng khi các phép đo của bạn là độc lập (thường có nghĩa là chúng được thực hiện trên hai nhóm đối tượng khác nhau). Chúng ta sẽ thảo luận về phần 'phương sai bằng nhau' trong giây lát.
  • Kiểm định t: Giả sử hai mẫu có các phương sai không bằng nhau cũng dành cho các phép đo độc lập, nhưng được sử dụng khi các phương sai của bạn không bằng nhau.

Để kiểm tra xem phương sai của hai mẫu có bằng nhau hay không, bạn sẽ cần chạy F-test. Tìm thấy F-Test hai mẫu cho các phương sai trong danh sách Công cụ phân tích, hãy chọn nó và nhấp vào VÂNG .

Nhập hai tập dữ liệu của bạn vào các hộp phạm vi đầu vào. Để giá trị alpha ở mức 0,05 trừ khi bạn có lý do để thay đổi nó - nếu bạn không biết điều đó có nghĩa là gì, chỉ cần bỏ đi. Cuối cùng, bấm vào VÂNG .

Excel sẽ cung cấp cho bạn kết quả trong một trang tính mới (trừ khi bạn đã chọn Phạm vi đầu ra và một ô trong trang tính hiện tại của bạn):

Bạn đang xem giá trị P ở đây. Nếu nó nhỏ hơn 0,05, bạn có phương sai không bằng nhau . Vì vậy, để chạy NS -test, bạn nên sử dụng tùy chọn phương sai không bằng nhau.

Để chạy một NS -kiểm tra, chọn bài kiểm tra thích hợp từ cửa sổ Công cụ phân tích và chọn cả hai bộ dữ liệu của bạn theo cách tương tự như bạn đã làm cho bài kiểm tra F. Để giá trị alpha là 0,05 và nhấn VÂNG .

Kết quả bao gồm mọi thứ bạn cần để báo cáo NS -test: phương tiện, bậc tự do (df), thống kê t và các giá trị P cho cả phép thử một và hai phía. Nếu giá trị P nhỏ hơn 0,05 thì hai mẫu có sự khác biệt đáng kể.

Nếu bạn không chắc chắn nên sử dụng một hoặc hai đuôi NS -kiểm tra, kiểm tra người giải thích này từ UCLA .

ANOVA trong Excel

Công cụ phân tích dữ liệu Excel cung cấp ba loại phân tích phương sai (ANOVA). Thật không may, nó không cung cấp cho bạn khả năng chạy các bài kiểm tra tiếp theo cần thiết như Tukey hoặc Bonferroni. Nhưng bạn có thể xem liệu có mối quan hệ giữa một vài biến số khác nhau hay không.

Dưới đây là ba bài kiểm tra ANOVA trong Excel:

  • ANOVA: Yếu tố đơn phân tích phương sai với một biến phụ thuộc và một biến độc lập. Tốt hơn là sử dụng nhiều NS -kiểm tra khi bạn có nhiều hơn hai nhóm.
  • ANOVA: Hai yếu tố với sự nhân rộng tương tự như cặp NS -kiểm tra; nó liên quan đến nhiều phép đo trên các đối tượng đơn lẻ. Phần 'hai yếu tố' của thử nghiệm này chỉ ra rằng có hai biến độc lập.
  • ANOVA: Hai yếu tố không cần sao chép liên quan đến hai biến độc lập, nhưng không lặp lại trong phép đo.

Chúng ta sẽ xem xét phân tích một nhân tố ở đây. Trong ví dụ của chúng tôi, chúng tôi sẽ xem xét ba bộ số, được gắn nhãn 'Can thiệp 1,' 'Can thiệp 2' và 'Can thiệp 3.' Để chạy ANOVA, hãy nhấp vào Phân tích dữ liệu , sau đó chọn ANOVA: Yếu tố đơn .

Chọn phạm vi đầu vào và đảm bảo cho Excel biết liệu các nhóm của bạn nằm trong cột hay hàng. Tôi cũng đã chọn 'Nhãn ở hàng đầu tiên' ở đây để tên nhóm được hiển thị trong kết quả.

Sau khi đánh VÂNG , chúng tôi nhận được các kết quả sau:

Lưu ý rằng giá trị P nhỏ hơn 0,05, vì vậy chúng tôi có một kết quả có ý nghĩa. Điều đó có nghĩa là có sự khác biệt đáng kể giữa ít nhất hai trong số các nhóm trong bài kiểm tra. Nhưng vì Excel không cung cấp các bài kiểm tra để xác định cái mà các nhóm khác nhau, điều tốt nhất bạn có thể làm là nhìn vào mức trung bình được hiển thị trong phần tóm tắt. Trong ví dụ của chúng tôi, Can thiệp 3 có vẻ như có lẽ một trong những khác biệt.

Điều này không hợp lý về mặt thống kê. Nhưng nếu bạn chỉ muốn xem liệu có sự khác biệt hay không và xem nhóm nào có thể gây ra nó, thì nó sẽ hoạt động.

ANOVA hai yếu tố phức tạp hơn. Nếu bạn muốn tìm hiểu thêm về thời điểm sử dụng phương pháp hai yếu tố, hãy xem video này từ Sophia.org và ' mà không cần sao chép ' và ' với sự nhân rộng 'ví dụ từ Thống kê thực.

Tương quan trong Excel

Tính toán tương quan trong Excel đơn giản hơn nhiều so với NS -test hoặc ANOVA. Sử dụng Phân tích dữ liệu để mở cửa sổ Công cụ phân tích và chọn Tương quan .

Chọn phạm vi đầu vào của bạn, xác định nhóm của bạn dưới dạng cột hoặc hàng và cho Excel biết liệu bạn có nhãn hay không. Sau đó, đánh VÂNG .

Bạn sẽ không nhận được bất kỳ thước đo tầm quan trọng nào, nhưng bạn có thể thấy mỗi nhóm có tương quan như thế nào với những nhóm khác. Giá trị của một là tương quan tuyệt đối, cho biết rằng các giá trị hoàn toàn giống nhau. Giá trị tương quan càng gần một thì mối tương quan càng mạnh.

Hồi quy trong Excel

Hồi quy là một trong những bài kiểm tra thống kê được sử dụng phổ biến nhất trong ngành và Excel cung cấp một lượng sức mạnh đáng ngạc nhiên cho phép tính này. Chúng tôi sẽ chạy một hồi quy bội nhanh trong Excel tại đây. Nếu bạn không quen thuộc với hồi quy, hãy xem Hướng dẫn sử dụng hồi quy cho doanh nghiệp của HBR .

Giả sử biến phụ thuộc của chúng ta là huyết áp, và hai biến độc lập của chúng ta là cân nặng và lượng muối ăn vào. Chúng tôi muốn xem công cụ dự đoán huyết áp nào tốt hơn (hoặc nếu cả hai đều tốt).

Nhấp chuột Phân tích dữ liệu và chọn hồi quy . Bạn cần phải cẩn thận khi điền vào các hộp phạm vi đầu vào lần này. Các Đầu vào Y Dải hộp phải chứa một biến phụ thuộc của bạn. Các Đầu vào X Dải hộp có thể bao gồm nhiều biến độc lập. Đối với một hồi quy đơn giản, đừng lo lắng về phần còn lại (mặc dù hãy nhớ cho Excel biết nếu bạn đã chọn nhãn).

Đây là những gì tính toán của chúng tôi trông giống như:

Sau khi đánh VÂNG , bạn sẽ nhận được một danh sách lớn các kết quả. Tôi đã đánh dấu giá trị P ở đây cho cả trọng lượng và lượng muối ăn vào:

Như bạn có thể thấy, giá trị P cho trọng lượng lớn hơn 0,05, vì vậy không có mối quan hệ đáng kể nào ở đó. Tuy nhiên, giá trị P của muối dưới 0,05, cho thấy rằng đó là một yếu tố dự đoán tốt về huyết áp.

Nếu bạn đang lên kế hoạch trình bày dữ liệu hồi quy của mình, hãy nhớ rằng bạn có thể thêm một dòng hồi quy vào biểu đồ phân tán trong Excel. nó là một hỗ trợ thị giác tuyệt vời cho phân tích này.

Thống kê Excel: Khả năng đáng ngạc nhiên

Mặc dù Excel không được biết đến với sức mạnh thống kê của nó, nhưng nó thực sự đóng gói một số chức năng thực sự hữu ích, chẳng hạn như công cụ PowerQuery , tiện dụng cho các tác vụ như kết hợp các tập dữ liệu. (Tìm hiểu cách tạo Tập lệnh truy vấn Microsoft Power đầu tiên của bạn.) Ngoài ra còn có bổ trợ thống kê Data Analysis Toolpak, thực sự mang lại một số tính năng tốt nhất của Excel. Tôi hy vọng bạn đã học được cách sử dụng Toolpak và bây giờ bạn có thể tự mình tìm hiểu cách sử dụng nhiều chức năng hơn của nó.

kẻ lừa đảo có thể làm gì với địa chỉ email của tôi

Với điều này ngay bây giờ, hãy nâng kỹ năng Excel của bạn lên một tầm cao mới với các bài viết của chúng tôi về sử dụng tính năng Tìm kiếm Mục tiêu của Excel để thu thập dữ liệu nhiều hơntìm kiếm các giá trị với vlookup . Tại một số điểm, bạn cũng có thể muốn học cách nhập dữ liệu Excel vào Python.

Đăng lại Đăng lại tiếng riu ríu E-mail Xóa các tệp và thư mục Windows này để giải phóng dung lượng đĩa

Cần xóa dung lượng ổ đĩa trên máy tính Windows của bạn? Dưới đây là các tệp và thư mục Windows có thể được xóa một cách an toàn để giải phóng dung lượng ổ đĩa.

Đọc tiếp
Chủ đề liên quan
  • Năng suất
  • Bảng tính
  • Microsoft Excel
Giới thiệu về tác giả Sau đó, Albright(506 bài báo đã xuất bản)

Dann là một nhà tư vấn chiến lược nội dung và tiếp thị, người giúp các công ty tạo ra nhu cầu và khách hàng tiềm năng. Anh ấy cũng viết blog về chiến lược và tiếp thị nội dung tại dannalbright.com.

Xem thêm từ Dann Albright

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký