Jak wykonać podstawową analizę danych w programie Excel

Jak wykonać podstawową analizę danych w programie Excel

W większości przypadków, gdy prowadzisz statystyki, chcesz korzystać z oprogramowania statystycznego. Te narzędzia są zbudowane do wykonywania obliczeń, takich jak T -testy, testy chi-kwadrat, korelacje i tak dalej. Excel nie jest przeznaczony do analizy danych. Ale to nie znaczy, że nie możesz tego zrobić.





Niestety funkcje statystyczne programu Excel nie zawsze są intuicyjne. I zwykle dają ci ezoteryczne wyniki. Zamiast więc korzystać z funkcji statystyk, użyjemy dodatku do statystyk programu Excel: the Analiza danych Pakiet narzędzi.





Toolpak, pomimo dość niefortunnej pisowni, zawiera wiele przydatnych funkcji statystycznych. Zobaczmy, co możemy zrobić ze statystykami Excela.





Dodawanie pakietu narzędzi do analizy danych programu Excel

Podczas gdy Ty Móc robić statystyki bez pakietu narzędzi do analizy danych, z nim jest znacznie łatwiej. Aby zainstalować pakiet narzędzi w programie Excel 2016, przejdź do Plik > Opcje > Dodatki .

Kliknij Udać się obok pozycji „Zarządzaj: dodatki programu Excel”.



W wyświetlonym oknie zaznacz pole obok Pakiet narzędzi analitycznych a następnie kliknij ok .

Jeśli poprawnie dodałeś pakiet narzędzi do analizy danych do programu Excel, zobaczysz: Analiza danych przycisk w Dane zakładka, zgrupowana w Analiza Sekcja:





Jeśli potrzebujesz jeszcze większej mocy, koniecznie wypróbuj inne dodatki programu Excel .

Statystyki opisowe w Excelu

Bez względu na to, jaki test statystyczny przeprowadzasz, prawdopodobnie chcesz najpierw uzyskać statystyki opisowe programu Excel. W ten sposób uzyskasz informacje o średnich, medianach, wariancji, odchyleniu standardowym i błędzie, kurtozie, skośności i wielu innych liczbach.





Prowadzenie statystyk opisowych w programie Excel jest łatwe. Kliknij Analiza danych na karcie Dane wybierz Opisowe statystyki, i wybierz zakres wejściowy. Kliknij strzałkę obok pola zakresu wejściowego, kliknij i przeciągnij, aby wybrać dane, i naciśnij Wejść (lub kliknij odpowiednią strzałkę w dół), jak w GIF poniżej.

Następnie poinformuj program Excel, czy dane mają etykiety, czy chcesz uzyskać wyniki w nowym arkuszu, czy w tym samym, a także czy chcesz podsumować statystyki i inne opcje.

Następnie uderz ok , a otrzymasz opisowe statystyki:

Test t-Studenta w programie Excel

ten T -test to jeden z najbardziej podstawowych testów statystycznych, który można łatwo obliczyć w programie Excel za pomocą pakietu Toolpak. Kliknij Analiza danych i przewiń w dół, aż zobaczysz T -testuj opcje.

Masz trzy możliwości:

  • Test t: sparowane dwie próbki dla średnich powinny być używane, gdy pomiary lub obserwacje zostały sparowane. Użyj tego, gdy wykonałeś dwa pomiary tych samych pacjentów, na przykład pomiar ciśnienia krwi przed i po interwencji.
  • Test t: dwie próby przy założeniu równych wariancji należy stosować, gdy pomiary są niezależne (co zwykle oznacza, że ​​zostały wykonane na dwóch różnych grupach tematycznych). Za chwilę omówimy część „równe wariancje”.
  • Test t: dwie próby przy założeniu nierównych wariancji służy również do niezależnych pomiarów, ale jest używany, gdy twoje wariancje są nierówne.

Aby sprawdzić, czy wariancje dwóch próbek są równe, musisz przeprowadzić test F. Odnaleźć Test F z dwiema próbkami dla wariancji na liście Narzędzia analizy wybierz je i kliknij ok .

Wprowadź swoje dwa zestawy danych w polach zakresu wejściowego. Pozostaw wartość alfa na 0,05, chyba że masz powód, aby ją zmienić -- jeśli nie wiesz, co to znaczy, po prostu zostaw. Na koniec kliknij ok .

Excel poda wyniki w nowym arkuszu (chyba że wybrałeś) Zakres wyjściowy i komórkę w bieżącym arkuszu):

Patrzysz tutaj na wartość P. Jeśli jest mniej niż 0,05, masz nierówne wariancje . Aby uruchomić T -test, powinieneś użyć opcji nierównych wariancji.

Aby uruchomić T -test, wybierz odpowiedni test z okna Narzędzia analizy i wybierz oba zestawy danych w taki sam sposób, jak w przypadku testu F. Pozostaw wartość alfa na 0,05 i naciśnij ok .

Wyniki zawierają wszystko, co musisz zgłosić za T -test: średnie, stopnie swobody (df), statystyka t i wartości P dla testów jednostronnych i dwustronnych. Jeśli wartość P jest mniejsza niż 0,05, dwie próbki znacznie się różnią.

Jeśli nie masz pewności, czy użyć jedno-, czy dwuogoniastego T -przetestuj, sprawdź to wyjaśnienie z UCLA .

ANOVA w Excelu

Pakiet Excel Data Analysis Toolpak oferuje trzy rodzaje analizy wariancji (ANOVA). Niestety nie daje to możliwości przeprowadzenia niezbędnych testów uzupełniających, takich jak Tukey czy Bonferroni. Ale możesz zobaczyć, czy istnieje związek między kilkoma różnymi zmiennymi.

Oto trzy testy ANOVA w programie Excel:

  • ANOVA: pojedynczy czynnik analizuje wariancję z jedną zmienną zależną i jedną zmienną niezależną. Lepiej jest używać wielu T -testy, gdy masz więcej niż dwie grupy.
  • ANOVA: Dwuczynnikowa z replikacją jest podobny do sparowanego T -test; obejmuje wielokrotne pomiary na pojedynczych obiektach. „Dwuczynnikowa” część tego testu wskazuje, że istnieją dwie niezależne zmienne.
  • ANOVA: Dwuczynnikowa bez replikacji obejmuje dwie niezależne zmienne, ale nie ma replikacji w pomiarze.

Omówimy tutaj analizę jednoczynnikową. W naszym przykładzie przyjrzymy się trzem zestawom liczb oznaczonym „Interwencja 1”, „Interwencja 2” i „Interwencja 3”. Aby uruchomić ANOVA, kliknij Analiza danych , a następnie wybierz ANOVA: pojedynczy czynnik .

Wybierz zakres wejściowy i poinformuj program Excel, czy grupy są w kolumnach, czy w wierszach. Wybrałem tutaj również „Etykiety w pierwszym wierszu”, aby nazwy grup były wyświetlane w wynikach.

Po uderzeniu ok , otrzymujemy następujące wyniki:

Zauważ, że wartość P jest mniejsza niż 0,05, więc mamy znaczący wynik. Oznacza to, że istnieje znacząca różnica między co najmniej dwiema grupami w teście. Ale ponieważ program Excel nie zapewnia testów w celu ustalenia który grupy różnią się, najlepiej, co możesz zrobić, to spojrzeć na średnie wyświetlane w podsumowaniu. W naszym przykładzie Interwencja 3 wygląda jak prawdopodobnie ten, który się różni.

To nie jest statystycznie rozsądne. Ale jeśli chcesz tylko sprawdzić, czy istnieje różnica i zobaczyć, która grupa prawdopodobnie ją powoduje, to zadziała.

ANOVA dwuczynnikowa jest bardziej skomplikowana. Jeśli chcesz dowiedzieć się więcej o tym, kiedy stosować metodę dwuczynnikową, zobacz ten film z Sophia.org i ' bez replikacji ' oraz ' z replikacją ' przykłady ze statystyk rzeczywistych.

Korelacja w Excelu

Obliczanie korelacji w Excelu jest znacznie prostsze niż T -test lub ANOVA. Użyj Analiza danych , aby otworzyć okno Narzędzia analizy i wybierz Korelacja .

Wybierz zakres wejściowy, zidentyfikuj grupy jako kolumny lub wiersze i poinformuj program Excel, czy masz etykiety. Następnie uderz ok .

Nie uzyskasz żadnych miar istotności, ale możesz zobaczyć, jak każda grupa jest skorelowana z innymi. Wartość jeden jest korelacją bezwzględną, wskazującą, że wartości są dokładnie takie same. Im bliższa jedności wartość korelacji, tym silniejsza korelacja.

Regresja w Excelu

Regresja jest jednym z najczęściej używanych testów statystycznych w przemyśle, a Excel oferuje zaskakującą ilość mocy do tych obliczeń. W tym miejscu przeprowadzimy szybką regresję wielokrotną w programie Excel. Jeśli nie znasz regresji, sprawdź Przewodnik HBR dotyczący wykorzystania regresji w biznesie .

Powiedzmy, że naszą zmienną zależną jest ciśnienie krwi, a dwiema niezależnymi zmiennymi są waga i spożycie soli. Chcemy zobaczyć, który z nich jest lepszym predyktorem ciśnienia krwi (lub czy oba są dobre).

Kliknij Analiza danych i wybierz Regresja . Tym razem musisz być ostrożny podczas wypełniania pól zakresu wejściowego. ten Wejście Zakres Y pole powinno zawierać twoją pojedynczą zmienną zależną. ten Wejście X Zakres pole może zawierać wiele niezależnych zmiennych. W przypadku prostej regresji nie przejmuj się resztą (choć pamiętaj, aby poinformować program Excel, jeśli wybrałeś etykiety).

Oto jak wygląda nasza kalkulacja:

Po uderzeniu ok , otrzymasz dużą listę wyników. Podkreśliłem tutaj wartość P zarówno dla wagi, jak i spożycia soli:

Jak widać, wartość P dla wagi jest większa niż 0,05, więc nie ma tam znaczącej zależności. Wartość P dla soli jest jednak poniżej 0,05, co wskazuje, że jest to dobry predyktor ciśnienia krwi.

Jeśli planujesz prezentację danych regresji, pamiętaj, że możesz dodać linię regresji do wykresu rozrzutu w programie Excel. To jest świetna pomoc wizualna do tej analizy.

Statystyki Excela: zaskakująco wydajne

Chociaż Excel nie jest znany ze swojej mocy statystycznej, w rzeczywistości zawiera kilka naprawdę przydatnych funkcji, takich jak narzędzie PowerQuery , co jest przydatne do zadań takich jak łączenie zestawów danych . (Dowiedz się, jak wygenerować swój pierwszy skrypt Microsoft Power Query ). Dostępny jest również dodatek statystyk Data Analysis Toolpak, który naprawdę udostępnia niektóre z najlepszych funkcji programu Excel. Mam nadzieję, że nauczyłeś się korzystać z Toolpak i możesz teraz samodzielnie pobawić się, aby dowiedzieć się, jak korzystać z większej liczby jego funkcji.

darmowe nowe filmy bez rejestracji

Mając to teraz za pasem, przenieś swoje umiejętności Excela na wyższy poziom dzięki naszym artykułom na temat korzystanie z funkcji wyszukiwania celu w programie Excel w celu uzyskania większej ilości danych oraz wyszukiwanie wartości z vlookup . W pewnym momencie możesz również chcieć dowiedzieć się, jak importować dane z Excela do Pythona.

Udział Udział Ćwierkać E-mail Usuń te pliki i foldery systemu Windows, aby zwolnić miejsce na dysku

Chcesz zwolnić miejsce na dysku na komputerze z systemem Windows? Oto pliki i foldery systemu Windows, które można bezpiecznie usunąć, aby zwolnić miejsce na dysku.

Czytaj dalej
Powiązane tematy
  • Wydajność
  • Arkusz
  • Microsoft Excel
O autorze Potem Albright(506 opublikowanych artykułów)

Dann jest konsultantem ds. strategii treści i marketingu, który pomaga firmom generować popyt i leady. Prowadzi również bloga o strategii i content marketingu na dannalbright.com.

Więcej od Danna Albrighta

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować