Centralne miary trendów dla zgrupowanych danych
The miary centralnej tendencji zgrupowanych danych są one używane w statystykach do opisania pewnych zachowań grupy dostarczonych danych, takich jak między innymi to, co jest blisko, jaka jest średnia zebranych danych..
Gdy pobierana jest duża ilość danych, warto je pogrupować, aby uzyskać lepszą ich kolejność, a tym samym móc obliczyć pewne miary tendencji centralnej.
Wśród miar tendencji centralnej najczęściej używane są średnia arytmetyczna, mediana i tryb. Liczby te mówią o pewnych cechach danych zebranych w pewnym eksperymencie.
Aby użyć tych środków, należy najpierw wiedzieć, jak pogrupować zestaw danych.
Zgrupowane dane
Aby najpierw pogrupować dane, należy obliczyć zakres danych, który uzyskuje się, odejmując najwyższą wartość minus najniższą wartość danych.
Następnie wybierz liczbę „k”, która jest liczbą klas, w których chcesz pogrupować dane.
Kontynuujemy dzielenie zakresu między „k”, aby uzyskać amplitudę grup, które mają być grupowane. Ta liczba to C = R / k.
W końcu uruchamiane jest grupowanie, dla którego wybierana jest mniejsza liczba niż najmniejsza wartość uzyskanych danych..
Ta liczba będzie dolną granicą pierwszej klasy. Do tego dodaje się C. Uzyskana wartość będzie górną granicą pierwszej klasy.
Następnie dodaje się C do tej wartości i uzyskuje górną granicę drugiej klasy. W ten sposób kontynuujesz, aż osiągniesz górną granicę ostatniej klasy.
Po pogrupowaniu danych można przystąpić do obliczania średniej, mediany i mody.
Aby zilustrować sposób obliczania średniej arytmetycznej, mediany i trybu, przejdziemy do przykładu.
Przykład
Dlatego grupując dane, otrzymasz tabelę w następujący sposób:
Trzy główne główne środki tendencji
Teraz przystąpimy do obliczania średniej arytmetycznej, mediany i trybu. Powyższy przykład zostanie użyty do zilustrowania tej procedury.
1- Średnia arytmetyczna
Średnia arytmetyczna polega na pomnożeniu każdej częstotliwości przez średnią przedziału. Następnie wszystkie te wyniki są dodawane i ostatecznie dzielone przez łączne dane.
Używając poprzedniego przykładu uzyskalibyśmy, że średnia arytmetyczna jest równa:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Oznacza to, że średnia wartość danych w tabeli wynosi 5.11111.
2- średni
Aby obliczyć medianę zestawu danych, najpierw wszystkie dane są uporządkowane od najmniejszej do największej. Można przedstawić dwa przypadki:
- Jeśli numer danych jest nieparzysty, mediana to dane znajdujące się dokładnie w środku.
- Jeśli numer danych jest parzysty, mediana jest średnią z dwóch danych pozostających w środku.
Jeśli chodzi o zgrupowane dane, obliczenie mediany odbywa się w następujący sposób:
- Oblicza się N / 2, gdzie N jest sumą danych.
- Pierwszy przedział jest przeszukiwany, gdy skumulowana częstotliwość (suma częstotliwości) jest większa niż N / 2, a dolna granica tego przedziału, zwana Li, jest wybrana..
Mediana jest podana w następującym wzorze:
Me = Li + (Ls-Li) * (N / 2 - Skumulowana częstotliwość przed Li) / Częstotliwość [Li, Ls]
Ls jest górną granicą zakresu wymienionego powyżej.
Jeśli używana jest powyższa tabela danych, mamy N / 2 = 18/2 = 9. Skumulowane częstotliwości to 4, 8, 14 i 18 (po jednym dla każdego wiersza tabeli).
Dlatego należy wybrać trzeci przedział, ponieważ skumulowana częstotliwość jest większa niż N / 2 = 9.
Więc Li = 5 i Ls = 7. Stosując powyższą formułę, musisz:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Moda
Moda to wartość, która ma największą częstotliwość wśród wszystkich zgrupowanych danych; to znaczy, że jest to wartość powtarzana najczęściej w początkowym zestawie danych.
W przypadku bardzo dużej ilości danych do obliczenia trybu zgrupowanych danych służy następujący wzór:
Mo = Li + (Ls-Li) * (częstotliwość Li - Częstotliwość L (i-1)) / ((Częstotliwość Li-częstotliwość L (i-1)) + (Częstotliwość Li-częstotliwość L ( i + 1)))
Interwał [Li, Ls] jest przedziałem, w którym znajduje się najwyższa częstotliwość. Na przykład przedstawiony w tym artykule mamy tę modę:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Inną formułą używaną do uzyskania przybliżonej wartości mody jest:
Mo = Li + (Ls-Li) * (częstotliwość L (i + 1)) / (częstotliwość L (i-1) + częstotliwość L (i + 1)).
Dzięki tej formule konta są następujące:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referencje
- Bellhouse, D. R. (2011). Abraham De Moivre: Wyznaczanie poziomu prawdopodobieństwa klasycznego i jego zastosowań. CRC Naciśnij.
- Cifuentes, J. F. (2002). Wprowadzenie do teorii prawdopodobieństwa. Univ. National of Colombia.
- Daston, L. (1995). Klasyczne prawdopodobieństwo w Oświeceniu. Princeton University Press.
- Larson, H. J. (1978). Wprowadzenie do teorii prawdopodobieństwa i wnioskowania statystycznego. Artykuł wstępny Limusa.
- Martel, P. J., & Vegas, F. J. (1996). Statystyka prawdopodobieństwa i matematyki: zastosowania w praktyce klinicznej i zarządzaniu zdrowiem. Ediciones Díaz de Santos.
- Vázquez, A. L., i Ortiz, F. J. (2005). Metody statystyczne do pomiaru, opisu i kontroli zmienności. Wydawca Uniwersytet w Kantabrii.
- Vázquez, S. G. (2009). Podręcznik matematyczny o dostępie do uniwersytetu. Redakcyjne Centrum Studiów Ramon Areces SA.