Znak klasy na to, co służy, jak to się robi i na przykładach



The marka klasy, znany również jako punkt środkowy, to wartość znajdująca się w środku klasy, która reprezentuje wszystkie wartości należące do tej kategorii. Zasadniczo znak klasy jest używany do obliczania niektórych parametrów, takich jak średnia arytmetyczna lub odchylenie standardowe.

Następnie znak klasy jest środkiem każdego interwału. Ta wartość jest również bardzo przydatna do znalezienia wariancji zbioru danych już pogrupowanych w klasy, co z kolei pozwala nam zrozumieć, jak daleko od centrum znajdują te określone dane.

Indeks

  • 1 Rozkład częstotliwości
    • 1.1 Ile klas należy rozważyć?
  • 2 Jak się masz?
    • 2.1 Przykład
  • 3 Po co to jest??
    • 3.1 Przykład
  • 4 odniesienia

Rozkład częstotliwości

Aby zrozumieć, czym jest marka klas, konieczna jest koncepcja rozkładu częstotliwości. Biorąc pod uwagę zestaw danych, rozkład częstotliwości jest tabelą, która dzieli takie dane na kilka kategorii zwanych klasami.

Ta tabela pokazuje liczbę elementów należących do każdej klasy; ten drugi jest znany jako częstotliwość.

W tej tabeli część informacji, które otrzymujemy z danych, jest poświęcana, ponieważ zamiast mieć indywidualną wartość każdego elementu, wiemy tylko, że należy on do tej klasy.

Z drugiej strony uzyskujemy lepsze zrozumienie zestawu danych, ponieważ w ten sposób łatwiej docenić ustalone wzorce, co ułatwia manipulowanie wymienionymi danymi..

Ile klas do rozważenia?

Aby dokonać rozkładu częstotliwości, musimy najpierw określić liczbę klas, które chcemy wziąć i wybrać ich ograniczenia klasowe.

Wybór liczby zajęć powinien być wygodny, biorąc pod uwagę, że niewielka liczba klas może ukryć informacje o danych, które chcemy studiować, a bardzo duża klasa może wygenerować zbyt wiele szczegółów, które niekoniecznie są przydatne.

Czynniki, które musimy wziąć pod uwagę przy wyborze liczby klas, które należy wziąć, są różne, ale spośród tych dwóch wyróżniają się: po pierwsze należy wziąć pod uwagę, ile danych musimy wziąć pod uwagę; drugi to wiedzieć, jaki jest rozmiar zasięgu (to znaczy różnica między największą i najmniejszą obserwacją).

Po zdefiniowaniu klas, zaczynamy liczyć, ile danych istnieje w każdej klasie. Ta liczba jest nazywana częstotliwością klasy i jest oznaczona przez fi.

Jak już powiedzieliśmy, rozkład częstotliwości traci informacje, które pochodzą indywidualnie z każdego z danych lub obserwacji. Dlatego poszukiwana jest wartość reprezentująca całą klasę, do której należy; ta wartość to marka klas.

Jak się masz?

Znak klasy to centralna wartość reprezentowana przez klasę. Uzyskuje się go, dodając granice przedziału i dzieląc tę ​​wartość przez dwa. Możemy to wyrazić matematycznie w następujący sposób:

xi= (Dolna granica + górna granica) / 2.

W tym wyrażeniu xi oznacza znak i-tej klasy.

Przykład

Biorąc pod uwagę następujący zestaw danych, podaj reprezentatywny rozkład częstotliwości i uzyskaj odpowiedni znak klasy.

Ponieważ dane o najwyższej wartości liczbowej wynoszą 391, a najmniejsza 221, mamy zakres 391 -221 = 170.

Wybierzemy 5 klas, wszystkie o tym samym rozmiarze. Jednym ze sposobów wyboru klas jest:

Zauważ, że każde dane są w klasie, są rozłączne i mają tę samą wartość. Innym sposobem wyboru klas jest rozważenie danych jako części zmiennej ciągłej, która może osiągnąć dowolną rzeczywistą wartość. W tym przypadku możemy rozważyć klasy formularza:

205-245, 245-285, 285-325, 325-365, 365-405

Jednak ten sposób grupowania danych może przedstawiać pewne niejasności z granicami. Na przykład w przypadku 245 powstaje pytanie: do jakiej klasy należy, do pierwszej czy drugiej??

Aby uniknąć tych nieporozumień, stosuje się konwencję punktów ekstremalnych. W ten sposób pierwszą klasą będzie interwał (205,245), drugi (245,285) i tak dalej.

Po zdefiniowaniu klas przystępujemy do obliczania częstotliwości i mamy następującą tabelę:

Po uzyskaniu rozkładu częstotliwości danych przechodzimy do oznaczeń klas każdego przedziału. W efekcie musimy:

x1= (205+ 245) / 2 = 225

x2= (245+ 285) / 2 = 265          

x3= (285 + 325) / 2 = 305

x4= (325+ 365) / 2 = 345

x5= (365+ 405) / 2 = 385

Możemy to przedstawić za pomocą następującej grafiki:

Po co to jest??

Jak wspomniano wcześniej, znak klasy jest bardzo funkcjonalny, aby znaleźć średnią arytmetyczną i wariancję grupy danych, które zostały już pogrupowane w różne klasy.

Możemy zdefiniować średnią arytmetyczną jako sumę obserwacji uzyskanych między wielkością próby. Z fizycznego punktu widzenia jego interpretacja jest jak punkt równowagi zbioru danych.

Zidentyfikowanie całego zestawu danych za pomocą pojedynczej liczby może być ryzykowne, więc musimy również wziąć pod uwagę różnicę między tym punktem równowagi a danymi rzeczywistymi. Te wartości są znane jako odchylenie od średniej arytmetycznej, a wraz z nimi staramy się określić, jak bardzo średnia arytmetyczna danych jest zmienna.

Najczęstszym sposobem znalezienia tej wartości jest wariancja, która jest średnią kwadratów odchyleń od średniej arytmetycznej.

Aby obliczyć średnią arytmetyczną i wariancję zbioru danych zgrupowanych w klasie, korzystamy odpowiednio z następujących wzorów:

W tych wyrażeniach xi  jest marką i-tej klasy, fi reprezentuje odpowiednią częstotliwość i k liczbę klas, w których dane zostały pogrupowane.

Przykład

Korzystając z danych podanych w poprzednim przykładzie, możemy nieco rozszerzyć dane tabeli rozkładu częstotliwości. Otrzymujesz następujące informacje:

Następnie, zastępując dane we wzorze, pozostawiliśmy, że średnia arytmetyczna wynosi:

Jego wariancja i odchylenie standardowe to:

Na tej podstawie możemy stwierdzić, że oryginalne dane mają średnią arytmetyczną 306,6 i odchylenie standardowe 39,56.

Referencje

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Statystyki opisowe. Redakcja Esic.
  2. Jhonson Richard A.Miller i Freund Probability i Statesmen for Engineers.Pearson Education.
  3. Miller I i Freund J. Prawdopodobieństwo i mężowie stanu dla inżynierów. REVERTE.
  4. Sarabia A. Jose Maria, Pascual Marta. Podstawowy kurs statystyki dla firm
  5. Llinás S. Humberto, Rojas A. Carlos Statystyka opisowa i rozkłady prawdopodobieństwa.Universidad del Norte Editorial