Tendencja centralna: znaczenie, zastosowania i miary

Tendencja centralna: znaczenie, zastosowania i środki!

Znaczenie tendencji centralnej:

Miary tendencji centralnej są kombinacją dwóch słów, tj. "Miara" i "tendencja centralna". Środek oznacza metody i tendencję centralną oznacza średnią wartość dowolnych szeregów statystycznych. Można więc powiedzieć, że tendencja centralna oznacza metody określania wartości centralnej lub średniej wartości szeregu statystycznego informacji ilościowych.

JP Guilford wskazał, że "średnia jest centralną wartością grupy obserwacji lub osób".

Według Clarka "Average jest próbą znalezienia jednej postaci do opisania całej figury".

Według słów AE Waugh "Średnia to pojedyncza wartość wybrana z grupy wartości do reprezentowania ich w ten sam sposób - wartość, która ma stanowić całą grupę, której jest częścią, jak typowa dla wszystkich wartości w grupie."

Można więc powiedzieć, że przeciętna lub centralna tendencja jest pojedynczą wartością obliczoną z danego rozkładu, aby dać centralną ideę całej serii. Wartość średniej leży w granicach wartości maksymalnej i minimalnej w serii.

Zastosowania Tendencji Centralnej:

Główna tendencja jest potrzebna z następujących powodów:

1. Średnia zapewnia ogólny obraz serii. Nie pamiętamy wszystkich faktów dotyczących dziedziny badań.

2. Średnia wartość zapewnia jasny obraz na temat badanego pola w celu uzyskania wskazówek i niezbędnych wniosków.

3. Podaje zwięzły opis działania grupy jako całości i umożliwia nam porównanie dwóch lub więcej grup pod względem typowej wydajności.

Miary tendencji centralnej:

Istnieją trzy miary tendencji centralnej, takie jak:

(1) Średnia arytmetyczna.

(2) Mediana i

(3) Tryb.

(1) Średnia (M):

Dla przeciętnego człowieka średnia oznacza średnią arytmetyczną. Jest najczęściej używany ze względu na swoją prostotę, sztywność itp.

Średnia arytmetyczna jest definiowana jako "iloraz uzyskany przez podzielenie sumy wartości zmiennej przez całkowitą liczbę ich obserwacji lub pozycji."

II.E. Garett (1985 P) definiuje "średnią arytmetyczną lub po prostu średnia jest sumą oddzielnych wyników lub miar podzielonych przez ich liczbę."

Metody obliczania średniej:

Istnieje kilka metod obliczania średniej. Ale tutaj omówimy tylko dwie metody.

Są następujące:

1. Metoda bezpośrednia lub metoda długa.

2. Metoda krótka lub założona metoda średnia.

1. Metoda bezpośrednia lub metoda długa:

W tej metodzie średnia jest obliczana bezpośrednio z podanej serii. W tej metodzie możemy obliczyć średnią z niezgrupowanych danych i formułę do obliczenia średniej z danych nie zgrupowanych.

Formuła obliczania średniej z danych zgrupowanych to:

Z pogrupowanych danych średnia jest obliczana według następującego wzoru:

Ilustracja:

Oblicz średnią z następujących rozkładów częstotliwości metodą bezpośrednią:

2. Metoda krótka lub założona metoda średnia:

Jest to tzw. Metoda średnia zakładana, ponieważ zamiast obliczać średnią z punktów środkowych przyjmujemy założoną średnią w celu ustalenia średniej. Najpierw "odgadujemy" lub zakładamy średnią, a następnie stosujemy korektę do tej zakładanej wartości, aby znaleźć dokładną wartość.

Wzór do ustalenia średniej w przyjętej średniej jest podany poniżej:

Poniżej omówiono etapy obliczania średniej w krótkiej metodzie:

Krok 1:

Przyjmij dowolny środkowy punkt rozkładu jako średni. Ale najlepszym planem jest wziąć punkt środkowy przedziału blisko centrum, który ma największą częstotliwość.

Krok 2:

Znajdź kolumnę x ', x' jest odchyleniem od wyniku i przyjętej średniej.

Tutaj możemy dowiedzieć się x ', używając następującej formuły:

Krok 3:

Dowiedz się kolumna fx . Okazuje się to przez pomnożenie kolumny f przez x '.

Krok 4:

Dowiedz się Σ f x. Dodaj wszystkie wartości dodatnie i wartości ujemne osobno. Następnie sprawdź sumę algebraiczną which f x.

Krok 5:

Znajdź średnią, używając wzoru 9.4.

Ilustracja:

Znajdź średnią rozkładu w przyjętej średniej metodzie.

W teście z matematyki oceny 50 uczniów zostały przedstawione w następującym rozkładzie:

Tutaj przyjęliśmy 44, 5 punktu środkowego Ci 40-49 jako przyjętą średnią. Teraz możemy znaleźć średnią, używając wzoru-8.4.

Łączone Średnia:

Oddzielne środki z szeregu różnych serii mogą wytworzyć połączoną średnią arytmetyczną ze wszystkich różnych serii, gdy podana jest liczba pozycji w każdej z takich serii. Oblicza się to za pomocą następującej formuły, gdy liczba grup wynosi n.

Ilustracja:

Poniżej podano średnią uczniów klas VI z 4 szkół. Jaka jest średnia dla uczniów klas VI w ogóle.

Możemy dowiedzieć się średniej łączonej za pomocą wzoru 9.5:

Tak więc średnia wszystkich uczniów klas VI to 55, 25.

Wykorzystuje średnią:

Istnieją pewne ogólne zasady korzystania ze środka. Niektóre z tych zastosowań są następujące:

1. Środek jest środkiem ciężkości rozkładu, a każdy wynik przyczynia się do jego określenia, gdy rozrzut wyników jest symetryczny wokół punktu centralnego.

2. Średnia jest bardziej stabilna niż mediana i tryb. Tak więc, gdy miarą tendencji centralnej o największej stabilności jest pożądany środek jest używany.

3. Średnia służy do obliczania innych statystyk, takich jak SD, współczynnik korelacji, ANOVA, ANCOVA itp.

Merits of Mean:

1. Środek jest sztywno określony, więc nie ma kwestii nieporozumień co do jego znaczenia i natury.

2. Jest to najpopularniejsza tendencja centralna, ponieważ jest łatwa do zrozumienia.

3. Łatwo to obliczyć.

4. Obejmuje wszystkie wyniki dystrybucji.

5. Nie ma wpływu na pobieranie próbek, aby wynik był wiarygodny.

6. Średnia jest zdolna do dalszego algebraicznego traktowania, tak że różne inne statystyki, takie jak dyspersja, korelacja, pochylenie wymagają średniej do obliczeń.

Demerits of Mean:

1. Średnia ma wpływ na wyniki ekstremalne.

2. Czasami średnia oznacza wartość, która nie występuje w serii.

3. Czasami daje absurdalne wartości. Na przykład jest 41, 44 i 42 uczniów w klasie VIII, IX i X szkoły. Tak więc średnia liczba uczniów w klasie wynosi 42, 33. To nigdy nie jest możliwe.

4. W przypadku przerw w klasie otwartej nie można jej obliczyć bez założenia wielkości klas otwartych.

(2) Mediana:

Mediana to kolejna miara tendencji centralnej. Jest to średnia pozycyjna, ponieważ jej wartość jest określana w odniesieniu do jej pozycji w kolumnie wartości szeregu. W Słowniku statystyk Collinsa definiuje się go jako "środkową wartość w rozkładzie, poniżej i powyżej której leżą wartości o równych całkowitych częstotliwościach lub prawdopodobieństwach".

D. Patri (1996) definiuje medianę "jako wartość środkowej pozycji serii ułożonej w porządku rosnącym lub malejącym. Jako taki dzieli serię na dwie równe części. "

Medianę można zdefiniować jako punkt rozkładu, poniżej którego znajduje się pięćdziesiąt procent przypadków, a powyżej 50% przypadków.

Obliczanie mediany z niezogrupowanych danych:

W przypadku niezgrupowanych danych wyniki są uporządkowane według wielkości. Następnie zostaje znaleziony punkt środkowy, który jest medianą. W procesie tym powstają dwie sytuacje w obliczeniach mediany, (a) N jest nieparzysta (b) N jest jeszcze pierwsza. Najpierw omówimy sposób obliczania mediany (Mdn), gdy N jest nieparzyste.

Ilustracja:

W klasie 9 uczniowie zdobyli następujące oceny w teście na słownictwo. Znajdź medianę.

Znaki-6, 12, 8, 13, 7, 10, 7, 11, 9

W niezgrupowanych danych

Omówmy jak obliczyć Mdn, gdy N jest parzyste.

Ilustracja:

Obliczyć Mdn następujących danych 10 studentów egzaminu z ortografii w języku angielskim.

Znaki = 7, 6, 8, 12, 7. 9, 11, 10, 13, 14

Aby rozwiązać problem, musimy uporządkować według wielkości

6, 7, 7, 8, 9, 10, 11, 12, 13, 14

Teraz stosując wzór 8.6 otrzymujemy;

Obliczanie mediany z danych zgrupowanych:

Wiemy, że mediana jest punktem, który dystrybuuje dystrybucję na dwie równe połowy.

Formuła pozwalająca ustalić medianę z pogrupowanych danych brzmi:

Gdzie L = Dolna granica klasy median.

Klasą median jest ta klasa, której łączna częstotliwość jest większa niż wartość N / 2, tj. N / 2> cf (skumulowana częstotliwość)

N / 2 = połowa całkowitej liczby wyników.

F = Łączna częstotliwość klasy wewnętrznej poniżej klasy mediany.

fm = Częstotliwość klasy median.

i = Rozmiar wewnętrznych elementów klasy.

Kroki do obliczenia mdn z pogrupowanych danych:

Krok 1.

Oblicz N / 2, czyli 50% rozkładu.

Krok 2:

Oblicz skumulowaną częstotliwość rozkładu z dolnego końca.

Krok 3:

Znajdź klasę mdn. Łączna częstotliwość przedziału klasy, w której N / 2> por

Krok 4:

Znajdź F skumulowaną częstotliwość poniżej klasy mdn.

Krok 5:

Dowiedz się f m . i wstaw wszystkie wartości do formuły.

Ilustracja:

Znajdź medianę dystrybucji.

Poniżej podane są wyniki 40 studentów z testu z matematyki:

L = 59, 5. Ponieważ N / 2, tj. 20, jest zawarte w skumulowanej częstotliwości przedziału klasy 60-61 i dokładnych granic Ci = 59, 5-61, 5.

F = 17. Skumulowana częstotliwość poniżej klasy mdn.

fm = 7. Dokładna częstotliwość klasy mdn.

i = 2. Rozmiar przedziału klasy.

Teraz wprowadzam wartość do formuły

Mdn dystrybucji wynosi 60, 63.

Mdn można również obliczyć z górnej granicy rozkładu. Formuła, aby dowiedzieć się mdn, biorąc górne limity, brzmi tak.

Gdzie U = Górny limit klasy Mdn.

F 1 = Skumulowana częstotliwość przedziału klasy powyżej klasy Mdn.

fm = Częstotliwość klasy median.

i = Rozmiar przedziału klasy.

Kroki:

W przypadku obliczania Mdn z górnego limitu jedyną różnicą jest obliczenie skumulowanej częstotliwości z górnego końca.

Ilustracja:

U = 61, 5. Ponieważ skumulowana częstotliwość 23 zawiera N / 2, tj. 20.

F = 16. Łączna częstotliwość przedziału klasy powyżej klasy Mdn.

fm = 7 częstotliwość klasy median.

i = 2

Mdn to 60, 36.

Istnieją również wyjątkowe przypadki median informatycznych. Są to sytuacje, gdy rozkład częstotliwości zawiera przerwy i kiedy przerwy w klasie są otwarte. Przede wszystkim omówimy, kiedy istnieją luki w rozkładzie częstotliwości.

Kiedy w odstępach klasowych występują kolejne częstotliwości 0, w których leży Mdn, pojawia się trudność w znalezieniu klasy Mdn. W tym przypadku dodajemy 0 interwałów częstotliwości do powyższych i poniżej przedziałów klasowych.

Poniższa ilustracja wyjaśnia wyraźnie proces:

Ilustracja:

Znajdź Mdn następującej serii:

L = 49, 5. Dolna granica wartości Ci, gdzie Ci jest większa niż N / 2.

F = 4 Cf w C1 poniżej klasy Mdn

f m = 2. Częstotliwość klasy Mdn.

i = 10. Rozmiar Ci

Umieszczenie wartości we wzorze 8.7.

Tak więc Mdn rozkładu wynosi 57.

Druga sytuacja jest taka, że ​​w obu końcach są otwarte przedziały klasowe. W tym przypadku otwarte końce mogą pozostać otwarte lub mogą zostać przekształcone w określone klasy. Poniżej przedstawiono ilustrację.

Ilustracja:

30 uczniów uzyskało następujące oceny w teście z matematyki. 4 studentów zabezpieczyło poniżej 10 marek. 6 studentów uzyskało oceny od 10 do 20, 10 uczniów od 20 do 30, 8 od 30 do 40, 7 od 40 do 50 i od 3 do 50 osób. Dowiedz się o Mdn.

L = 19, 5. Dolna granica klasy Mdn, czyli 20-30.

F = 10 Cf klasy Ci poniżej Mdn.

fm = 10

i = 10

Więc Mdn rozkładu wynosi 28, 5.

Wykorzystuje medianę:

1. Mediana jest używana, gdy potrzebny jest dokładny punkt środkowy rozkładu lub wymagany jest punkt 50%.

2. Kiedy skrajne wyniki wpływają na średnią w tym czasie, mediana jest najlepszą miarą tendencji centralnej.

3. Medianę stosuje się, gdy wymagane jest, aby pewne wyniki miały wpływ na centralną tendencję, ale wiadomo tylko, że są one powyżej lub poniżej mediany.

4. Mediana jest używana, gdy klasy są otwarte lub ma ona nie równy rozmiar komórki.

Merity of Median:

1. Jest łatwy do obliczenia i zrozumienia.

2. Wszystkie obserwacje nie są wymagane do jego obliczeń.

3. Ekstremalne wyniki nie mają wpływu na medianę.

4. Można to określić na podstawie serii otwartych.

5. Można ją wyznaczyć na podstawie nierównomiernych odstępów między klasami.

Demerits of Median:

1. Nie jest sztywno zdefiniowany jak średnia, ponieważ jego wartości nie można obliczyć, ale zlokalizować.

2. Nie obejmuje wszystkich obserwacji.

3. Nie może być dalej traktowane algebraicznie jak średnia.

4. Wymaga to uporządkowania wyników lub odstępów między klasami w porządku rosnącym lub malejącym.

5. Czasami tworzy wartość, której nie ma w serii.

(3) Tryb:

Tryb to najczęściej występujące wyniki w rozkładzie. Jako średnia reprezentuje ona najbardziej typową wartość serii, która prawie pokrywa się z istniejącymi pozycjami. Na to nigdy nie wpływają skrajne wyniki, ale skrajne częstotliwości wartości. Aby określić tryb, istnieją różne metody.

Niektóre z ważnych metod omówiono poniżej:

Metody do określenia trybu:

1. Metoda inspekcji

2. Metoda grupowania

3. Empiryczna metoda powiązania

1. Metoda inspekcji:

W tym trybie metoda jest określana właśnie przez obserwację. W tym przypadku tryb określa się, obserwując najczęściej występujący wynik lub przedział klasy, dla którego podstawiona jest maksymalna częstotliwość, jako klasa modalna. Gdy dwie takie wartości lub przedziały klasowe mają takie samo wystąpienie lub częstotliwość, zarówno wyniki, jak i przedziały klasowe są traktowane jako tryb ". Dystrybucja nazywana jest dystrybucją dwumodalną. Jeżeli istnieje więcej niż dwie takie wartości lub przedziały klasowe, jest to sprzymierzone jako rozkład multimodalny.

2. Metoda grupowania:

Kiedy różnica wartości pomiędzy najwyższą częstotliwością a następną najwyższą częstotliwością jest bardzo niska w tym czasie, nie jest możliwe bezpieczne określenie trybu w metodzie inspekcji. W takich wątpliwych przypadkach zastosowano metodę grupowania.

W tej metodzie najpierw przygotowywana jest tabela grupująca lub zestawienie częstotliwości. W tym stwierdzeniu umieść wartości lub klasy wartości w kolumnie po lewej stronie i odpowiadające im częstotliwości w następnej kolumnie. W następnej kolumnie (2) zgrupuj częstotliwości w dwóch punktach począwszy od pierwszej częstotliwości. Następnie w trzeciej kolumnie grupy częstotliwości w dwóch począwszy od drugiej częstotliwości. W następnej kolumnie grupy częstotliwości w trzech począwszy od 1. częstotliwości.

W następnej kolumnie grupy częstotliwości w trójkach zaczynają się od drugiej częstotliwości. W ostatniej grupie kolumn częstotliwości w trzech od 3 częstotliwości. Po zakończeniu grupowania określ maksymalną liczbę (y) każdej z 6 kolumn, umieszczając okrąg.

Kolejnym krokiem jest przygotowanie tabeli analizy w celu zlokalizowania wartości modalnej lub klasy modalnej. W tabeli tej prawdopodobne wartości modalne są przedstawione w górnej poziomej linii pod różnymi kolumnami, a różne numery kolumn zostaną umieszczone po lewej stronie tabeli.

Wartości przedstawiające maksymalne zgrupowane częstotliwości w tabeli grupowania zostaną oznaczone znacznikiem w odpowiedniej kolumnie. Liczba takich znaków umieszczonych pod kolumnami prawdopodobnej wartości zostanie podsumowana na dole tej tabeli. Prawdopodobna wartość, pokazująca maksimum takiej sumy, zostanie określona jako wartość modalna, w zależności od przypadku, w zależności od klasy modalnej.

Poniższa ilustracja zapewni lepsze zrozumienie:

Ilustracja:

Powyższa tabela analizy pokazuje, że około 60 punktów, maksimum klastrów, czyli ogółem 4. Tak więc tutaj 60 jest wartością modalną.

Gdy dane znajdują się w ciągłej serii, możemy obliczyć tryb, stosując następującą formułę:

Gdzie M 0 = Tryb

L 0 = Dolna granica klasy modalnej

f 2 = częstotliwość klasy modalnej następnej klasy.

f 0 = częstotliwość klasy poprzedzającej klasę modalną.

i = Rozmiar przedziału klasy.

Ilustracja:

Na podstawie poniższych danych określ tryb:

Rozwiązanie:

Tutaj przedział klasy 20-25 zawiera najwyższą częstotliwość. Aby można go było uznać za klasę modalną

Tutaj:

3. Empiryczna metoda powiązania:

Jest to najskuteczniejsza metoda określania trybu. Prof. Karl Pearson przewidział tę metodę. Profesor Pearson stwierdził, że w seriach o umiarkowanie asymetrycznym lub krzywym profilu istnieje związek między średnią, medianą i modem. W takich seriach odległość między średnią a medianą wynosi 1/3 odległości między średnią a trybem.

Ilustracja:

Znajdź tryb z dystrybucji podanej powyżej.

Rozwiązanie:

Średnia rozkładu to 25.94

Mediana rozkładu wynosi 23.83

M 0 = 3 Median-2 średnia

M 0 = 3 X 23, 83-2 x 25, 94

= 71, 49-51, 88

= 19, 61 (w przybliżeniu)

Zastosowania trybu:

Używany jest tryb:

(i) Gdy chcemy szybkiej i przybliżonej miary tendencji centralnej.

(ii) Gdy chcemy mierzyć tendencję centralną, która powinna być typową wartością. Na przykład, gdy chcemy poznać typowy strój indyjskich kobiet, czyli najpopularniejszy styl ubioru. Podobnie średnie oceny danej klasy nazywają się znakami modalnymi.

Merits of Mode:

1. Tryb daje najbardziej reprezentatywną wartość serii.

2. Żadne ekstremalne wyniki, takie jak średnia, nie mają wpływu na tryb.

3. Można to ustalić na podstawie przedziału klasy otwartej.

4. Pomaga w analizie danych jakościowych.

5. Tryb można również określić graficznie za pomocą histogramu lub wieloboku częstotliwości.

6. Tryb jest łatwy do zrozumienia.

Wyzwania:

1. Tryb nie jest zdefiniowany sztywno jak średnia. W niektórych przypadkach może dojść do różnych wyników.

2. Nie obejmuje wszystkich obserwacji rozkładu, ale koncentracji częstotliwości pozycji.

3. Dalsze leczenie algebraiczne nie może być wykonane w trybie takim jak średnia.

4. W przypadkach multimodalnych i bimodalnych trudno jest określić.

5. Nie można określić trybu na podstawie nierównych odstępów w klasie.

6. Istnieją różne metody i różne formuły, które dają różne wyniki modów i dlatego słusznie jest to określane jako najbardziej źle określona średnia.