5 Metody obrazowania rozkładu częstotliwości

W celu zobrazowania rozkładów częstotliwości w formie graficznej powszechnie stosuje się następujące metody: 1. Histogram lub diagram kolumnowy 2. Diagram słupkowy lub wykres słupkowy 3. Wielobok częstotliwości 4. Wygładzony wielokąt częstotliwości 5. Diagram kołowy.

Metoda nr 1. Histogram lub diagram kolumnowy:

Jest to jeden z najpopularniejszych i najczęściej używanych urządzeń do prezentacji rozkładu częstotliwości. Histogram to zbiór prostokątów, których powierzchnia jest proporcjonalna do częstotliwości klasowych. Jest to wykres, w którym częstotliwości są reprezentowane przez paski. Histogram pojawia się jako seria wykresów słupkowych umieszczonych jeden obok drugiego w pionie.

Zwróć uwagę na następujące właściwości histogramu:

(i) Częstotliwości są wzdłuż osi pionowej, a wyniki (CI) są wzdłuż osi poziomej.

(ii) Jeden zakłada, że ​​wyniki są równomiernie rozłożone w przedziale klasy, dając nam prostokątne paski.

(iii) Częstotliwości w każdym przedziale histogramu są reprezentowane przez prostokąt, przy czym rozmiar przedziału jest podstawą, a częstotliwość tego przedziału wysokością.

(iv) Obszar każdego prostokąta na histogramie odpowiada częstotliwości w danym przedziale, podczas gdy całkowity obszar histogramu odpowiada całkowitej częstotliwości (N) rozkładu.

(v) Histogram może być najlepiej skonstruowany na papierze milimetrowym, który jest rządzony z równomiernie rozłożonymi poziomymi i pionowymi liniami.

Zobaczmy, jak histogram rozkładu częstotliwości można skonstruować w dwóch sytuacjach, tj. Gdy przedziały klasowe są równe i gdy przedziały klasowe są nierówne.

Histogram (równy przedziałowi klasy):

Krok 1:

W tabeli 2.12 uwzględniono klasy i, w pierwszym etapie, powinny one zostać zamienione na klasy z rzeczywistymi lub rzeczywistymi ograniczeniami klasowymi podanymi w drugiej kolumnie tej samej tabeli.

Krok 2:

Zasadniczo, dopuszcza się również pustą klasę na obu końcach klas i odbijaną na dwóch krańcowych krańcach poziomej skali, tj. 9, 5 i 99, 5 (patrz rys. 2.1). Poprawia to czytelność wykresu i jest również użyteczne w konstrukcji wielokąta częstotliwości.

Krok 3:

Następnie te rzeczywiste granice klas są następnie nanoszone razem z osią poziomą (oś X) za pomocą odpowiedniej skali pomiaru. Aby nadać symetrię i równowagę histogramowi lub dowolnej reprezentacji graficznej, należy zachować ostrożność przy wyborze odległości jednostkowych, aby reprezentować ograniczenie klasy na osi X i częstotliwości na osi Y.

Aby przedstawić te odległości, skala pomiaru na dwóch osiach jest tak dobrana, aby wysokość histogramu lub dowolnej innej prezentacji graficznej stanowiła około 75 procent jej szerokości.

Krok 4:

Gdy dolny limit jest zdawkowym wynikiem z punktu początkowego, należy podać przerwę na osi X (∫∫), aby wskazać, że oś pionowa została przeniesiona dla wygody. Następnie rozpocznij oś X z dolnym limitem przedziału najniższej klasy.

Histogram przedstawiający rozkład częstotliwości wyników w Tabeli 2.12 pokazano na Rys. 2.1. Na tej figurze wysokość prostokąta utworzonego nad klasą 19, 5-29, 5 wynosi 4 jednostki wzdłuż skali pionowej i jako taka jego powierzchnia staje się 4 x 1 = 4 jednostki kwadratowe, co jest równe częstotliwości klasy. Podobnie wysokości pozostałych prostokątów uformowanych w kolejnych klasach przyjmowane są odpowiednio jako 6, 8, 12. 9, 7 i 4.

Histogram (Nierówny odstęp między klasami):

Aby wziąć przykład, niech arbitralnie pogrupuj klasy 150 - 154 i 155-159 w jedną klasę jako 150 - 159 * i 185 - 189 i 190 - 194 w jedną klasę jako 185 - 194 ** w tabeli 2.13.

Przedział klasy czwartej i dziesiątej klasy jest dwa razy większy niż pozostałych klas. Zatem częstotliwości w tych dwóch klasach nie są porównywalne z innymi klasami. Aby ustalić tę porównywalność, częstości w większych klasach powinny zostać zmniejszone o połowę lub podzielone przez dwa.

Zatem, przed utworzeniem histogramu dla rozkładu częstotliwości z nierównymi przerwami klasowymi, wszystkie większe klasy powinny być wyrażone jako wielokrotności mniejszych klas; a następnie podzieliła odpowiednie częstotliwości klas przez te wielokrotności.

Ten podział daje zatem wysokość prostokątów, jak pokazano w Tabeli 2.14. Jednakże wysokości innych prostokątów uformowanych w klasach długości jednostkowych pozostaną równe odpowiadającym im klasom częstotliwości. Rozkład częstotliwości wyników w tabeli 2.14 przedstawiono na ryc. 2.3.

Zalety:

1. Jest prosty i łatwy do wykonania.

2. Wszystkie zalety przedstawienia graficznego, jak pokazano wcześniej, mają zastosowanie tutaj.

Ograniczenia:

1. Trudno jest nałożyć na siebie więcej niż jeden histogram na tym samym wykresie.

2. Porównania kilku rozkładów częstotliwości nie można łatwo uzyskać za pomocą histogramów. Wielokrotności częstotliwości są znacznie lepiej dostosowane do tego celu.

3. Założenie, że wyniki są równomiernie rozłożone w CI, powoduje większy błąd, gdy N jest małe, niż gdy N jest duże.

4. Nie można go wygładzić.

Metoda nr 2. Diagram słupkowy lub wykres słupkowy:

Wykres słupkowy jest jednym z najłatwiejszych i najczęściej używanych urządzeń do prezentacji danych dyskretnych serii. Są one szczególnie satysfakcjonujące dla danych lub serii kategorycznych. Składają się z grupy równoodległych prostokątów, po jednym dla każdej grupy lub kategorii danych, w których wartości lub wielkości są reprezentowane przez długość lub wysokość prostokątów, szerokość prostokątów jest arbitralna i niematerialna.

Diagramy te nazywane są jednowymiarowymi, ponieważ na takich wykresach uwzględniany jest tylko jeden wymiar mianowicie, wysokość (lub długość) prostokątów w celu przedstawienia podanych wartości.

Poniższe punkty mogą być brane pod uwagę przy rysowaniu wykresów słupkowych:

(i) Wszystkie słupki narysowane w jednym badaniu powinny mieć jednolitą (choć dowolną) szerokość w zależności od liczby prętów do narysowania i dostępnego miejsca.

(ii) Prawidłowe, ale równomierne odstępy między różnymi taktami powinny zostać wprowadzone, aby schemat wyglądał bardziej atrakcyjnie i elegancko.

(iii) Wysokość (długość) prostokątów lub słupków jest proporcjonalna do wielkości obserwacji, przy czym wybrana jest skala, mając na uwadze wielkość największej obserwacji.

(iv) Wszystkie pręty powinny być zbudowane na tej samej linii bazowej.

(v) Pożądane jest zapisanie liczb (wielkości) reprezentowanych przez paski na górze taktów, aby umożliwić czytelnikowi dokładne zorientowanie się w wartości bez patrzenia na skalę.

(vi) Pręty mogą być rysowane w pionie lub w poziomie. Jednak w praktyce pręty pionowe są zwykle używane, ponieważ zapewniają atrakcyjny i atrakcyjny wygląd.

(vii) Tam, gdzie to możliwe, pręty powinny być ułożone od lewej do prawej (od góry do dołu w przypadku poziomych prętów) w kolejności wielkości, aby uzyskać przyjemny efekt.

W danym mieście całkowita liczba szkół wynosi 24, a dystrybucja szkół według zasad zarządzania, jak pokazano w tabeli 2.15.

Dla zmiennej dyskretnej jednostka miary na osi poziomej nie jest ważna. Również klasy nie są ze sobą powiązane. Tak więc pręty są równo rozmieszczone i mają jednakową szerokość na osi poziomej.

Wysokość prętów jest jednak proporcjonalna do odpowiednich częstotliwości. Wykresy słupkowe są często wykorzystywane do graficznej prezentacji dyskretnych danych. Jeśli dwie zmienne są używane jednocześnie, nawet wtedy wykresy słupkowe mogą być dość skuteczne.

Na przykład, jeśli wraz z ogólną liczbą szkół (zarządzaniem) należy wskazać liczbę szkół dla chłopców, dziewcząt i szkół koedukacyjnych, można to zrobić na tym samym papierze milimetrowym za pomocą różnych kolorów, z których każda wskazuje kategorię płci. Dla każdego kierownictwa będą 4 paski o różnych kolorach wskazujące różne kategorie.

Metoda # 3. Wielokrotność częstotliwości:

Wielokąt to wieloboczna, bliska postać. Wielobok częstotliwości jest graficznym przedstawieniem rozkładu częstotliwości, w którym punkty środkowe CI są wykreślane względem częstotliwości.

Omówmy, jak narysować wielokąt częstotliwości:

Krok 1:

Narysuj dwie proste prostopadłe do siebie, pionową linię w pobliżu lewej strony papieru, poziomą linię w pobliżu dna. Oznacz linię pionową (oś Y) OY i linię poziomą (oś X) OX. Umieść O, tam gdzie przecinają się dwie linie. Ten punkt jest źródłem.

Aby uzyskać symetrię i równowagę wielokąta, należy zachować ostrożność przy wyborze odległości jednostkowych na obu osiach. Dobrą ogólną zasadą jest wybór jednostek X i Y, które uczynią wysokości figury około 75% jej szerokości.

Krok 2:

Następnie należy wskazać środkowe punkty CI na osi poziomej, zamiast wskazywać granice całki. Tutaj również należy wskazać punkt środkowy interwałów tuż przed najniższym interwałem i zaraz po najwyższym interwale (odpowiednio punkty środkowe 137 i 202 w tabeli 2.16). Wzdłuż linii pionowej zaznacz jednostki, aby przedstawić częstotliwości przedziałów klasowych.

Krok 3:

W punkcie środkowym każdego interwału na osi X idź w górę w kierunku Y na odległość równą liczbie wyników w przedziale. Umieść punkty w tych lokalizacjach.

Krok 4:

Po narysowaniu wszystkich punktów na wykresie łączymy te punkty za pomocą szeregu krótkich linii prostych tworzących wielobok częstotliwości.

Metoda # 4. Wygładzony wielobok częstotliwości:

Wielobok częstotliwości powinien zostać wygładzony:

ja. Aby wyeliminować przypadkowe nieprawidłowości;

ii. Aby uzyskać lepsze wyobrażenie o tym, jak postać może wyglądać, jeśli dane są bardziej liczne;

iii. Aby dowiedzieć się, jak wyglądałby wielokąt, gdyby usunięto z niego błędy grupowania i błędy próbkowania;

iv. W celu ustalenia kształtu, który byłby potrzebny, gdyby reprezentował warunki uwolnione od drobnych przypadkowych fluktuacji.

Przy wygładzaniu wieloboku częstotliwości pobierana jest seria ruchomych lub działających średnich, z których wyznaczane są nowe lub skorygowane częstotliwości. Aby znaleźć wyrównane lub wygładzone " f, dodaj f na podanym przedziale i fs w dwóch sąsiednich interwałach (interwał tuż poniżej i przedział tuż powyżej) i podziel je przez 3.

Na przykład wygładzone f dla przedziału 170-174 w tabeli 2.17 wynosi (8 + 10 + 6) / 3 lub 8, 00. Aby znaleźć wygładzone f s dla dwóch przedziałów na krańcach rozkładu, mianowicie 140-144 i 195-199, konieczna jest nieco inna procedura. Najpierw dodajemy 0, f w przedziale kroków poniżej lub powyżej, do f na podanym przedziale i do f na sąsiednim przedziale, i dzielimy przez 3. Wygładzone f dla 140-144 wynosi (0 + 1 + 3) / 3 wynosi 1, 33; a wygładzone f dla 195-199 to (2 + 1 + 0) / 3 lub 1, 00.

Musimy wziąć jeszcze dwa CI w 135-139, a pozostałe 200-204, dla których f przyjmuje się jako 0. Ich wygładzone f w każdym przypadku wynosi (0 + 0 + 1) / 3 lub .33 i (0 + 0 + 1) / 3 lub .33. Włączenie tych ostatnich dwóch przedziałów powoduje, że N = 50, 00 dla wygładzonego rozkładu.

Jeśli N jest duże, wygładzenie może nie zmienić znacznie kształtu wykresu, a zatem często jest niepotrzebne.

Zalety:

(i) Jest prosty i łatwy do wykonania.

(ii) Możliwe jest nakładanie więcej niż jednego wielokąta częstotliwości na tym samym wykresie za pomocą kolorowych linii, przerywanych linii, przerywanych linii itp.

(iii) Porównanie kilku rozkładów częstotliwości można łatwo uzyskać za pomocą wielokątów częstotliwości.

(iv) Wszystkie zalety przedstawienia graficznego, o którym mowa powyżej, mają zastosowanie tutaj.

(v) Można go wygładzić. Ograniczenia.

Ograniczenie:

(ii) Część obszaru znajdująca się powyżej danego interwału nie może być traktowana jako proporcjonalna do częstotliwości tego CI z powodu nieregularności powierzchni częstotliwości.

(ii) Założenie, że wszystkie wyniki w obrębie CI spadają w punkcie środkowym tego przedziału, powoduje większy błąd, gdy N jest większe niż gdy N jest małe.

(iii) Jest mniej precyzyjny niż histogram, ponieważ nie reprezentuje dokładnie, tj. Pod względem powierzchni, częstotliwości po każdym interwale.

Skumulowany wykres częstotliwości:

Skumulowany wykres częstotliwości jest innym sposobem reprezentacji rozkładu częstotliwości za pomocą diagramu. Zanim będziemy mogli wykreślić skumulowany wykres częstotliwości, wyniki rozkładu muszą być dodawane seryjnie lub kumulowane, jak pokazano w Tabeli 2.18.

Aby określić Cum.f dla każdego rzędu, musimy kontynuować dodawanie f s stopniowo od dołu. Aby zilustrować, w rozkładzie wyników pierwsza skumulowana częstotliwość wynosi 1; 1 + 3, od niskiego końca rozkładu, daje 4 jako następny wpis; 4 + 2 = 6; 6 + 4 = 10, itp. Ostatni łączny / jest równy, oczywiście, do 50 lub N, całkowita częstotliwość.

Przy wykreślaniu wieloboku częstotliwości częstotliwość w każdym przedziale jest pobierana w środkowym punkcie przedziału klasy. Ale przy konstruowaniu skumulowanej krzywej częstotliwości każda skumulowana częstotliwość jest wykreślona dokładnie w górnej granicy przedziału, w którym się znajduje.

Dzieje się tak dlatego, że dodawanie stopniowo od dołu każdego przewoźnika częstotliwości do dokładnego górnego limitu przedziału klasy. Przy wybranej skali, jeśli bierzemy górne granice ci wzdłuż osi X i bierzemy Cum- f wzdłuż osi Y, możemy narysować wykres dla skumulowanego rozkładu częstotliwości.

W skumulowanej krzywej częstotliwości każda skumulowana częstotliwość jest wykreślana w górnej granicy przedziału. Aby krzywa zaczynała się na osi X, rozpoczyna się od 139, 5 (dokładna górna granica 134, 5-1 39, 5), której łączna częstotliwość wynosi 0.

Skumulowana krzywa procentowa lub Ogive:

Rysując "Ogive'a" musimy obliczyć skumulowane częstotliwości procentowe w górnej granicy każdego ci. "Łączna procentowa częstotliwość" oznacza, jaki procent N jest Cum- f . Skumulowana krzywa procentowa lub ostrołukt różni się od wykresu skumulowanej częstotliwości tym, że częstotliwości są wyrażone jako łączny procent N na osi Y, a nie jako skumulowane częstotliwości. Tabela 2.19 pokazuje, w jaki sposób skumulowane częstotliwości można zamienić na procent N.

W kolumnach (1), (2) i (3) przedziałach klas wymienia się górne limity PW i częstotliwości; aw kolumnie (4) f zostały skumulowane z dolnego końca rozkładu w górę. Te Cum- f są wyrażone jako wartości procentowe N w kolumnie (5). Konwersję Cum- f s na skumulowane procenty można przeprowadzić przez podzielenie każdego skumulowanego / przez N; np. 2 + 40 = .05, 6 + 40 = .15 i tak dalej.

Lepszą metodą - zwłaszcza gdy dostępna jest maszyna licząca - jest określenie najpierw odwrotności. 1 / N, zwany Rate, i pomnóż każdą skumulowaną f w porządku przez tę frakcję. Jak pokazano w tabeli 2.19, szybkość wynosi 1/40 lub 0, 025. Stąd pomnożenie 2 przez 0, 025, otrzymujemy 0, 05 lub 5%; 6 X. 025 =. 15 lub 15% itp.

Krzywa na rysunku 2.8 przedstawia ostrołuk wyłuskany z danych w kolumnie (5), tabela 2.19. Dokładne limity przedziałowe zostały zwolnione na osi X, a skala złożona z 10 równych odległości, z których każda stanowi 10% rozkładu, została zaznaczona na osi Y. Pierwszym punktem ostrołuku są jednostki 5 Y tuż powyżej 35, 5. Ostatni punkt to 100 jednostek Y powyżej 56.5 dokładnego górnego limitu przedziału najwyższej klasy.

Z ostrołuku możemy przeczytać PR. różnych wyników, a także percentyle:

(a) Odczytywanie percentyli z ostrołuku:

Przypuśćmy, że chcemy się dowiedzieć P 2 5- Jak wiemy, P 25 jest punktem, poniżej którego leży 25% przypadków. Znajdźmy 25 na osi Y, a następnie narysuj poziomą linię od tego punktu. W pewnym momencie spotka się z ostrołukiem.

Od tego punktu narysuj prostopadle na osi X. Z osi X możemy odczytać wynik. Z ostrołuku możemy odczytać, że P 2 5 = 41, 5. Podobnie możemy odczytać, że P 50 = 46, 7 i P 75 = 49. Możemy odczytać inne percentyle w ten sam sposób z ostrołuku.

(b) Czytanie percentyla Rankingu ocen:

Załóżmy, że chcemy wiedzieć, że PR wynosi 53, 5. Musimy zlokalizować ten wynik na osi X i narysować pionową linię od tego punktu. Linia w pewnym momencie dotrze do ostrołuku, z którego możemy narysować poziomą linię w lewo, a ta linia osiągnie oś Y w punkcie. W tym miejscu możemy odczytać współczynnik% f . Ten% / wartość cum jest PR. wyniku.

W ten sposób możemy przeczytać, że:

PR wyniku, 40 = 20

PR wyniku, 53 = 90.

W podobny sposób możemy odczytać PR z dowolnego innego wyniku z ostrołuku.

Metoda # 5. Schemat kołowy:

Diagramy kołowe są bardzo popularnie używane do oznaczenia podziału procentowego. Jest tak nazywany, ponieważ cały wykres wygląda jak ciasto, a składniki ciasta przypominają plasterki wycięte z ciasta. Przedstawia wartości procentowe, a nie bezwzględne.

Diagramy kołowe są bardzo przydatne w przedstawianiu wydatków Govt. Lub firmy itp. Rozmieszczonych w różnych głowach. Jest również stosowany w nauczaniu geografii, nauki, itp.

Podczas konstruowania diagramu kołowego można wykonać następujące kroki:

1. Narysuj okrąg odpowiedniego rozmiaru za pomocą kompasu. Rozmiar promienia zależy od dostępnej przestrzeni i innych czynników.

2. Przygotuj dane w postaci% pod różnymi głowami. Te% dla różnych sektorów powinny zostać przetransponowane na odpowiednie stopnie na okręgu.

W tym celu należy ustalić wartość kąta każdej pod-części. Wiemy, że wartość wszystkich kątów w dowolnym punkcie jest równa 360 °, czyli cały okrąg jest 360 °, co stanowi 100%. Zatem jeden% oznacza 360 ° / 100 = 3, 6 °.

W związku z tym dla znalezienia wartości kąta każdej podgrupy będzie obowiązywać następująca formuła:

3. Załóżmy, że istnieją 3 komponenty o wartości 60% jako osiągających wysokie wyniki, 25% jako średniozamożny i 15% jako o niskich osiągach. Dlatego powinny one wynosić odpowiednio: 216 ° (60 x 3, 6 °), 90 ° (25 x 3, 6 °) i 54 ° (15 x 3, 6 °).

4. Po ustaleniu wartości wszystkich kątów ich suma może nie być dokładnie 360 ​​° z powodu przybliżenia. W takim przypadku niektóre wartości kąta mogą wymagać nieznacznego skorygowania, aby uzyskać całkowitą wartość 360 °.

5. Zmierz punkty na okręgu, aby przedstawić rozmiar każdego sektora za pomocą kątomierza. Powszechną praktyką jest uporządkowanie sektorów według wielkości, przy czym największy sektor znajduje się u góry, a inne w

sekwencja działa zgodnie z ruchem wskazówek zegara. Sektory mogą być oznaczone. Etykiety mogą być umieszczone wewnątrz sektora lub poza okręgiem.