Techniki stosowane w statystykach

W tym artykule omówimy niektóre z technik statystycznych. Niektóre z technik są następujące: 1. Miary tendencji centralnej 2. Zmienność 3. Prawdopodobieństwo 4. Rozkład częstotliwości 5. Szeregi czasowe.

Miary tendencji centralnej:

Średnie:

Każda miara statystyczna, która daje pojęcie o położeniu punktu, wokół którego gromadzą się inne obserwacje, nazywa się miarą tendencji centralnej. Najczęściej stosowanym pomiarem jest średnia lub średnia arytmetyczna.

Dzienne zarobki dwóch pracowników na tydzień są następujące:

1. pracownik Rs 70, 50, 100, 90, 50 Średnie zarobki = Rs 76

2. pracownik Rs 200, 250, 50, 300, 150 Średnie zarobki = Rs 190

Z powyższego przykładu możemy wywnioskować, że przeciętnie drugi pracownik zarabia więcej niż pierwszy. Celem obliczenia średniej - jak łatwo można zauważyć - jest zastąpienie szeregu obserwacji jedną wartością, którą uważa się za reprezentatywną dla wszystkich obserwacji. Z powyższego przykładu można zauważyć, że średnia arytmetyczna jest wartością bliską środka, a niektóre z obserwacji są większe niż podczas gdy niektóre są mniejsze.

Można więc powiedzieć, że średnia arytmetyczna obserwacji zmiennych jest definiowana jako suma obserwacji podzielona przez liczbę obserwacji.

Dla pierwszego pracownika średnia arytmetyczna została obliczona jako:

(Rs 70 + 50 + 100 + 90 + 50) ÷ 5 = R 76

Średnia geometryczna (GM) Średnia geometryczna grupy obserwacji jest zdefiniowana jako n-ty pierwiastek iloczynu wszystkich obserwacji. Załóżmy, że obserwacje to x ₁, x ₂, x ₃, ..., x _n .

GM można obliczyć jako:

Można to obliczyć za pomocą tabeli logów.

Tryb:

Tryb definiowany jest jako wartość zmiennych lub obserwacji, które występują najczęściej. Na przykład, jeśli obserwacje mają wartość -2, 9, 6, 2, 8, 2, 2, 7, 2 i 3, wówczas widoczny jest tryb 2, który wystąpił dla maksymalnej liczby razy, tj. 5 czasy.

Mediana:

Mediana jest wartością najbardziej środkowej zmiennej, gdy obserwacje są ułożone w porządku rosnącym lub malejącym. Jest oczywiste, że połowa wartości będzie mniejsza niż mediana, a połowa wartości będzie większa. Zatem, jeśli obserwacje wynoszą 3, 9, 6, 4, 5, 7 i 10, a następnie uporządkuje wartości w porządku rosnącym 3, 4, 5, 6, 7, 9 i 10, wartość mediana jest uważana za 4. obserwacja i jest równa 6.

Jeśli jednak liczba obserwacji jest parzysta, są dwie średnie wartości i zwykle przyjmuje się średnią arytmetyczną z tych dwóch wartości. Na przykład, jeśli obserwacja 10 zostanie pominięta w powyższych zmiennych, istnieją dwie najbardziej wartościowe wartości 5 i 6, a mediana wynosi 5 + 6 ÷ 2 = 5, 5.

Inne ważne narzędzia statystyczne do pomiaru i analizy danych oraz element zmienności w nich zawarte obejmują obliczanie (i) zakresu, (ii) zakresu pół-kwartylnego, (iii) średniego bezwzględnego odchylenia, (iv) odchylenia standardowego, (v) ) Rozkład częstotliwości (zarówno symetryczny, jak i asymetryczny).

Rozkład symetryczny charakteryzuje się istnieniem linii symetrii, która dzieli histogram na dwie części, a jedna część jest lustrzanym odbiciem drugiej. Jednak większość dystrybucji w handlu i ekonomii nie jest tego typu. Asymetryczne rozkłady są również nazywane rozkładami skośnymi. Skośność oznacza brak symetrii, a wypaczone rozkłady charakteryzują się dłuższym ogonem po jednej stronie histogramu.

Mierzenie zmienności:

Środki arytmetyczne i geometryczne lub Mediany służą jako podstawa do porównania dwóch lub więcej populacji lub obserwacji. Ale inne mierniki zmienności lub odchylenia są również ważne w wyrażaniu stopnia, w jakim obserwacje różnią się od siebie. W statystyce dyspersja jest synonimem zmienności lub odchylenia.

Poniżej przedstawiono ważne miary zmienności:

Zasięg:

Różnica między największą i najmniejszą wartością zestawu obserwacji nazywa się "zakresem".

Zakres kwartylowy pół-inter :

Różnica między wartością obserwacji w drugim i trzecim kwartylu nazywana jest zakresem pół-kwartylnym. Eliminuje to wpływ bardzo małych i bardzo wysokich wartości obserwacji, których jest niewiele.

Średnie odchylenie bezwzględne:

Średnie bezwzględne odchylenie oznacza zmienność obserwacji od średniej arytmetycznej z obserwacji.

Przykład: Obserwacje to x ₁, x ₂ ... x _n, a średnia arytmetyczna to x.

Formuła to:

i stąd średnia jest

Ale Σ (x ₁ - x̅) = 0, jakakolwiek jest wartość x ₁, x ₂, ... .x _n

Dlatego też formuła Σ (xi - x̅) nie może być stosowana jako miara zmienności. Trudności tej można uniknąć, jeśli znaki (+ lub -) są ignorowane. Jest to logiczne, ponieważ znak szczególnego odchylenia xi - x̅ wskazuje jedynie, czy obserwacja x _i, jest po lewej stronie x lub po jego prawej stronie, a to nie ma znaczenia przy obliczaniu odchyleń od punktu centralnego (x), o każdej obserwacji.

Odchylenie standardowe:

Odchylenie obserwacji od ich średniej arytmetycznej (x̅) może być dodatnie (+) lub ujemne (-). W statystykach, oznaki odchyleń od średniej arytmetycznej wskazują tylko kierunek obserwacji z centralnej tendencji (x̅), a zatem są ignorowane. Można również uniknąć ujemnych (-) znaków między odchyleniem od x, jeśli zamiast przyjmować wartości bezwzględne, kwadraty odchyleń są przyjmowane w następujący sposób:

Ponieważ miara zmienności powinna być w tej samej jednostce, co oryginalne obserwacje, odchylenie standardowe jest obliczane według następującego wzoru:

Dla rozkładu częstotliwości, przy x ₁ x ₂, ..., x _n jako środkowych wartościach klas i f ₁ f ₂, ..., f _n jako częstotliwościach, odchylenie standardowe (SD) oblicza się przez następujące ulepszenie powyższy wzór:

Odchylenie standardowe jest zdecydowanie najszerzej stosowaną miarą zmienności w statystykach. Ma wiele właściwości, które sprawiają, że jest to najbardziej preferowany miernik problemów statystycznych.

Przykład:

Poziomy IQ pięciu studentów Business Management są następujące:

dlatego odchylenie standardowe wynosi: 13, 22

13.22 to odchylenie standardowe wyrażone w tych samych jednostkach, co same obserwacje. Wartość 13.22 jest punktem na tej samej skali liczbowej.

Powyższe odchylenie standardowe zostało opracowane na podstawie zróżnicowania populacji 5 uczniów. Jednak w praktyce odchylenie standardowe często nie może być obliczane na podstawie populacji, ponieważ w większości przypadków populacja jest tak duża, że zwykle próbka jest pobierana w celu obliczenia odchylenia.

W przypadku danych próbki zmienność mierzy się za pomocą wariancji próbki, a odchylenie standardowe oblicza się, stosując następujący wzór:

Należy zauważyć, że ponieważ użyto danych próby, "n" oznacza wielkość próby w miejsce "N", które oznacza populację.

Pojęcie prawdopodobieństwa:

Często w naszym codziennym życiu przewidujemy pewne przyszłe wydarzenia z takimi słowami, jak - prawdopodobnie to się stanie ", " prawdopodobieństwo tego jest bardzo wysokie "lub" nastąpi to z dużym prawdopodobieństwem ", z pewną dozą niejasności w takich przypadkach. sprawozdania. Stwierdzenia te są w dużym stopniu subiektywne i zależą głównie od naszej zdolności do analizowania podobnych sytuacji w przeszłości. Znaczenie pojęcia prawdopodobieństwa zdarzenia i niektórych metod jego pomiaru za pomocą narzędzi statystycznych jest ogromne dla banków komercyjnych.

Udzielając pożyczki klientowi, bankowiec chciałby poznać prawdopodobieństwo niewykonania zobowiązania przez wspomnianego klienta, które jest mierzone na podstawie badania prawdopodobieństwa z wykorzystaniem obliczeń statystycznych. Chociaż dość trudno jest zdefiniować prawdopodobieństwo na poziomie elementarnym, można dokonać wysiłku, aby przewidzieć to samo, stosując techniki losowego eksperymentowania i definicji częstotliwości.

Losowy eksperyment oznacza eksperyment, którego wszystkie możliwe wyniki są znane i które można powtórzyć w identycznych warunkach, ale dokładne przewidzenie wyniku jest niemożliwe. Cenę towaru w różne dni można traktować jako wyniki losowego eksperymentu. Wyniki będą zwykle oznaczane jako E ₁, E ₂, E ₃ ..., E _n i przyjmuje się, że są one skończone pod względem liczby.

Rozkład częstotliwości:

Jeśli wynik E ₁ wystąpi r razy, gdy eksperyment losowy zostanie powtórzony n razy, wówczas prawdopodobieństwo E ₁ jest określone przez stosunek "r / n", ponieważ liczba powtórzeń jest zwiększana w nieskończoność. Tak więc prawdopodobieństwo jest zdefiniowane jako granica względnej częstotliwości, gdy eksperyment jest powtarzany nieskończoną liczbę razy.

Szereg czasowy:

Seria obserwacji w różnych punktach czasu na zmiennej - która jest zależna od czasu - stanowi szereg czasowy. Tak więc, taka seria obserwacji daje zmiany lub zmiany wielkości w pewnym okresie czasu i często nazywane są danymi historycznymi lub chronologicznymi. W przypadku tego typu danych jedną ze zmiennych jest czas reprezentowany przez "t", a drugi, który jest zależny od czasu, jest reprezentowany przez "Yt."

Na przykład, plony w różnych porach roku, produkcja stali w różnych miesiącach, kwartalny wywóz herbaty, sprzedaż lodów w różnych miesiącach roku, itp. Wszystkie powyższe przykłady odnoszą się do niektórych działań gospodarczych lub biznesowych, a seria obserwacji tych zmiennych jest zwykle nazywana danymi ekonomicznych szeregów czasowych. Innym przykładem danych z szeregów czasowych są opady w calach w różne dni w roku.

Zatem oczywiste jest, że każda zmienna, która zależy od czasu, tworzy dane szeregów czasowych. Cenne wnioski wyciągnięte przez zainteresowane strony, takie jak społeczność biznesowa, bankierzy, przemysłowcy itp., Z szeregu czasowego prowadzą do pomiaru trendów na podstawie danych, które znacząco wpływają na ich decyzje.