Optymalna próbka: definicja i czynniki

Po przeczytaniu tego artykułu dowiesz się o definicji i czynnikach wpływających na optymalną próbkę do badania.

Definicja optymalnej próbki:

Optymalna próbka do badania może być zdefiniowana jako próbka, która spełnia wymagania wydajności, reprezentatywności, niezawodności i elastyczności. Oznacza to, że próbka powinna być na tyle mała, aby uniknąć niepotrzebnych kosztów i wystarczająco duża, aby pomóc badaczowi uniknąć błędu próbki poza granicę tolerancji.

Powinien być wystarczająco duży, aby uzyskać statystycznie reprezentatywne i znaczące wyniki we wszystkich tabelach importu, ale nie musi być na tyle duży, aby doprowadzić do marnotrawstwa środków, opóźnienia projektu i osiągnięcia niepotrzebnie wysokiej precyzji. Próbka powinna dostarczyć pożądanych oszacowań z wymaganym poziomem niezawodności przy minimalnym koszcie.

Należy pamiętać, że w praktyce wydajne pobieranie próbek obejmuje wykorzystywanie w pełni dostępnych zasobów pod względem techniki i organizacji danych statystycznych oraz dostosowywanie, w możliwie jak największym stopniu, ograniczeń czasu, funduszy i personelu, pierwotnie nałożonych na badanie.

Ponadto w niektórych przypadkach powinno być możliwe rozszerzenie lub zawężenie wielkości próby w celu spełnienia nieprzewidzianych wymogów pojawiających się w trakcie badania. W niektórych sytuacjach niezawodność i wydajność można poprawić, wprowadzając pożądane zmiany w wielkości próbki.

Na poziomie praktyki można osiągnąć te ideały, ale rzadko się je realizuje i dlatego nie można oczekiwać, że wybiorą prawidłową wielkość próby.

Czynniki wpływające na optymalną próbkę:

Wybór wielkości próbki dla danego badania zależy od kilku czynników. Czynniki te są ze sobą powiązane i różnią się znacznie w różnych badaniach w odniesieniu do ich względnego znaczenia przy określaniu wielkości próby.

(1) Natura populacji (jednorodna homogeniczna):

Wielkość próbki w badaniu zależeć będzie od stopnia homogeniczności populacji. Im bardziej jednorodna jest populacja, tym mniej przypadków jest wymaganych, aby uzyskać wiarygodną próbkę, i odwrotnie, im bardziej heterogeniczna jest populacja, tym więcej przypadków musi stanowić wiarygodną jej próbkę.

Wielkość próbki wymaganej do zadowalającego badania heterogenicznej populacji można zmniejszyć, klasyfikując populację w warstwach. Niektóre z tych warstw będą bardziej jednorodne, a inne mniej. Bardziej homogeniczne warstwy mogą być reprezentowane przez mniejsze próbki niż te o stosunkowo niejednorodnej strukturze.

Dzieje się tak dlatego, że im bardziej jednorodna jest warstwa, tym lepsza może być losowa próbka o danym rozmiarze, tj. Bardziej podobne będą przypadki w próbce, a więc mniej zmienna ich średnia.

(2) Złożoność tabeli:

Podejmując decyzję o wielkości próby, należy również wziąć pod uwagę liczbę kategorii i klas, w których wyniki mają być grupowane i analizowane. Im większa liczba kategorii, tym większa będzie ogólna próba potrzebna do uzyskania wiarygodnych miar statystycznych.

Nawet jeśli próbka może wydawać się odpowiednia dla głównego zestawienia, liczba ta prawdopodobnie bardzo szybko spadnie, gdy przygotowywane są szczegółowe tabulacje.

Na przykład próba 1000 uczniów może wydawać się odpowiednią liczbą dla ankiety mającej na celu określenie odsetka studentów sprzyjających koedukacji. Powiedzmy, że tylko 25% jest za (250 studentów).

Gdyby badacz chciał pójść dalej i poznać typ studentów, którzy faworyzowali koedukację, musiałby jeszcze bardziej sklasyfikować tych respondentów, na takich wymiarach, czy mieli wcześniejszy kontakt z instytucją koedukacyjną? Z jakiej klasy społecznej pochodzą? Jakie mają pochodzenie rodzinne? Jaki był charakter ich doświadczenia (jeśli w ogóle) instytucji koedukacyjnej? I tak dalej.

Postępując w ten sposób, badacz może ostatecznie znaleźć tylko 10 lub 15 przypadków określonego typu (tj. Bez wcześniejszego doświadczenia w zakresie koedukacji, klasy średniej, ortodoksyjnego pochodzenia rodzinnego itp.). Taka próbka może dostarczyć tylko bardzo, kruchych podstaw do uzyskania znaczących i możliwych do uogólnienia wniosków na temat związku między zmiennymi.

Rozmiar wybranej próbki powinien być wystarczająco duży, aby zapewnić wiarygodne pomiary najmniejszych ważnych kategorii. Kiedy dane są podzielone na mniejsze i mniejsze podklasy, liczba przypadków przypadających na różne komórki szybko staje się tak mała, że ​​miara statystyczna obliczona na podstawie wpisów komórek prawdopodobnie nie będzie wiarygodna.

Zatem intensywność zestawiania jest czynnikiem, który ma znaczenie dla decyzji odnoszącej się do wielkości próby.

(3) Problemy związane ze zbieraniem danych:

Zazwyczaj wielkość próby musi być utrzymywana w granicach liczbowych przypadków, które można zabezpieczyć za pomocą danych środków i czasu. Na wielkość danych wpływa długość kwestionariusza / harmonogramu, liczba pracowników terenowych, rozproszenie lub koncentracja przypadków na obszarze geograficznym, wskaźnik odmowy, utrata spraw, rodzaj wykorzystywanego próbkowania i wreszcie, metoda gromadzenia danych.

Koszty transportu związane z dotarciem z jednego adresu do drugiego i oddzwanianiem (drugie lub trzecie połączenie) muszą być brane pod uwagę przy podejmowaniu decyzji o wielkości próby. Planując wielkość próbki, badacz musi zawsze przewidywać, że może nie być w stanie zgromadzić liczby przeznaczonej do przesłuchania.

Ludzie migrują, umierają, nie są w stanie przekazywać informacji z powodu choroby, na wakacjach lub w interesach, nie mogą się znajdować, odmawiać odpowiedzi, adresy okazują się błędne, i tak dalej.

Dobrze jest planować uzyskiwanie informacji z każdego przypadku w próbie, jeśli jest to możliwe z ludzkiego punktu widzenia. Oznacza to, że wymagane będzie znacznie więcej czasu niż to, co byłoby wymagane, gdyby uzyskano tylko dostępne i kooperatywne przypadki. Jednak lepiej jest mieć mniejszą próbkę bez uprzedzeń niż duża próbka, która prawdopodobnie będzie niereprezentatywna dla wszechświata z powodu tendencyjności.

(4) Rodzaj pobierania próbek:

Ogólnie rzecz biorąc, mniejsza ilość próbki wystarczy, gdy stosuje się stratyfikację. Dzieje się tak dlatego, że efekt rozwarstwienia polega na rozwiązaniu stosunkowo heterogenicznej całości na wiele indywidualnie homogenicznych pod-próbek. Im bardziej heterogeniczna jest populacja, tym większa jest ekonomiczność przypadków dzięki rozwarstwianiu.

Podczas pobierania próbek zwanego podwójnym próbkowaniem badacz łączy dużą próbkę losową (w celu zebrania kilku podstawowych informacji) z bardzo małą kontrolowaną lub podzieloną próbką (z której zabezpieczone są szczegółowe lub skomplikowane informacje).

Wymaga się tutaj, aby wielkość próbki losowej była wystarczająco duża, aby uzyskać wiarygodne wagi dla różnych warstw. Sama warstwowa próbka pobiera mniej przypadków w porównaniu z prostą próbą losową, ponieważ próbka w każdej warstwie musi być reprezentatywna dla tej warstwy, a nie dla "wszechświata".

Ważnym czynnikiem przy określaniu wymaganej liczby przypadków jest wielkość jednostek próbkowania. W rzeczywistości, im większa jednostka próbkowania, tym większa liczba przypadków, które będą potrzebne do indywidualnego zestawiania.