8 Ważne typy prób probabilistycznych

Ten artykuł rzuca światło na osiem ważnych typów prób probabilistycznych wykorzystywanych do prowadzenia badań społecznych. Rodzaje to: 1. Proste losowe pobieranie próbek 2. Systematyczne pobieranie próbek 3. Uwarunkowane losowe pobieranie próbek 4. Proporcjonalne próbki warstwowe 5. Nieproporcjonalne próbki warstwowe 6. Optymalna próbka przydziału 7. Próbkowanie klastra 8. Pobieranie próbek wielofazowych.

Wpisz # 1. Proste losowe pobieranie próbek:

Proste losowe pobieranie próbek jest w pewnym sensie podstawowym tematem całego próbkowania naukowego. Jest to podstawowy projekt próbkowania prawdopodobieństwa. Rzeczywiście, wszystkie inne metody próbkowania naukowego są odmianami prostego losowego próbkowania. Zrozumienie dowolnej wyrafinowanej lub złożonej różnorodności procedury pobierania próbek zakłada zrozumienie prostego losowego próbkowania.

Prosta losowa próbka jest wybierana w procesie, który nie tylko daje każdemu elementowi w populacji równe szanse włączenia do próbki, ale także sprawia, że ​​wybór każdej możliwej kombinacji przypadków w pożądanym rozmiarze próbki jest równie prawdopodobny. Załóżmy na przykład, że mamy populację sześciorga dzieci, a mianowicie: A, B, C, D, E i F.

Możliwe są następujące kombinacje przypadków, z których każda ma dwa elementy z tej populacji, a mianowicie. AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF i EF, tj. We wszystkich 15 kombinacjach.

Jeśli napiszemy każdą kombinację na kartach o jednakowej wielkości, włożymy karty do kosza, dokładnie je wymieszamy i niech osoba z zasłoniętymi oczami wybierze jedną, każda z kart będzie miała taką samą szansę na wybranie / uwzględnienie w próbce.

Dwa przypadki (para) zapisane na karcie pobranej przez osobę z zawiniętym w ten sposób, będą stanowić pożądaną prostą próbkę losową. Jeśli chce się wybrać proste losowe próbki trzech przypadków z powyższej populacji sześciu przypadków, możliwe próbki, każdy z trzech przypadków, będą: ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF i DEF, czyli w sumie 20 kombinacji.

Każda z tych kombinacji będzie miała równe szanse wyboru w próbce. Za pomocą tej samej metody można wybrać prostą losową próbkę czterech przypadków z tej populacji.

W zasadzie można użyć tej metody do wybierania losowych próbek o dowolnej wielkości z populacji. Jednak w praktyce byłoby bardzo niewygodnym, aw niektórych przypadkach niemożliwym zadaniem byłoby wyszczególnienie wszystkich możliwych kombinacji pożądanej liczby przypadków. Ten sam wynik można uzyskać, wybierając poszczególne elementy, jeden po drugim, za pomocą powyższej metody (loteria) lub używając książki liczb losowych.

Książka tabel zawierająca listę liczb losowych jest nazwana po Teppet, która jako pierwsza tłumaczyła pojęcie losowości w książkę liczb losowych.

Książka ta jest przygotowywana według bardzo skomplikowanej procedury w taki sposób, że liczby nie wykazują żadnego dowodu systematycznego porządku, to znaczy nikt nie może oszacować liczby następnej, na podstawie poprzedniej liczby i na odwrót. Omówmy dwie metody losowania prostej losowej próbki.

Metoda loterii:

Ta metoda obejmuje następujące kroki:

(a) Każdemu członkowi lub elementowi w "populacji" przypisany jest unikalny numer. Oznacza to, że żaden z dwóch członków nie ma tego samego numeru,

(b) Każda liczba jest zapisana na osobnej karcie lub chipie. Każdy chip lub karta powinna być podobna do wszystkich innych pod względem wagi, rozmiaru i kształtu itp.

(c) Karty lub żetony są umieszczane w misce i dokładnie wymieszane,

(d) Osoba w ciemno złożona jest proszona o odebranie dowolnego żetonu lub karty z miski.

W tych okolicznościach można oczekiwać, że prawdopodobieństwo wylosowania jednej karty będzie takie samo, jak prawdopodobieństwo wylosowania innej karty. Ponieważ każda karta reprezentuje członka populacji, prawdopodobieństwo wyboru każdej z nich byłoby dokładnie takie samo.

Jeśli po wybraniu karty (chip) została ona wymieniona w misce, a zawartość ponownie dokładnie wymieszana, każdy żeton miałby takie samo prawdopodobieństwo wyboru na drugim, czwartym lub n-tym rysunku. Taka procedura ostatecznie dałaby prostą losową próbkę.

Wybieranie próbki za pomocą losowych liczb :

Powiedzieliśmy już, jakie są liczby losowe. Liczby te pomagają uniknąć wszelkiego uprzedzenia (nierównych szans) na elementy obejmujące populację, które są uwzględniane w próbce przy doborze próby.

Te losowe liczby są tak przygotowane, że spełniają matematyczne kryterium całkowitej losowości. Każda standardowa książka statystyczna zawiera kilka stron liczb losowych. Liczby te są zazwyczaj wymienione w kolumnach na kolejnych stronach.

Poniżej znajduje się część zbioru liczb losowych:

Korzystanie z tabel liczb losowych obejmuje następujące kroki:

(a) Każdemu członkowi populacji przypisany jest unikalny numer. Na przykład jeden członek może mieć numer 77 i kolejne 83 itd.

(b) Tabela liczb losowych jest wprowadzana w pewnym losowym punkcie (ze ślepym znaczkiem na dowolnej stronie księgi tabel), a przypadki, których liczby pojawiają się jako jeden ruch od tego punktu w dół kolumny, są uwzględniane w próbce do momentu uzyskuje się pożądaną liczbę przypadków.

Załóżmy, że nasza populacja składa się z pięciuset elementów i chcemy pobrać pięćdziesiąt próbek jako próbkę. Załóżmy, że używamy ostatnich trzech cyfr w każdej liczbie pięciu cyfr (ponieważ rozmiar wszechświata wynosi 500, tj. Trzy cyfry).

Przechodzimy w dół kolumny zaczynając od 42827; ale ponieważ zdecydowaliśmy się użyć tylko trzech cyfr (powiedzmy ostatnie trzy), zaczynamy od 827 (ignorując pierwsze dwie cyfry). Teraz zanotujemy każdą liczbę poniżej 501 (ponieważ populacja wynosi 500).

Próbka będzie składać się z elementów populacji o liczbach odpowiadających wybranym. Zatrzymujemy się po wybraniu 50 wybranych przez nas elementów. Na podstawie powyższej części tabeli wybieramy 12 liczb odpowiadających wybranym. Wybieramy 12 przypadków odpowiadających numerom 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Charakterystyka prostej próbki losowej:

Zaczniemy od rozważenia jednej bardzo ważnej właściwości prostych próbek losowych; dlatego, że im większa jest wielkość próbki, tym bardziej prawdopodobne jest, że jej średnia (średnia wartość) będzie zbliżona do średniej "populacji", tj. wartości rzeczywistej. Zilustrujmy tę właściwość, zakładając populację składającą się z sześciu członków (dzieci).

Niech wiek tych dzieci będzie wynosił odpowiednio: A = 2 lata, B = 3 lata, C = 4 lata, D = 6 lat, E = 9 lat i F = 12 lat. Wylosujmy losowo próbki z jednego, dwóch, trzech czterech i pięciu członków z tej populacji i zobaczmy, jak w każdym przypadku średnie próbki (średnie) zachowują się w odniesieniu do rzeczywistej średniej "populacji" (tj. 2 + 3 + 4 + 6 + 9 + 12 = 36/6 = 6). Poniższa tabela ilustruje zachowanie środków próbki jako powiązane z rozmiarem próbki.

Tabela przedstawiająca możliwe próbki jednego, dwóch, trzech, czterech i pięciu elementów (dzieci, odpowiednio z sześciorga dzieci w wieku 2, 3, 4, 6, 9 i 12 lat):

W podanej tabeli pokazane są wszystkie możliwe próbki losowe o różnych rozmiarach (tj. 1, 2, 3, 4 i 5) i odpowiadające im środki. Prawdziwa (populacja) średnia wynosi 6 lat. Średnią tę można oczywiście obliczyć, sumując wartości średnie całkowitych kombinacji elementów w populacji dla dowolnej wielkości próbki.

W tabeli widzimy na przykład, że dla wielkości próby trzech elementów istnieje 20 możliwych kombinacji elementów, przy czym każda kombinacja ma taką samą szansę na wybranie jako próbki zgodnie z zasadą prawdopodobieństwa.

Dodając średnie wartości tych możliwych kombinacji przedstawione w tabeli, otrzymujemy łączny wynik 120. Średnia będzie wynosić 120 ÷ 20 = 6, co jest również oczywiście średnią populacyjną. Jest to dobre także dla innych kolumn.

Przyjrzyjmy się teraz uważnie tabeli. Przekonamy się, że dla próbek po jednym elemencie każdy (kolumna A) jest tylko jedna wartość średnia, która nie odbiega o więcej niż 1 jednostkę od rzeczywistej średniej populacji wynoszącej 6 lat. Oznacza to, że wszystkie inne, tj. 2, 3, 4, 9 i 12, odbiegają o więcej niż jedną jednostkę od średniej populacji, tj. 6. Gdy zwiększamy rozmiar próbki, np. W kolumnie B, gdzie wielkość próby wynosi 2, znajdujemy większy odsetek średnich (średnich), które nie odbiegają od średniej populacji o więcej niż 1 jednostkę.

Powyższa tabela pokazuje, że dla próbki dwóch istnieje 15 możliwych kombinacji, a zatem 15 możliwych środków. Spośród tych 15 środków jest 5 środków, które nie odbiegają od średniej populacji o więcej niż 1 jednostkę.

Oznacza to, że 33% próbek stanowią bliskie średniej populacji w jednostkach +1 i -1. W kolumnie C tabeli widzimy, że istnieje 20 możliwych kombinacji elementów dla wielkości próbki trzech elementów, z których każdy.

Spośród 20 możliwych próbek, okazuje się, że 10, tj. 50% nie odstaje od średniej populacji o więcej niż 1 jednostkę. Dla wielkości próby czterech elementów 67% średnich mieści się w przedziale +1 i -1 jednostki od średniej rzeczywistej (populacyjnej).

Wreszcie, w przypadku próby pięciu elementów, istnieje znacznie więcej, tj. 83% takich środków lub szacunków. Lekcja wypływająca z naszych obserwacji jest dość jasna, a mianowicie, im większa jest próba, tym bardziej prawdopodobne jest, że jej średnia będzie zbliżona do średniej populacji.

Jest to to samo, co powiedzenie, że rozproszenie szacunków (średnich) maleje wraz ze wzrostem wielkości próby. Możemy to wyraźnie zobaczyć w powyższej tabeli. Dla wielkości próby jednej (kolumna A) zakres średnich jest największy, tj. Pomiędzy 2 a 12 = 10. Dla próbki o wielkości dwóch zakres wynosi od 2, 5 do 10, 5 = 8.

Dla próbki o wielkości trzech, czterech i pięciu, zakres zmienności średnich wynosi odpowiednio 3 do 9 = 6, 3, 8 do 7, 8 = 4 i 4, 8 do 6, 8 = 2. Widać również z tabeli, że im więcej próbek średnia różni się od populacji - tym rzadziej jest prawdopodobne, że wystąpi.

Możemy opisać to zjawisko w odniesieniu do prostego losowego próbkowania wyraźnie za pomocą szeregu krzywych pokazujących związek między zmiennością szacunków a wielkością próbki. Rozważmy dużą populację mieszkańców. Można sobie wyobrazić, że ich wiek będzie wynosił od poniżej 1 roku (co najmniej) do ponad 80 lat (co najwyżej).

Normalne i uzasadnione oczekiwanie polega na tym, że są mniejsze przypadki, gdy zbliżamy się do skrajności, a liczba przypadków wzrasta progresywnie i symetrycznie, gdy oddalamy się od tych skrajności.

Średni wiek populacji wynosi, powiedzmy, 40 lat. Taki rozkład rezydentów można przedstawić za pomocą krzywej zwanej normalną lub dzwonkowatą (A na poniższym diagramie). Załóżmy teraz, że pobieramy z tej populacji różne losowe próbki o różnych rozmiarach, np. 10, 100 i 10 000. Dla dowolnej wielkości próbki otrzymamy bardzo dużą liczbę próbek z populacji.

Każda z tych próbek da nam szczególne oszacowanie średniej populacji. Niektóre z tych środków będą nadmiernymi szacunkami i pewnymi niedostatecznymi szacunkami charakterystycznymi dla populacji (średnia lub średnia wieku). Niektóre środki będą mu bardzo bliskie, całkiem sporo daleko.

Jeśli wykreślimy takie próbki dla określonej wielkości próbki i połączymy te punkty, w każdym przypadku otrzymamy krzywą normalną. Różne normalne krzywe będą zatem reprezentować wartości próbek dla próbek o różnych rozmiarach.

Powyższy diagram przybliża obraz sposobu, w jaki środki próbki będą zachowywać się względem wielkości próbki. Krzywa A reprezentuje lokalizacje wieków pojedynczych osób. Szacowane średnie dla próbek po 10 osobników, z krzywej B, która wykazuje dość szeroką dyspersję od rzeczywistej populacji - średnio 40 lat).

Każdy z próbek po 100 osobników tworzy normalną krzywą C, która wykazuje znacznie mniejsze odchylenie od średniej populacji. Wreszcie środki próbek o wartości 10 000 od krzywej, która jest prawie w przybliżeniu zbliżona do linii pionowej odpowiadającej średniej populacji. Odchylenie wartości reprezentujących krzywą D od średniej populacji byłoby nieistotne, co wyraźnie wynika z diagramu.

Z powyższego rysunku można również łatwo wywnioskować, że dla próbek o dowolnym rozmiarze najbardziej prawdopodobną średnią próbki jest średnia dla populacji. Kolejne najprawdopodobniej są wartościami średnimi zbliżonymi do średniej populacji.

W związku z tym możemy stwierdzić, że im więcej średnia próbki odejdzie od średniej populacji, tym mniej prawdopodobne jest wystąpienie. I wreszcie, widzimy również, co już powiedzieliśmy o zachowaniu próbek, a mianowicie, im większa jest próba, tym bardziej prawdopodobne jest, że jej średnia będzie bliska średniej populacji.

To właśnie takie zachowanie ze strony prostych losowych (prawdopodobieństwa) próbek w odniesieniu do średniej, jak również proporcji i innych rodzajów statystyk, pozwala nam oszacować nie tylko charakterystykę populacji (np. średnia), ale także prawdopodobieństwo, że próbka będzie różnić się od rzeczywistej wartości populacji o pewną określoną ilość.

Jedną z typowych cech prostego losowego pobierania próbek jest to, że gdy populacja jest duża w porównaniu do wielkości próby (np. Więcej niż, powiedzmy, dziesięciokrotnie większa), na zmienność rozkładów pobierania próbek wpływa większa liczba bezwzględnych przypadków w niż w proporcji populacji objętej próbą.

Innymi słowy, wielkość błędów, które mogą powstać w wyniku próbkowania, zależy bardziej od bezwzględnej wielkości próbki, niż od proporcji, jaką ma do populacji, to znaczy od tego, jak duża lub jak mała jest część populacja.

Im większa jest wielkość próby losowej, tym większe jest prawdopodobieństwo, że da ona dość dobre oszacowanie charakterystyki populacji niezależnie od jej proporcji w stosunku do populacji.

Tak więc oszacowanie popularnego głosowania w krajowym plebiscycie, w granicach dopuszczalnego marginesu błędu, nie wymagałoby znacznie większej próbki niż ta, która byłaby wymagana do oszacowania liczby ludności w danej prowincji, gdzie wynik sondażu jest wątpliwe.

Aby rozwinąć ten punkt, próbka 500 (próbka 100%) da doskonałą dokładność, jeśli społeczność liczy tylko 500 mieszkańców. Próbka 500 da nieco większą dokładność w przypadku 1000 mieszkańców, niż w mieście liczącym 10 000 mieszkańców. Ale poza punktem, w którym próbka jest dużą częścią "wszechświata", nie ma znaczącej różnicy w dokładności wraz ze wzrostem rozmiaru "wszechświata".

Dla każdego poziomu dokładności, identyczne wielkości próbek dawałyby taki sam poziom dokładności dla społeczności różnej populacji, np. Od 10 000 do 10 milionów. Stosunek wielkości próby do populacji tych społeczności nic nie znaczy, chociaż wydaje się to ważne, jeśli postępujemy intuicyjnie.

Typ # 2. Systematyczne pobieranie próbek:

Ten typ pobierania próbek jest dla wszystkich praktycznych zastosowań przybliżeniem prostego losowego próbkowania. Wymaga to, aby populacja mogła być jednoznacznie zidentyfikowana przez jego kolejność. Na przykład mieszkańcy danej społeczności mogą być wymienieni, a ich nazwy uporządkowane alfabetycznie. Każdej z tych nazw można nadać niepowtarzalny numer. Taki wskaźnik nazywany jest "ramą" danej populacji.

Załóżmy, że ta ramka składa się z 1000 członków, każdy z unikalnym numerem, tj. Od 1 do 1000. Powiedzmy, że chcemy wybrać próbkę 100. Możemy zacząć od wybrania dowolnej liczby od 1 do 10 (włącznie). Załóżmy, że dokonujemy losowego wyboru, wpisując listę i otrzymując 7.

Następnie wybieramy członków; począwszy od 7, z regularnym odstępem 10. Wybrany do wyboru członków: począwszy od regularnego odstępu 10. Wybrana próbka składałaby się zatem z elementów o numerach 7, 17, 27, 37, 47, ... 977, 987, 997. Te elementy razem stanowiłyby próbkę systematyczną.

Należy pamiętać, że próbkę systematyczną można uznać za próbkę prawdopodobieństwa tylko wtedy, gdy pierwszy przypadek (np. 7) został wybrany losowo, a następnie nawet dziesiąty przypadek z ramki został wybrany później.

Jeśli pierwszy przypadek nie zostanie wybrany losowo, wynikowa próbka nie będzie próbą prawdopodobieństwa, ponieważ, z natury rzeczy, większość przypadków, które nie znajdują się w odległości dziesięciu od początkowo wybranego numeru, będzie miała zero (0) ) prawdopodobieństwo włączenia do próby.

Należy zauważyć, że przy systematycznym pobieraniu próbek, gdy pierwszy przypadek jest losowany, nie ma z góry żadnego ograniczenia szansy na uwzględnienie danego przypadku w próbie. Ale gdy pierwszy przypadek zostanie wybrany, szanse na kolejne przypadki będą miały decydujący wpływ lub zostaną zmienione. W powyższym przykładzie przypadki inne niż 17, 27, 37, 47 ... itd. Nie mają szansy na włączenie do próby.

Oznacza to, że systematyczny plan próbkowania nie pozwala na wszystkie możliwe kombinacje przypadków, taką samą szansę na uwzględnienie w próbie.

Zatem wyniki mogą być całkiem nieuczciwe, jeśli przypadki na liście są uporządkowane w jakiejś cyklicznej kolejności lub jeśli populacja nie jest dokładnie zmieszana w odniesieniu do badanych cech (np. Dochodu lub godzin nauki), tj. W pewnym sensie że każdy z dziesięciu członków miał równą szansę na wybór.

Typ # 3. Losowe próbkowanie warstwowe:

W stratyfikowanym losowym próbkowaniu populacja jest najpierw podzielona na kilka warstw. Warstwy takie mogą opierać się na jednym kryterium, np. Poziomie wykształcenia, dając liczbę warstw odpowiadających różnym poziomom wykształcenia) lub kombinacji dwóch lub więcej kryteriów (np. Wieku i płci), tworząc warstwy takie jak mężczyźni pod 30 lat i mężczyźni powyżej 30 lat, kobiety poniżej 30 lat i kobiety powyżej 30 lat.

W stratyfikowanym losowym próbkowaniu pobiera się prostą losową próbkę z każdej z warstw i takie podpróbki są łączone w celu utworzenia całkowitej próbki.

Ogólnie rzecz biorąc, rozwarstwienie wszechświata w celu pobierania próbek przyczynia się do skuteczności pobierania próbek, jeśli ustanawia klasy, to znaczy, jeśli może podzielić populację na klasy członków lub elementy, które są wewnętrznie stosunkowo homogeniczne i względne względem siebie, heterogeniczne., w odniesieniu do badanych cech. Załóżmy, że wiek i płeć stanowią dwie potencjalne podstawy stratyfikacji.

Teraz powinniśmy uznać, że stratyfikacja na podstawie płci (mężczyzna / kobieta) daje dwie warstwy, które różnią się znacznie od siebie pod względem wyników w innych istotnych badanych cechach, podczas gdy z drugiej strony wiek jako podstawa stratyfikacji nie warstwy plonu, które zasadniczo różnią się od siebie pod względem wyników na innych istotnych cechach, wówczas wskazane jest, aby stratyfikować populację na podstawie płci, a nie wieku.

Innymi słowy, kryterium płci będzie bardziej skuteczną podstawą stratyfikacji w tym przypadku. Jest całkiem możliwe, że proces podziału populacji na warstwy, które są wewnętrznie jednorodne i względnie niejednorodne pod względem pewnych istotnych cech, jest zbyt kosztowny.

W takiej sytuacji badacz może wybrać dużą prostą próbkę losową i nadrobić wysokie koszty, zwiększając (poprzez dużą, prostą próbkę losową) całkowitą wielkość próbki i unikając zagrożeń związanych z rozwarstwieniem.

Należy jasno zrozumieć, że stratyfikacja prawie nie ma nic wspólnego z uczynieniem próbki repliką populacji.

W rzeczywistości kwestie związane z podjęciem decyzji o tym, czy stratyfikacja ma zostać dokonana, są przede wszystkim związane z przewidywaną jednorodnością zdefiniowanych warstw w odniesieniu do badanych cech i kosztów porównawczych różnych metod osiągania precyzji. Uwarstwione losowe pobieranie próbek, takie jak proste losowe pobieranie próbek, obejmuje reprezentatywne plany próbkowania.

Przejdziemy teraz do omówienia głównych form lub warstwowego próbkowania. Liczba przypadków wybranych w ramach każdej warstwy może być proporcjonalna do siły warstwy lub nieproporcjonalna do niej.

Liczba przypadków może być taka sama od warstwy do warstwy lub różnić się w zależności od warstwy w zależności od planu pobierania próbek. Rozpatrzymy teraz bardzo krótko te dwie formy, tj. Proporcjonalne i nieproporcjonalne stratyfikowane próbki.

Typ # 4. Proporcjonalne próbkowanie warstwowe :

Przy proporcjonalnym pobieraniu próbek przypadki są pobierane z każdej warstwy w takiej samej proporcji, w jakiej występują we wszechświecie. Załóżmy, że wiemy, że 60% "populacji" to mężczyźni, a 40% to kobiety. Proporcjonalna próbka warstwowa w odniesieniu do tej "populacji" wymagałaby pobrania próbki w taki sposób, aby odzwierciedlić ten sam podział na płeć, tj. 60:40 w próbie.

Jeżeli w badaniu stosowana jest systematyczna procedura pobierania próbek, podstawa, na której sporządzana jest lista, określa, czy uzyskana próbka jest proporcjonalną próbką warstwową. Na przykład, jeśli co 7 nazwisko zostanie wybrane w regularnej sekwencji z listy alfabetycznie ułożonych nazw, wynikowa próbka powinna zawierać około 1/7 nazw zaczynających się od każdej litery alfabetu.

Uzyskana w tym przypadku próbka byłaby proporcjonalną warstwową próbką alfabetyczną. Oczywiście, jeśli układ alfabetyczny jest całkowicie niezwiązany i nie ma związku z badanym problemem, próbkę można uznać za próbę losową z pewnymi ograniczeniami typowymi dla próbek systematycznych omówionych powyżej.

Można podać różne przyczyny pobierania próbek różnych warstw o ​​nierównych lub odmiennych proporcjach. Czasami konieczne jest zwiększenie odsetka próbek pobranych z warstw o ​​niewielkiej liczbie przypadków, aby mieć gwarancję, że w ogóle te warstwy zostaną pobrane.

Na przykład, jeśli ktoś planował badanie sprzedaży detalicznej odzieży w danym mieście w danym momencie, prosta losowa próba sklepów z odzieżą detaliczną może nie dać nam dokładnego oszacowania całkowitej wielkości sprzedaży, ponieważ niewielki liczba zakładów o bardzo dużej części łącznej sprzedaży może zostać wyłączona z próby.

W takim przypadku rozsądne byłoby rozwarstwienie populacji sklepów z tkaninami w kategoriach kilku sklepów z materiałami, które mają bardzo dużą wielkość sprzedaży, będą stanowić najwyższą warstwę. Badacz postąpiłby dobrze, gdyby uwzględnić wszystkie w swojej próbie.

Oznacza to, że czasami może on dobrze zrobić, aby pobrać 100% próbkę z tej warstwy i znacznie mniejszy odsetek przypadków z innych warstw reprezentujących dużą liczbę sklepów (z małą lub średnią liczbą obrotów). Taka nieproporcjonalna próba wyrywkowa najprawdopodobniej da wiarygodne dane szacunkowe dla populacji.

Inną przyczyną większego odsetka przypadków z jednej warstwy niż z innych jest to, że badacz może chcieć podzielić przypadki w obrębie każdej warstwy w celu dalszej analizy.

Podsumowane w ten sposób pod-warstwy mogą nie zawierać wystarczającej liczby przypadków do pobrania próbek i w takiej samej proporcji, jak inne pod-warstwy, a zatem nie będą miały wystarczającej liczby przypadków, aby stanowić odpowiednią podstawę do dalszej analizy. W takim przypadku konieczne może być wypróbowanie większej liczby przypadków z podstruktury.

Ogólnie można powiedzieć, że największą dokładność i reprezentację można uzyskać, jeśli próbki z różnych warstw odpowiednio odzwierciedlają ich względne zmienności w odniesieniu do badanych cech, a nie przedstawiają ich względne rozmiary w "populacji".

Wskazane jest bardziej intensywne pobieranie próbek w warstwach, w których badacz ma powody sądzić, że zmienność danej cechy, np. Postaw lub uczestnictwa, byłaby większa.

W związku z tym w badaniu przeprowadzonym w celu przewidywania wyników wyborów krajowych z wykorzystaniem metody warstwowego pobierania próbek, przy czym państwa jako podstawę stratyfikacji, należy pobrać cięższą próbkę z obszarów lub regionów, w których wynik jest poważnie zachmurzony i ma poważne wątpliwości .

Wpisz # 5. Nieproporcjonalne próbkowanie warstwowe :

Zasugerowaliśmy już charakterystykę nieproporcjonalnego pobierania próbek, a także niektóre z głównych zalet tej procedury pobierania próbek. Oczywiste jest, że warstwowa próbka, w której liczba elementów pochodzących z różnych warstw jest niezależna od wielkości tych warstw, może być nazwana nieproporcjonalną warstwową próbką.

Ten sam efekt można osiągnąć alternatywnie, czerpiąc z każdej warstwy równą liczbę przypadków, niezależnie od tego, jak silnie lub słabo jest ona reprezentowana w populacji.

Jako konsekwencja sposobu, w jaki został wybrany, przewaga nieproporcjonalnego warstwowego próbkowania polega na tym, że wszystkie warstwy są jednakowo niezawodne z punktu widzenia wielkości próbki. Jeszcze ważniejszą zaletą jest oszczędność.

Ten rodzaj próbki jest ekonomiczny, ponieważ badacze oszczędzają niepotrzebnie dużej ilości informacji od najbardziej rozpowszechnionych grup w populacji.

Taka próbka może jednak również zdradzić połączone wady różnej liczby przypadków, tj. Małości i niereprezentatywności. Poza tym nieproporcjonalna próba wymaga głębokiej znajomości istotnych cech różnych warstw.

Wpisz # 6. Przykład optymalnej alokacji :

W tej procedurze pobierania próbek wielkość próbki pobieranej z każdej warstwy jest proporcjonalna zarówno do wielkości, jak i do rozprzestrzeniania wartości w ramach danej warstwy. Precyzyjne stosowanie tej procedury pobierania próbek wymaga użycia pewnych pojęć statystycznych, które nie zostały jeszcze odpowiednio i przekonująco wprowadzone.

Teraz wiemy coś o stratyfikowanej losowej próbce i jej różnych przejawach. Zobaczmy teraz, jak należy zaplanować zmienne lub kryteria stratyfikacji.

Poniższe rozważania najlepiej wchodzą w wybór kontroli do stratyfikacji:

(a) Informacje od producenta do instytucji warstw powinny być aktualne, dokładne, kompletne, mające zastosowanie do populacji i dostępne dla badacza.

Wiele cech populacji nie może być wykorzystywanych jako kontrola, ponieważ nie są dostępne zadowalające statystyki na ich temat. W wysoce dynamicznym społeczeństwie, charakteryzującym się dużymi wstrząsami w populacji, badacz stosujący strategię stratyfikacji zwykle ryzykuje, że źle pójdzie w swoich szacunkach dotyczących rozmiarów warstw, które ma w swojej próbce.

(b) Naukowiec powinien mieć powody, by sądzić, że czynniki lub kryteria stosowane do stratyfikacji są znaczące w świetle badanego problemu.

(c) O ile rozpatrywana warstwa nie jest wystarczająco duża, a zatem sampler i pracownicy terenowi nie mają trudności z lokalizacją kandydatów na nią, nie należy jej używać.

(d) Przy wyborze przypadków stratyfikacji naukowiec powinien próbować wybrać te, które są jednorodne pod względem cech, które są istotne dla badanego problemu. Jak wspomniano wcześniej, stratyfikacja jest skuteczna w takim stopniu, że elementy w warstwie są podobne do siebie, a jednocześnie różnią się od elementów w innych warstwach.

Rozważmy teraz ogólnie zalety i ograniczenia losowego losowania warstwowego:

(1) Przy stosowaniu procedury losowania losowego, badacz może mieć pewność, że żadne istotne grupy ani kategorie nie zostaną wyłączone z próby. W ten sposób zapewniona jest większa reprezentatywność próbki i unika się w ten sposób przypadkowych wypadków, które występują w prostym losowym próbkowaniu.

(2) W przypadku bardziej jednorodnych populacji można osiągnąć większą dokładność przy mniejszej liczbie przypadków.

(3) W porównaniu do prostych losowych, próbki warstwowe są bardziej skoncentrowane geograficznie, co zmniejsza koszty pod względem czasu, pieniędzy i energii podczas wywiadów z respondentami.

(4) Próbki wybrane przez osobę przeprowadzającą wywiad mogą być bardziej reprezentatywne, jeżeli jego kwota jest przydzielana w ramach bezosobowej procedury stratyfikacji, niż w przypadku, gdy ma on zastosować własny osąd (jak w przypadku pobierania próbek z kwot).

Głównym ograniczeniem stratyfikowanego losowego pobierania próbek jest to, że aby zapewnić maksymalne korzyści z niego w trakcie badania, badacz musi dużo wiedzieć o problemie badawczym i jego związku z innymi czynnikami. Taka wiedza nie zawsze nadchodzi i dość często czekanie jest długie.

Należy pamiętać, że z punktu widzenia teorii prób losowych nie ma istotnego znaczenia, czy stratyfikacja została wprowadzona podczas procedury pobierania próbek lub podczas analizy danych, z wyjątkiem sytuacji, w której pierwsza umożliwia kontrolę wielkości próbka uzyskana z każdej warstwy, a tym samym w celu zwiększenia wydajności projektu próbkowania.

Innymi słowy, procedura losowania prostej losowej próbki, a następnie podzielenie jej na warstwy, jest równoważna w efekcie z losowaniem stratyfikowanej próbki losowej, wykorzystującej jako ramkę do próbkowania w każdej warstwie, .populacji tej warstwy, która jest zawarta w danym prostym losowa próbka.

Wpisz # 7. Próbkowanie klastra :

Zazwyczaj proste losowe pobieranie próbek i stratyfikowane losowe pobieranie próbek wiążą się z ogromnymi wydatkami w przypadku dużych i rozproszonych geograficznie lub geograficznie populacji.

W powyższych typach pobierania próbek elementy wybrane w próbie mogą być tak szeroko rozproszone, że ich przesłuchanie może wiązać się z dużymi wydatkami, większą częścią nieproduktywnego czasu (wydanymi podczas podróży), większym prawdopodobieństwem braku jednolitości wśród ankieterów. przesłuchania, nagrania, a na koniec duże wydatki na nadzorowanie personelu terenowego.

Istnieją również inne praktyczne czynniki tego pobierania próbek. Na przykład można uznać za mniej kontrowersyjny i tym samym zezwolić na administrowanie kwestionariuszem do trzech lub czterech działów fabryki lub urzędu zamiast administrowania nim na próbie sporządzonej przez wszystkie wydziały na prostej lub podzielonej losowo podstawie, ponieważ ta ostatnia procedura może znacznie zakłócić procedury fabryczne.

Z tych właśnie powodów badania zakrojone na szeroką skalę rzadko wykorzystują proste lub stratyfikowane próbki losowe; zamiast tego korzystają z metody próbkowania klastra.

W pobieraniu prób klastra próbnik pobiera najpierw próbki z populacji, niektóre duże grupy, tj. "Klaster". Te klastry mogą być oddziałami miejskimi, gospodarstwami domowymi lub kilkoma jednostkami geograficznymi lub społecznymi. Pobieranie próbek klastrów z populacji odbywa się za pomocą prostych lub warstwowych metod losowego pobierania próbek. Z tych wybranych klastrów elementy składowe są próbkowane przez odwoływanie się do procedur zapewniających losowość.

Załóżmy na przykład, że badacz chce przeprowadzić próbne badanie problemów studentów studiów wyższych w Maharashtra.

Może on postępować w następujący sposób:

(a) Najpierw przygotowuje listę wszystkich uniwersytetów w stanie i wybiera próbę uniwersytetów na zasadzie "losowej".

(b) Dla każdego uniwersytetu w państwie zawierającym próbkę, sporządza listę kolegiów podlegających jej jurysdykcji i pobiera próbę kolegiów na zasadzie "losowej".

(c) W przypadku każdego z kolegiów, które przypadkowo zostaną włączone do próby, tworzy listę wszystkich studentów, którzy się z nią zapisali. Spośród tych uczniów wybiera on próbkę o pożądanej wielkości na zasadzie "losowej" (prostej lub stratyfikowanej).

W ten sposób badacz otrzymuje prawdopodobieństwo lub losową próbkę elementów mniej lub bardziej skoncentrowanych geograficznie. W ten sposób jest w stanie uniknąć wysokich nakładów, które w przeciwnym razie byłyby poniesione, gdyby uciekał się do prostego lub stratyfikowanego losowego próbkowania, a jednak nie musiał rezygnować z zasad i korzyści z próbkowania prawdopodobieństwa.

Charakterystyczne jest, że ta procedura pobierania próbek przechodzi przez szereg etapów. Jest to w pewnym sensie próbka "wieloetapowa", a czasem znana pod tą nazwą. Ta procedura pobierania próbek postępuje stopniowo od bardziej włączających do mniej inkluzyjnych jednostek do pobierania próbek, które naukowiec ostatecznie dociera do tych elementów populacji, które stanowią jego pożądaną próbkę.

Należy zauważyć, że przy próbkowaniu klastrów nie jest już prawdą, że każda kombinacja pożądanej liczby elementów w populacji jest równie prawdopodobna, aby została wybrana jako próbka populacji. W związku z tym nie można zobaczyć tego rodzaju efektów, które widzieliśmy w naszej analizie prostych losowych próbek, tj. Wartości populacji będącej najbardziej prawdopodobną wartością próbki.

But such effects do materialize in a more complicated way, though, of course, the sampling efficiency is hampered to some extent. It has been found that on a per case basis, the cluster sampling is much less efficient in getting information than comparably effective stratified random sampling.

Relatively speaking, in the cluster sampling, the margin of error is much greater. This handicap, however, is more than balanced by associated economies, which permit the sampling of a sufficiently large number of cases at a smaller total cost.

Depending on the specific features of the sampling plan attendant upon the objects of survey, cluster sampling may be more or less efficient than simple random sampling. The economies associated with cluster sampling generally tilt the balance in favour of employing cluster sampling in large-scale surveys, although compared to simple random sampling, more cases are needed for the same level of accuracy.

Type # 8. Multi-Phase Sampling:

It is sometimes convenient to confine certain questions about specific aspects of the study to a fraction of the sample, while other information is being collected from the whole sample. This procedure is known as 'multi-phase sampling.'

The basic information recorded from the whole sample makes it possible to compare certain characteristics of the sub-sample with that of the whole sample.

One additional point that merits mention is that multi-phase sampling facilitates stratification of the sub-sample since the information collected from the first phase sample can sometimes be gathered before the sub-sampling process takes place. It will be remembered that panel studies involve multi-phase sampling.