Metody stosowane do oceny wydajności pracy

Psycholog przemysłowy ma wybór metod ustanowienia procedury oceny wyników pracy z udziałem osądów osób. Metody te mogą być pogrupowane w klasy w zależności od rodzaju porównania wymaganego od osoby dokonującej oceny. Trzy najczęściej używane to systemy oceny, systemy rankingowe i porównania parami.

1. Systemy oceny:

Mechanika dowolnego systemu skali ocen jest dość prosta. Zadaniem sędziego jest wydanie opinii dotyczącej stopnia, w jakim dana osoba posiada lub jest opisywana przez określoną cechę. Chociaż może to przybierać wiele różnych form, jedną z wyróżniających cech jest to, że sędzia może przyznać dwóm osobom taki sam wynik, cechę, która nie występuje w pozostałych dwóch metodach.

Liczbowe skale ocen:

Ta forma jest prawdopodobnie najbardziej popularnym i powszechnym typem skali ratingowej. Takie skale są często nazywane "skalami graficznymi".

Poniżej podano przykład:

Zadaniem sędziego jest dać każdemu pracownikowi ocenę od 1 do 9, która najlepiej opisuje jego "stopień niezawodności". Wynik kryterialny dla pracownika to zwykle średnia punktacja wszystkich sędziów. W sytuacji, gdy szereg różnych pytań stanowi kryterium (na przykład stopień niezawodności, ogólny poziom wiedzy o pracy, relacje z innymi pracownikami itp.), Problem staje się bardziej skomplikowany. Często stosowanym kryterium całkowitym jest po prostu całkowity wynik wszystkich pytań.

Jednakże, gdy do oceny pracowników używa się wielu pytań, należy od razu zmierzyć się z problemem złożonym a problemem wielu kryteriów. W takich sytuacjach podejście staje się bardziej popularne, polega na analizie czynnikowej pytań w celu ustalenia podstawowych niezależnych wymiarów kryterium, a następnie przypisaniu "wyników czynnikowych" na każdym z tych wymiarów, które następnie są stosowane jako kryteria.

Standardowe skale:

Innym rodzajem skali ratingowej jest stosowanie zestawu standardów lub przykładów do celów porównawczych. Są one używane w miejsce lub wraz z ustnymi punktami kontrolnymi znalezionymi za pomocą skali graficznej.

Standardowa skala zaprojektowana do oceny niezawodności może wyglądać następująco:

Rater może następnie porównać człowieka, którego ocenia, z mężczyznami w pracy, którzy są wyznaczeni jako punkty odniesienia w skali. Metoda ta jest również czasami określana jako skala porównania "człowiek-mężczyzna". Główna trudność ze standardowymi skalami polega na znalezieniu odpowiednich standardów. Zazwyczaj wymaga to ostrożnego wstępnego skalowania grupy obecnych pracowników. Istnieje również bardzo drażliwy problem polegający na tym, że nazwiska tych mężczyzn są bez zakłopotania. Dlatego trzeba bardzo uważać, aby nie można było upublicznić standardowej skali. Kolejna trudność polega na tym, że przerwy między mężczyznami w skali często nie są równej wielkości.

Zaleta tej metody jest całkiem jasna. Dopóki grupa sędziów może zgodzić się z kwalifikacjami niewielkiej grupy robotników, dobrze znanych wszystkim sędziom, przygotowana jest gotowa skala porównawcza, która zapewnia, że ​​wszyscy sędziowie będą mieli wspólnego referenta do oceniania reszty mężczyzna.

Skumulowana skala punktów (lista kontrolna):

Wiele skal ocen wymaga od sędziego sprawdzenia lub wskazania, które z wielu stwierdzeń, przymiotników lub atrybutów mają charakter opisowy dla ocenianej osoby. Na przykład formularz oceny pokazany na rysunku 7.3 jest reprezentatywny dla listy kontrolnej przymiotnika.

Każdej osobie przypisuje się całkowitą punktację opartą na sprawdzonych przedmiotach. W przedstawionym przykładzie dana osoba może otrzymać + 1 za każdy korzystny przymiotnik i a - 1 za każdy niekorzystny przymiotnik. Na bardziej rozbudowanych listach kontrolnych do różnych pozycji można przypisać wagi różnicowe. Na przykład Uhrbrock (1961) skorygował 2000 stwierdzeń dotyczących zachowania pracowników.

Każdemu stwierdzeniu nadano średnią wartość skali jego postrzeganej faworyzacji w opisie pracownika. Wyciągi można następnie wybrać do użycia na liście kontrolnej, która z kolei jest używana przez przełożonych do oceny swoich pracowników. Metoda punktowania może opierać się na sumie sumy (sumy algebraicznej) dla sprawdzonych elementów lub, być może, na wartości średniej (średniej) wszystkich sprawdzonych elementów. Niektóre przykłady wypowiedzi Uhrbrocka, wraz z ich wartościami skali, są pokazane w Tabeli 7.3.

Lista Critical Incident Check:

Technika krytycznego incydentu to procedura opracowana przez Flanagana (1954). Jak zwykle można go najlepiej opisać jako procedurę oceny listy kontrolnej. Jest jednak wystarczająco różny w rozwoju, że zasługuje na osobne wyróżnienie.

Metoda obejmuje trzy odrębne etapy:

1. Zbieranie krytycznych incydentów

2. Skalowanie incydentów

3. Zbudowanie skali listy kontrolnej

Pierwszy krok sprawia, że ​​ta metoda jest wyjątkowa. Termin incydent krytyczny odnosi się do wszystkich zachowań osób w miejscu pracy, które opiekun uznałby za "godne uwagi". Warto zauważyć, że z kolei mogą odnosić się do przypadków wybitnie "dobrych" lub "złych" w odniesieniu do zachowanie zawodowe. Innymi słowy, każdy z opiekunów jest proszony o dostarczenie jak największej liczby wybitnych faktycznych zachowań w miejscu pracy, jakie tylko sobie przypomina. Te incydenty związane z pracą są następnie przedstawiane (krok drugi) grupie ekspertów, którzy przypisują wartości skali do stopnia pożądalności tego incydentu.

W kroku trzecim skonstruowana jest lista kontrolna zawierająca tylko te stwierdzenia lub incydenty, które uważane są za istotne dla zdefiniowania "dobrych" i "złych" pracowników. Te listy kontrolne mogą następnie zostać użyte przez przełożonego do oceny jego pracowników. Oceniając pracownika, po prostu umieszcza znacznik wyboru obok każdego incydentu, który zauważył, że pracownik "popełnia" lub wystawia. Wynik dla pracownika jest zwykle brany jako średnia lub mediana wartości wszystkich sprawdzonych incydentów (można również wykorzystać wynik całkowity).

Krytyczna lista kontrolna incydentów ma tę wielką zaletę, że opiera się na faktycznych zachowaniach lub incydentach pracy. Osoba nadzorująca nie jest w stanie być zmuszana do oceniania cech lub pozycjonowania swoich pracowników itd. Musi jedynie odpowiadać pod względem tego, czy zaobserwował lub nie zaobserwował określonego incydentu ze strony każdego pracownika. Kirchner i Dunnette (1957) donoszą o korzystnych wynikach w badaniu po nieco opisanej powyżej procedurze.

Zanim opuścisz metodę krytycznego incydentu, należy podkreślić, że ma ona bardziej ogólną charakterystykę i zastosowanie, niż po prostu jest źródłem dla elementów listy sprawdzającej wydajność. Przypadki zachowań opartych na pracy zostały bardzo dobrze wykorzystane w badaniach w obszarach przywództwa (Fleishman, 1955), wartości organizacyjnych (Shartle, Brumback i Rizzo, 1964) oraz kreatywności (Buel, 1960).

2. Systemy rankingowe:

Cechą charakterystyczną systemu ratingowego jest to, że pozwala on dwóm lub większej liczbie osób mieć taką samą ocenę lub wartość skali. System rankingowy ze swej natury zniechęca do tego. Prosty ranking wymaga, aby sędzia nakazał osobom od najwyższego do najniższego.

W związku z tym określona grupa organów nadzoru może zaliczyć do dziesięciu pracowników, jak pokazano poniżej:

Systemy rankingowe mają tę nieodłączną zaletę, że są wyjątkowo łatwe do wytłumaczenia i są zwykle łatwo akceptowane przez osoby wyznaczone jako sędziowie. Procedura "ma dla nich sens". Zaletą tego jest również umożliwienie rangowaniu dużej liczby osób bez większych trudności. Zasada przyjmuje, że zadowalające i wiarygodne wyniki w systemie rankingowym można osiągnąć przy wartościach Ns równych od 50 do 60.

Guilford (1954) wskazał kolejną zaletę rankingu. Ponieważ sędzia jest zmuszony do porównywania ludzi, a nie bezwzględnych porównań, musi porównywać jednostki, decydując się na umieszczenie jednego nad drugim.

Metoda ta wymusza na sędziach rozróżnianie osób, które są w rankingu niezależnie od tego, czy uważa, że ​​są naprawdę różne! Przypuśćmy, że dziesięciu mężczyzn podanych we wcześniejszym przykładzie miało dość równe możliwości. Wówczas sędziowie mieliby zapewne niezmiernie trudny czas, próbując uszeregować porządek wśród mężczyzn, a ranking sędziów byłby wysoce złudny, jeśli chodzi o względne zalety dziesięciu mężczyzn, o których mowa.

Jednym ze sposobów sprawdzenia tej możliwości jest oczywiście użycie kilku sędziów. Jeśli sędziowie zgadzają się co do swoich rankingów, możliwość dyskwalifikacji "prawdziwych" lub prawdziwych różnic między mężczyznami może zostać zdyskontowana. We wcześniejszym przykładzie sędziowie wydają się być rozsądnie konsekwentni w ocenie tego, kto jest dobry, a kto jest biednym pracownikiem. W związku z tym ich wybory muszą opierać się na rzeczywistych, a nie przypadkowych przyczynach zamawiania tych mężczyzn. Jest to jeden doskonały powód używania wielu sędziów, gdy tylko jest to możliwe, oraz do obliczania porozumienia pomiędzy sędziami z pewnym wskaźnikiem, takim jak współczynnik korelacji.

3. Porównania parami:

Chociaż systemy porządkowania rankingu domyślnie wymagają porównania człowieka z innymi osobami na liście podczas procesu klasyfikacji, nie jest to systematycznie wbudowane w tę metodę. Procedura, która systematycznie wymusza na raterach porównywanie każdego człowieka z każdym innym człowiekiem, jest znana jako metoda porównywania parami. Weźmy na przykład sytuację, w której czterech pracowników jest ocenianych przez przełożonego. Jeśli utworzymy wszystkie możliwe pary ludzi, utworzymy N (N-l) / 2 takie pary; w naszym przypadku 4 (3/2) = 6 par.

Zwykłą procedurą jest zatem przedstawienie każdej z par (po jednym na raz) opiekunowi. Opiekun wskazuje (zwykle z zaznaczeniem), który z dwóch mężczyzn uważa za najlepszy. Następnie można skonstruować macierz porównania, jak pokazano poniżej, w której stosowana jest następująca reguła: Kiedy przełożony woli kolumnę od wiersza, umieść znak w tej komórce.

Przypuśćmy, że supervisor X wyda następujące wyroki dotyczące sześciu par pracowników:

Jeśli umieścimy znaki tally w naszej macierzy przy użyciu powyższej reguły, mamy następujące:

Zatem ten przełożony ocenia B jako najlepszego pracownika, a następnie w kolejności C, A i D. W rzeczywistej praktyce osądy wielu sędziów są zawarte w macierzy w celu zapewnienia bardziej stabilnego oszacowania rzędu zasług mężczyźni oceniani. Ponadto powszechną praktyką jest przekształcanie proporcji w każdej komórce do wyników standardowych (wyniki Z), a następnie znalezienie średniego wyniku Z dla każdej kolumny.

Ten średni wynik Z jest wartością skali dla osoby, która jest reprezentowana przez tę kolumnę w macierzy. Zaletą tej ostatniej procedury jest to, że te wartości skali mogą być traktowane jako reprezentujące nie tylko porządek rangowy umiejętności pracownika, ale także jako wskazanie stopnia, w jakim dwóch pracowników różni się zdolnością.

Pomocna może być prosta ilustracja oparta na odpowiedziach dziesięciu hipotetycznych superwizorów na czterech wyżej wymienionych. Najpierw rozważmy poniższą macierz

Teraz zmieńmy macierz na macierz proporcji, gdzie definiujemy proporcję jako n / N, gdzie n równa się liczbie znaczników w komórce, a N jest równe liczbie sędziów lub liczbie możliwych znaczników. Zwyczajowo wprowadza się proporcje równe 0, 50 we wszystkich przekątnych, chociaż w rzeczywistości nigdy nie przedstawiamy sędziom osoby sparowanej z samym sobą.

Następnym krokiem jest zamiana proporcji na wyniki Z. (Tabela do zrobienia tego można znaleźć w dowolnej elementarnej książce o statystykach.)

Jeśli dodamy stałą 0, 78 do wszystkich wartości skali, aby usunąć negatywne znaki, jednostki mogą być reprezentowane wzdłuż kontinuum zasług

Zauważ, że odległość między C i A jest znacznie większa niż odległość między D i A lub B i C. Jeżeli założenia tej metody zostały spełnione, te względne odległości można uznać za wskazujące na względne różnice w oceniane osoby - atrakcyjną cechą tej metody oceny wyników. Aby uzyskać bardziej szczegółowy opis porównywania parami, odwołaj się do Edwardsa (1957) lub Guilford (1954).

Jedną z wad metody porównywania parami jest to, że nie jest szczególnie przydatna, gdy liczba osób, które mają być ocenione, staje się duża. Wcześniej wskazywano, że przełożony może prawdopodobnie z powodzeniem uszeregować zamówienie 50 lub 60 pracowników. Gdybyśmy spróbowali zastosować procedurę porównań parzystych, mielibyśmy

50 (49) 72 = 1225 par

Nawet jeśli osoba nadzorująca może pracować w tempie sześciu par na minutę, wykonanie oceny wymaga więcej niż trzech godzin. Im większa liczba osób, które mają być oceniane, tym bardziej astronomiczny staje się wymogiem czasu.