Upload
phungkhuong
View
218
Download
0
Embed Size (px)
Citation preview
1
Status poznawczy badań eksperymentalnych w psychologii społecznej - kontekst
trafności zewnętrznej
Łukasz Budzicz
Uniwersytet im. A. Mickiewicza w Poznaniu
Konspekt na otwarcie przewodu doktorskiego
napisany pod kierunkiem profesora Jerzego Brzezińskiego
2
Autor składa serdeczne podziękowanie Panu Profesorowi Jerzemu Brzezińskiemu
za nieocenioną pomoc merytoryczną i życzliwe wsparcie
3
Wprowadzenie
Psychologia jest jedną z podstawowych nauk empirycznych, a większość jej
nurtów współdzieli z innymi podstawowymi naukami (szczególnie fizyką, chemią i
biologią) najważniejsze założenia epistemologiczne, w szczególności to, które
zakłada występowanie poznawalnych na drodze empirycznej praw rządzących
fenomenami, które są w obrębie zainteresowania danej nauki (co – moim zdaniem –
pozytywnie odróżnia ją od niektórych postmodernistycznych nurtów humanistyki
zakładających brak wiedzy obiektywnej i antyempiryzm). Dyscyplina posiada
ugruntowaną pozycję instytucjonalną na uczelniach i cieszy się pewnym poważaniem
w oczach opinii publicznej. Niedawna analiza powiązań pomiędzy czasopismami
naukowymi z wykorzystaniem zaawansowanych metod naukometrycznych wykazała,
że psychologia jest jedną z 7 centralnych nauk (hub science) tj. nauką, wokół której
koncentrują się inne dyscypliny (Boyack i in., 2005). Psychologowie generują
corocznie olbrzymią ilość wiedzy pochodzącej z badań empirycznych (przykładowo
baza PsycINFO grupuje abstrakty z prawie 2,5 tys. czasopism), a wiele czasopism
pod względem rygorów edytorskich w niczym nie ustępuje najbardziej prestiżowym
czasopismom fizycznym czy biologicznym.
Pomimo tego w ostatnich latach pojawia się wiele głosów poważnie
kwestionujących kierunek w jakim zmierza psychologia jako całość. Rozmaici autorzy
zwracają szczególnie uwagę na brak unifikującej metateorii, która wyznaczałaby
ramy do rozumienia fenomenów psychologicznych (takimi metateoriami są w fizyce
mechanika kwantowa i teoria względności, a w biologii neodarwinowska synteza).
Inne zarzuty dotyczą braku ujednoliconych standardów badania zjawisk
psychologicznych, dużego stopnia separacji pomiędzy poszczególnymi
subdyscyplinami (a nawet różnymi obszarami w obrębie subdyscyplin),
pojawiających się i przemijających mód na metody i obszary badawcze oraz
znacznego rozdźwięku pomiędzy badaniami podstawowymi a praktyką. Przytoczmy
kilka reprezentatywnych cytatów:
Charakter psychologii w coraz większym stopniu manifestuje się w szybkim
przyroście wąsko zorientowanych i kompulsywnie wyizolowanych obozów,
przyroście, który zdaje się nie mieć żadnych granic. Dążymy do odpowiadania
na małe pytania, zamiast na duże, nie widzimy całego lasu tylko poszczególne
drzewa (Bevan, 1991, s. 475)
4
Kiedy spojrzymy na psychologię przez soczewkę unifikacji, zobaczymy naukę
wypełnioną nadmiarowymi pojęciami, zasadami, odkryciami, teoriami, testami,
terapiami i temu podobnymi. Akceptacja nadmiarowości prowadzi w naszej
płodnej nauce do niemożliwej do ogarnięcia, chaotycznej złożoności i braku
efektywności. Taki sposób działania byłby nie do zaakceptowania w fizyce,
chemii czy biologii, jest on wbrew podstawowemu wymaganiu parsymonii w
teorii naukowej. Nie mogłoby być tak, że jedna grupa fizyków używałaby
podstawowych pojęć masy, grawitacji, protonu, neutronu i kwarku, podczas
gdy druga grupa używała innych pojęć dla tych samych zjawisk, a ta różnica w
terminologii byłaby uzasadnionym powodem istnienia dwóch odrębnych teorii i
braku komunikacji. Ale tak się dzieje w psychologii, co skutkuje
zdumiewającym bałaganem i nieefektywnością. (Staats, 1999, s. 7)
[C] występujące w psychologii rozliczne i zróżnicowane programy badawcze,
nie są zwykle ani koherentnie powiązane ze sobą, ani w istotny sposób
związane z dociekaniami badawczymi w powiązanych dziedzinach
naukowych. Zamiast tego jesteśmy świadkami niepohamowanej akumulacji
różnorodnych faktów, odkryć i teorii, które zwyczajowo nie integrują się z
konkurencyjnymi enklawami badawczymi i frakcjami teoretycznymi. W skrócie,
psychologia funkcjonuje jako mało dojrzała nauka. (Rand, Ilardi, 2005, s. 7)
Praktycy w psychologii są w dalszym ciągu w stanie utrzymać względną
niezależność od psychologii jako nauki. Przykładowo, pomimo braku
przekonywującego empirycznego wsparcia, wielu profesjonalistów w dalszym
ciągu korzysta z technik podobnych do tych rozwiniętych przez Freuda prawie
wiek temu. W rzeczy samej wielu psychologów klinicystów i doradców
aktywnie kwestionuje twierdzenie, że terapie psychologiczne wymagają
empirycznej walidacji (Rand, Ilardi, 2005, s. 11).
Peters i Ceci (1982) wysłali niegdyś do dwunastu prestiżowych czasopism
psychologicznych artykuły, które ukazały się w tych samych czasopismach
kilkadziesiąt miesięcy wcześniej, zmieniając nieznacznie tytuły i abstrakty, oraz
podpisując je nazwiskami nieznanych autorów z nieznanych instytucji. Artykuły te
zostały odrzucone, jednak najczęściej (75%) nie ze względu na wykrycie próby
oszustwa, ale z powodu „poważnych błędów metodologicznych”! Nie stanowiło to
przeszkody, aby te same artykuły opublikować kilka miesięcy wcześniej. Te badanie
oraz bardzo wysoki stopień odrzutów występujący w czasopismach
5
psychologicznych, szczególnie na tle dużo bardziej dojrzałej fizyki (Sulz, Martin,
2009), wydaje się być pośrednim dowodem na to, że redaktorzy, recenzenci i
badacze posiadają umiarkowany konsensus, co do tego, co stanowi wartościowy
wkład w naukę psychologiczną.
Jakaś część wymienionych tutaj problemów z pewnością wynika z tego, że
psychologowie zajmują się fenomenami niewyobrażalnie złożonymi. Biolodzy
zgadzają się co do tego, że komórka jest systemem o stopniu złożoności
niespotykanym nigdzie w świecie zjawisk fizycznych (Mayr, 2004). Można zasadnie
zakładać, że 100 mld komórek wchodzących ze sobą w interakcje, które tworzą
ludzki mózg, jest systemem o jeszcze większej złożoności. Simonton (2004)
przebadał główne nauki wykorzystując rozmaite wskaźniki dojrzałości (m.in. stopień
konsensusu dotyczący tego, kto wniósł największy wkład w rozwój nauki; stosunek
praw do teorii w podręcznikach akademickich; ilość młodych naukowców z
ponadprzeciętną liczbą cytowań; produktywność naukowców po dłuższej przerwie w
karierze itp.) i wykazał, że nauki układają się pod względem tak
zoperacjonalizowanej dojrzałości w przewidywalny sposób: fizyka, chemia, biologia,
psychologia, socjologia (przy czym fizyka i chemia były do siebie względnie zbliżone,
w połowie skali znajdowała się biologia z blisko umiejscowioną psychologią, a na
końcu socjologia). Nietrudno zauważyć, że kolejność ta pokrywa się ze stopniem
matematyzacji poszczególnych nauk, stopniem złożoności badanych przez nie
obiektów oraz ich następstwem czasowym i przyczynowo-skutkowym w historii
wszechświata (tj. materia, życie, umysł, kultura).
Mając - pełną pokory - świadomość, że badane przez psychologów fenomeny
są niewyobrażalnie złożone i z tej racji psychologia z pewnością w najbliższych
dziesięcioleciach nie osiągnie choćby ułamka tej precyzji i koherencji, jaką posiada
fizyka, chciałbym w swojej pracy podjąć próbę analizy tych problemów, na które
psycholodzy jednak mają wpływ, i które mogą w jakimś stopniu przyczyniać się do
relatywnie niskiej dojrzałości psychologii i wolniejszego postępu naukowego. Jako
punkt wyjścia chciałbym przyjąć dwie analizy stanu współczesnej psychologii
społecznej przeprowadzone przez Rozina (2001) oraz Baumeistera, Vohs i Fundera
(2007) i spróbować dowieźć, że praca psychologów-badaczy zyskałaby na jakości,
gdyby większą wagę przykładali do opisu i obserwacji badanych fenomenów (przed
eksperymentalną sprawdzeniem hipotez) oraz opierali się na szerokiej klasie metod
badawczych i źródeł danych. Swoją analizę chciałbym ograniczyć tylko do obszaru
6
psychologii społecznej, co motywuję po części względami pragmatycznymi (wydaje
się, że próba ogarnięcia wszystkich subdyscyplin psychologii przy monstrualnej ilości
wiedzy obniżyłaby jakość końcowych wniosków), a po części przekonaniem, że
psychologia społeczna pełni szczególną rolę w psychologii, znajduje się bowiem
najbliżej zachowania sensu stricte, tym samym budując korpus wiedzy dla innych
subdyscyplin (np. neuropsychologii, psychologii ewolucyjnej, różnych obszarów
psychologii stosowanej), jak również jej odkrycia są najłatwiej i najszybciej
upowszechniane dla ogółu społeczeństwo (co może pośrednio wpływać na
wiarygodność psychologii jako nauki). Uważam również, że w psychologii społecznej
szczególnie duże znaczenie ma problem trafności zewnętrznej badanych efektów,
który jest szczególnie związany z zarysowanymi wcześniej postulatami.
Rozdział 1
Ramy filozoficzne
Panuje konsensus, co do tego, że psychologia jest nauką o zachowaniu
człowieka (względnie też zwierząt) i jego determinantach. Intuicja podpowiada, że
tym co interesuje naukowców najbardziej (także laików), jest zachowanie człowieka
w codziennych życiowych kontekstach, a więc opis i wyjaśnienie takich procesów jak
skuteczne przewodzenie ludziom, podejmowanie decyzji czy kupić określony
produkt, zabawa dzieci, zakochiwanie się, chorowanie na depresje itd. W psychologii
bardzo często bada się inne fenomeny (np. funkcjonowanie mózgu, różnice
indywidualne), ale wydaje się, że na ogół przyświeca temu na dłuższą metę cel, aby
lepiej zrozumieć zachowanie człowieka w owych codziennych życiowych kontekstach
(np. badamy różnice indywidualne, po to aby na ich podstawie określić tendencje do
określonych zachowań; badamy funkcjonowanie mózgu, aby lepiej rozumieć
podstawy neuronalne obserwowalnych zachowań itd.).
Psychologia, tak jak inne nauki empiryczne, zajmuje się wyjaśnianiem
obserwowanych zjawisk poprzez odwołanie do ogólnych właściwości obiektów,
procesów występujących w naturze oraz zmiennych, które wywierają wpływ na
konkretne wyjaśniane zachowanie. Mówiąc najprościej psychologia powinna być w
stanie podać powody, dlaczego określone zachowanie wystąpiło. Analizując
zawartość czasopism można łatwo dojść do wniosku, że psychologowie starają się
wyjaśnić zachowania poprzez odwołanie do czynników dyspozycyjnych, czynników
sytuacyjnych lub ich interakcji (wg tej klasyfikacji są zoorganizowane np.
podrozdziały w podręczniku Kenricka i in., 2006). Wiarygodna nauka powinna
7
potrafić nie tylko wyjaśnić określone fakty, ale i przewidzieć je, znając wszystkie
istotne zmienne, które je wywołują (słuchając komentarzy politologów w mediach
trudno nie oprzeć się wrażeniu, że niezawodnie znajdą post factum wytłumaczenie
dla dowolnych zachowań aktorów sceny politycznej; nie wydaje się jednak, żeby byli
w stanie przewidzieć rozwój sytuacji politycznej w ciągu choćby kilku dni).
Docelowym zadaniem psychologii jest więc w miarę precyzyjnie przewidzieć
zachowanie określonego człowieka, znając wszystkie istotne zmienne, które je
determinują. Nietrudno się domyślić, że na obecnym poziomie rozwoju nauki jest to
cel bardzo odległy.
Fundamentalnie tak samo działa fizyka, gdy stara się przewidzieć
„zachowanie” np. wysłanej do odległej planety sondy na podstawie znanych praw
natury i pomiaru istotnych zmiennych wywierających wpływ na ruch owej sondy (jako,
że sondy na ogół docierają do miejsca swojego przeznaczenia, można zakładać, że
wiedza fizyków jest całkiem rzetelna i zbliżona do prawdy). Sytuacja psychologa
różni się, niestety, pod kilkoma istotnymi względami, w szczególności zakładałbym
(gdzieniegdzie spekulatywnie), że:
1. zmiennych istotnie wpływających na zachowanie jest prawdopodobnie
znacząco więcej; spora ich część może być zupełnie nieznana dla nauki
2. pomiar istotnych zmiennych (np. indywidualnych dyspozycji) jest
nieporównywalnie mniej precyzyjny
3. niezwykle trudno wyizolować wpływ pojedynczych zmiennych na
wyjaśniane zachowanie (na prędkość toczącej się kulki wywierają wpływ
grawitacja, tarcie i opór powietrza, jednakże fizycy mogą wyizolować każdy
z tych czynników w laboratorium i na tej podstawie stworzyć ogólny wzór
na prędkość; psycholodzy mieliby znacznie większe trudności, żeby
wyizolować dajmy na to „czysty” wpływ sytuacji, w oderwaniu od
osobowości, szerszego obecnego kontekstu życia czy aktualnego stanu
fizjologicznego mózgu); wydaje się także, że pomiar niektórych zmiennych
jest zupełnie niemożliwy
4. sam fakt pomiaru może wywierać istotny wpływ na wyjaśniane zachowanie
(problem ten występuje też w innych naukach np. fizyce kwantowej, wydaje
się jednak, że psychologów dotyczy w szczególności)
5. zmienne wyjaśniające określone zachowanie, wchodzą ze sobą w
nieporównywalnie bardziej złożone interakcje np. wartość jaką przybiera
8
jedna zmienna może zmieniać naturę wzajemnej relacji dwóch innych
zmiennych (przykładowo: poczucie własnej wartości jest dodatnio
skorelowane z liczbą krótkoterminowych partnerów seksualnych u
mężczyzn, natomiast u kobiet taka zależność - w zależności od badań - nie
występuje lub jest negatywna; Walsh, 1991)
6. istnieją zmienne potężnie zakłócające proces badania, zaczynając od tego
jak osoba interpretuje sytuacje w której się znalazła (tzw. procesy
odgórne), skończywszy na całej gamie dobrze udokumentowanych
artefaktów na linii badacz-badany (Rosenthal, Rosnow, 2009)
7. wymagania etyczne ograniczają możliwości stosowania niektórych metod i
rodzajów manipulacji zmiennymi
Wszystko to powoduje, że praca psychologa nie tylko jest trudniejsza, ale też
więcej wymaga się, aby wykazać istnienie jakiegoś efektu w psychologii. A nawet
jeśli odkryje się i bardzo dobrze udokumentuje jakieś prawa rządzące zachowaniem
człowieka, na ogół jedyne na co możemy sobie pozwolić, to mało precyzyjne
twierdzenia opisowe typu „mężczyźni wykazują większą agresję fizyczną niż kobiety”.
Nie mamy możliwości stworzenia „wzorów na agresję” i wyliczenia jej poziomu na
podstawie znajomości wszystkich istotnych zmiennych.
Wydaje się jednak, że na tym etapie rozwoju nauki psychologowie-badacze
mogą zrobić kilka rzeczy, aby tworzyć korpus względnie pewnej wiedzy.
1. tam gdzie to możliwe badać (mierzyć) bezpośrednio zachowanie, a nie
pośrednie jego wskaźniki np. sprawozdania z przeszłych zachowań, czasy
reakcji itd. Pojęcie „badania bezpośredniego” może być problematyczne z
punktu widzenia niektórych stanowisk filozoficznych, dlatego poświęcę mu
więcej uwagi. Niektórzy badacze zakładają, że nie istnieje coś takiego jak
„czysta obserwacja” i teoria zawsze poprzedza obserwacje (np. Brzeziński,
2010, komunikacja osobista). Zasadniczo zgadzam się, jednak z pewnymi
zastrzeżeniami. Jeśli chcemy zaobserwować występowanie takich zjawisk
jak „wywieranie dobrego wrażenia”, „uleganie wpływowi”, „pomaganie
innym”, „dystansowanie się od drugiej osoby” to – chcąc, nie chcąc –
musimy korzystać z „teorii” znajdującej się w naszym systemie
poznawczym. Prawdopodobnie jednak nie ma to większego
epistemologicznego znaczenia, bowiem badacze (i laicy) będą w stanie z
dużym stopniem konsensusu zoperacjonalizować występowanie lub nie
9
takich zjawisk na podstawie obserwowalnych wskaźników, gdyż zdolność
do spostrzegania i interpretacji wspomnianych fenomenów w jakimś
stopniu jest zawarta w uniwersalnych wyewoluowanych cechach naszego
systemu poznawczego (tak jak zdolność widzenia kolorów czy odróżniania
strony prawej od lewej). Jestem świadom, że jest to założenie mocno
spekulatywne, ale niektóre badania m.in. nad uniwersalną w pewnym
wieku u małych dzieci ekspresją zdolności zwanych „teorią umysłu”
niezależnie od kultury (Callaghan i in., 2005), skłaniają mnie do wniosku,
że podstawowe ludzkie umiejętności poznania społecznego są tak samo
wrodzone i uniwersalne jak zdolność widzenia czy słyszenia („wrodzone”
nie znaczy przy tym, że wpływ środowiska jest nieistotny; najbardziej
elementarna umiejętność widzenia do swojego wykształcenia się wymaga
bodźców ze środowiska).
Tak więc moim zdaniem „teoria poprzedza obserwację”, ale jest to teoria
uniwersalna i nie stoi to na przeszkodzie naukowej komunikacji. Inną
sprawą jest natomiast sytuacja, gdy zachowanie mierzymy przy pomocy
pośrednich metod wypracowanych przez badaczy. Jeżeli chcemy wyjaśnić
skłonność do pomagania, to inną miarą jest zapytać badanego o to, czy
pomaga innym, a inną zaangażować sytuację w której badany może
pomóc (najlepiej, aby nie wiedział, że jest mierzona jego skłonność do
pomagania) i zaobserwować reakcje. Ta pierwsza miara może być w jakiś
sposób trafna, ale jest zapośredniczona przez wiele procesów (np.
pamiętanie, podwyższanie własnej samooceny, kulturowy wymóg
pomagania), które z pomaganiem mają niewiele wspólnego. Należy przy
tym zaznaczyć, że nie jest problemem to, że mierzymy coś pośrednio.
Fizycy bardzo często tak robią (np. mierząc średnicę atomu, albo odległość
od gwiazdy). Problemem jest to, że wiedza o zachowaniu, która jest
gromadzona przy pomocy pośrednich jego wskaźników jest bardziej
ułomna, gdyż relacja pomiędzy nią a rzeczywistym zachowaniem jest
zapośredniczona przez wiele procesów poznawczych, osobowościowych i
kulturowych, o których nie zawsze mamy przyzwoite pojęcie lub które po
prostu wypaczają wynik. Posiadamy natomiast solidne dowody, aby sądzić,
że niektóre pośrednie wskaźniki zachowania są w niektórych sytuacjach
mało trafne (np. werbalne wskazywanie przyczyn własnego zachowania,
10
Nisbett i Wilson, 1977; hipotetyczne przewidywanie własnego zachowania:
West, Brown, 1975; Wilson, Gilbert, 2005). Tam gdzie to możliwe pomiar
zachowania powinien być jak najbardziej „ubogi teoretycznie” (i wydaje się,
że jest taki w najbardziej słynnych badaniach psychologicznych takich jak
badania Ascha nad konformizmem, Miligrama nad posłuszeństwem,
Festingera nad dysonansem poznawczym, czy Seligmana nad wyuczoną
bezradnością).
2. minimalizować wpływ zmiennych zakłócających, szczególnie poprzez a)
angażowanie eksperymentów terenowych w których badani nie zdają sobie
sprawy, że uczestniczą w eksperymencie lub nie wiedzą jaki aspekt ich
zachowania jest mierzony (szereg takich prostych i pomysłowych
eksperymentów opisał ekonomista behawioralny Dan Ariely, 2009; należy
jednak podkreślić, że w takim przypadku badacze powinni zachować
maksymalną czujność etyczną) oraz b) korzystanie z danych
wytworzonych nie na potrzeby badania np. rozmaitych statystyk, zapisów
archiwalnych, przemówień, nagrań, wytworów kulturowych itp.
Przykładowo Dunbar analizował treść sag skandynawskich, aby wykazać
występowanie pewnych prawidłowości związanych z doborem
krewniaczym (Dunbar i in., 1995), a Graham analizował ilościowo treść
kazań kościołów uznawanych w Ameryce za liberalne i konserwatywne,
aby wykazać pewne prawidłowości związane z różnicami w rozumowaniu
moralnym pomiędzy konserwatystami a liberałami (Graham i in., 2009).
3. starać się dowieźć istnienia jakiegoś efektu przy pomocy jak najszerszego
zestawu metod badawczych i różnych źródeł danych. Przykładowo
inspirowaną ewolucyjnie hipotezę, że kobiety preferują długoterminowych
partnerów o wysokiej pozycji społecznej dowodzono przy pomocy: badań
kwestionariuszowych, badań laboratoryjnych w których manipulowano
istotnymi zmiennymi (oznakami statusu), badań etnograficznych nad
zależnością pomiędzy sukcesem reprodukcyjnym a statusem w
społecznościach łowiecko zbierackich, statystyk ślubów, narodzin dzieci i
rozwodów w społeczeństwach historycznych i współczesnych, porównań
międzygatunkowych, analizie treści kulturowych i innych (szeroka analiza:
Schmitt, 2005). Analogicznie Nisbett i Cohen (1996) dowodzili
występowania zjawiska kultury honoru (tj. tendencji do łatwego
11
reagowania, szczególnie przemocą, na rzeczywiste lub wyimaginowane
obrazy i inne zagrożenia „honoru” w kulturach w których własność może
łatwo zmienić właściciela i nie ma silnych instytucji prawnych), korzystając
z szerokiego spektrum metod np. rejestrów popełnianych przestępstw,
wyników wyborczych, wyników ankiet, rezultatów eksperymentów
terenowych, treści w literaturze itp. W jednym i drugim przypadku można
zasadnie skrytykować każde osobne źródło danych, jednak wszystkie
razem układają się w bardzo spójny wzór potwierdzający wyjściową teorię.
4. badać występowanie danego efektu w różnych grupach społecznych i
kulturowych. Rozmaite uwarunkowania historyczno-kulturowo mogą
istotnie wpływać na trafność zewnętrzną wyników (tj. prawo do ich
generalizowania na sytuacje pozalaboratoryjne i inne populacje; szerzej
ten problem omawia Brzeziński, 2004). Łatwo się domyślić, że ludzie z
różnych części świata będą różnili się pod kątem takich zachowań i cech
jak chodzenie do kościoła, postrzeganie roli kobiet w społeczeństwie czy
waga przykładana do indywidualnych osiągnięć. Jednakże niedawna
analiza Heinricha i zespołu (2010) pokazała, że międzykulturowo
występują różnice w zakresie nawet takich - wydawać by się mogło mało
związanych z kulturą - procesów jak uleganie iluzjom wzrokowym. Nie
posiadamy jeszcze teorii, która wyczerpująco tłumaczyłaby, które elementy
fenotypu psychologiczne są względnie niezależne od wpływów
kulturowych, stąd profilaktycznie lepiej badać wszystkie pod kątem
zmienności kulturowej, przynajmniej jeśli badacz chce mieć zasadne
roszczenia do uniwersalności odkrytych przez siebie zjawisk
psychologicznych.
5. co ważne, badania z wykorzystaniem innych osób, metod i warunków
mogą pomóc nie tylko w ustaleniu rzeczywistej trafności zewnętrznej
określonego efektu i dopuszczalności generalizacji, ale również wydatnie
przyczynić się do odkrycia nieznanych moderatorów i mediatorów efektów,
a nawet zupełnie nowych zjawisk. Jak zauważa we wspomnianej wcześniej
analizie Heinrich z zespołem (2010) porównania międzykulturowe pozwoliły
wykazać występowanie w innych kulturach efektów, które są nieznane w
kulturze zachodu, jak np. tendencja do karania osób zbyt dużo
12
wkładających we wspólną pulę w niektórych grach ekonomicznych
badających zaufanie.
Wszystkie powyższe uwagi nie są zbyt odkrywcze i wydaje się, że nie powinny
budzić wielu kontrowersji. Problem polega jednak na tym, że prawdopodobnie
praktyka badawcza znacząco odbiega od tych zaleceń. W szczególności wydaje się,
że psycholodzy mają tendencję do a) raczej badania („kolekcjonowania”) wielu
efektów, zamiast systematycznego pogłębiania rozumienia jednego efektu; b)
nagminnego korzystania z pośrednich miar zachowania, których trafność jest
niepewna lub przynajmniej mało precyzyjna; c) pomijania obserwacyjnej i opisowej
części pracy badawczej.
Hipotezy te mogą wyjaśniać, dlaczego pomimo olbrzymiej akumulacji badań
empirycznych, wielu badaczy odnosi wrażenie powolnego postępu w psychologii. W
swoim badaniu chciałbym spróbować systematycznie je zweryfikować za pomocą
metod naukometrycznych, w szczególności badania zawartości czasopism i
powiązanych artykułów. Zanim jednak omówię metodę, przybliżę krótko
najważniejsze źródła, które zainspirowały mnie do postawienia takich hipotez.
Czy psychologia rzeczywiście zajmuje się zachowaniem?
Trójka badaczy o uznanym dorobku w psychologii społecznej Baumeister,
Vohs i Funder (2007) głęboko w to powątpiewa. Ich artykuł analizujący ten problem
nosi znamienny tytuł „Psychologia jako nauka o samoopisach i ruchach palców”, co
oddaje doskonale jego treść. Autorzy przeanalizowawszy wybrane numery
sztandarowego czasopisma psychologii społecznej Journal of Personality and Social
Psychology (dalej: JPSP), wykazali, że rzeczywistego zachowania jest bardzo
niewiele, a olbrzymią większość stanowią jego pośrednie miary takie jak tytułowe
samoopisy i techniki oparte na czasach reakcji („ruchy palców”). W analizowanych
numerach JPSP (z 2006 roku) mniej niż 20 % empirycznych badań polegało na
obserwacji i pomiarze rzeczywistego badania. Pozostałe badania wykorzystywały
rozmaite skale szacunkowe, szczególnie w postaci samoocen, czasami wymagano
od badanych, aby wyobrazili sobie hipotetyczne sytuacje i określili, jak by
zareagowali, a kiedy indziej proszono o sprawozdanie z przeszłych zachowań.
Autorzy w ten sposób podsumowali swoją analizę:
Tak oto wygląda „zachowanie” w czołowym czasopiśmie psychologii
społecznej i osobowości: oceny, oceny i jeszcze raz oceny, okazjonalnie jakiś
13
wybór, czytanie i wypełnianie testu oraz przekreślanie litery „e” (Baumeister i
in., 2007, s. 398).
Dodatkowo przeanalizowano również zawartość numerów JPSP z dekad
1960.-1990.. Stwierdzono, że spadek znaczenia „zachowania” rozpoczął się w latach
80., bowiem jeszcze w latach 70. zachowanie występowało w ponad 80 % badań.
Autorzy pozwolili sobie na kilka spekulacji na temat przyczyn takiego stanu rzeczy.
Ich zdaniem wynika on z pewnego oportunizmu psychologów. Poproszenie
badanych o wypełnienie kwestionariusza lub zareagowanie na serie bodźców na
ekranie komputera jest łatwiejsze niż zaaranżowanie eksperymentów
behawioralnych, szczególnie w sytuacji, gdy prestiżowe czasopisma wymagają kilku
badań (np. Carver, 2004). Dodatkowo, ich zdaniem komisje etyczne na
uniwersytetach wykazują niejednokrotnie nadmierne przewrażliwienie na zagrożenia
etyczne badania: „z punktu widzenia komisji etycznej jest mniej inwazyjne zapytać
badanego ile zjadł, niż obserwować ile rzeczywiście zjadł [C]. Analogicznie jest mniej
inwazyjne zmierzenie „uprzedzeń” poprzez szybkość naciskania klawiszy w
odpowiedzi na bodźce na komputerze niż zaobserwowanie jak badany wchodzi w
interakcje z osobą, wobec której mógłby być uprzedzony” (Baumeister i in., 2007 s.
400).
Wyniki analizy trójki psychologów społecznych są o tyle zaskakująca, że -
historycznie patrząc - większość najbardziej znanych klasycznych badań
psychologicznych (przynajmniej tych według wyboru Hocka, 2003) mierzyła
rzeczywiste zachowanie, a nie jego pośrednie wskaźniki.
Analogiczne wnioski przynosi analiza Furra (2009), tyle, że jest ona
poświęcona obecności „zachowania” w psychologii osobowości. Autor
przeanalizował trzy roczniki (1997; 2002; 2007) JPSP (sekcji poświęconej
osobowości) oraz Journal of Personality. Ogólnie różne formy danych
behawioralnych występowały w ok. 20-25 % badań, przy czym bezpośrednio
obserwowane zachowanie w 2.5 %, a raportowane bieżące zachowanie (np. w
postaci prowadzonych dzienników) w około 1 %. Większość danych behawioralnych
(ok. 13 %) stanowiły retrospektywne sprawozdania z przeszłych zachowań robione
przez badanego lub osoby dobrze go znające. Zdecydowana większość badań nie
zawierała żadnych danych behawioralnych, ale „specjalność” psychologów czyli
korelacje testów z testami.
14
Co ważne Furr wprowadza definicję zachowania, którą chciałbym się
posługiwać w dalszych analizach, definicję która - jak wydaje się - czyni sprawne
rozróżnienie pomiędzy rzeczywistym zachowaniem, a jego pośrednimi wskaźnikami.
Jego zdaniem zachowanie to „wypowiedzi (wyłączając raporty werbalne w kontekście
testowania psychologicznego) lub ruchy, które są potencjalnie dostępne dla
uważnego obserwatora korzystającego z normalnych procesów zmysłowych” (Furr,
2009, s. 372). Ta definicja wyłącza z zachowania wewnętrzne procesy fizjologiczne
lub neuronalne, ale także milisekundowe różnice w czasach reakcji, które są
niedostępne dla obserwatora korzystającego z normalnych procesów zmysłowych.
Poprzez uwzględnienie tylko obserwowalnych elementów zachowania, ta definicja
kładzie szczególny nacisk na rolę zachowania w interakcjach społecznych.
Za dopełnienie tych analiz niechaj posłuży esej Cialdiniego (2009), który zdaje
relację z coraz większych problemów z publikowaniem artykułów w JPSP z
badaniami zachowania w naturalnych kontekstach (szczególnie wyników
eksperymentów terenowych). Autor wyraża wątpliwości czy współcześnie
przeprowadzane badania mają dużą trafność zewnętrzną, szczególnie pod kątem
projektowania interwencji dla decydentów.
Na gruncie polskim podobne spostrzeżenia wyprowadził Doliński (2008), który
zwrócił uwagę na to, że współcześnie psychologia społeczna w niewielkim stopniu
koncentruje się na badaniu zachowań pozawerbalnych.
Czy psycholodzy pomijają etap obserwacji i opisu?
Powyższe artykuły w istotny sposób uzupełniają rozważania badacza o
biologicznym „backgroundzie” Paula Rozina (2001). Rozin upatruje słabości
psychologii społecznej w błędach metodologicznych popełnianych przez naukowców,
w szczególności w zbyt dużym nacisku na eksperyment i przedwczesnym
formułowaniu modeli teoretycznych, zamiast szerokiej i dogłębnej obserwacji i opisu
fenomenów psychologicznych (tj. nie kwestionuje roli eksperymentów i modeli jako
takich, ale twierdzi, że psychologowie za szybko do nich zmierzają pomijając rzeczy
bardziej podstawowe). Patrząc historycznie – zdaniem Rozina – badania w naukach
przyrodniczych zwykle zaczynały się od próby systematycznego opisu odkrytego
zjawiska, jego uniwersalności (i anomalii), a dopiero potem następowały próby
znalezienia regularności, czy wreszcie praw. Jako przykład podaje sformułowanie
prawa gazów Boyle’a i praw genetyki Mendla, które nie były pierwotnie motywowane
15
chęcią weryfikacji określonego modelu, ale raczej próbą jak najdokładniejszego
opisania interesujących fenomenów.
Autor wytyka też psychologii społecznej inne pomniejsze błędy np. korzystanie
w badaniach z bardzo jednorodnych i „niszowych” grup (studentów psychologii i
członków cywilizacji zachodniej), które są następnie generalizowane na całą
populację ludzką, nie uwzględnianie kontekstów i nie wymienianie ich w badaniach z
psychologii społecznej (np. pora dnia, pora roku, miejsce itd. itp.), tak jakby badania z
tej dziedziny były oderwane od reszty rzeczywistości i te informacje nie miały
żadnego znaczenia. Oddając głos Rozinowi:
W przeciwieństwie do odnoszących sukcesy nauk przyrodniczych czy
psychologii percepcji, badania w psychologii społecznej nie zostały
poprzedzonej gruntowną obserwacją i zbieraniem informacji o istotnych
fenomenach oraz opisem uniwersalnych stałych. W bardziej dojrzałych
naukach, które psychologia chciałaby naśladować, większy nacisk kładzie się
na opis fenomenów, jak również w mniejszym stopniu polega się na
eksperymentach. Takie nauki, szczególnie nauki biologiczne, zwracają
mniejszą uwagę na modele i hipotezy, a większą na dane, w przeciwieństwie
do „dowodów” lub badań „definitywnie” potwierdzających hipotezę. W
badaniach nad zachowaniem człowieka w sytuacjach społecznych, w których
efekty kontestualne są liczne, a istotne procesy złożone, zebranie danych,
które jednoznacznie potwierdzą hipotezę jest niezwykle trudne (Rozin, 2001,
s. 3).
Aby dowieźć zasadności swoich intuicji Rozin porównuje zawartość kilku
numerów JPSP i trzech prestiżowych czasopism biologicznych (Cell, American
Jorunal of Physiology, Development). Jak zauważa w JPSP w około 70 % badań
uczestniczą tylko studenci amerykańscy; bardzo rzadko wymienia się religię, rasę,
religię badanych, albo to w jakiej porze roku odbywało się badanie; większość badań
inspirowanych jest wyartykułowanym modelem lub hipotezą (70 % w obszarze
poznania społecznego); posiada statystyki inferencyjne (100%!) i nie zawiera
żadnych obserwacji. Dla porównania badania w czasopismach biologicznych bardzo
rzadko są inspirowane modelem teoretycznym (ok. 20 %). Najczęstszą inspiracją jest
chęć opisu procesu „jak X wpływa na Y” (np. 62 % artykułów w czasopiśmie Cell) lub
„jak X zmienia się w czasie od t1 do t2” (43 % w Development). Statystyki
inferencyjne spotyka się rzadko (0 % badań w czasopiśmie Cell, 14 % w
16
Development, ale 85 % w American Jorunal of Physiology). Dodatkowo czasopisma
biologiczne regularnie replikują określone prawidłowości na podstawie danych
dotyczących wielu gatunków (biologiczny odpowiednik używania różnych grup
społecznych i kulturowych).
Uwagi Rozina skłaniają do refleksji. Psycholodzy rozwojowi badający małe
dzieci, albo etolodzy badający zwierzęta nie mogą rozdać swoim badanym serii
kwestionariuszy, albo posadzić ich przed komputerem i poprosić o zareagowanie na
serie bodźców, stąd - chcąc nie chcąc - muszą obserwować. W etologii regularnie
spotykamy badania oparte na setkach lub tysiącach godzin obserwacji (przykładowo,
badanie transmisji kulturowej pewnych zwyczajów u makaków japońskich oparto na 2
tys. godzin obserwacji, Hoffmann i in., 2008), i takich badań nie sposób znaleźć w
psychologii społecznej (z całym szacunkiem dla makaków japońskich, ale wydaje się,
że człowiek jest gatunkiem równie ciekawym i można mu poświęcić podobną ilość
czasu).
Rozin prezentuje pewną filozofię nauki, która zakłada, że teorie i
eksperymenty są poprzedzane przez obserwacje i opisy. Zasadniczo zgadzam się z
nim, choć proces rozwoju nauki zapewne bardzo trudno poddać algorytmizacji. Tak
czy owak, prawdopodobnie więcej badań opisowych tam gdzie to możliwe nie
zaszkodziłoby psychologii społecznej. Przede wszystkim mogłyby stanowić pewien
korpus wiedzy dla budowania hipotez i teorii. W psychologicznych czasopismach i
podręcznikach akademickich niezwykle rzadko (praktycznie nigdy?) znajdziemy
odpowiedzi na pytania typu: „o czym zwykle ludzie rozmawiają”, „w jaki sposób
spędzają czas wolny”, „na co wydają pieniądze”, „jak okazują niechęć lub sympatię
innym” (co wykazał w innym artykule także Rozin, 2006). Czasami można znaleźć
wyjątki od reguły (przykładowo: Dunbar i współpracownicy (1997) przysłuchiwali się
zwykłym towarzyskim rozmowom osób w kawiarniach i na kampusach i odnotowali,
że zdecydowana większość rozmów dotyczy tematów społecznych, co stało się
podstawą do zbudowania pewnych hipotez dotyczących ewolucyjnych funkcji
języka), ogólnie jednak można odnieść wrażenie, że dla psychologów taka wiedza
jest zbyt „mało wyrafinowana”.
Rozin nie mówi „róbmy wszystko tak samo jak badacze komórek”. Zmusza
raczej do zastanowienia, czy to co robimy teraz zawsze dobrze nam służy. Nie od
dziś wiadomo, że nadmierne przywiązanie do modeli teoretycznych może ograniczać
rozwój (Greenwald i in., 1986; modelowym, wręcz „klinicznym”, przypadkiem takiego
17
upośledzenia jest bodajże psychoanaliza). Podobnie trudno nie zgodzić się z
Rozinem w stwierdzeniu, że stosowanie eksperymentu, gdy wiemy mało o badanym
zjawisku, zapewne niewiele poszerzy naszą wiedzę. Jeśli eksperymentalnie
stwierdzimy, że X wywiera wpływ na Y (na ogół w badaniach psychologicznych ów
„X” wywiera wpływ na kilka, kilkanaście procent wariancji „Y”), w dalszym ciągu
niewiele wiemy co oprócz X może jeszcze wpływać na Y, w jaki sposób X wchodzi w
interakcję z innymi zmiennymi wywołującymi Y, nie mówiąc już o najbardziej
elementarnym pytaniu: jaki podstawowy proces powoduje, że X wywołuje Y. Jest
zapewne możliwe, że jakiś genialny badacz wygeneruje i przetestuje wszystkie
rozsądne hipotezy co do zmiennych wywołujących Y, choć przypuszczam, że jest to
bardzo mało prawdopodobne. Sądzę raczej, że etap gruntownego opisu określonego
zachowania z większym prawdopodobieństwem zaowocuje trafnymi hipotezami, co
do potencjalnych moderatorów i zmiennych istotnie modyfikujących dany efekt niż
sytuacja, gdy badacz angażuje się tylko w badanie eksperymentalne z celem
potwierdzenia lub falsyfikacji gotowego modelu. Nie wspominając już o tym, że
wiedza opisowa zapewne będzie łatwiej doprowadzało do uwspólniania języka przez
badaczy, co często jest wymieniane jako oznaka niedojrzałości psychologii.
Jak to miałoby wyglądać w praktyce?
Przeanalizuję teraz krótko kilka przykładowych artykułów empirycznych z
ostatniego JPSP (plus jedno nieco starsze). Pozwoli to lepiej zilustrować główne idee
w dalszej części.
1. McGregor i in. (2010)
a. Zakładany efekt: niemożność zrealizowania konkretnych celów będzie
zwiększała zaangażowanie w zachowania religijne
b. Sposób dowodzenia występowania efektu: osoby, które otrzymywały
nierozwiązywalne zadanie wykazywały wyższy wzrost przekonań
religijnych (mierzonych kwestionariuszowo) w porówaniu do osób z
grupy kontrolnej (uwzględniano również pewne zmienne dyspozycyjne,
ale dla tych rozważań to nieistotne)
2. Hafer (2000)
a. Zakładany efekt: dostrzegana niesprawiedliwość wywołuje „wiarę w
sprawiedliwy świat” (m.in. obwinianie jej ofiary, dystansowanie się od jej
cierpienia itp.)
18
b. Sposób dowodzenia występowania efektu: osobom eksperymentalnie
indukowano „wiarę w sprawiedliwy świat” poprzez wyświetlanie filmu o
ofierze pobicia z niesprawiedliwym lub sprawiedliwym zakończeniem, a
następnie mierzono czas reakcji w zmodyfikowanym zadaniu Stroopa
na słowa związane ze sprawiedliwością (i inne słowa oraz kontrolne);
dodatkowo osoby odpowiadały jak bardzo identyfikowały się z ofiarą.
Osoby dłużej (ok. 90 ms.) reagowały na słowa związane ze
sprawiedliwością w sytuacji niesprawiedliwości, jak również relatywnie
do innych słów. Dodatkowo ta ostatnia różnica była skorelowana z
tendencją do niewielkiego identyfikowania się z ofiarą.
3. Bergsieker i in. (2010)
a. Zakładany efekt: osoby białe w interakcji z osobą czarną będą przede
wszystkim podkreślały swoją sympatyczność; natomiast osoby czarne
w obecności osób białych swoją kompetencję (inteligencję, wiedzę itp.),
gdyż obydwie grupy chcą przeciwdziałać stereotypom i oczekiwaniom
drugiej strony
b. Sposób dowodzenia efektu: 1) proszono o wyobrażenie sobie interakcji
z osobą tej samej rasy lub innej rasy i odpowiadanie na pytanie o to
jakie elementy zachowania byłyby ważne 2) badanie ankietowe na
temat zachowania w obecności przyjaciela innej rasy lub tej samej 3)
zaaranżowanie interakcji z osobą z innej lub takiej samej rasy, a
następnie ocena przez ślepych sędziów kompetentnych zachowań na
podstawie nagrań na taśmach wideo
4. Piff i in. (2010)
a. Zakładany efekt: osoby z niższych klas społecznych są bardziej
prospołeczne (co wyrażą się m.in. większą szczodrością, zaufaniem i
gotowością do pomagania)
b. Sposób dowodzenia efektu: trzy eksperymenty, w tym dwie gry
ekonomiczne w których mierzono gotowość do dzielenia się i zaufanie
do partnera gry (np. poprzez dzielenie się potencjalnymi punktami, bez
gwarancji ich odzyskania); eksperyment w którym mierzono gotowość
do pomocy rzekomemu drugiemu badanemu; badanie
kwestionariuszowe w którym indukowano poczucie przynależności do
różnych stopni drabiny społecznej (poprzez poznawcze porównywanie
19
się z osobami stojącymi nisko lub wysoko), a następnie wypełniano
ankietę mierząca „ile należy łożyć na dobroczynność”. Z wyjątkiem
ostatniego badania przynależność do klasy społecznej badano poprzez
kwestionariuszowe samooceny
Wszystkie powyższe artykuły empiryczne z pewnością zaliczają się do „górnej
półki”. Aby dowieźć zakładanych efektów przeprowadzano kilka niezależnych badań
(zwykle minimum 4), stosowano alternatywne, czasami pomysłowe metody, nieco
modyfikowano warunki i próbowano wyeliminować alternatywne wyjaśnienia.
Trafność wewnętrzna wydaje się być bez zarzutu. Podbudowa teoretyczna
gdzieniegdzie jest solidna. Ogólnie artykuły jako takie z pewnością zasługują na druk,
a poznawczo wskazują, że istnieją dobre wstępne przesłanki, żeby przypuszczać, że
hipotetyczne efekty są prawdziwe.
Ogólnie jednak powyższe artykuły powinny stanowić początek pracy nad
dowodzeniem rzeczonych efektów, natomiast znając praktykę prawdopodobnie
dalszych dociekań nie będzie lub będzie ich bardzo niewiele. Rzetelna praca
empiryczna wymagałaby teraz, aby niezależny zespół badaczy zreplikował owe
badania (aby wykluczyć występowanie jakiś niezidentyfikowanych artefaktów),
następnie warto by sprawdzić tradycyjne zagrożenia trafności zewnętrznej
(Brzeziński, 2004): czy inne osoby, inne warunki i sposoby manipulacji zmiennymi lub
inne okoliczności kulturowe nie zmieniają zasadniczo obrazu wyników.
Zakładając nawet, że hipotetyczne efekty są trafne zewnętrznie (np. inne
grupy społeczne zasadniczo uzyskiwałyby podobne wyniki) w dalszym ciągu owe
badania relatywnie niewiele mówią nam o tym jak owe efekty mają się do „życia
codziennego”. Przykładowo w badaniu nad zachowaniami religijnymi manipulacja
eksperymentalna podnosiła wynik o ok. pół punktu na pięciopunktowej skali postaw
religijnych. Choć można wyliczyć wielkość efektu relatywnie do grupy kontrolnej,
myślę jednak, że powie nam to bardzo niewiele jak bardzo porażka w życiu
codziennym będzie zwiększyła uczestnictwo w praktykach religijnych. Analogicznie
nie wiemy czy 90 ms różnicy w zmodyfikowanym zadaniu Stroopa (badanie 2)
przekłada się na radykalne zmniejszenie wrażliwości na ofiary niesprawiedliwości czy
niewielkie? Może też być tak, że obecny w laboratorium efekt, w codziennym życiu
wskutek interakcji z innymi zmiennymi rozmywa się zupełnie, a może wprost
przeciwnie, potęguje się.
20
Oto kilka pomysłów jak mogłyby wyglądać kontynuacje badań nad
hipotetycznymi efektami:
1. Niepowodzenia zwiększają zachowania religijne (McGregor i in., 2010):
pomimo tego że hipoteza implikuje konsekwencje behawioralne badano tylko
postawy. Być może ów efekt jest krótkotrwały i nie przekłada się na
zasadnicze zmiany zachowania? Być może nie jest on uniwersalny, ale
wynika tylko ze specyficznych funkcji religii w określonym kręgu kulturowym?
Na początku spróbowałbym powtórzyć eksperyment, tym razem jednak
zaangażować miarę behawioralną zamiast pomiaru postawy (przykładowo po
eksperymencie do badanych podchodziłby pomocnik badacza i zapraszał na
jakąś formę praktyk religijnych). Dalej można sobie wyobrazić podłużne nawet
kilkuletnie badania w których monitoruje się rozmaite aspekty życia badanych
oraz zaangażowanie w praktyki religijne (badani za stosowną gratyfikacją np.
regularnie wypełniają ankiety w Internecie). Dodatkowo można przebadać
różne grupy społeczne mniej lub bardziej „odnoszące sukcesy”, względnie
osoby o różnych stopniach sukcesu w obrębie grup społecznych pod kątem
ich aktywności religijnej.
2. „Wiara w sprawiedliwy świat” (Hafer, 2000): tutaj również nie mierzono
zachowania, ale pośrednią reakcję poznawczą, której status teoretyczny jest
jeszcze mocno niedookreślony (przykładowo w przypadku innej miary opartej
na czasach reakcji tj. testu utajonych skojarzeń, niedawna meta-analiza
wykazała, że jego korelacje z zewnętrznym kryterium tj. zachowaniem, sądem
lub miarą fizjologiczną, są umiarkowane, średnio r=0,274; pomimo tego, że
czasami wyższe niż wskaźniki jawne, szczególnie w przypadku postaw
rasowych, Greenwald i in., 2009). Można wyobrazić sobie próby weryfikacji
tego efektu: przeprowadzić eksperyment laboratoryjny lub terenowy w którym
osoby badane mają możliwość pomóc rzekomym ofiarom (np. poprzez
przedstawienie alternatywnych historii co do sprawiedliwej lub
niesprawiedliwej kontynuacji ich historii). Jeżeli ten efekt jest prawdziwy,
osoby które padły ofiarą i których nie spotkała sprawiedliwość, powinny
również doświadczać pewnych form ostracyzmu i pod tym kątem można
przebadać takie osoby.
3. Interakcje międzyrasowe (Bergsieker i in., 2010): w jednym z badań pojawia
się nagrywanie rzeczywistej interakcji i analizowanie jej przez sędziów
21
kompetentnych (co jest z pewnością krokiem w dobrym kierunku). Dalsze
badania mogłyby wyglądać w ten sposób: obserwowanie i przysłuchiwanie się
interakcjom międzyrasowym w kawiarniach, lub innych publicznych miejscach,
korzystanie z rzeczywistych zarejestrowanych danych (np. rozmaitych talk
show), w szczególności warto sprawdzić co się dzieje gdy osoba nie powinna
się przejmować swoim stereotypem ulec odwróceniu (np. osoba czarna jest
stoi wysoko w hierarchii organizacji, a biała nisko). Badanie wykonano na
amerykańskich studentach i prawdopodobnie jest to grupa o nastawieniu
antyrasistowskim. Zastanawiające jest więc czy takie same efekty
zaobserwowano by u osób z grup o innych wartościach.
4. Klasa niższa bardziej skłonna do pomagania (Piff i in., 2010): to badanie
zasługuje na pochwałę w stosunku do poprzednich, gdyż 3 z 4 badań używało
jako zmiennej zależnej zachowania, co prawda w kontekście laboratoryjnym,
ale jednak. Jedno z badań uwzględniało procesy wewnętrzne. I tu można
sobie wyobrazić szereg prób uzupełnienia danych, szczególnie o
eksperymenty terenowe, ale również dane archiwalne o rzeczywistych
zachowaniach (przykładowo: skłonność osób z klas niższych do działania w
organizacjach charytatywnych; ilość udzielanych pożyczek znajomym itd.)
Pogłębianie badań nad określonymi efektami powinno pomóc wygenerować
lepiej udokumentowaną i tym samym pewniejszą wiedzę, ale również przy tej okazji
badacze powinni z większą szansą odkryć istotne moderatory hipotetycznych
efektów. Poza tym badanie tego samego efektu przy pomocy rozmaitych metod
może pomóc lepiej naturę niektórych pośrednich miar zachowania (takich jak czasy
reakcji), a tym samym przyszłe badania, które z jakichś względów (np. etycznych)
będą wykorzystywały tylko owe miary, będą mogły być z większym stopniem
pewności generalizowane na zachowania pozalaboratoryjne.
Rozdział 2
Omawiane w poprzednim rozdziale artykuły empiryczne są nowe (z wyjątkiem
jednego), tak więc trudno w tym momencie wyrokować jaki będzie los dalszych
badań nad hipotetycznymi efektami. W swojej pracy chciałbym wyselekcjonować z
grupy czasopism poświęconych psychologii społecznej z początku dekady artykuły
opisujące podobne efekty, a następnie na podstawie ich cytowań prześledzić los
badań nad nim. Analizy czasopism Rozina (2001) i Baumeistera z zespołem (2007)
stanowią dobry punkt wyjścia trzeba jednak przyznać, że są dokonane na niewielkiej
22
próbie i nie uwzględniają cyklu badań. Mam więc nadzieję, że moja analiza pozwoli
mi bardziej obiektywnie odpowiedzieć na pytania a) jak często badacze dowodząc
istnienia określonych efektów psychologicznych starają się korzystać z różnych
metod; b) jak często wśród tych metod pojawia się zachowanie (zgodnie z definicją
Furra, 2009); c) jak często replikują badania na członkach innych grup społecznych,
oraz w szczególności d) innych grup kulturowych. Dodatkowo chciałbym sprawdzić
jak często autorzy hipotetycznego efektu powołują się na systematyczne obserwacje
(postulat Rozina, 2001).
Zarys metody
Poniżej znajduje się wstępny zarys metody. W toku pracy prawdopodobnie
niektóre elementy mogą ulec modyfikacji i doprecyzowaniu (szczególnie sposoby
kategoryzacji).
I. Przeanalizować roczniki (zaczynając od roku 2000) czterech najbardziej
prestiżowych czasopism poświęconych psychologii społecznej tj. Journal of
Personality and Social Psychology, Journal of Experimental Social Psychology,
Journal of European Social Psychology, Personality and Social Psychology Bulletin
(dodatkowo również roczniki Studiów Psychologicznych jako uzupełnienie
porównawcze o akcent polski). Wybrać z każdego pierwsze 10 artykułów, które:
• są oryginalnymi artykułami empirycznymi;
• opisują jakiś efekt psychologicznych wywierający wpływ na zachowanie; tj.
różnice w zachowaniu w zależności od określonych zmiennych
dyspozycyjnych lub sytuacyjnych w przynajmniej 3 niezależnych
badaniach;
• opisują ten efekt jako pierwsze (tj. z analizy artykułu i bibliografii nie
wynika, że jest on replikacją lub rozszerzeniem wcześniejszych badań
analizujących ten sam efekt).
II. Następnie analizując prace cytujące wybrane artykuły (przy wykorzystaniu
odpowiednich baz w szczególności Google Scholar i SCOPUS) wyodrębnić te
artykuły empiryczne z dowolnych czasopism, które w całości lub części podejmują
empiryczną próbę weryfikacji zakładanego efektu (czy to jako dokładna lub
zmodyfikowana replikacja, dowodzenie występowania lub niewystępowania efektu na
innych populacjach, z wykorzystaniem innych metod lub źródeł danych itp.). W razie
potrzeby sprawdzić również artykuły cytujące artykuły replikujące oryginalne badania.
23
III. Przeanalizować co stanowiło inspirację do wygenerowania określonych
hipotez, w szczególności jak często badani poprzedzali swoje hipotezy obserwacją
interesujących efektów, lub do obserwacji się odwoływali.
IV. Skategoryzować metody w artykułach opisujących odkryte efekty oraz w
artykułach podejmujących próby replikacji, rozszerzenia itp.:
a) badanie laboratoryjne
a. w którym zmienną zależną jest rzeczywiste zachowanie wg definicji
Furra (2009)
b. w których zmienną zależną są różne formy samoopisu (w tym
wybory, oceny, postawy, hipotetyczna reakcja w określonej sytuacji
itp.)
c. w których zmienną zależną jest czas reakcji
d. w których zmienną zależną jest reakcja biologiczna (np. obraz
mózgu przy pomocy technik neuroobrazowania, przewodliwość
skóry itp.)
b) badanie terenowe
c) dane wytworzone nie na potrzeby eksperymentu (dane archiwalne,
statystyki, zapisy zachowania itd.)
d) sprawozdania werbalne
a. z przeszłych zachowań
b. z bieżących zachowań (np. w formie prowadzonych dzienników)
V. Cytujące artykuły skategoryzować pod kątem metody
a) dokładna replikacja
b) replikacja z uwzględnieniem innych osób
a. innych grup społecznych (ale z tej samej narodowości)
b. innych narodowości (ale z tego samego kręgu kulturowego)
c. innych grup kulturowych
c) replikacja tą samą metodą z uwzględnieniem innego materiału
bodźcowego, zmian procedury eksperymentalnej, wprowadzenia
dodatkowych moderatorów itp.
d) replikacja inną metodą eksperymentalną (kategoryzacja wg punktu V)
Dodatkowo uwzględnić czy cytujący artykuł podchodzi od tego samego
badacza (lub jego zespołu) czy też jest przeprowadzony przez niezależny zespół
Podsumowanie
24
Na podstawie zebranych danych chciałbym podjąć próbę wyciągnięcia
wniosków o na temat praktyki badawczej we współczesnej psychologii społecznej. W
szczególności:
a) jak często określona badana eksperymentalnie hipoteza jest poprzedzona
obserwacjami lub opisami zachowania – przypuszczam, że praktycznie
nigdy
b) jak często do dowodzenia określonego efektu wykorzystuje się rzeczywiste
zachowanie (zgodnie z definicją Furra, 2009) - przypuszczam, że rzadko
c) jak często po sprawozdaniu odkrycia efektu inni badacze próbują
zreplikować efekt, w szczególności z wykorzystaniem innych metod i grup
badanych – przypuszczam, że rzadko
d) jak często badacze korzystają z dosyć różnych metod, aby wykazać ten
sam efekt – przypuszczam, że sporadycznie
Liczę na to, że moja ilościowa analiza pozwoli mi dokonać pewnych
ilościowych i jakościowych uogólnień co do typowych praktyk badawczych w ramach
psychologii społecznej. Być może również uda mi się odnaleźć i opisać przykłady
serii badań, w których udanie i zasadniczo pogłębiano rozumienie danego efektu i
tym samym przybliżyć się do naszkicowania „złotego standardu” postępowania
badawczego w psychologii społecznej. Mam również nadzieję, że moja analiza
pozwoli powiedzieć coś na temat kondycji współczesnej psychologii jako całości.
25
Bibliografia
Ariely, D. (2009). Potęga irracjonalności. Wrocław: Wydawnictwo Dolnośląskie.
Baumeister, R., Vohs, K., Funder, D. (2007). Psychology as the science of self-
reports and finger movements: Whatever happened to actual behavior?
Perspectives on Psychological Science, 2, 396-403.
Bergsieker, H., Shelton, J., Richeson, J. (2010). To be liked versus respected:
Divergent goals in interracial interactions. Journal of Personality and Social
Psychology, 99, 248-264.
Bevan, W. (1991). Contemporary psychology: A tour inside the onion. American
Psychologist, 46, 475-483.
Boyack, K.W., Klavans, R., Börner, K. (2005). Mapping the backbone of
science. Scientometrics, 64, 351-374.
Brzeziński, J. (2004). Trafność zewnętrzna terenowych badań eksperymentalnych.
Zagadnienia Naukoznawstwa, 161, 455-469.
Callaghan, T., Rochat, P., Lillard, A., Claux, M., Odden, H., Itakura, S., et al. (2005).
Synchrony in the onset of mental-state reasoning: evidence from five
cultures. Psychological Science, 16, 378-384.
Carver, C. S. (2004) Editorial. Journal of Personality and Social Psychology, 86, 95.
Cialdini, R. (2009). We Have to Break Up. Perspectives on Psychological Science, 4,
5-6.
Doliński, D. (2008). O naturze eksperymentowania w psychologii społecznej.
Psychologia społeczna, 3, 87-91.
Dunbar, R., Marriott, A., Duncan, N. (1997). Human conversational behavior. Human
Nature, 8, 231-246.
Dunbar, R., Clark, A., Hurst, N. (1995). Conflict and cooperation among the Vikings:
Contingent behavioral decisions. Ethology and Sociobiology, 16, 233-246.
Furr, R. (2009). Personality psychology as a truly behavioural science. European
Journal of Personality, 23, 369-401.
Graham, J., Haidt, J., Nosek, B. (2009). Liberals and conservatives use different sets
of moral foundations. Journal of Personality and Social Psychology, 96, 1029-
1046.
Greenwald, A., Poehlman, T., Uhlmann, E., Banaji, M. (2009). Understanding and
using the Implicit Association Test: III. Meta-analysis of predictive
validity. Journal of Personality and Social Psychology, 97, 17-41.
26
Greenwald, A. G., Pratkanis, A. R., Leippe, M. R., Baumgardner, M. H. (1986). Under
what conditions does theory obstruct research progress? Psychological
Review, 93, 216-229.
Hafer, C. (2000). Do innocent victims threaten the belief in a just world? Evidence
from a modified Stroop task. Journal of Personality and Social Psychology, 79,
165-173.
Henrich, J., Heine, S. J., Norenzayan, A. (2010). The weirdest people in the
world? Behavioral and Brain Sciences, 33, 61-83.
Hock, R. (2003). 40 prac badawczych, które zmieniły oblicze psychologii. Gdańsk:
Gdańskie Wydawnictwo Psychologiczne.
Huffman, M., Nahallage, C., Leca, J. (2008). Cultured Monkeys: Social Learning Cast
in Stones. Current Directions in Psychological Science, 17, 410-414.
Kenrick, D. T., Neuberg, S. L., Cialdini R. B. (2006) Psychologia społeczna.
Rozwiązane tajemnice. Gdańsk: Gdańskie Wydawnictwo Psychologiczne.
Mayr, E. (2004) What makes biology unique. Considerations on the autonomy of a
scientific discipline. Cambridge: Cambridge University Press.
McGregor, I., Nash, K., Prentice, M. (2010). Reactive approach motivation (RAM) for
religion. Journal of Personality and Social Psychology, 99, 148-161.
Nisbett, R. E., Cohen, D. (1996). Culture of honor: The psychology of violence in the
south. Boulder, CO: Westview.
Nisbett, R.E., Wilson, T.D. (1977). Telling more than we can know: Verbal reports on
mental processes. Psychological Review, 84, 231–259.
Peters, D.P., Ceci, S.J. (1982). Peer-review practices of psychological journals: The
fate of published articles, submitted again. Behavioral and Brain Sciences, 5,
187–255.
Piff, P., Kraus, M., Cheng, B., Keltner, D. (2010). Having less, giving more: The
influence of social class on prosocial behavior. Journal of Personality and
Social Psychology, [Advance online publication].
Rand, K., Ilardi, S. (2005). Toward a consilient science of psychology. Journal of
Clinical Psychology, 61, 7-20.
Rosenthal, R., Rosnow, R.L. (2009) Artifacts in behavioral research. Oxford: Oxford University Press.
27
Rozin, P. (2001). Social psychology and science: some lessons from Salomon Asch.
Personality and Social Psychology Review, 5, 2-14.
Rozin, P. (2006). Domain Denigration and Process Preference in Academic
Psychology. Perspectives on Psychological Science, 1, 365-376
Schmitt, D.P. (2005). Fundamentals of human mating strategies. w: D. Buss (red.)
Handbook of Evolutionary Psychology, New York: Wiley. s. 258-291.
Simonton, D.K. (2004). Psychology’s status as a scientific discipline: Its empirical
placement within an implicit hierarchy of the sciences. Review of General
Psychology, 8, 59–67.
Staats, A. (1999). Unifying psychology requires new infrastructure, theory, method,
and a research agenda. Review of General Psychology, 3, 3-13.
Suls, J., Martin, R. (2009). The air we breathe: A critical look at practices and
alternatives in the peer-review process. Perspectives on Psychological
Science, 4, 40-50.
Walsh, A. (1991). Self-esteemand sexual behavior: Exploring gender differences.
Sex Roles, 25, 441–450.
West, S.G., Brown, T.J. (1975). Physical attractiveness, the severity of the
emergency and helping: A field experiment and interpersonal simulation.
Journal of Experimental Social Psychology, 11, 531–538.
Wilson, T.D., Gilbert, D.T. (2005). Affective forecasting: Knowing what to want.
Current Directions in Psychological Science, 14, 131–134.