1 Status poznawczy badań eksperymentalnych w psychologii

1

Status poznawczy badań eksperymentalnych w psychologii społecznej - kontekst

trafności zewnętrznej

Łukasz Budzicz

Uniwersytet im. A. Mickiewicza w Poznaniu

Konspekt na otwarcie przewodu doktorskiego

napisany pod kierunkiem profesora Jerzego Brzezińskiego

2

Autor składa serdeczne podziękowanie Panu Profesorowi Jerzemu Brzezińskiemu

za nieocenioną pomoc merytoryczną i życzliwe wsparcie

3

Wprowadzenie

Psychologia jest jedną z podstawowych nauk empirycznych, a większość jej

nurtów współdzieli z innymi podstawowymi naukami (szczególnie fizyką, chemią i

biologią) najważniejsze założenia epistemologiczne, w szczególności to, które

zakłada występowanie poznawalnych na drodze empirycznej praw rządzących

fenomenami, które są w obrębie zainteresowania danej nauki (co – moim zdaniem –

pozytywnie odróżnia ją od niektórych postmodernistycznych nurtów humanistyki

zakładających brak wiedzy obiektywnej i antyempiryzm). Dyscyplina posiada

ugruntowaną pozycję instytucjonalną na uczelniach i cieszy się pewnym poważaniem

w oczach opinii publicznej. Niedawna analiza powiązań pomiędzy czasopismami

naukowymi z wykorzystaniem zaawansowanych metod naukometrycznych wykazała,

że psychologia jest jedną z 7 centralnych nauk (hub science) tj. nauką, wokół której

koncentrują się inne dyscypliny (Boyack i in., 2005). Psychologowie generują

corocznie olbrzymią ilość wiedzy pochodzącej z badań empirycznych (przykładowo

baza PsycINFO grupuje abstrakty z prawie 2,5 tys. czasopism), a wiele czasopism

pod względem rygorów edytorskich w niczym nie ustępuje najbardziej prestiżowym

czasopismom fizycznym czy biologicznym.

Pomimo tego w ostatnich latach pojawia się wiele głosów poważnie

kwestionujących kierunek w jakim zmierza psychologia jako całość. Rozmaici autorzy

zwracają szczególnie uwagę na brak unifikującej metateorii, która wyznaczałaby

ramy do rozumienia fenomenów psychologicznych (takimi metateoriami są w fizyce

mechanika kwantowa i teoria względności, a w biologii neodarwinowska synteza).

Inne zarzuty dotyczą braku ujednoliconych standardów badania zjawisk

psychologicznych, dużego stopnia separacji pomiędzy poszczególnymi

subdyscyplinami (a nawet różnymi obszarami w obrębie subdyscyplin),

pojawiających się i przemijających mód na metody i obszary badawcze oraz

znacznego rozdźwięku pomiędzy badaniami podstawowymi a praktyką. Przytoczmy

kilka reprezentatywnych cytatów:

Charakter psychologii w coraz większym stopniu manifestuje się w szybkim

przyroście wąsko zorientowanych i kompulsywnie wyizolowanych obozów,

przyroście, który zdaje się nie mieć żadnych granic. Dążymy do odpowiadania

na małe pytania, zamiast na duże, nie widzimy całego lasu tylko poszczególne

drzewa (Bevan, 1991, s. 475)

4

Kiedy spojrzymy na psychologię przez soczewkę unifikacji, zobaczymy naukę

wypełnioną nadmiarowymi pojęciami, zasadami, odkryciami, teoriami, testami,

terapiami i temu podobnymi. Akceptacja nadmiarowości prowadzi w naszej

płodnej nauce do niemożliwej do ogarnięcia, chaotycznej złożoności i braku

efektywności. Taki sposób działania byłby nie do zaakceptowania w fizyce,

chemii czy biologii, jest on wbrew podstawowemu wymaganiu parsymonii w

teorii naukowej. Nie mogłoby być tak, że jedna grupa fizyków używałaby

podstawowych pojęć masy, grawitacji, protonu, neutronu i kwarku, podczas

gdy druga grupa używała innych pojęć dla tych samych zjawisk, a ta różnica w

terminologii byłaby uzasadnionym powodem istnienia dwóch odrębnych teorii i

braku komunikacji. Ale tak się dzieje w psychologii, co skutkuje

zdumiewającym bałaganem i nieefektywnością. (Staats, 1999, s. 7)

[C] występujące w psychologii rozliczne i zróżnicowane programy badawcze,

nie są zwykle ani koherentnie powiązane ze sobą, ani w istotny sposób

związane z dociekaniami badawczymi w powiązanych dziedzinach

naukowych. Zamiast tego jesteśmy świadkami niepohamowanej akumulacji

różnorodnych faktów, odkryć i teorii, które zwyczajowo nie integrują się z

konkurencyjnymi enklawami badawczymi i frakcjami teoretycznymi. W skrócie,

psychologia funkcjonuje jako mało dojrzała nauka. (Rand, Ilardi, 2005, s. 7)

Praktycy w psychologii są w dalszym ciągu w stanie utrzymać względną

niezależność od psychologii jako nauki. Przykładowo, pomimo braku

przekonywującego empirycznego wsparcia, wielu profesjonalistów w dalszym

ciągu korzysta z technik podobnych do tych rozwiniętych przez Freuda prawie

wiek temu. W rzeczy samej wielu psychologów klinicystów i doradców

aktywnie kwestionuje twierdzenie, że terapie psychologiczne wymagają

empirycznej walidacji (Rand, Ilardi, 2005, s. 11).

Peters i Ceci (1982) wysłali niegdyś do dwunastu prestiżowych czasopism

psychologicznych artykuły, które ukazały się w tych samych czasopismach

kilkadziesiąt miesięcy wcześniej, zmieniając nieznacznie tytuły i abstrakty, oraz

podpisując je nazwiskami nieznanych autorów z nieznanych instytucji. Artykuły te

zostały odrzucone, jednak najczęściej (75%) nie ze względu na wykrycie próby

oszustwa, ale z powodu „poważnych błędów metodologicznych”! Nie stanowiło to

przeszkody, aby te same artykuły opublikować kilka miesięcy wcześniej. Te badanie

oraz bardzo wysoki stopień odrzutów występujący w czasopismach

5

psychologicznych, szczególnie na tle dużo bardziej dojrzałej fizyki (Sulz, Martin,

2009), wydaje się być pośrednim dowodem na to, że redaktorzy, recenzenci i

badacze posiadają umiarkowany konsensus, co do tego, co stanowi wartościowy

wkład w naukę psychologiczną.

Jakaś część wymienionych tutaj problemów z pewnością wynika z tego, że

psychologowie zajmują się fenomenami niewyobrażalnie złożonymi. Biolodzy

zgadzają się co do tego, że komórka jest systemem o stopniu złożoności

niespotykanym nigdzie w świecie zjawisk fizycznych (Mayr, 2004). Można zasadnie

zakładać, że 100 mld komórek wchodzących ze sobą w interakcje, które tworzą

ludzki mózg, jest systemem o jeszcze większej złożoności. Simonton (2004)

przebadał główne nauki wykorzystując rozmaite wskaźniki dojrzałości (m.in. stopień

konsensusu dotyczący tego, kto wniósł największy wkład w rozwój nauki; stosunek

praw do teorii w podręcznikach akademickich; ilość młodych naukowców z

ponadprzeciętną liczbą cytowań; produktywność naukowców po dłuższej przerwie w

karierze itp.) i wykazał, że nauki układają się pod względem tak

zoperacjonalizowanej dojrzałości w przewidywalny sposób: fizyka, chemia, biologia,

psychologia, socjologia (przy czym fizyka i chemia były do siebie względnie zbliżone,

w połowie skali znajdowała się biologia z blisko umiejscowioną psychologią, a na

końcu socjologia). Nietrudno zauważyć, że kolejność ta pokrywa się ze stopniem

matematyzacji poszczególnych nauk, stopniem złożoności badanych przez nie

obiektów oraz ich następstwem czasowym i przyczynowo-skutkowym w historii

wszechświata (tj. materia, życie, umysł, kultura).

Mając - pełną pokory - świadomość, że badane przez psychologów fenomeny

są niewyobrażalnie złożone i z tej racji psychologia z pewnością w najbliższych

dziesięcioleciach nie osiągnie choćby ułamka tej precyzji i koherencji, jaką posiada

fizyka, chciałbym w swojej pracy podjąć próbę analizy tych problemów, na które

psycholodzy jednak mają wpływ, i które mogą w jakimś stopniu przyczyniać się do

relatywnie niskiej dojrzałości psychologii i wolniejszego postępu naukowego. Jako

punkt wyjścia chciałbym przyjąć dwie analizy stanu współczesnej psychologii

społecznej przeprowadzone przez Rozina (2001) oraz Baumeistera, Vohs i Fundera

(2007) i spróbować dowieźć, że praca psychologów-badaczy zyskałaby na jakości,

gdyby większą wagę przykładali do opisu i obserwacji badanych fenomenów (przed

eksperymentalną sprawdzeniem hipotez) oraz opierali się na szerokiej klasie metod

badawczych i źródeł danych. Swoją analizę chciałbym ograniczyć tylko do obszaru

6

psychologii społecznej, co motywuję po części względami pragmatycznymi (wydaje

się, że próba ogarnięcia wszystkich subdyscyplin psychologii przy monstrualnej ilości

wiedzy obniżyłaby jakość końcowych wniosków), a po części przekonaniem, że

psychologia społeczna pełni szczególną rolę w psychologii, znajduje się bowiem

najbliżej zachowania sensu stricte, tym samym budując korpus wiedzy dla innych

subdyscyplin (np. neuropsychologii, psychologii ewolucyjnej, różnych obszarów

psychologii stosowanej), jak również jej odkrycia są najłatwiej i najszybciej

upowszechniane dla ogółu społeczeństwo (co może pośrednio wpływać na

wiarygodność psychologii jako nauki). Uważam również, że w psychologii społecznej

szczególnie duże znaczenie ma problem trafności zewnętrznej badanych efektów,

który jest szczególnie związany z zarysowanymi wcześniej postulatami.

Rozdział 1

Ramy filozoficzne

Panuje konsensus, co do tego, że psychologia jest nauką o zachowaniu

człowieka (względnie też zwierząt) i jego determinantach. Intuicja podpowiada, że

tym co interesuje naukowców najbardziej (także laików), jest zachowanie człowieka

w codziennych życiowych kontekstach, a więc opis i wyjaśnienie takich procesów jak

skuteczne przewodzenie ludziom, podejmowanie decyzji czy kupić określony

produkt, zabawa dzieci, zakochiwanie się, chorowanie na depresje itd. W psychologii

bardzo często bada się inne fenomeny (np. funkcjonowanie mózgu, różnice

indywidualne), ale wydaje się, że na ogół przyświeca temu na dłuższą metę cel, aby

lepiej zrozumieć zachowanie człowieka w owych codziennych życiowych kontekstach

(np. badamy różnice indywidualne, po to aby na ich podstawie określić tendencje do

określonych zachowań; badamy funkcjonowanie mózgu, aby lepiej rozumieć

podstawy neuronalne obserwowalnych zachowań itd.).

Psychologia, tak jak inne nauki empiryczne, zajmuje się wyjaśnianiem

obserwowanych zjawisk poprzez odwołanie do ogólnych właściwości obiektów,

procesów występujących w naturze oraz zmiennych, które wywierają wpływ na

konkretne wyjaśniane zachowanie. Mówiąc najprościej psychologia powinna być w

stanie podać powody, dlaczego określone zachowanie wystąpiło. Analizując

zawartość czasopism można łatwo dojść do wniosku, że psychologowie starają się

wyjaśnić zachowania poprzez odwołanie do czynników dyspozycyjnych, czynników

sytuacyjnych lub ich interakcji (wg tej klasyfikacji są zoorganizowane np.

podrozdziały w podręczniku Kenricka i in., 2006). Wiarygodna nauka powinna

7

potrafić nie tylko wyjaśnić określone fakty, ale i przewidzieć je, znając wszystkie

istotne zmienne, które je wywołują (słuchając komentarzy politologów w mediach

trudno nie oprzeć się wrażeniu, że niezawodnie znajdą post factum wytłumaczenie

dla dowolnych zachowań aktorów sceny politycznej; nie wydaje się jednak, żeby byli

w stanie przewidzieć rozwój sytuacji politycznej w ciągu choćby kilku dni).

Docelowym zadaniem psychologii jest więc w miarę precyzyjnie przewidzieć

zachowanie określonego człowieka, znając wszystkie istotne zmienne, które je

determinują. Nietrudno się domyślić, że na obecnym poziomie rozwoju nauki jest to

cel bardzo odległy.

Fundamentalnie tak samo działa fizyka, gdy stara się przewidzieć

„zachowanie” np. wysłanej do odległej planety sondy na podstawie znanych praw

natury i pomiaru istotnych zmiennych wywierających wpływ na ruch owej sondy (jako,

że sondy na ogół docierają do miejsca swojego przeznaczenia, można zakładać, że

wiedza fizyków jest całkiem rzetelna i zbliżona do prawdy). Sytuacja psychologa

różni się, niestety, pod kilkoma istotnymi względami, w szczególności zakładałbym

(gdzieniegdzie spekulatywnie), że:

1. zmiennych istotnie wpływających na zachowanie jest prawdopodobnie

znacząco więcej; spora ich część może być zupełnie nieznana dla nauki

2. pomiar istotnych zmiennych (np. indywidualnych dyspozycji) jest

nieporównywalnie mniej precyzyjny

3. niezwykle trudno wyizolować wpływ pojedynczych zmiennych na

wyjaśniane zachowanie (na prędkość toczącej się kulki wywierają wpływ

grawitacja, tarcie i opór powietrza, jednakże fizycy mogą wyizolować każdy

z tych czynników w laboratorium i na tej podstawie stworzyć ogólny wzór

na prędkość; psycholodzy mieliby znacznie większe trudności, żeby

wyizolować dajmy na to „czysty” wpływ sytuacji, w oderwaniu od

osobowości, szerszego obecnego kontekstu życia czy aktualnego stanu

fizjologicznego mózgu); wydaje się także, że pomiar niektórych zmiennych

jest zupełnie niemożliwy

4. sam fakt pomiaru może wywierać istotny wpływ na wyjaśniane zachowanie

(problem ten występuje też w innych naukach np. fizyce kwantowej, wydaje

się jednak, że psychologów dotyczy w szczególności)

5. zmienne wyjaśniające określone zachowanie, wchodzą ze sobą w

nieporównywalnie bardziej złożone interakcje np. wartość jaką przybiera

8

jedna zmienna może zmieniać naturę wzajemnej relacji dwóch innych

zmiennych (przykładowo: poczucie własnej wartości jest dodatnio

skorelowane z liczbą krótkoterminowych partnerów seksualnych u

mężczyzn, natomiast u kobiet taka zależność - w zależności od badań - nie

występuje lub jest negatywna; Walsh, 1991)

6. istnieją zmienne potężnie zakłócające proces badania, zaczynając od tego

jak osoba interpretuje sytuacje w której się znalazła (tzw. procesy

odgórne), skończywszy na całej gamie dobrze udokumentowanych

artefaktów na linii badacz-badany (Rosenthal, Rosnow, 2009)

7. wymagania etyczne ograniczają możliwości stosowania niektórych metod i

rodzajów manipulacji zmiennymi

Wszystko to powoduje, że praca psychologa nie tylko jest trudniejsza, ale też

więcej wymaga się, aby wykazać istnienie jakiegoś efektu w psychologii. A nawet

jeśli odkryje się i bardzo dobrze udokumentuje jakieś prawa rządzące zachowaniem

człowieka, na ogół jedyne na co możemy sobie pozwolić, to mało precyzyjne

twierdzenia opisowe typu „mężczyźni wykazują większą agresję fizyczną niż kobiety”.

Nie mamy możliwości stworzenia „wzorów na agresję” i wyliczenia jej poziomu na

podstawie znajomości wszystkich istotnych zmiennych.

Wydaje się jednak, że na tym etapie rozwoju nauki psychologowie-badacze

mogą zrobić kilka rzeczy, aby tworzyć korpus względnie pewnej wiedzy.

1. tam gdzie to możliwe badać (mierzyć) bezpośrednio zachowanie, a nie

pośrednie jego wskaźniki np. sprawozdania z przeszłych zachowań, czasy

reakcji itd. Pojęcie „badania bezpośredniego” może być problematyczne z

punktu widzenia niektórych stanowisk filozoficznych, dlatego poświęcę mu

więcej uwagi. Niektórzy badacze zakładają, że nie istnieje coś takiego jak

„czysta obserwacja” i teoria zawsze poprzedza obserwacje (np. Brzeziński,

2010, komunikacja osobista). Zasadniczo zgadzam się, jednak z pewnymi

zastrzeżeniami. Jeśli chcemy zaobserwować występowanie takich zjawisk

jak „wywieranie dobrego wrażenia”, „uleganie wpływowi”, „pomaganie

innym”, „dystansowanie się od drugiej osoby” to – chcąc, nie chcąc –

musimy korzystać z „teorii” znajdującej się w naszym systemie

poznawczym. Prawdopodobnie jednak nie ma to większego

epistemologicznego znaczenia, bowiem badacze (i laicy) będą w stanie z

dużym stopniem konsensusu zoperacjonalizować występowanie lub nie

9

takich zjawisk na podstawie obserwowalnych wskaźników, gdyż zdolność

do spostrzegania i interpretacji wspomnianych fenomenów w jakimś

stopniu jest zawarta w uniwersalnych wyewoluowanych cechach naszego

systemu poznawczego (tak jak zdolność widzenia kolorów czy odróżniania

strony prawej od lewej). Jestem świadom, że jest to założenie mocno

spekulatywne, ale niektóre badania m.in. nad uniwersalną w pewnym

wieku u małych dzieci ekspresją zdolności zwanych „teorią umysłu”

niezależnie od kultury (Callaghan i in., 2005), skłaniają mnie do wniosku,

że podstawowe ludzkie umiejętności poznania społecznego są tak samo

wrodzone i uniwersalne jak zdolność widzenia czy słyszenia („wrodzone”

nie znaczy przy tym, że wpływ środowiska jest nieistotny; najbardziej

elementarna umiejętność widzenia do swojego wykształcenia się wymaga

bodźców ze środowiska).

Tak więc moim zdaniem „teoria poprzedza obserwację”, ale jest to teoria

uniwersalna i nie stoi to na przeszkodzie naukowej komunikacji. Inną

sprawą jest natomiast sytuacja, gdy zachowanie mierzymy przy pomocy

pośrednich metod wypracowanych przez badaczy. Jeżeli chcemy wyjaśnić

skłonność do pomagania, to inną miarą jest zapytać badanego o to, czy

pomaga innym, a inną zaangażować sytuację w której badany może

pomóc (najlepiej, aby nie wiedział, że jest mierzona jego skłonność do

pomagania) i zaobserwować reakcje. Ta pierwsza miara może być w jakiś

sposób trafna, ale jest zapośredniczona przez wiele procesów (np.

pamiętanie, podwyższanie własnej samooceny, kulturowy wymóg

pomagania), które z pomaganiem mają niewiele wspólnego. Należy przy

tym zaznaczyć, że nie jest problemem to, że mierzymy coś pośrednio.

Fizycy bardzo często tak robią (np. mierząc średnicę atomu, albo odległość

od gwiazdy). Problemem jest to, że wiedza o zachowaniu, która jest

gromadzona przy pomocy pośrednich jego wskaźników jest bardziej

ułomna, gdyż relacja pomiędzy nią a rzeczywistym zachowaniem jest

zapośredniczona przez wiele procesów poznawczych, osobowościowych i

kulturowych, o których nie zawsze mamy przyzwoite pojęcie lub które po

prostu wypaczają wynik. Posiadamy natomiast solidne dowody, aby sądzić,

że niektóre pośrednie wskaźniki zachowania są w niektórych sytuacjach

mało trafne (np. werbalne wskazywanie przyczyn własnego zachowania,

10

Nisbett i Wilson, 1977; hipotetyczne przewidywanie własnego zachowania:

West, Brown, 1975; Wilson, Gilbert, 2005). Tam gdzie to możliwe pomiar

zachowania powinien być jak najbardziej „ubogi teoretycznie” (i wydaje się,

że jest taki w najbardziej słynnych badaniach psychologicznych takich jak

badania Ascha nad konformizmem, Miligrama nad posłuszeństwem,

Festingera nad dysonansem poznawczym, czy Seligmana nad wyuczoną

bezradnością).

2. minimalizować wpływ zmiennych zakłócających, szczególnie poprzez a)

angażowanie eksperymentów terenowych w których badani nie zdają sobie

sprawy, że uczestniczą w eksperymencie lub nie wiedzą jaki aspekt ich

zachowania jest mierzony (szereg takich prostych i pomysłowych

eksperymentów opisał ekonomista behawioralny Dan Ariely, 2009; należy

jednak podkreślić, że w takim przypadku badacze powinni zachować

maksymalną czujność etyczną) oraz b) korzystanie z danych

wytworzonych nie na potrzeby badania np. rozmaitych statystyk, zapisów

archiwalnych, przemówień, nagrań, wytworów kulturowych itp.

Przykładowo Dunbar analizował treść sag skandynawskich, aby wykazać

występowanie pewnych prawidłowości związanych z doborem

krewniaczym (Dunbar i in., 1995), a Graham analizował ilościowo treść

kazań kościołów uznawanych w Ameryce za liberalne i konserwatywne,

aby wykazać pewne prawidłowości związane z różnicami w rozumowaniu

moralnym pomiędzy konserwatystami a liberałami (Graham i in., 2009).

3. starać się dowieźć istnienia jakiegoś efektu przy pomocy jak najszerszego

zestawu metod badawczych i różnych źródeł danych. Przykładowo

inspirowaną ewolucyjnie hipotezę, że kobiety preferują długoterminowych

partnerów o wysokiej pozycji społecznej dowodzono przy pomocy: badań

kwestionariuszowych, badań laboratoryjnych w których manipulowano

istotnymi zmiennymi (oznakami statusu), badań etnograficznych nad

zależnością pomiędzy sukcesem reprodukcyjnym a statusem w

społecznościach łowiecko zbierackich, statystyk ślubów, narodzin dzieci i

rozwodów w społeczeństwach historycznych i współczesnych, porównań

międzygatunkowych, analizie treści kulturowych i innych (szeroka analiza:

Schmitt, 2005). Analogicznie Nisbett i Cohen (1996) dowodzili

występowania zjawiska kultury honoru (tj. tendencji do łatwego

11

reagowania, szczególnie przemocą, na rzeczywiste lub wyimaginowane

obrazy i inne zagrożenia „honoru” w kulturach w których własność może

łatwo zmienić właściciela i nie ma silnych instytucji prawnych), korzystając

z szerokiego spektrum metod np. rejestrów popełnianych przestępstw,

wyników wyborczych, wyników ankiet, rezultatów eksperymentów

terenowych, treści w literaturze itp. W jednym i drugim przypadku można

zasadnie skrytykować każde osobne źródło danych, jednak wszystkie

razem układają się w bardzo spójny wzór potwierdzający wyjściową teorię.

4. badać występowanie danego efektu w różnych grupach społecznych i

kulturowych. Rozmaite uwarunkowania historyczno-kulturowo mogą

istotnie wpływać na trafność zewnętrzną wyników (tj. prawo do ich

generalizowania na sytuacje pozalaboratoryjne i inne populacje; szerzej

ten problem omawia Brzeziński, 2004). Łatwo się domyślić, że ludzie z

różnych części świata będą różnili się pod kątem takich zachowań i cech

jak chodzenie do kościoła, postrzeganie roli kobiet w społeczeństwie czy

waga przykładana do indywidualnych osiągnięć. Jednakże niedawna

analiza Heinricha i zespołu (2010) pokazała, że międzykulturowo

występują różnice w zakresie nawet takich - wydawać by się mogło mało

związanych z kulturą - procesów jak uleganie iluzjom wzrokowym. Nie

posiadamy jeszcze teorii, która wyczerpująco tłumaczyłaby, które elementy

fenotypu psychologiczne są względnie niezależne od wpływów

kulturowych, stąd profilaktycznie lepiej badać wszystkie pod kątem

zmienności kulturowej, przynajmniej jeśli badacz chce mieć zasadne

roszczenia do uniwersalności odkrytych przez siebie zjawisk

psychologicznych.

5. co ważne, badania z wykorzystaniem innych osób, metod i warunków

mogą pomóc nie tylko w ustaleniu rzeczywistej trafności zewnętrznej

określonego efektu i dopuszczalności generalizacji, ale również wydatnie

przyczynić się do odkrycia nieznanych moderatorów i mediatorów efektów,

a nawet zupełnie nowych zjawisk. Jak zauważa we wspomnianej wcześniej

analizie Heinrich z zespołem (2010) porównania międzykulturowe pozwoliły

wykazać występowanie w innych kulturach efektów, które są nieznane w

kulturze zachodu, jak np. tendencja do karania osób zbyt dużo

12

wkładających we wspólną pulę w niektórych grach ekonomicznych

badających zaufanie.

Wszystkie powyższe uwagi nie są zbyt odkrywcze i wydaje się, że nie powinny

budzić wielu kontrowersji. Problem polega jednak na tym, że prawdopodobnie

praktyka badawcza znacząco odbiega od tych zaleceń. W szczególności wydaje się,

że psycholodzy mają tendencję do a) raczej badania („kolekcjonowania”) wielu

efektów, zamiast systematycznego pogłębiania rozumienia jednego efektu; b)

nagminnego korzystania z pośrednich miar zachowania, których trafność jest

niepewna lub przynajmniej mało precyzyjna; c) pomijania obserwacyjnej i opisowej

części pracy badawczej.

Hipotezy te mogą wyjaśniać, dlaczego pomimo olbrzymiej akumulacji badań

empirycznych, wielu badaczy odnosi wrażenie powolnego postępu w psychologii. W

swoim badaniu chciałbym spróbować systematycznie je zweryfikować za pomocą

metod naukometrycznych, w szczególności badania zawartości czasopism i

powiązanych artykułów. Zanim jednak omówię metodę, przybliżę krótko

najważniejsze źródła, które zainspirowały mnie do postawienia takich hipotez.

Czy psychologia rzeczywiście zajmuje się zachowaniem?

Trójka badaczy o uznanym dorobku w psychologii społecznej Baumeister,

Vohs i Funder (2007) głęboko w to powątpiewa. Ich artykuł analizujący ten problem

nosi znamienny tytuł „Psychologia jako nauka o samoopisach i ruchach palców”, co

oddaje doskonale jego treść. Autorzy przeanalizowawszy wybrane numery

sztandarowego czasopisma psychologii społecznej Journal of Personality and Social

Psychology (dalej: JPSP), wykazali, że rzeczywistego zachowania jest bardzo

niewiele, a olbrzymią większość stanowią jego pośrednie miary takie jak tytułowe

samoopisy i techniki oparte na czasach reakcji („ruchy palców”). W analizowanych

numerach JPSP (z 2006 roku) mniej niż 20 % empirycznych badań polegało na

obserwacji i pomiarze rzeczywistego badania. Pozostałe badania wykorzystywały

rozmaite skale szacunkowe, szczególnie w postaci samoocen, czasami wymagano

od badanych, aby wyobrazili sobie hipotetyczne sytuacje i określili, jak by

zareagowali, a kiedy indziej proszono o sprawozdanie z przeszłych zachowań.

Autorzy w ten sposób podsumowali swoją analizę:

Tak oto wygląda „zachowanie” w czołowym czasopiśmie psychologii

społecznej i osobowości: oceny, oceny i jeszcze raz oceny, okazjonalnie jakiś

13

wybór, czytanie i wypełnianie testu oraz przekreślanie litery „e” (Baumeister i

in., 2007, s. 398).

Dodatkowo przeanalizowano również zawartość numerów JPSP z dekad

1960.-1990.. Stwierdzono, że spadek znaczenia „zachowania” rozpoczął się w latach

80., bowiem jeszcze w latach 70. zachowanie występowało w ponad 80 % badań.

Autorzy pozwolili sobie na kilka spekulacji na temat przyczyn takiego stanu rzeczy.

Ich zdaniem wynika on z pewnego oportunizmu psychologów. Poproszenie

badanych o wypełnienie kwestionariusza lub zareagowanie na serie bodźców na

ekranie komputera jest łatwiejsze niż zaaranżowanie eksperymentów

behawioralnych, szczególnie w sytuacji, gdy prestiżowe czasopisma wymagają kilku

badań (np. Carver, 2004). Dodatkowo, ich zdaniem komisje etyczne na

uniwersytetach wykazują niejednokrotnie nadmierne przewrażliwienie na zagrożenia

etyczne badania: „z punktu widzenia komisji etycznej jest mniej inwazyjne zapytać

badanego ile zjadł, niż obserwować ile rzeczywiście zjadł [C]. Analogicznie jest mniej

inwazyjne zmierzenie „uprzedzeń” poprzez szybkość naciskania klawiszy w

odpowiedzi na bodźce na komputerze niż zaobserwowanie jak badany wchodzi w

interakcje z osobą, wobec której mógłby być uprzedzony” (Baumeister i in., 2007 s.

400).

Wyniki analizy trójki psychologów społecznych są o tyle zaskakująca, że -

historycznie patrząc - większość najbardziej znanych klasycznych badań

psychologicznych (przynajmniej tych według wyboru Hocka, 2003) mierzyła

rzeczywiste zachowanie, a nie jego pośrednie wskaźniki.

Analogiczne wnioski przynosi analiza Furra (2009), tyle, że jest ona

poświęcona obecności „zachowania” w psychologii osobowości. Autor

przeanalizował trzy roczniki (1997; 2002; 2007) JPSP (sekcji poświęconej

osobowości) oraz Journal of Personality. Ogólnie różne formy danych

behawioralnych występowały w ok. 20-25 % badań, przy czym bezpośrednio

obserwowane zachowanie w 2.5 %, a raportowane bieżące zachowanie (np. w

postaci prowadzonych dzienników) w około 1 %. Większość danych behawioralnych

(ok. 13 %) stanowiły retrospektywne sprawozdania z przeszłych zachowań robione

przez badanego lub osoby dobrze go znające. Zdecydowana większość badań nie

zawierała żadnych danych behawioralnych, ale „specjalność” psychologów czyli

korelacje testów z testami.

14

Co ważne Furr wprowadza definicję zachowania, którą chciałbym się

posługiwać w dalszych analizach, definicję która - jak wydaje się - czyni sprawne

rozróżnienie pomiędzy rzeczywistym zachowaniem, a jego pośrednimi wskaźnikami.

Jego zdaniem zachowanie to „wypowiedzi (wyłączając raporty werbalne w kontekście

testowania psychologicznego) lub ruchy, które są potencjalnie dostępne dla

uważnego obserwatora korzystającego z normalnych procesów zmysłowych” (Furr,

2009, s. 372). Ta definicja wyłącza z zachowania wewnętrzne procesy fizjologiczne

lub neuronalne, ale także milisekundowe różnice w czasach reakcji, które są

niedostępne dla obserwatora korzystającego z normalnych procesów zmysłowych.

Poprzez uwzględnienie tylko obserwowalnych elementów zachowania, ta definicja

kładzie szczególny nacisk na rolę zachowania w interakcjach społecznych.

Za dopełnienie tych analiz niechaj posłuży esej Cialdiniego (2009), który zdaje

relację z coraz większych problemów z publikowaniem artykułów w JPSP z

badaniami zachowania w naturalnych kontekstach (szczególnie wyników

eksperymentów terenowych). Autor wyraża wątpliwości czy współcześnie

przeprowadzane badania mają dużą trafność zewnętrzną, szczególnie pod kątem

projektowania interwencji dla decydentów.

Na gruncie polskim podobne spostrzeżenia wyprowadził Doliński (2008), który

zwrócił uwagę na to, że współcześnie psychologia społeczna w niewielkim stopniu

koncentruje się na badaniu zachowań pozawerbalnych.

Czy psycholodzy pomijają etap obserwacji i opisu?

Powyższe artykuły w istotny sposób uzupełniają rozważania badacza o

biologicznym „backgroundzie” Paula Rozina (2001). Rozin upatruje słabości

psychologii społecznej w błędach metodologicznych popełnianych przez naukowców,

w szczególności w zbyt dużym nacisku na eksperyment i przedwczesnym

formułowaniu modeli teoretycznych, zamiast szerokiej i dogłębnej obserwacji i opisu

fenomenów psychologicznych (tj. nie kwestionuje roli eksperymentów i modeli jako

takich, ale twierdzi, że psychologowie za szybko do nich zmierzają pomijając rzeczy

bardziej podstawowe). Patrząc historycznie – zdaniem Rozina – badania w naukach

przyrodniczych zwykle zaczynały się od próby systematycznego opisu odkrytego

zjawiska, jego uniwersalności (i anomalii), a dopiero potem następowały próby

znalezienia regularności, czy wreszcie praw. Jako przykład podaje sformułowanie

prawa gazów Boyle’a i praw genetyki Mendla, które nie były pierwotnie motywowane

15

chęcią weryfikacji określonego modelu, ale raczej próbą jak najdokładniejszego

opisania interesujących fenomenów.

Autor wytyka też psychologii społecznej inne pomniejsze błędy np. korzystanie

w badaniach z bardzo jednorodnych i „niszowych” grup (studentów psychologii i

członków cywilizacji zachodniej), które są następnie generalizowane na całą

populację ludzką, nie uwzględnianie kontekstów i nie wymienianie ich w badaniach z

psychologii społecznej (np. pora dnia, pora roku, miejsce itd. itp.), tak jakby badania z

tej dziedziny były oderwane od reszty rzeczywistości i te informacje nie miały

żadnego znaczenia. Oddając głos Rozinowi:

W przeciwieństwie do odnoszących sukcesy nauk przyrodniczych czy

psychologii percepcji, badania w psychologii społecznej nie zostały

poprzedzonej gruntowną obserwacją i zbieraniem informacji o istotnych

fenomenach oraz opisem uniwersalnych stałych. W bardziej dojrzałych

naukach, które psychologia chciałaby naśladować, większy nacisk kładzie się

na opis fenomenów, jak również w mniejszym stopniu polega się na

eksperymentach. Takie nauki, szczególnie nauki biologiczne, zwracają

mniejszą uwagę na modele i hipotezy, a większą na dane, w przeciwieństwie

do „dowodów” lub badań „definitywnie” potwierdzających hipotezę. W

badaniach nad zachowaniem człowieka w sytuacjach społecznych, w których

efekty kontestualne są liczne, a istotne procesy złożone, zebranie danych,

które jednoznacznie potwierdzą hipotezę jest niezwykle trudne (Rozin, 2001,

s. 3).

Aby dowieźć zasadności swoich intuicji Rozin porównuje zawartość kilku

numerów JPSP i trzech prestiżowych czasopism biologicznych (Cell, American

Jorunal of Physiology, Development). Jak zauważa w JPSP w około 70 % badań

uczestniczą tylko studenci amerykańscy; bardzo rzadko wymienia się religię, rasę,

religię badanych, albo to w jakiej porze roku odbywało się badanie; większość badań

inspirowanych jest wyartykułowanym modelem lub hipotezą (70 % w obszarze

poznania społecznego); posiada statystyki inferencyjne (100%!) i nie zawiera

żadnych obserwacji. Dla porównania badania w czasopismach biologicznych bardzo

rzadko są inspirowane modelem teoretycznym (ok. 20 %). Najczęstszą inspiracją jest

chęć opisu procesu „jak X wpływa na Y” (np. 62 % artykułów w czasopiśmie Cell) lub

„jak X zmienia się w czasie od t1 do t2” (43 % w Development). Statystyki

inferencyjne spotyka się rzadko (0 % badań w czasopiśmie Cell, 14 % w

16

Development, ale 85 % w American Jorunal of Physiology). Dodatkowo czasopisma

biologiczne regularnie replikują określone prawidłowości na podstawie danych

dotyczących wielu gatunków (biologiczny odpowiednik używania różnych grup

społecznych i kulturowych).

Uwagi Rozina skłaniają do refleksji. Psycholodzy rozwojowi badający małe

dzieci, albo etolodzy badający zwierzęta nie mogą rozdać swoim badanym serii

kwestionariuszy, albo posadzić ich przed komputerem i poprosić o zareagowanie na

serie bodźców, stąd - chcąc nie chcąc - muszą obserwować. W etologii regularnie

spotykamy badania oparte na setkach lub tysiącach godzin obserwacji (przykładowo,

badanie transmisji kulturowej pewnych zwyczajów u makaków japońskich oparto na 2

tys. godzin obserwacji, Hoffmann i in., 2008), i takich badań nie sposób znaleźć w

psychologii społecznej (z całym szacunkiem dla makaków japońskich, ale wydaje się,

że człowiek jest gatunkiem równie ciekawym i można mu poświęcić podobną ilość

czasu).

Rozin prezentuje pewną filozofię nauki, która zakłada, że teorie i

eksperymenty są poprzedzane przez obserwacje i opisy. Zasadniczo zgadzam się z

nim, choć proces rozwoju nauki zapewne bardzo trudno poddać algorytmizacji. Tak

czy owak, prawdopodobnie więcej badań opisowych tam gdzie to możliwe nie

zaszkodziłoby psychologii społecznej. Przede wszystkim mogłyby stanowić pewien

korpus wiedzy dla budowania hipotez i teorii. W psychologicznych czasopismach i

podręcznikach akademickich niezwykle rzadko (praktycznie nigdy?) znajdziemy

odpowiedzi na pytania typu: „o czym zwykle ludzie rozmawiają”, „w jaki sposób

spędzają czas wolny”, „na co wydają pieniądze”, „jak okazują niechęć lub sympatię

innym” (co wykazał w innym artykule także Rozin, 2006). Czasami można znaleźć

wyjątki od reguły (przykładowo: Dunbar i współpracownicy (1997) przysłuchiwali się

zwykłym towarzyskim rozmowom osób w kawiarniach i na kampusach i odnotowali,

że zdecydowana większość rozmów dotyczy tematów społecznych, co stało się

podstawą do zbudowania pewnych hipotez dotyczących ewolucyjnych funkcji

języka), ogólnie jednak można odnieść wrażenie, że dla psychologów taka wiedza

jest zbyt „mało wyrafinowana”.

Rozin nie mówi „róbmy wszystko tak samo jak badacze komórek”. Zmusza

raczej do zastanowienia, czy to co robimy teraz zawsze dobrze nam służy. Nie od

dziś wiadomo, że nadmierne przywiązanie do modeli teoretycznych może ograniczać

rozwój (Greenwald i in., 1986; modelowym, wręcz „klinicznym”, przypadkiem takiego

17

upośledzenia jest bodajże psychoanaliza). Podobnie trudno nie zgodzić się z

Rozinem w stwierdzeniu, że stosowanie eksperymentu, gdy wiemy mało o badanym

zjawisku, zapewne niewiele poszerzy naszą wiedzę. Jeśli eksperymentalnie

stwierdzimy, że X wywiera wpływ na Y (na ogół w badaniach psychologicznych ów

„X” wywiera wpływ na kilka, kilkanaście procent wariancji „Y”), w dalszym ciągu

niewiele wiemy co oprócz X może jeszcze wpływać na Y, w jaki sposób X wchodzi w

interakcję z innymi zmiennymi wywołującymi Y, nie mówiąc już o najbardziej

elementarnym pytaniu: jaki podstawowy proces powoduje, że X wywołuje Y. Jest

zapewne możliwe, że jakiś genialny badacz wygeneruje i przetestuje wszystkie

rozsądne hipotezy co do zmiennych wywołujących Y, choć przypuszczam, że jest to

bardzo mało prawdopodobne. Sądzę raczej, że etap gruntownego opisu określonego

zachowania z większym prawdopodobieństwem zaowocuje trafnymi hipotezami, co

do potencjalnych moderatorów i zmiennych istotnie modyfikujących dany efekt niż

sytuacja, gdy badacz angażuje się tylko w badanie eksperymentalne z celem

potwierdzenia lub falsyfikacji gotowego modelu. Nie wspominając już o tym, że

wiedza opisowa zapewne będzie łatwiej doprowadzało do uwspólniania języka przez

badaczy, co często jest wymieniane jako oznaka niedojrzałości psychologii.

Jak to miałoby wyglądać w praktyce?

Przeanalizuję teraz krótko kilka przykładowych artykułów empirycznych z

ostatniego JPSP (plus jedno nieco starsze). Pozwoli to lepiej zilustrować główne idee

w dalszej części.

1. McGregor i in. (2010)

a. Zakładany efekt: niemożność zrealizowania konkretnych celów będzie

zwiększała zaangażowanie w zachowania religijne

b. Sposób dowodzenia występowania efektu: osoby, które otrzymywały

nierozwiązywalne zadanie wykazywały wyższy wzrost przekonań

religijnych (mierzonych kwestionariuszowo) w porówaniu do osób z

grupy kontrolnej (uwzględniano również pewne zmienne dyspozycyjne,

ale dla tych rozważań to nieistotne)

2. Hafer (2000)

a. Zakładany efekt: dostrzegana niesprawiedliwość wywołuje „wiarę w

sprawiedliwy świat” (m.in. obwinianie jej ofiary, dystansowanie się od jej

cierpienia itp.)

18

b. Sposób dowodzenia występowania efektu: osobom eksperymentalnie

indukowano „wiarę w sprawiedliwy świat” poprzez wyświetlanie filmu o

ofierze pobicia z niesprawiedliwym lub sprawiedliwym zakończeniem, a

następnie mierzono czas reakcji w zmodyfikowanym zadaniu Stroopa

na słowa związane ze sprawiedliwością (i inne słowa oraz kontrolne);

dodatkowo osoby odpowiadały jak bardzo identyfikowały się z ofiarą.

Osoby dłużej (ok. 90 ms.) reagowały na słowa związane ze

sprawiedliwością w sytuacji niesprawiedliwości, jak również relatywnie

do innych słów. Dodatkowo ta ostatnia różnica była skorelowana z

tendencją do niewielkiego identyfikowania się z ofiarą.

3. Bergsieker i in. (2010)

a. Zakładany efekt: osoby białe w interakcji z osobą czarną będą przede

wszystkim podkreślały swoją sympatyczność; natomiast osoby czarne

w obecności osób białych swoją kompetencję (inteligencję, wiedzę itp.),

gdyż obydwie grupy chcą przeciwdziałać stereotypom i oczekiwaniom

drugiej strony

b. Sposób dowodzenia efektu: 1) proszono o wyobrażenie sobie interakcji

z osobą tej samej rasy lub innej rasy i odpowiadanie na pytanie o to

jakie elementy zachowania byłyby ważne 2) badanie ankietowe na

temat zachowania w obecności przyjaciela innej rasy lub tej samej 3)

zaaranżowanie interakcji z osobą z innej lub takiej samej rasy, a

następnie ocena przez ślepych sędziów kompetentnych zachowań na

podstawie nagrań na taśmach wideo

4. Piff i in. (2010)

a. Zakładany efekt: osoby z niższych klas społecznych są bardziej

prospołeczne (co wyrażą się m.in. większą szczodrością, zaufaniem i

gotowością do pomagania)

b. Sposób dowodzenia efektu: trzy eksperymenty, w tym dwie gry

ekonomiczne w których mierzono gotowość do dzielenia się i zaufanie

do partnera gry (np. poprzez dzielenie się potencjalnymi punktami, bez

gwarancji ich odzyskania); eksperyment w którym mierzono gotowość

do pomocy rzekomemu drugiemu badanemu; badanie

kwestionariuszowe w którym indukowano poczucie przynależności do

różnych stopni drabiny społecznej (poprzez poznawcze porównywanie

19

się z osobami stojącymi nisko lub wysoko), a następnie wypełniano

ankietę mierząca „ile należy łożyć na dobroczynność”. Z wyjątkiem

ostatniego badania przynależność do klasy społecznej badano poprzez

kwestionariuszowe samooceny

Wszystkie powyższe artykuły empiryczne z pewnością zaliczają się do „górnej

półki”. Aby dowieźć zakładanych efektów przeprowadzano kilka niezależnych badań

(zwykle minimum 4), stosowano alternatywne, czasami pomysłowe metody, nieco

modyfikowano warunki i próbowano wyeliminować alternatywne wyjaśnienia.

Trafność wewnętrzna wydaje się być bez zarzutu. Podbudowa teoretyczna

gdzieniegdzie jest solidna. Ogólnie artykuły jako takie z pewnością zasługują na druk,

a poznawczo wskazują, że istnieją dobre wstępne przesłanki, żeby przypuszczać, że

hipotetyczne efekty są prawdziwe.

Ogólnie jednak powyższe artykuły powinny stanowić początek pracy nad

dowodzeniem rzeczonych efektów, natomiast znając praktykę prawdopodobnie

dalszych dociekań nie będzie lub będzie ich bardzo niewiele. Rzetelna praca

empiryczna wymagałaby teraz, aby niezależny zespół badaczy zreplikował owe

badania (aby wykluczyć występowanie jakiś niezidentyfikowanych artefaktów),

następnie warto by sprawdzić tradycyjne zagrożenia trafności zewnętrznej

(Brzeziński, 2004): czy inne osoby, inne warunki i sposoby manipulacji zmiennymi lub

inne okoliczności kulturowe nie zmieniają zasadniczo obrazu wyników.

Zakładając nawet, że hipotetyczne efekty są trafne zewnętrznie (np. inne

grupy społeczne zasadniczo uzyskiwałyby podobne wyniki) w dalszym ciągu owe

badania relatywnie niewiele mówią nam o tym jak owe efekty mają się do „życia

codziennego”. Przykładowo w badaniu nad zachowaniami religijnymi manipulacja

eksperymentalna podnosiła wynik o ok. pół punktu na pięciopunktowej skali postaw

religijnych. Choć można wyliczyć wielkość efektu relatywnie do grupy kontrolnej,

myślę jednak, że powie nam to bardzo niewiele jak bardzo porażka w życiu

codziennym będzie zwiększyła uczestnictwo w praktykach religijnych. Analogicznie

nie wiemy czy 90 ms różnicy w zmodyfikowanym zadaniu Stroopa (badanie 2)

przekłada się na radykalne zmniejszenie wrażliwości na ofiary niesprawiedliwości czy

niewielkie? Może też być tak, że obecny w laboratorium efekt, w codziennym życiu

wskutek interakcji z innymi zmiennymi rozmywa się zupełnie, a może wprost

przeciwnie, potęguje się.

20

Oto kilka pomysłów jak mogłyby wyglądać kontynuacje badań nad

hipotetycznymi efektami:

1. Niepowodzenia zwiększają zachowania religijne (McGregor i in., 2010):

pomimo tego że hipoteza implikuje konsekwencje behawioralne badano tylko

postawy. Być może ów efekt jest krótkotrwały i nie przekłada się na

zasadnicze zmiany zachowania? Być może nie jest on uniwersalny, ale

wynika tylko ze specyficznych funkcji religii w określonym kręgu kulturowym?

Na początku spróbowałbym powtórzyć eksperyment, tym razem jednak

zaangażować miarę behawioralną zamiast pomiaru postawy (przykładowo po

eksperymencie do badanych podchodziłby pomocnik badacza i zapraszał na

jakąś formę praktyk religijnych). Dalej można sobie wyobrazić podłużne nawet

kilkuletnie badania w których monitoruje się rozmaite aspekty życia badanych

oraz zaangażowanie w praktyki religijne (badani za stosowną gratyfikacją np.

regularnie wypełniają ankiety w Internecie). Dodatkowo można przebadać

różne grupy społeczne mniej lub bardziej „odnoszące sukcesy”, względnie

osoby o różnych stopniach sukcesu w obrębie grup społecznych pod kątem

ich aktywności religijnej.

2. „Wiara w sprawiedliwy świat” (Hafer, 2000): tutaj również nie mierzono

zachowania, ale pośrednią reakcję poznawczą, której status teoretyczny jest

jeszcze mocno niedookreślony (przykładowo w przypadku innej miary opartej

na czasach reakcji tj. testu utajonych skojarzeń, niedawna meta-analiza

wykazała, że jego korelacje z zewnętrznym kryterium tj. zachowaniem, sądem

lub miarą fizjologiczną, są umiarkowane, średnio r=0,274; pomimo tego, że

czasami wyższe niż wskaźniki jawne, szczególnie w przypadku postaw

rasowych, Greenwald i in., 2009). Można wyobrazić sobie próby weryfikacji

tego efektu: przeprowadzić eksperyment laboratoryjny lub terenowy w którym

osoby badane mają możliwość pomóc rzekomym ofiarom (np. poprzez

przedstawienie alternatywnych historii co do sprawiedliwej lub

niesprawiedliwej kontynuacji ich historii). Jeżeli ten efekt jest prawdziwy,

osoby które padły ofiarą i których nie spotkała sprawiedliwość, powinny

również doświadczać pewnych form ostracyzmu i pod tym kątem można

przebadać takie osoby.

3. Interakcje międzyrasowe (Bergsieker i in., 2010): w jednym z badań pojawia

się nagrywanie rzeczywistej interakcji i analizowanie jej przez sędziów

21

kompetentnych (co jest z pewnością krokiem w dobrym kierunku). Dalsze

badania mogłyby wyglądać w ten sposób: obserwowanie i przysłuchiwanie się

interakcjom międzyrasowym w kawiarniach, lub innych publicznych miejscach,

korzystanie z rzeczywistych zarejestrowanych danych (np. rozmaitych talk

show), w szczególności warto sprawdzić co się dzieje gdy osoba nie powinna

się przejmować swoim stereotypem ulec odwróceniu (np. osoba czarna jest

stoi wysoko w hierarchii organizacji, a biała nisko). Badanie wykonano na

amerykańskich studentach i prawdopodobnie jest to grupa o nastawieniu

antyrasistowskim. Zastanawiające jest więc czy takie same efekty

zaobserwowano by u osób z grup o innych wartościach.

4. Klasa niższa bardziej skłonna do pomagania (Piff i in., 2010): to badanie

zasługuje na pochwałę w stosunku do poprzednich, gdyż 3 z 4 badań używało

jako zmiennej zależnej zachowania, co prawda w kontekście laboratoryjnym,

ale jednak. Jedno z badań uwzględniało procesy wewnętrzne. I tu można

sobie wyobrazić szereg prób uzupełnienia danych, szczególnie o

eksperymenty terenowe, ale również dane archiwalne o rzeczywistych

zachowaniach (przykładowo: skłonność osób z klas niższych do działania w

organizacjach charytatywnych; ilość udzielanych pożyczek znajomym itd.)

Pogłębianie badań nad określonymi efektami powinno pomóc wygenerować

lepiej udokumentowaną i tym samym pewniejszą wiedzę, ale również przy tej okazji

badacze powinni z większą szansą odkryć istotne moderatory hipotetycznych

efektów. Poza tym badanie tego samego efektu przy pomocy rozmaitych metod

może pomóc lepiej naturę niektórych pośrednich miar zachowania (takich jak czasy

reakcji), a tym samym przyszłe badania, które z jakichś względów (np. etycznych)

będą wykorzystywały tylko owe miary, będą mogły być z większym stopniem

pewności generalizowane na zachowania pozalaboratoryjne.

Rozdział 2

Omawiane w poprzednim rozdziale artykuły empiryczne są nowe (z wyjątkiem

jednego), tak więc trudno w tym momencie wyrokować jaki będzie los dalszych

badań nad hipotetycznymi efektami. W swojej pracy chciałbym wyselekcjonować z

grupy czasopism poświęconych psychologii społecznej z początku dekady artykuły

opisujące podobne efekty, a następnie na podstawie ich cytowań prześledzić los

badań nad nim. Analizy czasopism Rozina (2001) i Baumeistera z zespołem (2007)

stanowią dobry punkt wyjścia trzeba jednak przyznać, że są dokonane na niewielkiej

22

próbie i nie uwzględniają cyklu badań. Mam więc nadzieję, że moja analiza pozwoli

mi bardziej obiektywnie odpowiedzieć na pytania a) jak często badacze dowodząc

istnienia określonych efektów psychologicznych starają się korzystać z różnych

metod; b) jak często wśród tych metod pojawia się zachowanie (zgodnie z definicją

Furra, 2009); c) jak często replikują badania na członkach innych grup społecznych,

oraz w szczególności d) innych grup kulturowych. Dodatkowo chciałbym sprawdzić

jak często autorzy hipotetycznego efektu powołują się na systematyczne obserwacje

(postulat Rozina, 2001).

Zarys metody

Poniżej znajduje się wstępny zarys metody. W toku pracy prawdopodobnie

niektóre elementy mogą ulec modyfikacji i doprecyzowaniu (szczególnie sposoby

kategoryzacji).

I. Przeanalizować roczniki (zaczynając od roku 2000) czterech najbardziej

prestiżowych czasopism poświęconych psychologii społecznej tj. Journal of

Personality and Social Psychology, Journal of Experimental Social Psychology,

Journal of European Social Psychology, Personality and Social Psychology Bulletin

(dodatkowo również roczniki Studiów Psychologicznych jako uzupełnienie

porównawcze o akcent polski). Wybrać z każdego pierwsze 10 artykułów, które:

• są oryginalnymi artykułami empirycznymi;

• opisują jakiś efekt psychologicznych wywierający wpływ na zachowanie; tj.

różnice w zachowaniu w zależności od określonych zmiennych

dyspozycyjnych lub sytuacyjnych w przynajmniej 3 niezależnych

badaniach;

• opisują ten efekt jako pierwsze (tj. z analizy artykułu i bibliografii nie

wynika, że jest on replikacją lub rozszerzeniem wcześniejszych badań

analizujących ten sam efekt).

II. Następnie analizując prace cytujące wybrane artykuły (przy wykorzystaniu

odpowiednich baz w szczególności Google Scholar i SCOPUS) wyodrębnić te

artykuły empiryczne z dowolnych czasopism, które w całości lub części podejmują

empiryczną próbę weryfikacji zakładanego efektu (czy to jako dokładna lub

zmodyfikowana replikacja, dowodzenie występowania lub niewystępowania efektu na

innych populacjach, z wykorzystaniem innych metod lub źródeł danych itp.). W razie

potrzeby sprawdzić również artykuły cytujące artykuły replikujące oryginalne badania.

23

III. Przeanalizować co stanowiło inspirację do wygenerowania określonych

hipotez, w szczególności jak często badani poprzedzali swoje hipotezy obserwacją

interesujących efektów, lub do obserwacji się odwoływali.

IV. Skategoryzować metody w artykułach opisujących odkryte efekty oraz w

artykułach podejmujących próby replikacji, rozszerzenia itp.:

a) badanie laboratoryjne

a. w którym zmienną zależną jest rzeczywiste zachowanie wg definicji

Furra (2009)

b. w których zmienną zależną są różne formy samoopisu (w tym

wybory, oceny, postawy, hipotetyczna reakcja w określonej sytuacji

itp.)

c. w których zmienną zależną jest czas reakcji

d. w których zmienną zależną jest reakcja biologiczna (np. obraz

mózgu przy pomocy technik neuroobrazowania, przewodliwość

skóry itp.)

b) badanie terenowe

c) dane wytworzone nie na potrzeby eksperymentu (dane archiwalne,

statystyki, zapisy zachowania itd.)

d) sprawozdania werbalne

a. z przeszłych zachowań

b. z bieżących zachowań (np. w formie prowadzonych dzienników)

V. Cytujące artykuły skategoryzować pod kątem metody

a) dokładna replikacja

b) replikacja z uwzględnieniem innych osób

a. innych grup społecznych (ale z tej samej narodowości)

b. innych narodowości (ale z tego samego kręgu kulturowego)

c. innych grup kulturowych

c) replikacja tą samą metodą z uwzględnieniem innego materiału

bodźcowego, zmian procedury eksperymentalnej, wprowadzenia

dodatkowych moderatorów itp.

d) replikacja inną metodą eksperymentalną (kategoryzacja wg punktu V)

Dodatkowo uwzględnić czy cytujący artykuł podchodzi od tego samego

badacza (lub jego zespołu) czy też jest przeprowadzony przez niezależny zespół

Podsumowanie

24

Na podstawie zebranych danych chciałbym podjąć próbę wyciągnięcia

wniosków o na temat praktyki badawczej we współczesnej psychologii społecznej. W

szczególności:

a) jak często określona badana eksperymentalnie hipoteza jest poprzedzona

obserwacjami lub opisami zachowania – przypuszczam, że praktycznie

nigdy

b) jak często do dowodzenia określonego efektu wykorzystuje się rzeczywiste

zachowanie (zgodnie z definicją Furra, 2009) - przypuszczam, że rzadko

c) jak często po sprawozdaniu odkrycia efektu inni badacze próbują

zreplikować efekt, w szczególności z wykorzystaniem innych metod i grup

badanych – przypuszczam, że rzadko

d) jak często badacze korzystają z dosyć różnych metod, aby wykazać ten

sam efekt – przypuszczam, że sporadycznie

Liczę na to, że moja ilościowa analiza pozwoli mi dokonać pewnych

ilościowych i jakościowych uogólnień co do typowych praktyk badawczych w ramach

psychologii społecznej. Być może również uda mi się odnaleźć i opisać przykłady

serii badań, w których udanie i zasadniczo pogłębiano rozumienie danego efektu i

tym samym przybliżyć się do naszkicowania „złotego standardu” postępowania

badawczego w psychologii społecznej. Mam również nadzieję, że moja analiza

pozwoli powiedzieć coś na temat kondycji współczesnej psychologii jako całości.

25

Bibliografia

Ariely, D. (2009). Potęga irracjonalności. Wrocław: Wydawnictwo Dolnośląskie.

Baumeister, R., Vohs, K., Funder, D. (2007). Psychology as the science of self-

reports and finger movements: Whatever happened to actual behavior?

Perspectives on Psychological Science, 2, 396-403.

Bergsieker, H., Shelton, J., Richeson, J. (2010). To be liked versus respected:

Divergent goals in interracial interactions. Journal of Personality and Social

Psychology, 99, 248-264.

Bevan, W. (1991). Contemporary psychology: A tour inside the onion. American

Psychologist, 46, 475-483.

Boyack, K.W., Klavans, R., Börner, K. (2005). Mapping the backbone of

science. Scientometrics, 64, 351-374.

Brzeziński, J. (2004). Trafność zewnętrzna terenowych badań eksperymentalnych.

Zagadnienia Naukoznawstwa, 161, 455-469.

Callaghan, T., Rochat, P., Lillard, A., Claux, M., Odden, H., Itakura, S., et al. (2005).

Synchrony in the onset of mental-state reasoning: evidence from five

cultures. Psychological Science, 16, 378-384.

Carver, C. S. (2004) Editorial. Journal of Personality and Social Psychology, 86, 95.

Cialdini, R. (2009). We Have to Break Up. Perspectives on Psychological Science, 4,

5-6.

Doliński, D. (2008). O naturze eksperymentowania w psychologii społecznej.

Psychologia społeczna, 3, 87-91.

Dunbar, R., Marriott, A., Duncan, N. (1997). Human conversational behavior. Human

Nature, 8, 231-246.

Dunbar, R., Clark, A., Hurst, N. (1995). Conflict and cooperation among the Vikings:

Contingent behavioral decisions. Ethology and Sociobiology, 16, 233-246.

Furr, R. (2009). Personality psychology as a truly behavioural science. European

Journal of Personality, 23, 369-401.

Graham, J., Haidt, J., Nosek, B. (2009). Liberals and conservatives use different sets

of moral foundations. Journal of Personality and Social Psychology, 96, 1029-

1046.

Greenwald, A., Poehlman, T., Uhlmann, E., Banaji, M. (2009). Understanding and

using the Implicit Association Test: III. Meta-analysis of predictive

validity. Journal of Personality and Social Psychology, 97, 17-41.

26

Greenwald, A. G., Pratkanis, A. R., Leippe, M. R., Baumgardner, M. H. (1986). Under

what conditions does theory obstruct research progress? Psychological

Review, 93, 216-229.

Hafer, C. (2000). Do innocent victims threaten the belief in a just world? Evidence

from a modified Stroop task. Journal of Personality and Social Psychology, 79,

165-173.

Henrich, J., Heine, S. J., Norenzayan, A. (2010). The weirdest people in the

world? Behavioral and Brain Sciences, 33, 61-83.

Hock, R. (2003). 40 prac badawczych, które zmieniły oblicze psychologii. Gdańsk:

Gdańskie Wydawnictwo Psychologiczne.

Huffman, M., Nahallage, C., Leca, J. (2008). Cultured Monkeys: Social Learning Cast

in Stones. Current Directions in Psychological Science, 17, 410-414.

Kenrick, D. T., Neuberg, S. L., Cialdini R. B. (2006) Psychologia społeczna.

Rozwiązane tajemnice. Gdańsk: Gdańskie Wydawnictwo Psychologiczne.

Mayr, E. (2004) What makes biology unique. Considerations on the autonomy of a

scientific discipline. Cambridge: Cambridge University Press.

McGregor, I., Nash, K., Prentice, M. (2010). Reactive approach motivation (RAM) for

religion. Journal of Personality and Social Psychology, 99, 148-161.

Nisbett, R. E., Cohen, D. (1996). Culture of honor: The psychology of violence in the

south. Boulder, CO: Westview.

Nisbett, R.E., Wilson, T.D. (1977). Telling more than we can know: Verbal reports on

mental processes. Psychological Review, 84, 231–259.

Peters, D.P., Ceci, S.J. (1982). Peer-review practices of psychological journals: The

fate of published articles, submitted again. Behavioral and Brain Sciences, 5,

187–255.

Piff, P., Kraus, M., Cheng, B., Keltner, D. (2010). Having less, giving more: The

influence of social class on prosocial behavior. Journal of Personality and

Social Psychology, [Advance online publication].

Rand, K., Ilardi, S. (2005). Toward a consilient science of psychology. Journal of

Clinical Psychology, 61, 7-20.

Rosenthal, R., Rosnow, R.L. (2009) Artifacts in behavioral research. Oxford: Oxford University Press.

27

Rozin, P. (2001). Social psychology and science: some lessons from Salomon Asch.

Personality and Social Psychology Review, 5, 2-14.

Rozin, P. (2006). Domain Denigration and Process Preference in Academic

Psychology. Perspectives on Psychological Science, 1, 365-376

Schmitt, D.P. (2005). Fundamentals of human mating strategies. w: D. Buss (red.)

Handbook of Evolutionary Psychology, New York: Wiley. s. 258-291.

Simonton, D.K. (2004). Psychology’s status as a scientific discipline: Its empirical

placement within an implicit hierarchy of the sciences. Review of General

Psychology, 8, 59–67.

Staats, A. (1999). Unifying psychology requires new infrastructure, theory, method,

and a research agenda. Review of General Psychology, 3, 3-13.

Suls, J., Martin, R. (2009). The air we breathe: A critical look at practices and

alternatives in the peer-review process. Perspectives on Psychological

Science, 4, 40-50.

Walsh, A. (1991). Self-esteemand sexual behavior: Exploring gender differences.

Sex Roles, 25, 441–450.

West, S.G., Brown, T.J. (1975). Physical attractiveness, the severity of the

emergency and helping: A field experiment and interpersonal simulation.

Journal of Experimental Social Psychology, 11, 531–538.

Wilson, T.D., Gilbert, D.T. (2005). Affective forecasting: Knowing what to want.

Current Directions in Psychological Science, 14, 131–134.

Documents

1 Status poznawczy badań eksperymentalnych w psychologii