STATISTICA PSIHOLOGICĂ ŞI PRELUCRAREA INFORMATIZATĂ A DATELOR...gândirea statistică va deveni într-o zi la fel de necesară pentru un cetăţean eficient, la fel ca şi abilitatea de a citi şi a scrie. H.G. Wells (1866-1946) Titular de curs: Conf. univ. dr. Marian Popa popamarian@gmail.com www.mpopa.ro Seminarii: Lect. univ. dr. Alina Vasile; Drd. Gorbănescu Adrian; Prof. asoc. dr. Traian Manea
Curs introductiv Organizarea cursului Definiţia statisticii Statistica, instrument al metodei ştiinţifice în psihologie Scurt istoric al statisticii în psihologie Utilitatea statisticii în activitatea curentă a psihologilor Dificultăţi şi riscuri în însuşirea metodelor statistice Concepte statistice fundamentale Măsurare în psihologie 2
1. Organizare Statutul cursului Durata studiilor Număr de credite Disciplină fundamentală de suport interdisciplinar 2 semestre 5+2 3
Tipuri de activităţi didactice: Sem. I: 2hC+2hS (56 ore) Sem. II: 1hC+2hL (42 ore) teme pentru acasă se găsesc pe site vor fi predate sub formă scrisă, la fiecare seminar nu se admite prezentarea ulterioară! 4
Sistemul de evaluare (sem I) evaluări periodice (2p) 3 pe semestru anunţate teste de cunoştinţe cu întrebări deschise evaluare de seminar (4p) prezenţa (o absenţă= -0.2p) calitatea temelor (copierea=absență) Activism (la aprecierea prof.) Examen (4p) semestrial 5
Suport de curs Manual de bază: Statistică pentru psihologie. Teorie și aplicații SPSS, M. Popa, Editura Polirom, 2008 Prezentări de curs - pagina web: www.mpopa.ro Bibliografie suplimentară (facultativă): Orice manual introductiv în statistică Referințele bibliografice ale cursului Adrese web recomandate pe site 6
Cerinţe Calculator de buzunar cu funcţii elementare Fixarea stabilă într-o grupă de studiu Conduita în sala de curs Evitaţi să deveniţi excepţii de la regulă 7
Dificultăţi specifice Volum mare de concepte noi Informaţii interdependente Precizie şi rigoare în exprimare Evaluări frecvente mai ales la primele cursuri! chiar şi o absenţă poate însemna mult! limbaj specializat care nu admite ambiguităţi obligatorii pentru fixarea cunoştinţelor statisticofobia RISCURI naivitatea statistică epatare statistică 8
Recomandări Prezenţa constantă la curs şi seminar Realizarea independentă a temelor cooperarea este un lucru bun dar nu prin copiere Participarea la evaluările parţiale Teamă de statistică? concentraţi-vă mai ales pe raţionament şi nu pe numere sau calcule calculele nu vor depăşi nivelul aritmeticii elementare nu va trebui sa reţineţi formule în spatele cifrelor se află întotdeauna realităţi intuitive 9
Echivalarea cursului? Condiţii: programa analitică a cursului urmat anterior să fie echivalentă cu cea a cursului nostru; o evaluare generală a cunoştinţelor întrebări referitoare la cunoştinţe statistice de bază; poate fi cerută numai în primele două saptamâni ale semestrului
2. Definiţii Statistica domeniu al matematicii cu ramuri aplicative (statistica psihologică) Ştiinţa care ne învaţă care este organizarea politică a tuturor statelor moderne ale lumii 1770, Londra, baronul Bielfeld The Elements of Universal Erudition (capitol de statistică ) recoltarea, descrierea şi analizarea datelor în vederea extragerii unor concluzii (inferenţe) pe baza acestora operează cu date numerice care descriu realitatea din jurul nostru Datele informaţii obţinute prin categorializare, numărare sau măsurare, pe baza utilizării unor metode adecvate 11
3. Metoda științifică în psihologie căută reguli cu un anumit nivel de generalitate, care depășesc nivelul particular sau individual; colectează dovezi obiective, de natură empiric-inductivă; operează cu afirmaţii controlabile pe care le testează cu proceduri acceptate de comunitatea cercetătorilor; atitudine sceptică faţă de rezultate și față de cunoştinţele acumulate; atitudine deschisă faţă de orice informaţii noi; creativitate şi transparenţă. 12
Pământenii se împart în trei categorii (Huck, 2004) cei care fac cercetare ştiinţifică Aproape orice psiholog face din această categorie cei care nu fac cercetare, dar se confruntă cu rezultatele altora cei care nici nu fac şi nici nu se întâlnesc cu rezultatele cercetărilor Orice psiholog face parte din această categorie Nu te poţi numi psiholog dacă faci faci parte din această categorie 13
Statistica nu se confundă cu metoda științifică, ci este doar un instrument al acesteia
Statistica este incercarea de a răspunde cu ajutorul numerelor la întrebările pe care ni le punem Punctul central al statisticii este problema (raționamentul), nu numerele! Ne punem o problemă Este eficientă utilizarea unei metode de terapie anxiolitică? Construim un model de cercetare Același grup înainte/după; Două grupuri (terapie/non-terapie) Măsurăm (cuantificăm) Chestionar Analizăm Proceduri statistice (descriptive, test de semnificație a diferenței ș.a.) Tragem concluzii Acceptăm existența unui efect? Cât de mare este? Câtă încredere putem avea?
un exemplu... 16
Observaţie Definirea problemei Ipoteză Date O nouă metodă de terapie a anxietăţii Este eficientă? Terapeutul DA; Cercetătorul -? Se măsoară anxietatea pe două grupe Testarea ipotezei Procedură de comparare a mediilor respingere acceptare Este diferenţa semnificativă? Publicare Se publică, într-un anumit format Teorie
EFPA (European Federation of Psychologists Associations) Formarea psihologilor trebuie să cuprindă obligatoriu: cunoştinţe teoretice abilităţi şi competenţe practice capacităţi de cercetare ştiinţifică
19
4. Scurt istoric al statisticii în psihologie Christian von. Wolf, 1732 Francis Galton (1882-1911) Karl Pearson (1857-1936) Charles E. Spearman (1863-1945) E.H. Weber (1795-1878) şi G.T. Fechner (1801-1887) Raymond B. Cattel (1905-1988) ideea unui domeniu matematic al psihologiei ( psihometrie ) iniţiatorul şcolii psihometrice engleze antropolog şi psiholog (analiza de corelaţie) Elev al lui Wundt, iniţiază analiza bifactorială a inteligenţei statistica aplicată în psihofiziologie teoria factorială a personalităţii (16PF) Ronald A. Fisher (1890-1962) un geniu al statisticii (analiza de varianţă) 20
5. Utilitatea statisticii în practica psihologică în evaluare construirea instrumentelor (teste, chestionare, scale) utilizarea instrumentelor (etalonare, diagnostic) selecţia psihologică (validare, prognoză) în psihoterapie probarea eficienţei construirea modelelor terapeutice (durată, context etc.) relația dintre genul tipul terapeutului și eficiența terapiei în instruire evaluarea performanţei 21
22
6. Concepte fundamentale noţiunea de variabilă statistică v. dependente / v. independente v. continue / v. discrete populaţie şi eşantion statistica descriptivă / inferenţială Cercetări experimentale / corelaţionale 23
Noţiunea de variabilă statistică Definiţie caracteristică a realităţii care poate lua valori diferite vârsta, inteligenţa, satisfacţia etc. distribuţia variabilei valorile şi frecvenţa de apariţie a fiecărei valori 2, 9, 11, 5, 8, 10, 15, 3, 7, 2, 11, 5 variabilitatea măsura în care o distribuţie este compusă din valori mai asemănătoare sau mai diferite una de alta caracteristica cea mai importantă a variabilei 24
ce sunt genul... culoarea ochilor... temperamentul lateralitatea... religia... dar... m, f căprui, albaștri, negri flegmatic, sanguin, coleric... dreptaci, stângaci ortodox, musulman... 25
v. dependente/v. independente distincţia se face în context de cercetare o cercetare vizează relaţia între variabile v. dependentă suportă un efect, variază în funcţie de ceva face obiectul central cercetării v. independentă determină un efect, induce variaţia VD reprezintă contextul în care se manifestă VD 26
exemplu: o cercetare care vizează numărul orelor de somn la studenţi, în timpul semestrului, comparativ cu perioada de sesiune orele de somn= v. dependentă perioada din semestru= v. independentă Ce valori iau fiecare din cele două variabile? 27
de ce este important să distingem VD și VI? alegerea procedurii de testare a ipotezei cum le distingem? le plasăm într-un raţionament de tip cauzal variabila cauză =v. independentă variabila efect =v. dependentă atenţie, concluziile cercetării nu vor fi neapărat de tip cauzal! 28
identificaţi VD şi VI: relaţia dintre ereditate şi inteligenţă relaţia dintre eficienţa învăţării şi temperatura ambiantă relaţia dintre nota la bacalaureat şi nota la examenul de admitere
v. continue/v. discrete v continuă poate lua un număr teoretic infinit de niveluri ale valorilor (suportă zecimale) exemple: greutatea, înălţimea, timpul de reacţie v. discretă poate lua un număr finit de valori (nu suportă zecimale) exemple: numărul persoanelor dintr-o familie, numărul de ţigarete fumate zilnic, scorul la un test 30
populaţie şi eşantion Populația cercetării: totalitatea unităţilor de informaţie care constituie obiectivul de interes al unei investigaţii (de regulă, persoane) statistică: valorile care descriu populația cercetării Eşantionul Cercetării: toate persoanele care fac obiectul studiului Statistic: toate valorile unei variabile, măsurate pe eşantionul cercetării Populatie eșantion 31
exemple studiu asupra relației dintre accesul la internet și comportamentul elevilor de liceu populaţia = elevii de liceu eşantionul = elevii selecţionaţi pentru investigaţie, studiu care vizează relația dintre inteligenţă și performanţa în instruirea de zbor populaţia = toţi piloţii Eşantionul = subiecţii incluşi în studiu.
Reprezentativitatea eșantionului caracteristica unui eșantion de a descrie în mod adecvat proprietățile populației din care a fost extras are un caracter relativ (nu există eșantion absolut reprezentativ) diferența dintre eșantion și populație se numește eroare de eșantionare cu cât eroare este mai mică, cu atât concluzia cercetării este mai sigură
Bias Eroare sistematică în constituirea eșantionului studiu asupra atitudinii faţă de utilizarea computerelor în educaţie sursă de BIAS: eşantionul este constituit numai din elevi care utilizează frecvent calculatorul Sondaj cu privire la intenţiile de vot bazat pe interviul telefonic surse de BIAS: starea socială a respondenţilor (îşi permit montarea unui telefon) ora apelului (în orele dimineţii sunt acasă, să zicem, mai multe femei casnice).
Statistica descriptivă/statistica inferenţială S. descriptivă descrie datele, aşa cum sunt (numeric, grafic) S. inferenţială susţine concluzii (inferenţe) cu privire la o populaţie, pe baza datelor unui eşantion extras din acea populaţie Parametrică Neparametrică 35
Măsurarea în psihologie 36
Tot ceea ce există în realitate, există într-o anumită cantitate. Pentru a cunoaște realitatea, trebuie să o abordăm în egală măsură sub aspect cantitativ, dar și calitativ (Thorndike, E. L., 1918, The nature, purposes, and general methods of measurement of educational products, p. 16) Thorndike, Edward Lee 1874-1949
Ce este măsurarea? - Concurs de manechine - Înălțime: 180 cm (poate fi exprimată și în inch sau picioare ) - Bust: 90 cm - Talie: 60 cm - Șolduri: 90 cm - Culoarea ochilor: - căprui (1), verzi (2), albaștri (3) ( c, v, a ) - Inteligența (unități QI, stanine, nr. răspunsuri corecte) - Frumusețea: - (1) urâțele - (2) drăguțe - (3) frumușele - (4) frumoase de pică 38
S.S. Stevens (1946) On the theory of scale of measurement - a măsura înseamnă a atribui valori numerice obiectelor și fenomenelor, în conformitate cu anumite reguli Limite ale definiției anterioare (Judd și McClelland, 1998) - nu toate măsurările au un caracter numeric - caracteristica de gen poate fi simbolizată cu caracterele m și f - o regulă de atribuire a numerelor are caracter de măsurare numai dacă ea instituie o anumită semnificație cu privire la caracteristica măsurată Descrierea realității sub formă numerică sau simbolică 1906-1973 39
Caracteristici măsurabile în psihologie - de natură fizică (timpul de reacție, vârsta, diverși indicatori fiziologici) - constructe psihice sociabilitatea, motivația, atitudinea față de risc, depresia - modele ale realității psihice a căror existență și nivel trebuie probate - nu pot fi măsurate direct, ci numai prin manifestările lor particulare - Sociabilitatea (disponibilitatea de a comunica) - numărul prietenilor - disconfortul resimțit în situații de izolare socială - Constructul=variabilă latentă - Indicatorii=variabile observate - distincție importantă pentru analiza de itemi, SEM 40
De ce este important să analizăm procesul de măsurare? - Cunoaşterea tipurilor de transformări la care putem spune în mod legitim valorile rezultate prin măsurare - Evitarea concluziilor lipsite de sens - Alegerea procedurilor statistice adecvate datelor numerice şi scopurilor pe care ni le propunem 41
Niveluri (scale) de măsurare - Numerele diferă între ele prin semnificația și proprietățile lor - niveluri (scale) de măsurare: - Nivelul nominal - Nivelul ordinal - Nivelul de interval - Nivelul de raport - Acestea sunt ordonate ierarhic - scalele superioare includ proprietățile celor inferioare 42
a. Nivelul nominal - Valorile indică categoria din care face parte cazul evaluat - Exemple: - Genul: masculin/feminin (m/f; 1-2 ) - Tipurile temperamentale (coleric, sanguinic, flegmatic, melancolic) - Tipuri - De identificare (CNP, alte coduri arbitrare) - Categoriale (m/f ) - Caracteristici: - cel mai redus nivel de măsurare - codurile valorilor sunt arbitrare - valorile au doar o semnificaţie calitativă - nu suportă operaţii aritmetice, în afară de însumare - Pot fi grupate sau rafinate - Extravert (coleric, sanguinic); introvert (flegmatic, melancolic) 43
b. Nivelul ordinal - Valorile au o semnificație cantitativă limitată la raportul de mărime - Exemple: - poziţia pe lista de admitere, în funcţie de notă - evaluarea satisfacţiei pe o scală de la 1 la 10 - anul de studiu (1, 2, 3) 44
b. Nivelul ordinal - Caracteristici: - valorile au o semnificaţie cantitativă (mai mare/mai mic; mai mult/mai puţin), dar - precizează doar raportul de mărime dintre valori - intervalele dintre valori sunt neprecizate - cit înseamnă mai mare?, cit înseamnă mai mic? - primul admis=9.90; al doilea=9.70; al treilea=8.15! - codurile valorilor pot fi acordate si arbitrar, dar ele trebuie sa exprime ideea de ordine 45
c. Nivelul de interval - Valorile au un caracter cantitativ, exprimat numeric - Intervalele dintre valori sunt egale - Exemple: - temperatura, în grade Celsius (5,6,7...) - coeficientul de inteligenţă - numărul de răspunsuri corecte la un test (14, 15, 25...) - scoruri la testele de personalitate (20, 19...) 46
c. Nivelul de interval - Caracteristici: - intervalele sunt egale, dar lipseşte zero absolut - 0 C nu înseamnă absenţa temperaturii (0 K) - 10 C faţă de 5 C este mai mare cu 5 -... dar nu şi de două ori mai cald! - suportă toate transformările matematice posibile 47
d. Nivelul de raport - valori cantitative, exprimate numeric - intervale egale plus... zero absolut! - Exemple: - gradele Kelvin, pentru temperatura (0 K este temperatura minimă absolută) - timpul, greutatea, înălţimea 48
d. Nivelul de raport - caracteristici: - cel mai înalt nivel de măsurare (valorile au mai multă informaţie) - suportă toate transformările matematice posibile - controverse în psihologie: - există valori de acest tip? - inteligenţa=0, anxietate=0, etc., nu sunt posibile la fiinţele vii - în practică, distincţia dintre variabilele de interval (I) şi de raport (R) nu este relevantă, ambele suportând aceleaşi proceduri statistice (I/R) 49
controversă în psihologie - Sunt posibile măsurări cantitative ale caracteristicilor subiective? - variabilele psihologice sunt expresia unor evaluări subiective - Este greu de demonstrat egalitatea intervalelor dintre valori consecutive, chiar şi la evaluări obiective, precise: - măsurarea iubirii prin durata ţinerii de mână a cuplurilor! 50
Pe ce scală sunt exprimate următoarele variabile: - genurile muzicale (rap, house, rock, disco) - latenţa reacţiei la un stimul auditiv, măsurată în sutimi de secundă - atitudinea faţă de statistică măsurată pe o scală continuă de la 1 (absolut antipatică) la 10 (absolut simpatică) - scalele de măsurare (nominal, ordinal, interval, raport) 51
52
Variabile categoriale - O variabilă se numește categorială atunci când valorile acesteia descriu categorii - În mod obișnuit, variabilele măsurate pe scală nominală sunt categoriale - Variabilele ordinale pot fi și ele categoriale - Categoriile de vârstă: - 1 (21-30 ani) - 2 (31-40 ani) - 3 (41-50 ani) - Variabilele cantitative (I/R) pot fi și ele categoriale: - Categoriile de motoare: 1100 cmc; 1400cmc; 1600 cmc - Există proceduri statistice speciale pentru variabile categoriale, motiv pentru care trebuie reținute! 53
Statistica parametrică/neparametrică - s. parametrică - proceduri inferenţiale pe v. măsurate pe scale cantitative (Interval sau Raport) - se bazează pe estimarea prin eşantionare a parametrilor populaţiei (medie, ab. std.) - s. neparametrică - proceduri inferenţiale pe v. măsurate pe scală calitative (nominale şi ordinale) - nu se bazează pe estimarea parametrilor populației 54
Scale de măsurare şi variabile - variabila=caracteristica supusă măsurării - scala de măsurare=tipul de valori pe care le ia variabila - variabilă nominală = variabilă măsurată pe scală nominală - variabilă ordinală = variabilă măsurată pe scală ordinală - variabilă interval = variabilă măsurată pe scală interval 55
Erori de măsurare Exemplu: măsurăm aptitudinea numerică Cazul 1: 10 măsurări repetate ale lui Gigel scor 1 14 2 19 3 19 4 14 5 19 6 19 7 19 8 17 9 19 10 13 Care este nivelul adevărat al aptitudinii numerice al lui Gigel? ar putea fi oricare valoare sau nici una o soluție: media măsurărilor (17.2), dar dacă nici una din valori nu este adevărată, atunci nici media nu este adevărată Deci (orice) medie are o eroare vom vorbi cu alt prilej despre modul în care o calculăm
Cazul 2: O singură măsurare pe un eșantion de 10 subiecți scor Elena 14 Ion 19 Dan 19 Toni 14 Dana 19 Mihai 19 Adrian 19 Cornel 17 Alex 19 Cornelia 13 Care este nivelul adevărat al aptitudinii numerice al populației din care a fost extras eșantionul? ar putea fi oricare valoare sau nici una Și în acest caz media eșantionului conține o eroare, în raport cu media adevărată a populației Populatie eșantion
Teoria clasică a măsurării Eroarea trăsăturii X Scor = T Scor adevărat + E Eroare Oboseală Motivație Emoție Eroare de metodă Fidelitatea măsurării = Scor adevărat Scor adevărat + Eroare Instructaj ambiguu Prea cald în sală Greșeli în text Validitatea măsurării De construct (Măsoară aptitudinea numerică și nu altceva) De criteriu (Valorile aptitudinii numerice sunt predictive pentru notele la statistică)
Tipuri de erori - erori aleatoare (e A ) - produse de surse care ar putea afecta oricare dintre valorile rezultate din măsurare, fără să știm dacă și în ce măsură acest lucru se întâmplă - pot fi în orice sens (mai mari sau mai mici decât scorul adevărat) - caracterul aleatoriu face ca abaterile în plus și cele în minus față de scorul adevărat să se anihileze - erorile aleatoare afectează valorile individuale, dar nu și media eșantionului - mai sunt denumite și zgomot de măsurare 59
Tipuri de erori - erori sistematice (e S ) - Se manifestă într-un anume sens față de valoarea adevărată X=T+(e A + e S ) - afectează în mod necesar un anumit număr, mai mare sau mai mic, din valorile măsurate - Exemplu: - Zgomot în sala de testare - O eroare în grila de corecție a rezultatelor - sunt numite și bias 60
Eroarea de măsurare aleatoare mică mare sistematică mică mare 61
Fidelitatea și Validitatea Fidelitatea: Cât de sigură este o măsurare? valori similare la măsurări diferite valori similare la evaluatori diferiți Validitatea: Cât de bine reflectă ( țintesc ) valorile caracteristica supusă măsurării Fidel/Valid Fidel/Ne-valid Nefidel/Ne-valid Validitatea presupune fidelitatea, dar fidelitatea nu este singura condiție a validității
X=T+(E A + E S ) - Modelul scorului adevărat este un construct teoretic - Nu există posibilitatea cuantificării erorilor numai Dumnezeu știe câtă eroare este în rezultatul unei măsurări! - Totuși modelul erorii este important: - pentru fundamentarea teoriei fidelității măsurării - pentru optimizarea practicii măsurării - pentru interpretarea rezultatelor măsurării 63
Scale de măsurare şi statistici adecvate CALITATIVE Scale IDENTITATE NOMINALE CATEGORIALE ORDINALE Proceduri statistice adecvate NON PARAMETRICE CANTITATIVE INTERVAL RAPORT PARAMETRICE (dacă sunt respectate anumite condiţii) 64
65