Unelte personale
 
Vizualizări

Statistici

De la Debatepedia

Revizia pentru 10 august 2010 23:07; Iulia p (Discuţie | contribuţii)
(dif) ←Versiunea anterioară | afişează versiunea curentă | Versiunea următoare → (dif)
Salt la: Navigare, căutare

Definitie

Statisticile reprezinta o stiinta matematica ce implica colectarea, sintetizarea, analizarea si interpretarea unor date.[1] In dezbateri statisticile sunt utilizate pentru a reprezenta situatii factuale, pentru a descrie trenduri si atitudini la nivel social sau pentru a argumenta relatii cauzale intre fenomene. Ele au o putere de convingere foarte mare, tocmai din cauza presupunerii ca sunt date obtinute in mod stiintific, prin mijloace riguroase, si sunt astfel obiective, sau chiar reprezinta adevaruri universal valabile si imposibil de contraargumentat. De cele mai multe ori insa nu este asa, si exista numeroase situatii in care - cu buna stiinta sau involuntar - statisticile sunt folosite pentru a manipula. Este util asadar sa cunoastem cateva dintre cele mai intalnite situatii de utilizare eronata a statisticilor, nu doar in dezbateri, ci si in viata de zi cu zi.

Scoaterea datelor din context

Celebrul om politic şi de cultură britanic Benjamin Disraeli ar fi spus la un moment dat că „Există minciuni, minciuni neruşinate şi statistici”. Parafrazând un slogan al Asociaţiei Americane pentru Arme am putea spune, mai corect, că „Statisticile nu mint, oamenii mint.”

Statisticile, la fel ca declaraţiile autorităţilor în domeniu, pot fi scoase din context pentru a crea impresii înşelătoare. A face acest lucru constituie în mod clar o eroare, din moment ce impresia creată nu este o continuare logică a premisei. Să luăm drept exemplu următorul raţionament: universitatea la care predau are 8,000 de studenţi şi este situată într-un oraş cu o populaţie de 6,825 locuitori, conform ultimei numărători. Probabil că încă 5,000 de oameni locuiesc în aşezările învecinate. Aşadar, dacă ar fi să deschizi o sală de bowling în oraş, ai avea un potenţial de piaţă format din peste 19,000 de oameni. O sală de bowling ar fi cu siguranţă o investiţie profitabilă cu o clientelă numeroasă.

Raţionamentul pare a fi destul de solid. Statisticile prezentate pot fi suficient de exacte. Însă plasându-le în afara contextului în care ele sunt corecte, cel care face acest raţionament creează o impresie greşită. Dacă o persoană cu expertiză în domeniu ar emite acest argument, am fi îndreptăţiţi să considerăm că ea nu este o persoană de bună credinţă. Să analizăm cu grijă argumentul prezentat. Este adevărat că la ultima numărătoare populaţia oraşului atingea 6,825 de locuitori, în 1990 şi este adevărat ca numărul studenţilor înscrişi la universitate atinge 8,000 de studenţi. Însă acest număr îi include atât pe cei care locuiesc în campus, cât li pe cei care locuiesc în apartamente în oraş. Nu se ştie cu exactitate câţi dintre studenţi trăiesc în oraş, însă ar putea fi cel mult 3,000. În acest caz, clientela potenţială din oraş trebuie limitată la un maxim de 11,825 şi nu 14,825

Numeroase alte informaţii care fac ca cifrele să nu fie exacte sunt omise. Astfel, deşi universitatea are înregistraţi 8,000 de studenţi, aproape jumătate dintre aceştia sunt navetişti. Ei fie nu se află în oraş noaptea, fie când se află în oraş sunt la şcoală. Acest lucru reduce şi mai mult numărul clienţilor posibili, la populaţia oraşului plus numărul rezidenţilor din zonele învecinate. Însă şi acest număr include persoane care nu ar trebui să intre în calcul. Pe de o parte, sunt persoanele prea tinere pentru a putea fi considerate clienţi. Putem astfel scoate din calcul cei 640 de copii sub 5 ani. În egală măsură putem scădea şi pe cele 1,000 de persoane peste 65 de ani, departe de a fi cei mai probabili clienţi ai unei săli de bowling. Numărul real al clienţilor potenţiali din oraş rămâne acum la 5,635. Mai mult, numărul copiilor foarte mici şi al bătrânilor peste 65 de ani trebuie scăzut şi din rândul populaţii învecinate.

Mai sunt cel puţin două aspecte care au fost omise din raţionamentul iniţial, chiar dacă nu sunt fapte statistice. Primul aspect este că deşi nu există alte săli de bowling private în oraş, există o sală de bowling a Universităţii, care nu este amintită. Toţi studenţii, personalul şi familiile personalului pot folosi acea sală de bowling la preţuri foarte mici. Din moment ce Universitatea este cel mai mare angajator din oraş, un număr mare de cetăţeni sunt fie parte a personalului sau sunt membrii ai familiilor personalului. Cel de al doilea aspect este că mulţi dintre cei care locuiesc în împrejurimile oraşului sunt de fapt destul de aproape de un alt oraş, cu aproximativ 20,000 de locuitori, care are deja o sală de bowling. Astfel încât, cel puţin o parte dintre locuitori nu vor constitui parte din clientela potenţială. În acest nou context, deschiderea unei săli de bowling în oraşul care face obiectul raţionamentului nu mai pare o idee aşa de bună.

Sursa si relevanta datelor prezentate

Mai mult, e bine să fim întotdeauna sceptici cu privire la date şi numere. Tindem să dăm crezare statisticilor care prezintă populaţia unui oraş, rata şomajului sau rata infracţiunilor. Însă trebuie să ne întrebăm cum sunt obţinute aceste statistici. Fără îndoială, 6,825 este numărul dat de rapoartele oficiale la ultimul census al populaţiei, în 1990. Însă dacă sau nu acest număr reprezintă cu adevărat numărul real al locuitorilor oraşului depinde de acurateţea măsurătorilor făcute. Asta ca să nu mai vorbim că acum informaţia este complet învechită. Putem totodata sa ne intrebam daca recensamantul populatiei a fost unul oficial sau neoficial, daca a fost realizat de o institutie administrativa sau de una non-guvernamentala, daca ar fi putut existat diferite interese in functie de rezultatul final al recensamantului etc.

Utilizarea unei valori medii

Un al doilea tip de utilizare eronată a statisticilor îl reprezintă cel legat de utilizarea termenilor şi conceptelor specifice. Când vorbim spre exemplu despre o valoare medie, acest termen se poate referi la unul dintre următoarele lucruri:

- media aritmetică a unui grup de numere - mijlocul unei secvenţe de numere - modelul (cea mai des întâlnită valoare dintr-o secvenţă de numere)

Să luăm exemplul unui grup de elevi şi a unui test cu punctaj maxim de 150 de puncte. În urma testării grupului, s-au obţinut următoarele punctaje: 150, 146, 100, 98, 96, 96, 88, 85, 82, 80. Pentru acest grup, media aritmetică este 102.1 (suma tuturor rezultatelor, împărţită la numărul rezultatelor). Mijlocul, pe de altă parte, este 96 (un număr egal de rezultate se află înainte de şi după 96), şi la fel şi modelul (rezultatul 96 apare de cele mai multe ori în secvenţa de numere). Deşi numerele sunt apropiate în acest caz, este evident şi riscul de a folosi termenul de valoare medie fără a şti exact la ce se referă. 80% dintre elevii din grup au obţinut un punctaj sub cel considerat „mediu” conform mediei aritmetice.

Un exemplu ilustrativ în acest sens este cel al unei clădiri în care proprietarul câştigă 120,000 de euro şi închiriază spaţii de locuit altor 4 oameni, fiecare dintre aceştia câştigând la rândul lor 20,000 de euro. Media aritmetică a câştigurilor în acea clădire este de 40,000 de euro, dublu cât câştigă de fapt majoritatea oamenilor de acolo. Este de asemenea dublu faţă de mijloc şi model.

Un alt concept la care trebuie să fim atenţi este cel de relativitate a numerelor. Cu siguranţă, 100,000 de euro pe an poate părea un salariu imens. Dar dacă vorbim despre un oraş în care doar chiria este de peste 30,000 de euro pe an? Iar restul cheltuielilor de întreţinere şi asigurare a hranei ating şi ele 20,000 de euro pe an? Dintr-o dată rămânem cu jumătate din cifra prezentată la început, care, deşi mare, nu mai are nici pe departe impactul iniţial. În mod similar, putem considera că a plăti 5 euro pentru o pâine este o valoare mult prea mare. Mai pare ea la fel de mare însă dacă o raportăm la un salariu de 100,000 de euro? Totul trebuie raportat la un context mai larg, altfel nu are nici o valoare. Un exemplu în acest sens îl reprezintă comentariile de la primele alegeri europarlamentare din România. Toată lumea s-a plâns atunci de prezenţa scăzută la vot, fără să se menţioneze însă că raportată la restul Uniunii Europene, a reprezentat una dintre cele mai mari valori pentru alegerile europarlamentare.

Operatii matematice cu procente

Operaţiile matematice cu procente par a fi însă unele dintre cele mai dificile pentru majoritatea oamenilor. Din acest motiv, erorile de argumentare care au la bază aceste operaţii sunt şi cele mai des întâlnite şi cu cea mai mare şansă de succes. Un exemplu este cel al unei dezbateri pro şi contra interzicerii de a vinde alcool într-un stat american. Cei care erau pentru această măsură au publicat un articol într-un ziar local în care descriau experienţa unui oraş care aplicase recent măsura interzicerii comerţului cu alcool. Conform articolului, după luarea acestei decizii arestările legate de traficul rutier au scăzut cu 229%. Majoritatea oamenilor ar găsi acest număr impresionant. Probabil câţiva ar invoca o eroare de raţionament de tip post hoc (e posibil ca rata arestărilor să fi scăzut şi din alt motiv decât interzicerea vânzării de băuturi alcoolice). Însă probabil nimeni nu ar obiecta faptul că este numeric imposibilă o scădere cu 229%. Dacă arestările ar fi scăzut cu 100% ar fi ajuns la zero, de unde nu ar fi putut scădea mai mult. Un celebru producător de automobile îşi prezenta la un moment dat un model ca fiind „cu 700% mai silenţios”. I s-a reproşat că nu menţiona decât ce era mai silenţios. Însă oricum nu conta. Cu 100% mai silenţios decât orice înseamnă tăcere completă. Cât priveşte procentul de 229%, s-a dovedit ulterior că era vorba despre o greşeală tipografică. Numărul ar fi trebuit să fie 22.9%, adică aproximativ 23%, nici pe departe la fel de impresionant.

Exista, desigur, numeroase alte instante ale folosirii statisticilor care pot pune probleme. Cel mai adesea ne putem feri de manipulare punandu-ne intrebari ce privesc corectitudinea colectarii si interpretarii datelor; altfel spus, cerand partii adverse sa prezinte si sa explice metodologia prin care s-a ajuns la o anumita concluzie prin intermediul statisticilor.

Referinte

Teaching the Argument in Writing, Richard Fulkerson, NCTE, 1996, pp. 130-135 Adus de la "http://idebate.org/wiki_ro/index.php/Statistici"

Problem with the site? 

Tweet a bug on bugtwits
.