Dacă aţi face un sondaj în rândul doctoranzilor din domeniul medical privind importanţa cunoştinţelor de biostatistică, nu veţi fi deloc surprinşi să primiţi o majoritate covârşitoare de răspunsuri pozitive, unele superlaudative. Dacă aţi solicita însă şi câteva precizări, veţi constata că destul de puţine răspunsuri conţin şi detalii satisfăcătoare. Am avut ocazia să predau un astfel de curs în cadrul programului de studii doctorale timp de câţiva ani şi, în afară de faptul că am în faţă câteva sute de răspunsuri la sondaje de acest tip, am cules multe informaţii şi prin dialoguri directe. Nu încerc să calific concluziile, cu convingerea că simpla lor prezentare va fi suficient de relevantă. De asemenea, ordinea prezentării lor nu este legată de importanţa sau impactul lor.
Cu sau fără formule?
Aş începe cu constatarea, deloc surprinzătoare, că nu erau mulţi cei care îşi mai aminteau principalele procedee statistice de prelucrare a datelor, rezumându-se cel mai adesea la media şi deviaţia standard, eventual nişte teste statistice, mai ales dacă tocmai le folosiseră recent pentru lucrarea de diplomă. Poate că un motiv ar fi plasarea cursului în anul I sau II, când încă nu este suficient de evidentă aplicabilitatea clinică. Oare ar fi posibilă reluarea principalelor metode de prelucrare statistică a datelor clinice într-un modul prin anul V? Aici am mai putea adăuga un comentariu, privind modul în care sunt predate noţiunile fundamentale de biostatistică studenţilor de la facultăţi cu profil medical. Urmărind manualele elaborate în diverse centre universitare, inclusiv din străinătate, putem vedea că, uneori, se alocă un spaţiu destul de consistent aspectelor teoretice, cu pagini întregi de formule, care, pe lângă faptul că nu sunt prea îndrăgite de studenţii la medicină, nici nu sunt chiar strict necesare pentru aplicaţiile ulterioare. O bună bucată de vreme consideram şi eu că dintr-un manual serios n-ar trebui să lipsească formulele respective. Realist vorbind, nu mai cred că absenţa formulelor complicate ar diminua nivelul ştiinţific al manualului. Am şi exersat, sper cu succes, că se poate preda biostatistica la un nivel avansat cu un minimum de formule. Sunt acum convins că esenţa constă în a prezenta fiecare procedeu cu detalii de punere a problemei şi de interpretare a rezultatelor, calitatea actului didactic fiind dependentă în bună măsură şi de experienţa personală a profesorului. Iar fixarea cunoştinţelor se va realiza firesc prin numeroase exemple, mai ales interactive, urmând ca în cadrul lucrărilor practice să se prezinte programele de calculator cu care se pot exersa procedeele statistice respective.
Erezii biostatistice
Şi fiindcă tocmai am ajuns să pomenim programele de calcul statistic, ne putem opri şi aici cu nişte constatări. În primul rând, trebuie să le lăudăm, să fim fericiţi că le avem. Generaţiile mai vechi îşi mai amintesc strădaniile deosebite pentru a efectua până şi banalele calcule ale parametrilor statistici uzuali. Însă accesibilitatea softului statistic are două tăişuri; utilizarea improprie a unor metode ne poate conduce la concluzii false. Două pericole frecvente stau în cale: este posibil să folosim softul potrivit, dar să nu ştim să interpretăm rezultatele sau, mai grav, să folosim un soft inadecvat. Nu sunt rare cazurile în care se porneşte de la o analogie cu studii „similare“ din literatură şi lumea se avântă cu entuziasm într-o abordare cam sportivă a prelucrărilor statistice, uneori cu abateri esenţiale. Se fac des confuzii între variabilele numerice propriu-zise (măsurate cu un „instrument“) şi cele ordinale (exprimate tot prin numere, dar conform unor scări convenţionale), fiind, de fapt, necesare metode diferite de prelucrare. Confuzia între deviaţia standard şi eroarea standard a mediei este la ordinea zilei. Deseori nici măcar nu se face încă de la început distincţia dacă studiul va urmări „diferenţe“ sau „asocieri“. Se mai face frecvent confuzie între termenul de „corelaţie“ (ca relaţie generală între două fenomene) şi termenul statistic de „corelaţie“ (exprimată prin coeficientul de corelaţie, ca intensitate a asocierii unei legături). Nu e prea clar nici cum se definesc intervalele de normalitate, ce sunt intervalele de încredere, deosebirea între seriile pereche şi nepereche, între studiile cohort şi case-control, când se lucrează cu riscul relativ şi când cu odds-ratio etc. Ar mai fi numeroase alte exemple, nu doresc să insist asupra lor, ci asupra faptului că, având softul la îndemână, fără o înţelegere temeinică a semnificaţiei parametrilor calculaţi, sunt mari şanse ca datele să fie prelucrate aiurea, ducând la interpretări la fel de... aiurea! Norocul este că, adesea, astfel de „erezii“ nu trec de filtrul reviewer-ilor jurnalelor serioase.
Prelucrări nesigure
O altă constatare, una care m-a cam întristat şi mi-a dat de gândit, se referă la paleta extrem de limitată a metodelor statistice solicitate şi utilizate. Căutasem să stau de vorbă cu fiecare cursant, să-mi spună pe scurt cam ce ar urma să studieze în teză, ce date să culeagă şi ce metode statistice de prelucrare s-ar potrivi pentru prelucrare. Trec peste faptul că erau unii (puţini) care încă nu prea ştiau ce ar urma să facă; doctoranzii, în marea lor majoritate, aveau planuri destul de clare, interesante, chiar îmi făcea plăcere să-i văd pe unii vorbind cu pasiune pătimaşă despre tema lor de lucru. Însă, ajungând la potenţialele prelucrări statistice, intrau pe un teritoriu mai puţin sigur. Paleta din care alegeau era destul de îngustă – în afară de clasica descriere statistică, la mare căutare erau testele statistice (chiar dacă nu era încă foarte clar care dintre cele câteva zeci de teste uşor accesibile ar fi cel recomandat); a mai fost citată analiza corelaţiei, deşi ar trebui să menţionez că nu de puţine ori era aleasă într-un context nepotrivit – nu se cunosc limitările de aplicabilitate în funcţie de tipul de variabilă, nu se cunosc variantele alternative pentru variabile calitative sau dihotomice etc. În rest, se pot număra pe degete alte metode vizate. De câteva ori au fost pomenite şi metodele din analiza riscului – se fac deja o serie de studii în care se determină nu numai clasicii indici OR (odds-ratio) sau RR (relative-risk), ci se fac chiar analize stratificate sau de identificare a factorilor confuzionali. De asemenea, au mai fost pomenite prelucrările specifice studiilor de evaluare a unui sistem diagnostic – calcule de sensibilitate/specificitate, valori predictive pozitive/negative, acurateţe şi curbe ROC, inclusiv construcţia lor din „cut-edge values“ – însă numărul celor ce vizau astfel de prelucrări era foarte redus, provenind în marea lor majoritate doar de la câţiva conducători de doctorat.
Biostatistica pentru elefanţi
Urmaşii lui Toma necredinciosul
Dacă vrei să fii la curent cu tot ce se întâmplă în lumea medicală, abonează-te la „Viața Medicală”, publicația profesională, socială și culturală a profesioniștilor în Sănătate din România!
Titularii abonamentelor pe 12 luni sunt creditați astfel de:
Cookie-urile ne ajută să vă îmbunătățim experiența pe site-ul nostru. Prin continuarea navigării pe site-ul www.viata-medicala.ro, veți accepta implicit folosirea de cookie-uri pe parcursul vizitei dumneavoastră.
Da, sunt de acord Aflați mai multe