Analiza multivariată a variaţiei ANOVA Frecvent utilizată pentru evaluarea legăturilor de dependenţă dintre variabile, datorită aplicării ei simple şi rapide, metoda analizei variaţiei a fost construită în jurul celui mai utilizat indicator de tendinţă centrală, media. Cu ajutorul acestei metode este analizat efectul uneia sau al mai multor variabile nominale sau ordinale asupra unei variabile cantitative. În cercetările de marketing, analiza variaţiei este folosită adesea pentru identificarea diferenţelor dintre grupuri sau segmente aducându-şi aportul, în mod deosebit, în realizarea experimentelor de marketing. Fundamente Analiza multivariată a variaţiei cuprinde un grup de metode aparţinând statisticii inferenţiale (deductive) care permit separarea şi testarea semnificaţiei efectelor cauzate de acţiunea simultană a mai multor factori asupra unei variabile. Analiza variaţiei (ANOVA) şi analiza covariaţiei (ANCOVA) sunt folosite pentru a examina diferenţele dintre valorile medii ale variabilei dependente sub efectul unor variabile independente controlate, după izolarea efectului unor variabile independente necontrolate. În esenţă, ANOVA este folosită pentru a testa diferenţele dintre mediile a două sau mai multe grupuri (populaţii). Mai precis, analiza variaţiei testează ipoteza nulă conform căreia nu există diferenţe între medii (altfel spus, toate mediile ar fi egale între ele). În forma cea mai simplă, analiza variaţiei necesită o variabilă dependentă măsurată pe o scală metrică (interval sau proporţională) şi una sau mai multe variabile independente măsurate pe o scală nemetrică (nominală sau ordinală). Aceste variabile independente de tip categorial sunt denumite, de obicei, factori. Modul în care nivelurile (categoriile) factorilor acţionează asupra variabilei dependente poartă denumirea de tratament. Procedurile de analiză a variaţiei au la bază acelaşi principiu dar se diferenţiază prin numărul de factori. Vom distinge situaţiile în care este analizată o singură variabilă dependentă cu un factor (one-way analysis of variance) sau analiza variaţiei cu n-factori (n-way analysis of variance). Aplicaţii în marketing ale analizei variaţiei Analiza variaţiei este utilizată în mod deosebit în experimentele de marketing, când se evaluează influenţa unor variabile independente asupra altora, tratate ca dependente. Mult mai frecvent însă cercetătorii urmăresc să analizeze, în studii pe care le realizează, diferenţele dintre valorile medii ale unei variabile dependente pe care le ia la nivelul mai multor categorii ale uneia sau mai multor variabile independente (factori) pentru a putea concluziona dacă există sau nu diferenţe între grupurile respective. Mai precis, analiza variaţiei poate furniza răspunsuri la întrebări precum: • există diferenţe în privinţa duratei totale lunare a convorbirilor telefonice între persoanele din diferite regiuni ale ţării sau pe categorii de educaţie şi venit? • care sunt diferenţele în privinţa intenţiilor de cumpărare la diferite niveluri ale preţurilor unui produs? • percepţiile privind diversitatea ofertei (categorii), interacţiunea cu vânzătorii (da/nu) şi modul în care au fost rezolvate plângerile (categorii) îşi pun amprenta asupra satisfacţiei clienţilor? • consumul de cafea este influenţat de vârstă (categorii) şi educaţie (categorii)? Indicatori şi noţiuni asociate analizei variaţiei (cu un factor) • Variaţia dintre grupuri (between variation) sau SSE între-grupuri reprezintă variaţia variabilei dependente corespunzătoare variaţiei mediei pe categoriile variabilei independente. Ea reprezintă partea din suma pătratelor aferentă variabilei independente; • Variaţia din interiorul grupurilor (within variation): notată, de obicei cu SSR (sau SSin-interior sau SSeroare) reprezintă variaţia variabilei dependente datorată variaţiei în interiorul fiecărei categorii a variabilei independente. Această variaţie nu este generată de variabila independentă; Variaţia totală (total variation): notată, de obicei cu SST (sau SStotală) reprezintă variaţia variabilei dependente corespunzătoare variaţiei mediei pe categoriile variabilei independente. Variaţia totală a variabilei dependente (SST) este formată din variaţia explicată de variabila independentă (SSE sau SSîntre-grupuri) şi variaţia reziduală (SSR sau SSin-interior). • Media pătrată (mean square): este suma pătratelor împărţită la numărul gradelor de libertate; • testul F (F statistic): verifică ipoteza nulă varianţa dintre grupe si varianţa din grupe. Testarea semnificaţiei statistice că mediile categoriilor variabilei independente pentru variabila dependentă sunt egale; se calculează ca raport între Verificarea ipotezei nulă (H0) confom căreia mediile variabilei dependente în cazul fiecărui grup (categorie) a variabilei independente sunt egale se face cu ajutorul testului F. Programele informatice îl calculează în mod automat dar, din considerente de informare, menţionăm că el se calculează ca raport între variaţia pusă pe seama variabilei independente şi ajustată cu numărul gradelor de libertate aferente (SSE/(k-1)) şi variaţia corespondentă erorii ajustată şi ea cu numărul gradelor de libertate diferenţă (SSR/(n-k)). Interpretarea testului F poate fi făcută absolut, prin compararea cu valorile tabelate sau prin prisma nivelului de semnificaţie asociat, pe care majoritatea programelor informatice de analiză statistică îl calculează. Un nivel de semnificaţie sub 0,05 (aferent unei probabilităţi peste 95%) permite respingerea ipotezei nule a egalităţii mediilor. În situaţia în care ipoteza nulă a egalităţii mediilor grupurilor a fost acceptată, variabila independentă nu are un efect semnificativ asupra variabilei dependente. În caz contrar, prin neacceptarea ipotezei nule se poate concluziona că grupurile diferă între ele din punct de vedere al caracteristicii studiate (variabila dependentă) şi că variabila independentă exercită un efect semnificativ asupra celei dependente. Mergând mai departe, o comparare a mediilor la nivelul grupurilor va da informaţii legate de natura efectului variabilei independente. Analiza variaţiei cu n-factori Acest tip de analiză se aplică în situaţia în care există o variabilă dependentă şi mai mulţi (n) factori (variabile independente). Faptul că există o acţiune simultană a mai multor factori aduce în discuţie efectul generat de fiecare dintre factori şi cel produs de interacţiunile dintre ei. Procedura de aplicare a analizei variaţiei cu n-factori este similară cu cea în care avem un singur factor, dar modul de descompunere a variaţiei este unul adaptat. Pentru modelul cel mai simplu, cu 2 factori (X1 şi X2) variaţia totală se descompune astfel: SST=SSE1+SSE2+SSE12+SSR Un efect mai puternic al variabilei X1 va fi reflectat printr-o diferenţă mai mare între medii la nivelul categoriilor acestei variabile şi sumă a pătratelor SSE1 mai mare, şi la fel în cazul celeilalte variabile independente. Pe de altă parte, cu cât există o interacţiune mai mare între factorii X1 şi X2 cu atât contribuţia comună la explicarea variaţiei (ca rezultat al acestei interacţiuni) va fi mai mare (relaţia funcţionează şi în sens invers, arătând că o o valoare mică a SSE12 arată o independenţă între cei doi factori (din acest punct de vedere). Testul F va ajuta, de data aceasta, la calcularea nu numai a efectului principal al fiecărui factor ci va fi calculat câte un indicator atât pentru evaluarea efectului interacţiunii cât şi pentru a testa semnificaţia statistică a întregului model, deci efectul global al tuturor tratamentelor (factori,individual + interacţiunea dintre ele).