Är multikollinearitet alltid det problem vi tror?

Mitt förra blogginlägg handlade om professor Lars Oxelheims analys som visar att företag med blandade styrelser presterar bättre än företag med enbart svenska medelålders män i styrelsen.

I bakänden av den analysen kände professor Oxelheim troligen ett behov att testa risken för multikollinearitet (om både A och B påverkar C så är multikolleniariteten den del av förklaringsgraden som kommer av att A och B också är kollererade till varandra).

Eftersom styrelsens perspektiv breddas när du för in en icke-svensk i den så har du ingen nytta av att också föra in en kvinna, är min förenklade version av resonemanget.

Det får mig att tänka på min hobby sen 38 år: löpning. Som löpare och som tränare har jag varit med om att välkomna en och annan rökare som nybörjare i gruppen.  

Smoking Runner

Vi har inte försökt övertala dem att sluta röka. Det sker av sig självt.

En statistiker skulle nog säga att det är viktigare för nybörjaren att sluta röka än det är att börja springa. Så tolkas statistik ofta. En regressionsanalys mellan löpning och förekomsten av cancer ger svaret att löpning motverkar cancer. Men löpning samvarierar också mycket starkt med rökfrihet. När den ambitiöse forskaren väljer att kontrollera för förekomsten av rökning så försvinner troligen sambandet*.

Men som jag sa tidigare: Den som börjar springa slutar nästan alltid röka (och ta narkotika). En cigarrett efter ett löparpass är som att duscha och sen dra på sig skitiga kläder. Det vill man inte göra.

När A leder till B och båda leder till C så är multikollineariteten inte det problem som många vill göra den till. Att försöka subtrahera förekomsten av den goda vanan från förekomsten av den dåliga vanan är fel. Det blir som att subtrahera förekomsten av människor på våning två i ett hus från förekomsten av människor på våning tre.  Det är bara superhjältar och folk med egen helikopter som kommer till trean utan att passera tvåan.

En blandad styrelse blir mer öppen. Om kvinnan eller icke-svensken kommer först är inte så viktigt.   Det ena ger det andra.

*Det här är ett antagande. Jag grundar inte det här resonemanget på faktiska data och tvivlar på att det finns en datamängd som innehåller information om både hur mycket man springer/joggar, röker och förekomsten av cancer.

Tagged with: , ,
Posted in Uncategorized