Mostres representatives

Vivim immersos en un món de dades en el qual, de manera contínua, volem conèixer les tendències, les opinions o els gustos d’una població o grup de persones en particular. No obstant, conèixer, ni que sigui només una miqueta, com funcionen aquestes eines estadístiques ens serà útil, entre d’altres coses, per entendre millor el món actual. muestraestadistica

Els motius pels quals pot ser necessari un estudi poblacional concret poden ser molts i molt variats; per exemple, poder predir el resultat electoral abans que les eleccions se celebrin, conèixer els gustos o les preferències dels consumidors per així poder llançar un nou producte amb garanties d’èxit, conèixer l’opinió de la societat enfront d’una o una altra qüestió, etc. Els motius pels quals pugui ser important un estudi poblacional són molts, i la seva importància en l’època actual, cabdal.

La millor manera de poder conèixer l’opinió de la població sobre un o un altre tema seria poder preguntar l’opinió persona per persona, enquestar a tota la població; en aquest cas, evidentment, els resultats finals serien els correctes però aquest mètode, a part de que seria caríssim, és també inviable, sobretot quan parlem de poblacions de milers o milions d’individus. No obstant això, l’estadística ens ha brindat una eina molt útil per poder efectuar un estudi d’una població amb garanties de fiabilitat, d’una manera barata i amb grans expectatives d’èxit, és a dir, amb un marge d’error controlat. Com és impossible poder arribar a preguntar sobre aquest tema a tota la població, podem intentar arribar a una part de la mateixa, podem escollir una mostra, i del resultat de l’estudi mostral es pot deduir, amb un marge de fiabilitat més que acceptable, com actuarà la població en el seu conjunt davant tal o quin tema estudiat.

És a dir, que si escollim mostres ben definides de n integrants sobre una població total de N individus, el comportament de la mostra n serà molt probablement igual al de la població N. Per entendre aquest concepte faré un símil senzill, si tirem un dau només sis vegades és bastant improbable que aconseguim que no es repeteixi cap nombre, encara que cada nombre tingui la mateixa probabilitat de sortir segurament es repetirà algun resultat; davant un nombre petit d’intents, el resultat final és imprevisible. No obstant això, si tirem deu mil vegades el dau, molt probablement la freqüència en la qual obtindrem els resultats serà més que semblada a l’esperada, és a dir, un sisè dels tiratges obtindrem un un, un sisè dels tiratges obtindrem un dos i així, successivament, fins a arribar al sis.

Mostra representativa és aquella que posseeix qualitat i grandària apropiada per fer mínims els errors de mostreig. Si la inferència estadística realitza generalitzacions sobre el comportament d’una població estudiant solament una part limitada d’ella (mostra) llavors si la mostra (o les mostres) no és representativa la inferència mancarà de valor científic

Aquest concepte anterior és molt important per poder triar la mostra a entrevistar, com més gran sigui la mostra, més s’assemblarà a la població original, més representativa serà i el resultat de l’estudi de la seva distribució es podrà inferir, amb una alta probabilitat, a l’estudi de la distribució de la població total. Escollir mostres representatives en els sondejos d’opinió és vital; si no escollim correctament una mostra, si aquesta no és representativa, correm el risc d’obtenir resultats incorrectes. La grandària mostral és molt important en la representativitat, però també hi ha un altre factor que influeix que nostres mostres puguin ser representatives, el criteri d’elecció de la mostra ha de ser objectiu i independent, vegem dos exemples més o menys actuals:

  • Imaginem que en una població de vuit milions de persones acudeixen dos milions a una manifestació en la qual es reivindica una qüestió concreta. Si entrevistem a aquests dos milions de persones sobre aquesta qüestió, probablement obtindrem uns resultats favorables a la qüestió reivindicada, una aclaparant majoria. Ara bé,encara que en aquest cas la mostra sigui prou gran, n dos milions contra N vuit milions, no ho és el criteri d’elecció. Una mostra així no és representativa i els seus resultats no són correctes.
  • D’igual manera, pretendre que els sis milions que s’han quedat a casa estan tots en contra de l’ideal de la manifestació anterior és estadísticament tan erroni com pretendre el contrari segons el punt anterior. En aquest cas tenim n de sis milions sobre N de vuit milions, però tal mostra tampoc és representativa perquè estem eliminant de la població a estudiar precisament als dos milions que sí que van ser a la manifestació; a més, segurament en aquests sis milions “silenciosos” hi haurà moltíssima gent d’acord amb les idees dels quals van anar a manifestar-se, però que no hi van ser per diversos motius, per desídia, per distància, o el que fos.

En les notícies d’actualitat, i més en els temps que corren, podem observar com s’usen les dades dels estudis estadístics a favor de qui els promou. Per exemple, si fem un estudi d’intenció de vot en unes eleccions i escollim una mostra prou gran sobre la població total però només a les zones de votants de cert partit, els resultats que obtindrem seran inconsistents. Per tant, queda clar que tan important és la grandària mostral com la independència i el criteri d’elecció de la mostra. Referent a la grandària, hi ha càlculs matemàtics que ens poden determinar amb fiabilitat el mínim de persones a tenir en compte en una mostra, admetent un error determinat o “alfa” (per exemple, amb un alfa del 5%, és a dir, amb un noranta-cinc per cent de probabilitat, el resultat de l’enquesta és XXX), encara que si volem la màxima fiabilitat com més gran sigui la mostra menor alfa, sempre, és clar, que el criteri d’elecció sigui el correcte. Respecte la independència de la mostra, no hi ha un criteri matemàtic sobre aquest tema, és una decisió de l’entrevistador; com més objectiva sigui tal decisió, millor.

Reprenent el tema anterior, si bé una mostra de dos milions versus vuit de població no és representativa quant a inferir el resultat a la població total, sí que és un símptoma clar que alguna cosa important passa, i és inútil negar-ho afirmant que la majoria que no hagi anat a manifestar-se està en contra de tal qüestió. Arguments així són puerils i no tenen cap rigor científic encara que desgraciadament siguin massa vegades titulars en la premsa, provocant desinformació. L’actualitat està plena d’exemples així, siguem seriosos, si us plau.

El mismo artículo, en castellano, aquí.

Jordi Mulé.

Economista CEC núm. 13147.