Comment créer un échantillon probabiliste ?

Etudes quantitatives et échantillon probabiliste

Dans la phase quantitative, l’échantillonnage est une étape cruciale. L’intérêt de prélever une partie de la population à interroger autrement dit de « sonder un échantillon » par rapport à un recensement qui consisterait à interroger toute la population est bien entendu la rapidité et l’économie de la chose. Pour réaliser un échantillon représentatif, il existe de très nombreuses méthodes. Mais en réalité, elles sont toutes dérivées de deux grands principes et appartiennent toutes à deux familles : les méthodes probabilistes et les méthodes empiriques. Dans la famille probabiliste on trouvera parmi les plus connues les méthodes aléatoires, simple tirage au sort dans une base de sondage et dans la famille empirique, on trouvera des semi aléatoires avec par exemple la méthode des itinéraires, des indications données à l’enquêteur du type prendre la première rue à gauche et interroger dans le premier bâtiment un habitant du deuxième étage, puis aller en face et au 3e etc. Et enfin la méthode la plus utilisée, la méthode dite des quotas qui consiste à donner à l’échantillon de personnes interrogées la même structure que la population de référence sur les critères importants pour l’enquête.
Si vous ne l’avez pas déjà visionnée dans la fiche « Faire un questionnaire pro » suivez notre courte présentation vidéo sur les études quantitatives et apprenez à manier les marges d’erreurs avec l’application ci-dessous : créer un échantillon probabiliste. Si vous débutez, peut-être devriez vous consulter notre fiche de cours sur ce thème.

Application intermédiaire, durée : 30 minutes

niveau de difficulté de l'exercice 3 étoiles

Échantillonner par une méthode probabiliste

Vous supervisez un sondage réalisé sur un échantillon construit par une méthode probabiliste. 40% des interrogés ont répondu oui à votre première question sur un échantillon de 1000 individus. Nous travaillons comme dans toutes les enquêtes marketing au seuil de confiance de 95%.
Ce que vous devez faire
Calculer la marge d’erreur maximale que nous devrions observer sur l’ensemble de la population mère pour la même question. Ci dessous un rappel des formules de calcul.

diapositive échantillonnage
ACNielsen HomescanTM est le seul panel disponible sur le marché, couvrant l’ensemble des types de magasins et permettant de rassembler toutes les informations relatives aux achats des produits de grande consommation, ainsi que des denrées périssables non équipées de codes à barres, quel que soit leur poids. Ces dix dernières années, le panel de consommateurs Homescan s’est affirmé comme le meilleur panel d’achats des consommateurs au monde. Un tel succès et la valeur qu’il représente ont amené les spécialistes du marketing à développer les services ACNielsen Worldwide Consumer Panel, qui fournissent désormais des études essentielles sur les habitudes de consommation de plus de 125 000 foyers répartis dans 22 pays. Couverture de l’ensemble des circuits L’un des principaux avantages de Homescan réside dans le fait qu’il fournit des études sur les comportements des consommateurs couvrant tous les types de circuits d’achat, des magasins d’appoints aux grandes surfaces en passant par les boutiques spécialisées et les achats par correspondance ou sur Internet. ACNielsen Homescan s’appuie sur des scanners de codes à barres brevetés et très perfectionnés pour proposer à nos clients des études des comportements des consommateurs disponibles nulle part ailleurs.
Source : http://fr.nielsen.com/

La suite
Vous vous penchez sur les ventes internationales de votre marque. Vos marchés correspondent aux 22 pays dans lesquels Nielsen propose Homescan. La notoriété de votre principale marque atteint 34% du panel. En supposant que l’échantillonnage soit probabiliste, au seuil de confiance de 95%,

Ce que vous devez faire
Indiquer dans quel intervalle de confiance se situe votre notoriété sur l’ensemble de la population mère et quel sera cet intervalle lorsque votre notoriété atteindra la moitié de l’échantillon ?

 

Correction échantillonnage probabiliste

En pratique  lorsque vous pouvez recourir à cette méthode (par exemple sur votre fichier clients) il vous suffit de choisir la fiabilité souhaitée, le budget alloué et vous connaissez immédiatement le nombre d’individu qu’il faudra interroger grâce à une formule mathématique ou un abaque. Par exemple, vous voulez une marge d’erreur maximale de 5%, vous devez interroger 1/0.05² soit 400 personnes. Vous n’avez que le budget pour 400 personnes, vous aurez une marge d’erreur maximale de 1/√400, soit +/-5%.

Chaque individu est tiré au hasard et dispose donc des mêmes chances de figurer dans l’échantillon que son voisin. Ce qui permet de lier mathématiquement la taille de l’échantillon, l’écart probable entre les quantités de réponses obtenues sur celui-ci et celles que l’on aurait eu en interrogeant toute la population (marge d’erreur) et enfin la proportion obtenue à la dite réponse concernée. L’erreur absolue ou encore marge d’erreur est notée e et correspond à 2 fois la racine de [px(1-p)/n] ou p est le pourcentage observé (exemple oui à 32%), n la taille de l’échantillon (exemple :400 personnes).

Dans un univers probabiliste, 40% des interrogés de l’échantillon de 1000 personnes ont dit oui. Au seuil de confiance de 95%, la marge d’erreur maximale sera donnée par e=2 √[p(1-p)/n] ou p est le pourcentage observé soit 40%, n la taille de l’échantillon soit 1000 personnes, e=2 √ [ 0.4 (1-0.4) /1000 ]= 0,0309 soit +/-3,1%.

La suite : l’Intervalle de confiance 

n correspond aux 125 000 foyers,
34% correspond à une réponse positive à la question permettant de déterminer la notoriété sur l’échantillon. Il suffit donc d’appliquer la formule générale.

e =  2 racine de [ 0.34 (1-0.34) /125000 ] soit 0,26 %,

L’intervalle de confiance dans la population mère sera donc

[(34-0,26%) ; (34+0,26%)] soit [33,74%; 34,26%]

Lorsque la notoriété égale la moitié de l’échantillon, on remplace 34% par 50%.

On peut aussi directement utiliser la formule dans sa version simplifiée. e=1/Ö n soit 1/Ö125000= 0,28%, l’intervalle de confiance sera donc [(50-0,28) (50+0,28)] soit [49,72% ; 50,28%].

Explication littérale : sur cette question 50% de mon échantillon dit oui, 50% dit non, j’ai 95% de chances pour que le pourcentage réel de oui et de non dans ma population mère soit compris entre 49,72% et 50,28%.

Accédez à votre espace premium

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *