Overblog Suivre ce blog
Editer la page Administration Créer mon blog

Alors là on s’attaque à un gros morceau de statistiques… Il est fondamental de bien choisir la taille de l’échantillon à utiliser, c’est la base de la « statistique inférentielle ». 

Le fait d’utiliser un échantillon vous permet de limiter l’étendu des mesures et ainsi économiser du temps et de l’argent, bien entendu cela implique d’accepter un degré d’incertitude. 

Afin de définir la taille de l’échantillon, il faut prendre certains facteurs en compte : 

·          Le type de données

·          L’objectif de ces mesures et ce que vous ferez des données

·          La confiance que vous pouvez déjà accorder à ces données et la marge d’erreur 

Voici quelques formules qui devraient vous aider à déterminer la taille de l’échantillon selon le type de données à mesurer. 

Link: http://www.profecogest.com/article.php3?id_article=96

 

·          Données continues 

Dans l’exemple ci-dessous N est la taille de l’échantillon, S est l’écart type (issu de précédentes mesures) ∆ est la marge d’erreur. 

N = (1.96S/ ∆)² 

1.96 est une constante représentant un intervalle de confiance de 95%

confiance-de-marge.gif 

Attention, cette approche n’est valable que si le résultat est supérieur à 30 

Exemple : Un groupe LSS souhaite connaître le temps de traitement moyen d’une panne à une panne prés (la marge d’erreur). En se basant sur des mesures précédement réalisée, l’équipe sait que l’écart type est de 4 heures. 

Quelle est la taille minimale requise de l’échantillon afin de pouvoir estimer la moyenne avec une précision de 95% ? 

N = (1.96 *4 / 1)² = 62 pannes (on arrondi à l’entier supérieur)

 

·          Données discrètes 

Ici nous allons introduire le facteur P qui correspond à la proportion de données étudiée 

N = (1.96S/ ∆)² (P)(1-P) 

Attention, cette approche n’est valable que pour les très grandes populations ou si la taille de l’échantillon ne correspond qu’à 5% des cas. Afin de valider le calcul assurez vous que (N)*(P)≥5 et (N)*(1-P)≥5 

Exemple : Ce même groupe souhaite maintenant définir le nombre de pannes qui nécessite un retravaille suite à la réparation. L’équipe sait qu’à peu prés 25% des pannes nécessite une deuxième intervention. Quelle doit être la taille de l’échantillon pour déterminer le % exigeant des retouches dans 5% de la population. 

N = (1.96 *4 / 0.05)² (0.25)(1-0.25)= 289 pannes (on arrondi à l’entier supérieur) 

 Pour savoir quand il est utilisé, je vous conseil de vous rendre sur la page traitant de la phase Mesurer d'un projet LSS

Partager cette page

Repost 0
Pour être informé des derniers articles, inscrivez vous :