Faire des essais comme un pro : Comparaison de moyenne – part3

Si vous arrivez sur ce blog pour la première fois, vous serez peut-être intéressés par 1h de formation pour débuter en Six Sigma. Pour recevoir gratuitement cette vidéo, saisissez votre adresse email ci-dessous.

Comparaison de moyenne

Vous voulez comparer deux échantillons pour savoir s’ils sont statistiquement différents ? Dans cette 3ème vidéo dédiée aux essais nous allons voir, comment faire un test de comparaison de moyenne. Le but c’est de démontrer s’il y a une différence entre avant et après si vous faites, un changement ou une amélioration dans un process.

Télécharger 1h de formation en Lean Six Sigma

Vidéo Comment faire des comparaisons de moyenne ?

Comparer des échantillons

Si je résume les 2 vidéos précédentes, on a vu comment organiser ces essais avec la méthode QQOQCCP pour ne rien oublier. Ensuite, on a appris à tester la normalité des données avec le probability plot. Maintenant la 3ème étape c’est de comparer statistiquement si les 100 pièces usinées avec l’outillage standard sont meilleurs, ou moins bonnes, qu’avec le nouvel outillage. En fait la question à laquelle on va répondre c’est : Y a-t-il une différence entre les deux populations ? (graphique) Pour ça on va utiliser un test d’hypothèse qui s’appelle le 2 sample t-test.

Les tests d'hypothèses

Petite parenthèse sur les tests d’hypothèse. D’abord faut savoir qu’il en existe plusieurs types. Selon ce que vous voulez comparer : la moyenne, l’écart type, la stabilité ou la distribution on n’utilisera pas le même. Autre critère qui rentre en compte : est ce que les données suivent une loi normale, c’est ce qu’on a vu dans la vidéo précédente. Et enfin, dernier point c’est le nombre d’échantillons à comparer. Aujourd’hui on veut comparer la moyenne de 2 échantillons qui suivent la loi normale, donc dans ce cas il faut utiliser le 2 sample t-test.

Intervalle de Confiance

Vous le savez, les statistiques ne sont pas précises à 100%. Si je vous dis qu’on a 1 chance sur 2 d’avoir la face d’une pièce. Est-ce que vous pensez que si je lance la pièce en l’air je vais avoir systématiquement Pile / Face / Pile / Face…Non, vous allez peut être avoir 2 piles et 1 face et puis 3 fois pile d’affiler, c’est qu’on appelle l’erreur d’échantillonnage….par contre si on lance cette pièce 1 million de fois on devrait être très très proche des 50/50. Donc pour s’affranchir de cette imprécision, on utilise un intervalle de confiance. C’est vraiment une notion importante. Qu’est-ce que ça veut dire. Si je reprends l’exemple du pile ou face, on dira qu’en moyenne on a 50% de chance d’avoir pile avec une incertitude qui variera entre 45 et 55%. L’intervalle de confiance, c’est une sécurité qu’on place autour de la moyenne parce qu’on sait pas exactement si ce sera à 49, 51 ou 55%. Les tests d’hypothèse c’est des outils qui permettent de dire : qu’elle est la probabilité que ce que l’on dit, est vrai, en prenant en compte cet intervalle de confiance.

Faire des comparaisons de moyenne avec Minitab

Voilà pour la théorie, passons maintenant à la pratique. On trouve les données dans Minitab en deux colonnes. Vous allez dans Stat / Basic Statistic / 2-sample t. Une boite de dialogue s’affiche. Le menu déroulant permet de choisir comment sont structurées vos données. Vous avez 3 possibilités. Si vos données sont dans 2 colonnes différentes, comme c’est le cas ici, utilisez « Each sample is in its own column ». Si vos données étaient dans la même colonne, comme ici, choisissez « Both samples are in one column ». Et enfin la 3ème option vous permet de rentrer directement les éléments important pour minitab pour faire le test, c’est-à-dire la moyenne, l’écart type et le nombre d’échantillon. J’en profite pour préciser qu’il n’est pas obligatoire d’avoir le même nombre d’échantillon dans chaque groupe pour faire un test d’hypothèse.

Minitab 2 sample t test

Dans « samples 1» on choisit la 1er colonne : données STD et dans « samples 2 » outillage nouveau. On voit qu’il y a un bouton option. On peut régler l’intervalle de confiance, généralement on le laisse à 95%. Hypothesized difference doit être laissé à zéro puisqu’on veut savoir si les 2 échantillons sont identiques. Alternative hypothesis. Généralement on laisse différent mais minitab 17 peut tester si les échantillons sont supérieurs ou inférieurs les uns aux autres. Je vous conseille de laisser par défaut différent pour éviter les confusions. Dans graphs, vous pouvez demander au logiciel de tracer 2 types de graphiques : Individual value plot et Boxplot. On peut cocher les 2. On valide par ok deux fois.

Box plot minitab

Voilà on voit que les graphiques sont générés. Je vais pas vous donner tous les détails du boxplot parce que ce sera l’objet d’une vidéo à part entière mais juste quelque info. Chaque boite représente un échantillon, à gauche c’est l’outillage std et à droite le nouvelle outillage. La ligne du milieu c’est la médiane, pas la moyenne mais la médiane. Si on reste avec la souris un petit moment sur la boite, on voit que la médiane est de 10.01 et 10.42. Les lignes ici qu’on appelle les moustaches représentent l’étendu des données. Donc avec ce graphique, on peut dire que la médiane des échantillons usinés avec l’outillage standard est plus basse qu’avec le nouvel outillage. Il semblerait que l’écart type, c’est-à-dire la largeur de la boite est plus petite avec l’outillage standard. On confirmera ça tout à l’heure par les chiffres.

Individual value plot minitab

Le deuxième graphique c’est un peu la même chose sauf que chaque point est représenté. Le point bleu par contre ici, c’est la moyenne.

Analyse test d'hypothèse Minitab 17

Mais le plus intéressant c’est le rapport texte. Dans la première partie, Minitab synthétise les données. Donc N c’est le nombre d’échantillons : 100 pour l’outillage STD et 100 pour le nouvel outillage. On retrouve la moyenne et l’écart type. Donc on confirme ce qu’on a vu avec le boxplot, la moyenne et l’écart type sont plus petit avec l’outillage standard.

P value et test d'hypothèse

Deuxième information importante c’est le p value. J’ai expliqué dans la vidéo précédente à quoi correspondait le p value, n’hésitez pas à la revoir. On voit qu’ici il est inférieur à 0,05 donc on peut conclure que les échantillons sont statistiquement différents. Il y a bien une différence entre les pièces usinées avec l’outillage standard et le nouvel outillage.

Analyse de capabilité avec Minitab

La dernière question à laquelle on doit répondre c’est, avec qu’elle outillage on a les meilleures performances. C’est qu’on va voir dans la dernière vidéo. Je vais vous présenter un 4ème outil qui permet de dire combien on génère de rebut à partir d’un échantillon. Vous allez littéralement prédire l’avenir…En attendant la suite, laissez-moi vos commentaires et vos questions sous la vidéo, j’y répondrai avec plaisir.

Formation gratuite six sigma

Merci d’avoir regardé cette vidéo, comme d’habitude vous êtes libre de recevoir gratuitement une heure de formation pour bien démarrer en Six Sigma, pour ça cliquez sur le lien qui apparait sur cette vidéo. Vous laissez votre email, et je vous l’envoie immédiatement. Et puis comme d’habitude j’ai besoin de votre feedback, si vous avez aimez cette vidéo cliquez sur j’aime juste en dessous et puis partagez là. A bientôt sur UpTraining.fr

Related Posts Plugin for WordPress, Blogger...

Pour aller plus loin, je vous offre le 1er module de ma formation Green Belt Lean Six Sigma !

About The Author

Simon Leclercq

Black Belt Lean 6 sigma

Leave A Response

Vérification * Time limit is exhausted. Please reload CAPTCHA.

* Denotes Required Field