Tester la normalité des données avec le Probability Plot

Si vous arrivez sur ce blog pour la première fois, vous serez peut-être intéressés par 1h de formation pour débuter en Six Sigma. Pour recevoir gratuitement cette vidéo, saisissez votre adresse email ci-dessous.

Vérifier la normalité avec Minitab

 Vous voulez faire des essais mais vous n’avez pas de méthodologie ? Dans cette série de vidéo, je vous présente les 4 outils que vous devez maitriser pour faire des essais comme un pro !

Cliquez ici pour Accéder à ma formation Green Belt

Vidéo tuto tester la normalité

Comment faire des essais ?

Dans la 1er vidéo, je vous ai expliqué comment planifier votre essai avec l’outil QQOQCCP, pour ne rien oublier. Aujourd’hui on va considérer que vous avez réalisé votre essai et que maintenant il faut analyser les résultats. Pour ça, la première étape c’est de vérifier la normalité des données. Pourquoi ? Tout simplement parce qu’en suite on va avoir besoin d’outils statistiques comme, les comparaisons de moyenne et les études de capabilités qui utilisent la loi normale dans leurs calculs. Donc si les données ne suivent pas la courbe de Gauss, vos calculs seront faux ! Je vais donc vous présenter un outil qui permet de vérifier la normalité des données, qui s’appelle le probability plot. Allez c’est parti !

Distribution normale

Si on reprend l’exemple de la vidéo précédente, vous avez fait usiner 100 pièces avec l’outillage standard, puis 100 autres pièces avec le nouvel outillage. Votre laboratoire contrôle sur chaque pièce, le diamètre de l’arbre et vous reporte les données.

Utiliser minitab pour tester la normalité

Pour vérifier la normalité des données le plus simple c’est d’utiliser Minitab. Comme vous le constatez, les valeurs obtenues avec l’outillage standard, ont été rentrées dans la 1er colonne et pour le deuxième outillage c’est la colonne 2. Ensuite on vous allez dans « Graph » « Probability plot ». Vous choisissez « Multiple ». Dans « Graph variables » vous sélectionnez « Outillage STD » et « Outillage Nouveau » et vous validez par « OK ».

Comment lire un probability plot

Le graphique apparait. Comment on lit ce graphique ? L’axe horizontal représente le diamètre de chaque pièce et l’axe verticale la probabilité cumulé en pourcentage. On voit ici qu’il y a 2 séries de données, l’outillage standard est en bleu et le nouvel outillage en rouge. Prenons un exemple pour que ce soit plus concret. Avec l’outillage standard, il y a 50 % des données qui sont inférieures à 10mm. Ou encore, avec le nouvel outillage : Combien il y a de chance d’avoir une valeur inférieur à 10.5mm…80% de chance.

Explication probability plot

On peut aussi faire des intervalles. Par exemple, combien de valeurs sont entre 10.5 et 10 mm avec le nouvel outillage ? On regarde les points rouges, on relève le pourcentage pour 10.5mm donc ici 80% et pour 10mm, 40% donc 80-40 = 40%. Il y a 40% des données qui sont entre 10 et 10.5mm.

Minitab probability plot

Voilà ça c’était la partie pour savoir lire un probability plot. Maintenant comment savoir si les données sont normales ? La première méthode c’est de regarder le p-value. Mais qu’est-ce que le P-value ? le p-value, c’est la probabilité que 2 échantillons soient identiques. En fait, on appelle ça faire un test d’hypothèse, on compare les données à une courbe de Gauss et si le P value est supérieur à 0,05 alors les données sont identiques à une distribution Normale. Je reviendrai sur les tests d’hypothèse dans une autre vidéo, mais retenez que si le p-value est supérieur à 0,05 alors les données sont Normales.

Définition P value

La deuxième méthode pour savoir si les données suivent une courbe de Gauss, c’est de regarder le graphique en lui-même. Si la distribution est normales, les points doivent former une ligne droite et rester dans l’intervalle de confidence formé par les lignes en pointillées. On voir que pour le nouvel outillage, on a pas une droite mais plutôt une sorte de S, ce qui se confirme avec le p value qui est inférieur à 0,05. Les données ne suivent pas une loi normale. Pour l’outillage standard, même s’il y a quelques points en dehors de l’intervalle de confidence, comme ici et là, on a bien une droite et le p value est supérieur à 0,05 donc les données sont normales.

Les outils pour réaliser des essais de production

Voilà le probability plot c’est deuxième outil dont je voulais vous parler. Ce qu’il faut retenir c’est qu’avant chaque étude statistique, il faut analyser la normalité des données. C’est la première étape avant de faire une ANOVA et une étude de capabilité que nous verrons dans la prochaine vidéo. Si vous faites une capabilité avec des données non-normales, vos résultats seront faux parce que tous les calculs sont extrapolés à partir d’une courbe de Gauss, que vos données ne suivent pas. Donc je le répète une dernière fois, toujours contrôler la normalité des données avant de faire une étude statistique. Pour ça vous pouvez utiliser le probability plot que l’on vient de voir. Si le p value est supérieur à 0,05 alors la distribution est normale.

Étude de capabilité

Dans la prochaine vidéo, on parlera du test, de comparaison de moyenne qu’on appelle ANOVA et qui permet de dire si 2 populations sont différentes. Est-ce que les arbres usinés avec l’outillage standard sont différents de ceux usinés avec le nouvel outillage. N’hésitez pas à partager votre expérience des essais, dans les commentaires. D’ailleurs contrôlez-vous systématiquement la normalité des données avant une analyse ?

Formation Six Sigma gratuite

En attendant la suite, vous êtes libre de recevoir gratuitement une heure de formation pour bien démarrer en Six Sigma, pour ça cliquez sur le lien qui apparait sur cette vidéo. Vous laissez votre email, et je vous l’envoie immédiatement. Et puis comme d’habitude j’ai besoin de votre feedback, si vous avez aimez cette vidéo cliquez sur j’aime juste en dessous et puis partagez là. A bientôt sur UpTraining.fr

Pour aller plus loin, je vous offre le 1er module de ma formation Green Belt Lean Six Sigma !

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.