Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
STMicroelectronics :
Moteur de règles et Machine Learning
pour la détection des failles d’exécution
dans une ligne de production industrielle complexe
Thomas BailetCTO
Guillaume Lepelletier Senior Technical Staff
Engineer
Hugues DuverneuilIT Section Manager
Automation, AMHS, APC & EDA
Le site de Crolles 2
• 60 000m² de bâtiments sur 44ha
• 20 000m² de salles blanches
• 4 000 salariés
• Production : 24h/24, 7j/7Crolles
300 mm
Crolles
200 mm
Sep 2017
Crolles 300 :
• 800 équipements organisés en ateliers
• Une usine « Full Auto »
• 100% des transports,
• 80% des planifications,
• Contrôle avancé des procédés
• Encours de production : 50 000 pièces
L’automatisation
levier de productivité
3
Tools
automatio
n Manufacturing
Execution System
Fault
Detection and
Control
Automatic
Material Handling
SystemCentralized
data storage
Advanced Process
Control
Une fabrication complexe
Un large portefeuille
• Plusieurs centaines de produits
• Plusieurs générations technologiques
• R&D en parallèle de la production
Des processus ultra sophistiqués
• Nanotechnologie
• Entre 600 et 1200 étapes par produit
• Système informatique complexe
Des investissements énormes
Et une compétition féroce !
Un outil de production complexe
• Parc machine hétérogène
• Outil de production flexible
• Transport automatisé
• Variété des compétences techniques
Les challenges industrielsEvolution du rôle de l’humain dans un système automatisé
4
Opérateur
Conducteur de machines
Alimente les machines et gère
les encours
Présence physique
dans les ateliers de production
Utilise ses 5 sens pour
analyser en continu la
situation.
Technicien
Expert domaine technique
Maintenance
Diagnostic Process
Résolution des problèmes
et des situations de blocage
Travail sur PC,
personnel statique
Patrouilles en salle,
Détection temps réel sur le terrain
et diagnostic quasi instantané
50 000 pièces
95% events OK
Ce qui était évident
Détection des blocages transitoires, des
comportements anormaux
Devient compliqué
Comment alors garantir la productivité
de l’unité de fabrication 7j/7 - 365j/an ?
Fab SupervisionHistoriquement
5
Avec la Fab SupervisionSurveillance par les opérateurs
• Très pertinente grâce à l’expérience
et l’expertise humaines
• Prise en compte du contexte
et des priorités du moment
• Parfois extrêmement efficace
Mais
• Un taux de détection faible et des ratés
flagrants
• Difficultés à remonter à l’origine du blocage
• Temps de formation opérateur très long
Détection automatisée …
• exhaustive, systématique
• capitalisant sur l’expérience humaine
• s’adaptant aux évolutions permanentes
du système et du contexte industriel
… assistant les techniciens
• Identification des causes potentielles des blocages
• diagnostic « boite blanche »
pouvant être complété par l’intervenant humain
Approche hybride - Système expert + IA
Fab Supervision Machine learning
Système expert
8
Architecture Big Data
SMACK-LD
Approche pure Machine Learning
envisagée dans un premier temps, mais :
• Difficulté à capter la complexité des
processus,
• Difficulté à généraliser (overfitting, etc.)
Approche « boite blanche »
permettant de capter l’expertise de
l’intervenant humain
- Expert au centre de l’approche
- Evite le rejet de la technologie
Système de détection des anomalies
• Système Expert
• Basé sur un méta langage arborescent
• Outil de communication avec les techniciens
• Modèle pour le moteur
9
• Apprentissage supervisé
• Détermination des seuils temporels à
partir des données historiques
• Pondération/modification de l’arbre
grâce aux retours des techniciens
• Faux positifs
• Faux négatifs
• Causes non diagnostiquées
L’anomalie = la perte de
productivité
Le contexte = la définition du
périmètre
Les conditions = quand est-ce
qu’il y a perte de productivité
Les causes = le diagnostique
des origines de la perte de
productivité
Implémentation 10
9Architecture retenue : SMACK-LD
− Architecture légère (No Hadoop)
− Scalable & évolutive
− Basée sur des standards et des
technos matures
− Mixer des traitements temps réel
(acquisition) et batch (IA)
10Data Engineering avec LogIsland
Acquisition et traitement temps réel des données
• Utilise Kafka Connect, Kafka, Spark et Mesos
• Standardisé
− Besoin de component-iser les traitements
− Service d’accès à des data sources (Oracle, Tibco, Cassandra)
− Opérations simples (regexp, add/del), plus complexes (XPath, MVEL)
• Distribué
− Traitement distribué par config ou développement de processeurs customs
• Scalable, performant, robuste
− Engine générique
− Utilise actuellement Spark Streaming (temps réel fenêtré)
− Complex event-processing
Challenges relevés et à venir
• Durant l’industrialisation
• Complexité de l’environnement métier ST
• Data Modelling Cassandra contraignant mais grosses performances à l'ingestion en "bulkload"
• Durant l’implémentation du Machine Learning
• Capacité à capter des retours utilisateurs pertinents :
les fausses anomalies reposent en partie sur la perception humaine
• Garder la lisibilité humaine sur l’analyse faite par le moteur
• Inhérents à l’approche : équilibre à trouver entre
• faux positif : Perte de temps opérateur, Perte de confiance dans l’outil
• faux négatif : Perte de productivité de l’usine, Mise au rebut de production
• Prochaines étapes
• Réduction du taux de faux positifs
• Elargissement du périmètre des anomalies (extension aux métiers engineering)
11
Merci de votre attention