View
231
Download
1
Category
Preview:
Citation preview
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE
MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE ABOU BEKR BELKA ΪD DE TLEMCEN
FACULTE DES SCIENCES DEPARTEMENT DE PHYSIQUE
DIVISION ETUDE ET PREDICTION DES MATERIAUX UNITE DE RECHERCHE MATERIAUX ET ENERGIES
RENOUVELABLES (URMER)
THÈSE
Pour obtenir le grade de
Docteur en physique Spécialité : Physique et chimie de la matière condensée
Présentée par :
M elle. Nadéra Settouti
Sur le Thème
Le réductionnisme en chimie quantique et les grandes contradictions du tableau périodique avec la mécanique
quantique et le rôle du data mining
Soutenue le : / / 2015 devant le jury composé de:
Président Pr. Ghouti MERAD (Univ. Tlemcen)
Directeur de Thèse Pr. Hafid AOURAG (Univ. Tlemcen)
Examinateur Pr. Houda Imane FARAOUN (Univ. Tlemcen)
Examinateur Pr. Tahar SAHRAOUI (Univ. Blida)
Examinateur Pr. Mohammed HADJI (Univ. Blida)
Examinateur Pr. Lahcene Larabi (Univ. Tlemcen)
Remerciements
En tout premier lieu, je remercie ALLAH le Tout-puissant de m’avoir donné la santé et tout dont je nécessitais pour l’accomplissement de cette thèse, et de m’avoir aidé à dépasser toutes les difficultés. Je tiens à remercier mon directeur de thèse, Monsieur le Professeur Hafid AOURAG Professeur à l’université de Tlemcen et directeur général de la recherche scientifique et du développement technologique pour m’avoir donné l’opportunité de travailler dans son équipe en me proposant le sujet, ainsi pour ses conseils qui m’ont été d’une grande utilité et clairvoyance dans la rédaction de cette thèse. En plus ce travail m’a permis de prendre contact avec le monde de la recherche, qui a été pour moi extrêmement enrichissant sur bien des plans. Je remercie aussi Mr le Professeur Ghouti MERAD professeur à l’université de Tlemcen et Directeur du Laboratoire d’Etude et Prédiction des matériaux, de m’avoir accepté au sein de son laboratoire, qui nous a initiés à la recherche, on a bénéficié de son savoir et de son savoir-faire au cours de nombreuses années, et qui m’a fait l’honneur de présider ce jury. Mes remerciements les plus sincères vont à l’ensemble des membres du jury ; tout d’abord à Melle Houda Imane FARAOUN Professeur à l’Université de Tlemcen, Mr Tahar SAHRAOUI Professeur à l’Université de Blida, et à Mr Mohammed HADJI Professeur à l’Université de Blida, et à Mr Lahcene Larabi Professeur à l’Université de Tlemcen d’avoir accepté d’examiner ce travail et de faire partie de ce jury. J’adresse aussi mes remerciements à tous mes collègues de l’URMER. Mes plus grand remerciements vont naturellement aussi à mes très chers parents, mes chers frères et sœurs, qui m’ont toujours encouragé et soutenu en toutes circonstances.
A mon père et ma mère
la lumière de ma vie
qui m’ont appris dès mon très jeune âge
la foi et le respect de la science
A mes sœurs et mes frères qui m’ont
toujours encouragé et soutenu
A mes très chers neveux et nièces
Je dédie ce modeste travail
« La connaissance pratique, c’est d’acquérir un contenu de pensée relative
à l’agir. » (Avicenne, Ibn Sina)
« Une théorie qui ne serait pas réfutable n’appartient pas au domaine
scientifique » Karl Popper
« Ce qu’il faut, c’est voir. Et voir c’est chercher à voir, derrière toutes les
images, toutes les représentations, derrière toutes les visions, ce qui ne se
laisse pas voir, mais qui se laisse chercher. » (Philippe Quéau)
« Aucune loi de la nature n’a d’importance scientifique, à moins qu’elle ne
soulève des questions auxquelles l’expérience puisse répondre ».
Dimitri I. Mendeleiev
« Personne ne croit une nouvelle théorie sauf le théoricien qui l'a
développée. Tout le monde croit des résultats expérimentaux sauf
l'expérimentateur qui les a obtenus. »
J.C.H Spence (1992)
Table des matières
Introduction générale
01
Chapitre I : Le réductionnisme en chimie quantique
I.1. Introduction …………………………………………………………………………. 05
I.2. Définition du réductionnisme……...………………………………………………… 05
I.3. Les différentes formes de réductionnisme………..……………………..................... 05
I.4. Réductionnisme et complexité ………………..…………………………………….. 06
I.5. Aspects du réductionnisme ……….………………………………….……………… 07
I.6. Le réductionnisme, une démarche incontournable………...………………………… 07
I.7. L’idée de réductionnisme……………………………... ……………………………. 08
I.8. Les types de réduction…………. …………………......…………………………….. 09
I.8.1.Réduction verticale……………………………………………………………... 09
I.8.2.Réduction horizontale………………...………………………………………... 10
I. 9. Comparaison entre la physique et la chimie………………………………………… 10
I. 10. Le monde quantique…...………………………………………………………….. 11
I.10.1. La réduction de la chimie à la mécanique quantique…………………………. 12
I.10.2. Le tableau périodique et le réductionnisme en chimie quantique…………..... 14
I. 11. Conclusion…………………………………………………………………………. 15
I. 12. Références...........................……………………………………………………..... 18
Chapitre II: Le Tableau périodique
II. 1. Introduction………………………………………………………………………... 20
II. 2. Historique ………………………………………………………………………..... 20
II.2.1. Lothar Meyer ou Dimitri Mendeleïev…………………………….................. 20
II.2.2. Le tableau périodique des éléments………………………………………...... 21
II.2.3. Qantification de l’énergie............................................................................... 23
II.2.4. Niveaux énergétiques des orbitales atomiques................................................ 24
II.2.5. La configuration électronique d’un atome………………………………........ 24
II.2.5.1. Principe d’exlusion de Pauli............................................................... 25
II.2.5.2. La règle de Klechkowski........................................................................ 25
II.2.5.3. Règle de Hund................................................................................... 26
II. 3. Principe de la classification moderne............………………………….................... 26
II.3.1. La loi de la périodicité des propriétés.………………................................... 27
II.3.2. La loi périodique.............................................................................................. 28
II.3.3. La compréhension du système périodique....................................................... 28
II.4. Analyse du tableau périodique……………………………………………………… 29
II.4.1. Les anomalies du tableau périodique............................................................ 29
II. 4.2. Propriétés physiques et chimiques des éléments......................................... 30
II.4.2.1. L'électronégativité............................................................................. 30
II.4.2.2. Le rayon atomique ………………………………............................. 30
II.4.2.3. L’énergie (ou potentiel) d'ionisation ……………............................. 31
II.4.2.4. L’affinité électronique......................................... ................................ 31
II.5. Conclusion................................................……….………………………………….. 32
II.6. Références .........................………………………………………………………... 33
Chapitre III: Le data mining et ses techniques d’analyse de données
III.1. Introduction………………………………………………………………………. 34
III.2. Différentes définitions du Data Mining..........………………………………....... 34
III.3. Historique................................................................................................................ 34
III.4. La démarche du Data Mining……………………………………………............. 35
III.4.1. Valorisation des données……………………………………………......... 36
III.4.2. Définition d’un modèle ………………………………………................. 36
III.4.3. Les modèles prédictifs …………………………………………................. 37
III.4.4. La segmentation......................................................................................... 37
III.4.5. La description (ou identification de modèles fréquents)….....….................. 38
III.4.6. Les deux types de techniques du Data Mining………………………......... 38
III.4.6.1. Les techniques descriptives…………………………………......... 38
III.4.6.2. Les techniques prédictives…………………………….……......... 38
III.4.6.3. Comparaison entre le Data Mining et la statistique………............. 38
III.4.6.4 Que peut-on trouver et prouver réellement avec le Data Mining ?… 39
III.4.6.5 Conclusions ............................………………………………........ 39
III.5. L’Analyse en Composantes Principales…………………………………………. 40
III.5.1. Introduction…….……………………………………................................ 40
III.5.2. Historique…………………………………………………………............... 40
III.5.3. L’analyse de données……………………………………………….............. 40
III.5.4. La nature des données………………………………………………............. 41
III.5.4.1. Définition des variables………………………………….............. 41
III.5.4.2. Définition des individus…………………………………………... 41
III.5.4.3. Le centrage et la réduction des données brutes……....................... 41
III. 5.4.3.1. Les paramètres de dispersion……………………….......... 42
III. 5.4.3.2. Caractéristique de la tendance centrale.………………….. 42
III. 5.4.3.3. Caractéristique de la dispersion……………...................... 42
III. 5.4.3.4. La variance…………….................................................... 42
III. 5.4.3.5. L’écart type ………………………................................... 43
III. 5.5. Qu'est-ce qu'une base de données ?………………………………........... 43
III. 5.6. Principe de l'Analyse en Composantes Principales (ACP)………............ 43
III. 5.7. Le processus de l'Analyse en Composantes Principales…........................... 44
III. 5.7.1. Construction des axes principaux, démarche géométrique.... 45
III. 5.7.2. Calcul matriciel……………………………………………... 46
III. 5.8. Conclusion…………………………………………………….... 47
III. 6. La méthode des moindres carrés partiels (PLS)…………………………………. 48
III.6.1. Introduction-Problématique ……………………………………………... 48
III.6.2. Historique …………………………………………………………........... 48
III.6.3. Définition de la régression PLS ?.................................................................. 49
III.6.4. Les objectifs de la régression PLS……………………………………...... 49
III.6.5. Les versions de la régression PLS............................................................ 49
III.7. Le principe de la régression PLS……………………........................................... 50
III.7.1. Données et notations………………………………………………………. 50
III.7.2. La méthode PLS …………………………………………………………… 50
III.7.3.Indépendance des composantes dans la régression PLS………………...... 51
III.8. Les avantages de la régression PLS……………………………………………….. 52
III.9. Conclusion ………………………………………………………………………... 53
III.10. Références ……………………………………………........................................... 54
Chapitre IV: Résultats et discussions
IV.1. Une étude comparative des propriétés physiques et mécaniques du lutétium avec
celles des métaux de transition par l'approche du datamining…………................
57
IV.1.1. Introduction.................................................................................................. 57
IV.1.2. La base de données……………………………………………................... 59
IV.1.3. Techniques de calculs………………………………………………...........
IV.1.4. L’analyse en composantes principales (ACP) ………………….................
60
60
IV.1.5. La régression par les Moindres Carrés Partiels (PLS)……........................... 66
IV.1.6. Conclusion…………………………………………………....................... 68
IV.1.7. Références................................................................................................ 69
IV.2.Une étude comparative des propriétés physiques et mécaniques de l’hydrogène en
appliquant les techniques de recherche du data mining..…....................................
71
IV.2.1. Introduction…………………………………………………………….... 71
IV.2.2. Les bases de données ……………………………………………………. 72
IV.2.2.1 La bases de données des métaux alcalins y compris l’hydrogène 72
IV.2.2.2. L’analyse en composantes principales (ACP)........................... 73
IV.2.2.3 La bases de données du groupe de carbone y compris
l’hydrogène.……………..…………….....................................
75
IV.2.2.4. L’analyse en composantes principales (ACP) ….................... 75
IV.2.2.5. La bases de données des halogènes y compris l’hydrogène….... 78
IV.2.2.6. L’analyse en composantes principales (ACP) …...................... 78
IV.2.3. La régression par les Moindres Carrés Partiels (PLS)................................. 81
IV.2.4. Conclusion ……………………………………………………….……..... 85
IV.2.5. Références ............................................................………………..…….. ... 86
IV.3. Investigation des propriétés structurales et mécaniques des hydrures alcalins par
les calculs ab initio et l'approche du datamining......................................................
104
IV.3.1. Introduction.................................................................................................... 104
IV.3.2. Base de données ........................................................................................... 105
IV.3.3. L’analyse en composantes principales (ACP)............................................... 107
IV.3.3.1. Les propriétés structurales ......................................................... 107
IV.3.3.2. Les propriétés mécaniques........................................................ 107
IV.3.4. Analyse par l’approche data mining…………………………………. 108
IV.3.5. Conclusion………………………………………………………………... 112
IV.3.6. Références………………………………………………………………… 113
Conclusion générale……………………………………………………………….. 112
Table des figures
Figures Titres Pages
Figure II.1 La première forme du système périodique de Mendeleev
datant du 17 février 1869, intitulée « une tentative au
système d’éléments, se basant sur leur masse ».
22
Figure II.2 Dimitri Ivanovitch Mendeleev 22
Figure II.3 Hiérarchie des niveaux énergétiques des orbitales
atomiques (visualisée par la règle de Klechkowski).
26
Figure III.1 Technologies et modèle général du data mining. 37
Figure III.2 Illustration en 2D de la réduction de la dimension. La
première composante contient le maximum
d’information (maximum de variance).
44
Figure III.3 Représentation en 2D des 2 vecteurs propres et des 2
valeurs propres associés aux deux nouvelles
composantes.
45
Figure III.4 Projection des individus dans le plan principal. 46
Figure IV.1.1 Le graphe des observations des métaux de transition de
la troisième période y compris le lutétium.
61
Figure IV.1.2 Le graphe des variables des métaux de transition de la
troisième période y compris le lutétium.
64
Figure IV.1.3 Le graphe des observations (t1, t2) des métaux de
transition de la troisième période y compris le lutétium.
65
Figure IV.2.1 Le graphe des observations des métaux alcalins y
compris l’hydrogène.
71
Figure IV.2.2 Le graphe des variables des métaux alcalins y compris
l’hydrogène.
72
Figure IV.2.3 Le graphe des observations du groupe du carbone y
compris l’hydrogène.
75
Figure IV.2.4 Le graphe des variables du groupe du carbone y compris
l’hydrogène.
75
Figure IV.2.5 Le graphe des observations du groupe des halogènes y
compris l’hydrogène.
76
Figure IV.2.6 Le graphe des variables du groupe des halogènes y
compris l’hydrogène.
77
Figure IV.2.7 Le cercle de corrélation entre les propriétés mécaniques,
et les propriétés physiques dans les deux composantes
PLS (t1, t2) (la base de données des métaux alcalins).
81
Figure IV.2.8 Le cercle de corrélation entre les propriétés mécaniques,
et les propriétés physiques dans les deux composantes
PLS (t1, t2) (la base de données du groupe de carbone).
81
Figure IV.2.9 Le cercle de corrélation entre les propriétés mécaniques,
et les propriétés physiques dans les deux composantes
PLS (t1, t2) (la base de données des halogènes).
82
Figure IV.3.1 Structure cristalline de la structure NaCl (B1) des
hydrures alcalins MH dans les conditions ambiantes. Les
cercles bleus représentent M = Li, Na, K, Rb, Cs, et les
cercles violets représentent les atomes d'hydrogène.
102
Figure IV.3.2 Le graphe des observations des hydrures alcalins. 108
Figure IV.3.3 Le graphe des variables des hydrures alcalins. 108
Figure IV.3. 4 Le graphe de «Biplot » représentant les hydrures alcalins
et les propriétés.
109
Liste des tableaux
Tableaux Titres Pages
Tableau II.1 Désignation des valeurs du nombre quantique azimutal, l. 24
Tableau II.2 Niveaux énergétiques des orbitales atomiques. 24
Tableau IV.1.1 La base de données incluant les propriétés physiques et
mécaniques des métaux de transition de la troisième
période y compris le lutétium.
58
Tableau IV.1.2 La matrice de corrélation des métaux de transition de la
troisième période y compris le lutétium.
60
Tableau IV.1.3 Les propriétés physiques du groupe 3 (IIIB), y compris le
lutécium. Les quantités indiquées dans le tableau sont les
suivantes: l'électronégativité (χ), le rayon atomique (r), 1er
potentiel d’ionisation (eV), 2ème potentiel d’ionisation
(eV), le point de fusion (° C).
63
Tableau IV.2.1 La base de données incluant les propriétés physiques et
mécaniques des métaux alcalins y compris l’hydrogène.
70
Tableau IV.2.2 La base de données incluant les propriétés physiques et
mécaniques du groupe de carbone y compris l’hydrogène.
73
Tableau IV.2.3 La base de données incluant les propriétés physiques et
mécaniques des halogènes y compris l’hydrogène.
76
Tableau IV.3.1 Les valeurs calculées de paramètre de maille a0 (Ǻ), le
module de compressibilité (B0) (GPa) et la dérivé
première de la pression (B’0) des hydrures alcalins dans la
structure NaCl (B1), avec quelques autres résultats.
103
Tableau IV.3.2 Les Constantes mécaniques et élastiques des hydrures
alcalins dans la structure NaCl (B1), avec quelques autres
résultats, le module de compressibilité (B0), module de
cisaillement (G), constantes élastiques (Cij)), le module
d'Young (E) sont en (GPa). Le rapport B/G, le facteur
d'anisotropie (A) et le coefficient de Poisson (ν) sont des
paramètres sans dimension.
104
INTRODUCTION GENERALE
INTRODUCTION GENERALE
Introduction générale
1
Introduction générale
La découverte de la structure de l’atome au début du vingtième siècle a marqué une
grande étape dans l’avancée des connaissances. De nombreux phénomènes physiques et
chimiques demeuraient sans interprétation tels que l’effet Compton, l’effet Zeeman,…etc. Ce
qui a conduit les physiciens et chimistes à abandonner le modèle classique de la mécanique
newtonienne et à introduire un nouveau modèle qui est la mécanique quantique, ce qui a
permis une interprétation nouvelle de la classification périodique [1].
La mécanique quantique a été la théorie la plus spectaculaire réussi dans l'histoire de la
science. L'impact de la théorie a été ressenti dans des domaines tels que la physique du solide,
et la science des matériaux [2].
L’évolution de l’histoire de la chimie au XIXe siècle nous montre à quel point une
classification devenait nécessaire. La classification telle que Mendeleiev l’a publiée en 1869
puis en 1871 a stimulé la recherche en chimie et de nombreuses questions fondamentales se
sont appuyées sur cette formidable base théorique que renferme ce tableau. C’est actuellement
un point de repère universel pour la communauté des chimistes [3].
Le tableau périodique reste, après plus d’un siècle, le plus important moyen de
comparaison entre les éléments chimiques. Il nous permet d'étudier rationnellement la grande
variété des substances que nous trouvons dans la nature [4].
La matière condensée est formée par l'agrégation d'atomes, et les propriétés de
l'agrégat dépendent de la structure électronique des atomes qui le constituent. Elle est donc
d’une grande importance, ce qui est essentiel pour la classification des propriétés physiques
des éléments solides comme il l’est pour ses atomes constitutifs [5].
La classification périodique des éléments exprime une profonde vérité physique et
permet d'unifier un grand nombre de connaissances portant sur la matière. Ce classement
facilite la compréhension des groupes d'éléments en montrant la relation entre leurs propriétés
chimiques et leur structure atomique. De plus, la connaissance du tableau périodique permet
de prévoir les formules des composés et les types de liaisons unissant les composants d'une
molécule [4]. Les éléments dans le tableau périodique sont rangés par ordre croissant du
Introduction générale
2
numéro atomique Z, selon la configuration électronique des atomes [6], en respectant la règle
de Klechkowski dans le remplissage des orbitales par énergie croissante.
Le tableau périodique est pour nous, de toute évidence, le guide le plus sûr dans
l’étude de la chimie. Mais il comporte certaines anomalies ou contradictions, qui sont les
éléments qui ne respectent pas la règle de Klechkowski, et qui présentent des configurations
électroniques faisant exception à la norme, tels que :
- L’hydrogène qui ne s’ajuste harmonieusement à aucun groupe, c’est un non-métal est
il est placé généralement dans la même colonne que le lithium qui est un métal très
réactif. L’hydrogène est parfois placé en tête du groupe 7, avec les halogènes. Dans
certains tableaux périodiques, il est même placé dans les deux groupes à la fois [7].
- L’Hélium se trouve dans le bloc p alors qu’il est de type s.
- Le lutécium et le lawrencium sont placés dans le bloc f, alors que leur couche f est
déjà saturée, ils contiennent 1 électron 5d ou 6d. Ils constituent bien le début des
éléments de transition.
Les tableaux périodiques habituels de Mendeleïev des éléments chimiques sont déjà à
97% en accord avec la mécanique quantique. Trois éléments seulement qui ne le sont pas, et
sont en désaccord avec le principe d'exclusion de Pauli. Afin d'assurer la cohérence, il est
proposé de placer l'hélium à côté de l’hydrogène dans le bloc s. Le lutécium et le lawrencium
dans le bloc d des métaux de transition, pour que le tableau périodique soit conforme à 100%
avec la mécanique quantique [8].
Dans cette thèse on a étudié les contradictions existantes dans le tableau périodique, et
on les a confronté moyennant l’approche data mining et ses techniques, telles que l'analyse en
composantes principales (ACP) et la régression (PLS), qui sont employées pour la première
fois pour l’étude de ce problème, et ce qui fait l’originalité de ce travail.
Cette thèse est organisée comme suit:
- Le premier chapitre est consacré à la présentation générale du réductionnisme en chimie
quantique, ses différentes formes, ses aspects, les types de réduction, la comparaison entre la
Introduction générale
3
physique et la chimie, la réduction de la chimie à la mécanique quantique, et le lien existant
entre le tableau périodique et le réductionnisme en chimie quantique.
- Le deuxième chapitre est consacré à l’étude du tableau périodique, son historique, la loi de
la périodicité des propriétés, son évolution, et ses anomalies.
- Le troisième chapitre est consacré à la définition du datamining et ses différentes techniques,
l’analyse en composantes principales (ACP) et la régression PLS (la régression par les
moindres carrés partiels), le principe de ces méthodes, et leurs objectifs.
- Le quatrième chapitre présente les résultats liés à l’application de l’approche datamining, et
ses techniques telles que : l’analyse en composantes principales (ACP) et la régression (PLS),
qui ont été appliquées sur les différentes bases de données contenant les différentes familles
du tableau périodique qui présentent des contradictions avec la mécanique quantique.
À la fin de cette thèse, une conclusion générale fait un récapitulatif de l’essentiel des
principaux résultats obtenus tout en dégageant des perspectives pour la poursuite de cette
investigation.
Introduction générale
4
Références
[1] André Durupthy, Jacques Estienne, Magali Giacino, Alain Jaubert, Claude Mesnil,
« Physique, Chimie et sciences de l’ingénieur » (PCSI), I.S.B.N. 978-2-0118-1752-5.
www.hachette-education.com.
[2] Eric R. Scerri, « Collected papers on philosophy of chemistry », Imperial College Press,
(2008). ISBN-13 978- 1-84816- 137-5.
[3] Jean-François Le Maréchal, « La classification périodique des éléments chimiques »,
Université Lyon 2 - UMR GRIC équipe COAST (1999).
[4] Le repaire des sciences, http://www.lerepairedessciences.fr
[5] H.P. Myers, « Introductory Solid State Physics », 2nd ed, Taylor & Francis e-Library,
(2009), ISBN 0-203-21255-X.
[6] http://www.web-sciences.com.
[7] Carole McQuarrie,Donald A. McQuarrie,Peter A. Rock, « Chimie générale », Editions
De Boeck Université 1st ed., (1992).
[8] Bernard SCHAEFFER, Periodic table quantum mechanics consistent,
https://www.scribd.com/doc/5994795/Periodic-table-quantum-mechanics-consistent.
CHAPITRE I
Le réductionnisme en chimie quantique
Chapitre I. Le réductionnisme en chimie quantique
5
I.1. Introduction
Bien qu'il soit évident que les tentatives pour expliquer la chimie en termes de
la théorie quantique ne peuvent apparaître suite au développement de la mécanique quantique
au XXe siècle, ce type de réductionnisme ne date pas d'aujourd'hui.
En général, le réductionnisme est l'idée qu’une science, telle que la chimie, peut être réduite
plus à une science "fondamentale", dans ce cas, à la physique.
Comme nous le verrons dans ce qui suit, la conception même du réductionnisme supposant
une hiérarchie dans les sciences entre les sciences plus fondamentales, généralement la
physique et les mathématiques, et ceux qui sont considérées comme des dérivés ou des
épiphénomènes, à commencer par la chimie, et passant par la biologie aux sciences humaines
comme la sociologie ou la psychologie [1].
I. 2. Définition du réductionnisme
Le réductionnisme consiste à rendre compte de la grande variété des phénomènes naturels
par un petit nombre d'entités « élémentaires » et de lois « fondamentales ». Son but, selon le
physicien français Jean Perrin, est d'« expliquer le visible compliqué par de l'invisible
simple», faisant de la simplicité une marque de vérité [2].
Réduire, dans un sens général, c’est rapetisser ; pour les sciences, on comprend le plus
souvent que réduire, c’est rendre compte d’une réalité dans les termes des propriétés des
éléments qui la constituent [3].
I. 3. Les différentes formes de réductionnisme
Le réductionnisme est un des thèmes les plus importants de l’épistémologie. Il existe
plusieurs formes de réductionnisme :
- La première, dite ontologique, consiste simplement à admettre que les lois d’une discipline
s'appliquent à une autre. (Dans le cadre qui nous intéresse ici, cela veut dire admettre que
toutes les lois de la physique, et elles seules, sont valables dans les systèmes chimiques et
dans l'ensemble de la chimie.)
- Le deuxième un niveau de réduction méthodologique, qui consiste à admettre que l'on peut
tout déduire dans une discipline à partir d'une autre. (Ici cela voudrait dire que l'on peut
Chapitre I. Le réductionnisme en chimie quantique
6
analyser et comprendre le comportement d'un système chimique à partir des seules lois de la
physique.)
- Il y a enfin un réductionnisme épistémologique (qui consisterait à admettre que la chimie
n'est qu'une branche de la physique). Il n'est jamais simple de mettre tout le monde d'accord
sur les réductions existantes entre deux champs disciplinaires. On peut cependant reconnaître
que la chimie est réductible à la physique du point de vue ontologique et méthodologique,
mais pas du point de vue épistémologique. La chimie n'est certainement pas une branche de la
physique, mais la mécanique quantique, et elle seule, permet de calculer avec une grande
précision les liaisons chimiques [4].
I. 4. Réductionnisme et complexité
L'essence des débats sur le réductionnisme est la question suivante: la connaissance d'un
objet complexe se réduit-elle à la seule connaissance de ses composants? Cette conception de
la réduction du complexe au simple a déjà été réfutée par Aristote (dans la métaphysique), qui
remarquait que la syllabe BA n'était pas identique à B et A, mais avait un contenu informatif
qui allait au-delà de celui des deux lettres qui la composent. Elle est autre chose. Il y a
émergence d’une propriété nouvelle. La définition de ce que sont des objets ou des systèmes
complexes demande à être précisée. Pour Gallacher et Apenzeller, dans leur introduction au
dossier déjà mentionné de Science (1999): «Un système complexe est celui dont les propriétés
ne sont pas complètement expliquées par la connaissance et la compréhension de ses
composants.» Cette définition identifie les objets complexes et les objets pour lesquels il est
nécessaire d'aller au-delà d'une analyse purement réductionniste pour les comprendre. Selon
cette définition, une syllabe ou un mot sont déjà des objets complexes.
Une autre définition empirique d'un système complexe est celle, d'un système dont les
composants sont nombreux et en interaction. D’autres définitions sont données dans un
dossier («Complex systems», Nature 410, 2001, p. 241-284.) consacré aux systèmes
complexes, principalement physiques, paru dans Nature, comme par exemple celle d’un
système opérant à la limite du chaos. On trouve de nombreux exemples de complexité dans un
livre récent, totalement consacré à ce thème (Réda Benkirane, 2002). En fait, il semble que
l’on parle de choses assez différentes quand un physicien, un informaticien ou un biologiste
utilisent le terme de complexité. Ce qui est commun est sans doute ce que Chaitin, dans cet
ouvrage, appelle complexité algorithmique, qui est essentiellement la quantité d’informations
Chapitre I. Le réductionnisme en chimie quantique
7
(les composants mais aussi toutes les interactions pouvant exister entre eux) nécessaires pour
décrire le système.
L’un des objectifs de la science est d’essayer de surmonter les problèmes posés par cette
complexité. En physique, dans le cas du problème à N corps, la théorie du chaos permet de
surmonter la complexité.
La complexité est, comme dit plus haut, une notion très ancienne; mais elle a connu
récemment un développement important dont témoigne la publication, en décembre 2003,
dans la revue Pour la science, d’un numéro spécial qui lui est totalement consacré sous le titre
«La complexité: la science du XXIe siècle». Ce concept a des applications dans tous les
domaines, y compris les sciences humaines [4].
I. 5. Aspects du réductionnisme
La question du réductionnisme s’est posée à tous les niveaux de la classification des
sciences: peut-on réduire les mathématiques à la logique, la chimie à la physique, les sciences
de la vie à la physico-chimie, la psychologie et la sociologie à la biologie? Historiquement,
elle a acquis son vocabulaire propre («réduire», «ramener», tant en langue française
qu’allemande) au milieu du XIXe siècle.
Quelles sont les raisons de la persistance, aujourd’hui, de la querelle du réductionnisme,
entamée il y a au moins un siècle et demi? Cette querelle assurément n’est pas vide de tout
contenu, car elle possède des motivations clairement identifiées. Il est pourtant difficile d’en
déceler le fondement réel, et plus difficile encore d’en démontrer l’utilité [4].
I.6. Le réductionnisme, une démarche incontournable
La physique corpusculaire, et la mécanique quantique ont conduit à diversifier les
concepts et les critères mêmes de la réalité, eu égard notamment à la « non-séparabilité »
absolue entre l’espace et le temps, entre la matière et l’énergie…
Il n’empêche, toute description de la réalité semble rester fidèle à un principe hiérarchique
visant à définir des niveaux supérieurs à partir de niveaux plus fondamentaux. Ainsi, et pour
rester dans le domaine de la physique, « toute la réalité matérielle est censée s’expliquer au
niveau fondamental par des quarks, des leptons (électrons, muons et tauons) et quatre
interactions fondamentales qui rendent compte des forces exercées entre les particules de la
Chapitre I. Le réductionnisme en chimie quantique
8
matière ». Il en va de même pour la chimie, pour la biologie, qui peuvent être donc «
réduites» selon cette même logique à la physique. Le réductionnisme gouverne aujourd’hui
toute démarche scientifique ; ce qui permet en outre d’effectuer les ponts nécessaires entre les
diverses disciplines que croise par exemple la modélisation moléculaire : physique, chimie,
biologie, médecine… ce qui lui vaut d'être un mode de réduction emblématique.
La conception réductionniste vise donc toujours plus l'élémentaire, le niveau fondamental,
afin d'assurer toujours davantage une « maîtrise du réel », et par suite, une efficacité de
l'intervention humaine sur ce même réel [5].
I.7. L’idée de réductionnisme
Les réductionnistes, ont la vertu d’essayer d’être aussi clairs et explicites que possibles.
La première précision qu’ils apportent est qu’il ne faut pas parler de concepts ou de propriétés
(comme par exemple la température) sans les placer à l’intérieur d’une théorie. Ce que l’on
met en rapport, ce sont toujours des théories. La réduction d’une théorie T à une théorie S
établit une telle relation entre deux théories.
De façon informelle, on peut dire qu’une théorie T est réductible à une théorie S si toute
observation que l’on peut expliquer par T peut être expliquée aussi par S. (C’est une relation
asymétrique ; toute observation explicable par S n’est pas nécessairement explicable par T.)
Il faut ajouter, pour qu’il y ait un sens à parler de réduction, que l’on suppose que le
vocabulaire de T (la théorie que l’on réduit) contient des termes que S ne contient pas, c'est-
à-dire que T parle d’objets dont S ne parle pas et/ou à l’aide de concepts que S ne connaît pas.
C’est, de nouveau, une de ces trivialités dont les conséquences ne sont pas triviales.
Evidemment, le vocabulaire de S peut contenir des termes que celui de T ne contient pas, de
sorte que l’on peut dire plus simplement que ce qu’on demande est que le vocabulaire de T ne
soit pas inclus dans celui de S.
Les réductionnistes admettent l’existence de niveaux et, associée à chaque niveau, une
liste de propriétés caractéristiques de ce niveau. Nous pouvons alors, en suivant Broad1 et en
utilisant une terminologie modifiée, distinguer trois sortes de lois. (i) Les lois ‘intra-niveaux’
qui concernent les propriétés caractéristiques d’un niveau. Elles sont valables à ce niveau et à
des niveaux supérieurs, mais pas à des niveaux inférieurs (par exemple une loi qui relie la
température et l’entropie d’un système). (ii) Les lois ‘inter-niveaux’ qui relient des propriétés
__________________________ 1
BROAD, C.D. The mind and its place in anture. London : Routledge & Kegan Paul, (1925) pp. 77-78.
Chapitre I. Le réductionnisme en chimie quantique
9
définies à un niveau i donné à celles définies au niveau i-1 (par exemple une loi qui relie
l’énergie cinétique à la température). (iii) Des lois ‘trans-niveaux’ qui seraient valables non
pas pour un niveau spécifique, ni pour une paire spécifique de niveaux adjacents, mais pour
tout niveau et toute paire de niveaux adjacents.
Les premières (‘intra’) n’offrent à mon avis pas de problèmes de principe, mais bien les
dernières (‘trans’). En voici un exemple. Oppenheim et Putnam proposent l’échelle suivante
comme « système de niveaux réductifs » : (1) particules élémentaires, (2) atomes, (3)
molécules, (4) cellules, (5) êtres vivants multicellulaires, (6) groupes sociaux. Laissant de côté
tout ce que les niveaux supérieurs peuvent avoir de problématique, constatons qu’ils obéissent
manifestement aux deux lois trans-niveaux : (i) toute entité d’un niveau quelconque, excepté
le niveau le plus bas, peut être décomposée en des entités du niveau sous-jacent, (ii) aucune
entité d’un niveau quelconque ne possède des parties qui appartiennent à un niveau supérieur.
Ce sont sans doute des lois ‘trans’ pour système de niveaux, qui d’ailleurs été construit
conformément à ces lois. Ce ci montre simplement que la notion de lois trans-niveaux n’est
pas absurde même si l’on n’en trouve pas d’intéressantes.
Les lois ‘inter-niveaux’ de quelle nature sont-elles, quels sont leurs ingrédients?
Contentons nous ici de prendre comme exemple une loi qui relie la mécanique à la
thermodynamique, et intéressons nous plus particulièrement et de façon tout à fait sommaire à
cette loi des gaz parfaits, selon laquelle le produit de la pression, P, et du volume, V, d’une
quantité donnée de gaz est proportionnel à sa température, T : PV α T. Comment peut-on
déduire cette loi de la mécanique à laquelle obéissent les molécules qui composent le gaz ?
Quels sont les ingrédients de cette déduction ? [6].
I.8.Les types de réduction
Il semble raisonnable de distinguer, la réduction “horizontale” d’une théorie à une autre
plus englobante, dont la première devient un cas particulier, et la réduction “verticale” d’une
théorie à une autre portant sur des objets considérés comme plus fondamentaux parce que plus
élémentaires.
I.8.1.Réduction verticale
La réduction de la chimie à la mécanique quantique est un des exemples le plus
souvent cités. « Les lois physiques fondamentales nécessaires pour la théorie mathématique
de la plus grande partie de la physique et de la totalité de la chimie sont ainsi complètement
Chapitre I. Le réductionnisme en chimie quantique
10
connues, et la difficulté est seulement que l’application de ces lois conduit à des équations
beaucoup trop compliquées pour qu’on puisse les résoudre » (Dirac, 1929).
I.8.2.Réduction horizontale
Pour prendre un exemple connu, la mécanique quantique a-t-elle englobé la mécanique
classique en sorte de la rendre superflue, ou en tout cas de la réduire au statut d’un cas
particulier, d’un cas limite? On sait que Bohr2 n’était pas de cet avis. Il attachait une
importance considérable au passage à la limite où la constante de Planck tend vers zéro, qu’il
avait théorisé sous le nom de principe de correspondance. Mais ce n’était pour lui que l’une
des faces de la relation entre la mécanique quantique et la physique classique : l’autre face
étant que les concepts classiques restaient, et devaient rester indispensables à la description
des expériences. « En fait, nous devons comprendre que l’interprétation non ambiguë de
n’importe quelle mesure doit être articulée essentiellement en termes des théories physiques
classiques, et nous pouvons dire en ce sens que le langage de Newton et Maxwell restera
toujours le langage des physiciens » [7].
I. 9. Comparaison entre la physique et la chimie
En 1669, Bernard Le Bovier De Fontenelle, le premier et le plus célèbre secrétaire
perpétuel de l'académie royale des sciences à Paris, avait proposé la comparaison suivante:
Par ses opérations évidentes, la chimie résout les corps en un certain nombre de principes
réels et bruts; les sels, les soufres, etc. tandis que par ses spéculations délicates, la physique
agit conformément aux principes comme agit la chimie sur les corps, les résolvant en d'autres
principes encore plus simples, petits corps façonnés et déplacés dans un nombre infini de
manières: c'est la différence principale entre la physique et la chimie, l'esprit de la chimie est
plus confus, plus dense; où les principes sont mélangés l'un avec l'autre, tandis que l'esprit de
la physique est plus clair, plus simple, moins encombré, et, enfin, va droit aux origines des
choses, tandis que l'esprit de la chimie ne va pas à la fin.
Ainsi, alors que la chimie est souvent perçue comme visant à fournir les principes
généraux régissant les transformations matérielles, c'est la physique qui est engagée dans la
recherche des constituants finaux de la nature et des lois fondamentales régissant leur
comportement.
2 BOHR N, 1931, Maxwell and modern theoretical physics, in Nature (Suppl.) 128, 691-692. Et Niels Bohr, Collected
Works, Amsterdam, North-Holland, vol. 6, 1985, pp. 357-360.
Chapitre I. Le réductionnisme en chimie quantique
11
En effet, comme une série d'études récentes sur la chimie du XVIIe siècle a montré,
ces positions ont été considérées comme étant entièrement compatibles. Ainsi, Daniel
Sennert, par exemple, explique un certain nombre d'opérations chimiques en termes d’ajout
ou de retrait d'atomes qui possèdent leurs propres propriétés chimiques caractéristiques. Nous
devons donc conclure, que ni la discontinuité ni l’homogénéité des matières sous-entendues
par atomisme ne fournit les raisons suffisantes pour distinguer une vue philosophique
caractéristique du physicien de celle du chimiste.
C’est trop superficiel d’essayer de distinguer la chimie de la physique suivant la ligne
des éléments contre les atomes, entre une philosophie de matière caractérisée par des
principes inhérents ou une vision basée sur la matière homogène mais discontinue. D'abord, le
désaccord entre ces deux traditions a précédé l'apparition des disciplines modernes de la
physique et de la chimie. En second lieu, et de manière plus significative, les chimistes ont
toujours été confrontés à une multiplicité d'interprétations des phénomènes chimiques, et un
grand nombre d'entre eux n'ont pas hésité à allier la doctrine corpusculaire avec celle des
éléments ou des principes.
Au milieu du dix-neuvième siècle, la définition d'un composé par la nature et la proportion de
ses constituants étaient défiées par un paradigme structural qui a tenu compte de
l'arrangement des atomes en molécules. Sur ce modèle, c'est l'arrangement physique des
éléments constitutifs qui explique les propriétés du composé [1].
I. 10. Le monde quantique
La révolution quantique, conduite vers le milieu des années vingt par de jeunes
physiciens est peut-être, parmi les nombreuses révolutions dont est jalonnée l’histoire des
sciences, celle qui a le plus radicalement et profondément bouleversé l’image que les
physiciens se faisaient du monde. La difficulté qu’ils eurent à l’accepter fut parfois si grande
que certains, et non des moindres puisque Einstein fut l’un d’entre eux, ne parvinrent pas à la
surmonter. « Celui qui n’est pas choqué par la théorie quantique », disait Bohr, « ne l’a pas
comprise ». Elle remettait profondément en question les concepts auxquels les avait habitués
la mécanique rationnelle et que la relativité n’avait pas vraiment bousculés : un monde fait de
points matériels doués à tout moment d’une masse, d’une position et d’une vitesse bien
définies. Elle introduisait à sa place la notion d’état d’un système et en faisait l’élément de
base de son processus d’abstraction et de mathématisation.
Chapitre I. Le réductionnisme en chimie quantique
12
Aujourd’hui, si elle est toujours aussi choquante et indigeste – et par conséquent
difficile à enseigner aux jeunes étudiants – elle est unanimement acceptée par les hommes de
science. Les anciens concepts de la mécanique rationnelle sont compris comme n’étant que
des approximations, en quelque sorte des illusions de la mécanique quantique. Il a fallu, pour
parvenir à ce résultat, des années d’observations et d’expériences qui ont donné de la théorie
tant d’éclatantes confirmations que le doute n’est plus permis [8].
I. 10. 1. La réduction de la chimie à la mécanique quantique
Les concepts et théories que les chimistes ont développés, sans contradiction avec la
mécanique quantique mais en renonçant aux solutions exactes et en usant d’approximations
justifiées par les données expérimentales, sont-ils légitimes ?
Même avec les techniques actuelles, on ne peut obtenir des solutions exactes de
l’équation de Schrödinger que dans des cas extrêmement particuliers : atomes à un électron,
molécules diatomiques homonucléaires à un électron. De plus, la fonction d’onde, définie
dans un espace de configuration abstrait, n’a pas de signification physique simple : elle oblige
le chimiste à renoncer à toute tentative de voir ce que les atomes et les molécules sont en train
de « faire » – et qui serait possible seulement dans l’espace à trois dimensions. Il en résulte
une curieuse dichotomie en chimie quantique : les approches ad hoc, simples et qualitatives,
très utilisées par les chimistes, coexistent avec des approches rigoureuses ou ab initio,
dépourvues de concepts et d’images simples. Il n’y a guère d’espoir, concluaient ces auteurs,
que l’abîme séparant ces deux types d’approches puisse être jamais franchi (« There appears
hardly any hope of ever bridging the chasm between the two »). Autrement dit, la réduction
de la chimie à la mécanique quantique est impossible, jusqu’à nouvel ordre. Certes, la
mécanique quantique joue un rôle fondamental en chimie, mais le concept de réduction est
incapable de décrire ce rôle. Non seulement les solutions exactes des équations quantiques
sont presque toujours inaccessibles, mais encore si nous les possédions nous ne saurions pas
quoi en faire. Les solutions approchées, élaborées en tenant compte des données empiriques,
nous aident bien mieux à comprendre. Pourquoi tenter de calculer exactement telle grandeur
chimique, quand on peut la mesurer ?
Un autre physicien, Philip W. Anderson, a publié une intéressante critique du
réductionnisme sous le titre More is different (Anderson. 1972). Il est vrai qu’il se dit
“réductionniste” : mais cela ne signifie pour lui rien de plus que la compatibilité au sens de
Leggtt : les lois de la physique sont universelles, en ce sens qu’aucun phénomène connu ne
Chapitre I. Le réductionnisme en chimie quantique
13
leur échappe. Mais, ajoute Anderson, on ne peut en aucune manière passer du réductionnisme
au “constructionnisme” : « La capacité de tout réduire à des lois fondamentales simples
n’implique pas la capacité de partir de ces lois pour reconstruire l’univers. En fait, plus la
physique des particules élémentaires nous dit de choses sur la nature des lois fondamentales,
moins celles-ci semblent pertinentes pour les problèmes bien réels du reste de la science, et
moins encore pour ceux de la société ». Après avoir analysé divers exemples (molécules,
solides, noyaux), Anderson énonce qu’en général la relation entre un système et ses parties à
sens unique : la synthèse est presque impossible, tandis que l’analyse peut être non seulement
possible, mais féconde à tous égards. Et il conclut : « L’arrogance du physicien des particules
est peut-être derrière nous (“ le reste est de la chimie”, a dit le découvreur du positron) [7].
En 1929, Paul Dirac, l’un des créateurs de la mécanique quantique, avait déclaré que
les lois physiques fondamentales nécessaires pour la théorie mathématique d'une grande partie
de physique et de la totalité de la chimie sont maintenant complètement connues. La seule
difficulté, selon Dirac, c’était que l'application exacte de ces lois a mené aux équations
beaucoup trop compliquées pour être soluble. Ceci et d'autres déclarations similaires ont
clairement démontré l'ambition des physiciens pour réduire tous les phénomènes chimiques
aux mécanismes de la mécanique quantique des atomes. L'argument lui-même est tout à fait
franc. En principe, la chimie est entièrement circonscrite par la description de la distribution
d'électron exprimée par l'équation de Schrödinger. Avec le principe établi, le reste de la
chimie est une question de détails. Quoique des solutions exactes pour l'équation de
Schrödinger ne sont connues que pour les atomes simples comme l'hydrogène et l’hélium
avec seulement un ou deux électrons, il est raisonnable de supposer qu’avec l'amélioration des
outils mathématiques, et en particulier, l'énorme multiplication de la puissance de calcul
apportée par l'ère numérique, approximations ou solutions de mieux en mieux pour tous les
autres éléments et composés suivra. Ainsi, la chimie pourrait, en principe au moins, être
déduite de la mécanique quantique. Les concepts d’électrons, des protons, des orbitales, et les
niveaux d'énergie qui sont déployés pour expliquer les phénomènes chimiques réussissent à
le faire seulement grâce à l'utilisation judicieuse des hypothèses complémentaires. Selon la
théorie quantique, le carbone devrait être bivalent, mais ceci n'arrête pas la majeure partie de
ses combinaisons étant tétravalent. L'hypothèse de l'hybridation des orbitales explique cette
tétravalence, mais, tout en étant compatible avec la théorie quantique, elle demeure ad hoc. En
outre, alors que la systématisation des théories en physique pourrait bien avoir réussi à
intégrer certains éléments de chimie, il n'a pas mis un terme au développement des théories
chimiques indépendantes. C'est pourquoi Monique Lévy discute à la fin d’une " réduction par
Chapitre I. Le réductionnisme en chimie quantique
14
synthèse " qui est une forme de réduction qui réserve un rôle fondamental pour la discipline
"réduite " la relation entre la microstructure et les propriétés macroscopiques qui forme l'axe
central de la physique de l'état solide, et qui a profondément modifié l'approche de tous les
chimistes travaillant sur des matériaux solides [1].
Ces dernières années, la réduction de la chimie a été traitée de différentes façons. De
nombreuses études se sont concentrées sur la réduction inter-théorique entre les théories de la
chimie et les théories de la physique (Bunge, 1982; Primas, 1983). D'autres ont discuté de la
réduction de la chimie d'une manière naturaliste, en examinant la question comment certaines
propriétés généralement moléculaires tels que les angles de liaison peuvent être déduites de la
mécanique quantique dans un modèle ab initio ou si le système périodique peut être déduit de
la même façon de la mécanique quantique [9].
I. 10. 2. Le tableau périodique et le réductionnisme en chimie quantique
Le tableau périodique des éléments a eu une influence profonde sur le développement de
la chimie et de la physique moderne. Dans la chimie son influence est bien connue et
indéniable. Les fonctions du système périodique comme un principe unificateur continue à
guider la recherche des chimistes de jour en jour dans de nombreux domaines spécialisés.
L'influence de la classification périodique sur le développement de la physique et en
particulier la mécanique quantique n’est pas si bien connue mais également indéniable. La
mécanique quantique fait partie de la tradition réductionniste dans la science moderne [9].
En 1939, Georges Champetier a suggéré que le tableau périodique avait efficacement été
réinventé en raison de la théorie atomique. Selon ses propres paroles, "la théorie atomique est
maintenant devenue le fondement le plus solide de la chimie théorique et expérimentale. La
classification périodique a pris une importance beaucoup plus grande à la suite de la
clarification de nos idées concernant la structure atomique". Champetier a suggéré que la
réforme pourrait être poussée plus loin en redéfinissant l'élément en termes de nombre
combiné de protons et de neutrons dans le noyau, donnant à chaque " isotope " sa propre place
dans un nouveau tableau. En dépit de cette réorientation proposée du tableau périodique
autour des découvertes en physique atomique, Champetier n'a jamais suggéré qu'il pourrait
être possible de déduire la chimie de la physique, voyant le futur rapport entre les deux
disciplines en termes de collaboration plutôt que de domination. Ainsi, la chimie des solides
continue à devenir de plus en plus orientée vers la science des matériaux, qui étudie - ou, de
plus en plus, conçoit - des matériaux en termes de leurs propriétés, développant les matériaux
Chapitre I. Le réductionnisme en chimie quantique
15
qui sont particulièrement bien adaptés à des applications données. De ce point de vue, le
chimiste peut voir le tableau périodique comme une boîte à outils bien organisée, où chaque
colonne est comme un tiroir, avec chaque élément fournissant un certain réseau de propriétés.
Tandis qu'un groupe fournit une gamme des métaux ioniques qui sont de bons conducteurs, ils
peuvent être employés en même temps que les oxydes d'un autre groupe pour faire une pile.
D'autres groupes fournissent des semi-conducteurs, et les halogènes, par exemple, assurent
une gamme d’additifs pour faire les lampes fluorescentes de diverses couleurs. Le tableau
périodique peut être vu comme un entrepôt accessiblement organisé, ou un catalogue à partir
duquel on peut commander les éléments de base pour construire de nouveaux matériaux qui
remplissent les fonctions désirées. C'est certainement l'impression donnée par le chimiste
Michel Pouchard: Le chimiste est principalement l'architecte de la matière aussi bien que son
maçon ; sa balance est celle du nanomètre, ses briques environ les cent éléments dans le
système périodique de Mendeleïev, et son ciment est leurs électrons de valence [1].
I. 11 Conclusion
On objectera aisément à ce qui précède que même si la réduction n’existe pas pour le
moment elle peut jouer le rôle d’un idéal, d’un but à atteindre. N’a-t-elle pas stimulé le
développement de la chimie et de la physique au 19e siècle ? N’inspire-t-elle pas aujourd’hui
la biologie? Examinons cela. L’idée d’une réduction verticale qui, de l’antiquité aux lumières,
a été une thèse philosophique (l’atomisme) s’incarne au 19e siècle dans l’hypothèse atomique
des chimistes, puis dans la théorie cinétique des gaz, dans la mécanique statistique, et
finalement dans la “réalité moléculaire” (selon l’expression de Jean Perrin). La théorie des
quanta puis la mécanique quantique donnent à l’atomisme des physiciens et des chimistes une
justification plus profonde ; elles expliquent que, comme le disait Bohr, il existe dans la
nature une tendance à produire des formes déterminées et à les faire réapparaître, encore et
toujours, même lorsqu’elles ont été perturbées ou détruites. Mais, en triomphant, l’atomisme a
perdu sa simplicité originelle. Les atomes ne sont plus insécables et inaltérables. L’existence
des molécules n’est plus un postulat de base de la chimie, mais un résultat de la théorie
quantique, valable sous certaines réserves. La postérité de l’atomisme s’est scindée en deux
branches bien distinctes : d’un côté la théorie savante, et les techniques récentes de
manipulation d’atomes ou de molécules presque isolées ; de l’autre, l’idée de réduction
verticale qui n’est plus une thèse philosophique ou une hypothèse scientifique, mais est
devenue une croyance.
Chapitre I. Le réductionnisme en chimie quantique
16
Imaginons que la chimie, la physique du solide, la thermodynamique, la mécanique
classique enfin, soient toutes remplacées par la mécanique quantique, devenue entièrement
calculable après l’avènement d’ordinateurs d’un type nouveau. L’industrie informatique
réaliserait des chiffres d’affaires fabuleux. Mais l’idéal d’intelligibilité qui a présidé à la
naissance de la science serait mort et enterré, au moins dans les sciences physiques ; car la
mécanique quantique, qui calcule par ses propres moyens et fournit des résultats d’une
exactitude numérique étonnante, ne peut guère se passer des béquilles de la physique
classique quand on lui demande de nous faire comprendre ce qui se passe. Par suite, les
sciences physiques, débarrassées désormais de toute incertitude et de toute nouveauté
véritable, sombreraient dans un océan d’ennui. En somme, même si la réduction devenait
possible dans les sciences physiques, elle ne les aiderait pas à remplir ce qui doit rester la
tâche fondamentale de toute science : nous aider à comprendre les phénomènes [7]. La
mécanique quantique a montré à quel point la séparation entre la physique et la chimie était
arbitraire [10].
Friedrich Paneth a clairement défini le statut épistémologique du concept chimique de
l'élément dans une conférence portant ce titre qu'il a donné en 1931. Ici, il a soulevé deux
questions. La première rappelle le problème d'Aristote avec « les mixtes véritables », en quel
sens peut-on supposer que les éléments persistent dans les composés? " Sa réponse - basée
sur une étude historique des notions d’éléments et des atomes - est claire: puisque la chimie
est concernée par les qualités secondaires des substances, les chimistes devraient assumer la
persistance des qualités dans les composés. Il a proposé d'appeler ce qui persiste " substance
de base " alors qu'il réservait le terme " substance simple " pour la matière montrant des
manifestations phénoménologiques associées à cette substance de base abstraite, renouvelant
de ce fait la distinction conceptuelle de Mendeleev. La deuxième question de Paneth était: «
s’il est vrai ou non que la chimie doit et va se dissoudre dans la physique? " Ici, il a traité la
possibilité de reduire la chimie à la physique, un développement qui avait été déjà prédit par
certains physiciens.
La théorie quantique offre clairement des avantages considérables pour l'enseignement de la
chimie et, en particulier, pour la présentation du tableau périodique, avec son explication du
comment et du pourquoi les propriétés chimiques des divers éléments obéissent à un modèle
global. Néanmoins, ceci ne signifie pas que les chimistes peuvent s'en sortir seuls avec la
mécanique quantique. Le chimiste ne peut pas s'isoler de ces développements et de se
contenter d'exécuter et de décrire les réactions. Il ne pourra pas tirer parti de ses succès
précédents à moins qu'il assimile les disciplines du physicien ou accepte de collaborer avec
Chapitre I. Le réductionnisme en chimie quantique
17
lui. Cette évolution de la chimie vers la physico-chimie est est le trait le plus caractéristique
de ces vingt dernières années [1].
Chapitre I. Le réductionnisme en chimie quantique
18
I. 12.Références
[1] Bernadette Bensaude-Vincent, Jonathan Simon, « CHEMISTRY THE IMPURE
SCIENCE », Imperial College Press, (2008), ISBN-13 978-1-84816-225-9.
[2] J. Perrin, « Les Atomes », Flammarion, (1991).
[3] Charles Widmer, «Droits de l’homme et sciences de l’homme pour une Ethique
anthropologique», Librairie Droz S. A., Genève - Paris (2007).
[4] Bernard JACROT, Eva PEBAY-PEYROULA, Régis MACHE, Claude DEBRU,
« PHYSIQUE ET BIOLOGIE, UNE INTERDISCIPLINARITÉ COMPLEXE », EDP
Sciences, (2006), ISBN 2-86883-892-8.
[5] Lambert D., 1999. « Sciences et théologie Les figures d'un dialogue », Ed. Lessius,
Presses Universitaires de Namur, 220p.
[6] Edgar Ascher, « L’idée d’émergence », Archives de psychologie, 52, (1984), 175-193.
[7] À René Thom, « Passion des formes : dynamique qualitative, sémiophysique et
intelligibilité », Vol 1, ENS Editions, (1994) 828 p.
[8] Pierre Darriulat, « Réflexions sur la science contemporaine », EDP Sciences (2007),
ISBN 978-2-86883-964-0.
[9] Eric R. Scerri, « Collected papers on philosophy of chemistry », Imperial College Press,
(2008). ISBN-13 978- 1-84816- 137-5.
[10] Champ Vallon, « La totalité », vol 5, (2002), Ed. Champ Vallon, Presses Universitaires
de France, ISBN 2-87673-355-2.
CHAPITRE II
Le tableau périodique
19
Le tableau périodique .Chapitre II
20
II.1. Introduction
Le tableau périodique se classe comme l'une des idées les plus fécondes et
unificatrices dans toute la science moderne [1]. L'élément chimique est proche d'une
abstraction mathématique. Ainsi, il devient un instrument qui nous permet de construire une
série qui est supposée se cacher derrière. Cette abstraction permet au chimiste de décrire
l'ordre qui existe derrière la multiplicité apparente chaotique du monde phénoménal. La plus
grande valeur du concept de Mendeleev d'un élément est sa puissance de construire la série
apparentée. Les éléments chimiques sont efficacement "désincarnés" les entités abstraites qui
sont attachées au vrai monde par le réseau des rapports décrits par le système périodique. Ce
rapport abstrait-concret est représenté par la position de l'élément dans le tableau périodique,
qui forme alternativement la base pour une multiplicité d'interprétation [2].
II.2. Historique
Tout a commencé par la notion d’élément, puis l'analyse de la réactivité des éléments
chimiques a amené bon nombre de scientifiques à proposer des systèmes de classement basés
sur l'analogie des réactivités. Le tout premier système de classement, publié en 1829, celui de
Johann Döbereiner de l'Université de Iéna et Sa "Loi des triades". La première
classification périodique qu'il nomma "la vis tellurique", fut celle de Beguyer de
Chancourtois en 1862. Dés 1857, William Odling s'intéressa au classement des éléments
connus en développant la règle des triades. Il publia en 1864 une classification assez proche
de celle que Dmitri Mendeleïev publia cinq ans plus tard.
En 1863, John Newlands publia dans "Chemical News" une classification de 56
éléments en 11 groupes basés sur la similitude de leurs propriétés chimiques, il observa aussi
que dans un même groupe deux éléments consécutifs avait une masse atomique différente
d'un multiple de huit, Newlands introduisit une loi des octaves laissant entendre que tous les
huit éléments on retrouve des propriétés chimiques similaires.
II.2.1. Lothar Meyer ou Dimitri Mendeleïev ?
L'allemand Meyer et le russe Mendeleïev ont établi, chacun de leur côté, un
classement des éléments chimiques. Meyer proposa une classification périodique dès 1864,
mais celle-ci ne fut publiée qu'en 1870, un an après celle de Mendeleïev.
Le tableau périodique .Chapitre II
21
Le classement se fit sur la base de la masse atomique croissante (les numéros atomiques
n'étaient pas encore inventés) en conjonction avec la similitude des propriétés chimiques.
L'originalité des tableaux de Mendeleïev et de Meyer fut de laisser des emplacements vides,
prévoyant ainsi la prochaine découverte de nouveaux éléments [3].
C'est au chimiste russe, Dimitri Ivanovitch Mendeleïev (1834-1907), que revient le
mérite d'avoir structuré une classification cohérente de l'ensemble des éléments. En rédigeant
un volume de chimie, il se rend compte qu'en plaçant les éléments en ordre croissant de leur
masse atomique, il apparaît une tendance en ce qui concerne les propriétés, tendance qui se
répète à plusieurs reprises. En 1869, il présenta une première version de son tableau
périodique. Celui-ci contient alors les 63 éléments connus à cette époque. Mendeleïev disposa
son tableau de manière que la périodicité apparût nettement. En classant les éléments
verticalement (ils sont disposés horizontalement dans la classification actuelle). Les rangées
horizontales se succèdent régulièrement au fur et à mesure que certaines propriétés chimiques
et physiques se répètent. Dans les rangées verticales, on retrouve des éléments possédant à
peu près les mêmes propriétés chimiques et des ressemblances dans leurs propriétés
physiques. Pour respecter la loi périodique à laquelle Mendeleïev croyait fermement, il dut
parfois modifier l'ordre déterminé par la progression des masses atomiques et laisser certaines
cases vides. Jusque là, très peu de scientifiques acceptaient les idées de Mendeleïev. Mais
lorsque ces éléments prédits par ce dernier furent découverts, présentant de surcroît des
propriétés très proches de celles qu'il avait prévues, les scientifiques reconnurent l'utilité de
son tableau périodique. Bien que la classification de Mendeleïev marquât un net progrès sur
tous les autres essais de classification d'alors, il reste qu'elle contenait certaines anomalies
dues à des masses atomiques encore mal déterminées à l'époque [4].
II.2.2. Le tableau périodique des éléments
Le tableau périodique des éléments répertorie les éléments chimiques selon l’ordre
croissant de leur nombre atomique. Le tableau périodique est constitué de rangées
horizontales, nommées periodes et de rangées verticales, nommées colonnes (groupes
d’éléménts).
Il est important de noter que:
- les périodes sont en nombre de 7;
- les groupes d’éléménts sont en nombre de 18; dont les propriétés présentent certaines
tendances [5].
Le tableau périodique .Chapitre II
22
Figure. II.1 : La première forme du système périodique de Mendeleev datant du 17 février
1869, intitulée « une tentative au système d’éléments, se basant sur leur masse.
Figure. II. 2 : Dimitri Ivanovitch Mendeleev [1].
Le tableau périodique .Chapitre II
23
Il en résulte que nous pouvons acquérir une connaissance raisonnable d’un élément si nous
savons à quel groupe il appartient et quels sont ses voisins [6].
- les groupes d’éléménts contiennent des éléments chimiques qui présentent des
propriétés chimiques similaires;
- le 1er groupe d’éléménts regroupe les métaux alcalins ;
- le 2e groupe d’éléménts regroupe les métaux alcalino-terreux ;
- le 17e groupe d’éléménts regroupe les halogènes ;
- le 18e groupe d’éléménts regroupe les gaz rares ;
- les groupes d’éléménts 3 à 12 compris regroupent les métaux de transition [5].
- Le long bloc situé au-dessous est constitué par les métaux de transition interne. La
rangée supérieure de ce bloc la 6e période, est constituée par les lanthanides et La
rangée inférieure la 7e période, par les actinides [6].
Les colonnes sont occupées de telle manière que chacune d’entre elles renferme tous les
éléménts dont les atomes ont la même configuration électronique de valence. Comme ce sont
les électrons de valence qui sont reponsables des propriétés chimiques des éléments, une
colonne regroupe tous les membres d’une même famille chimique.
On distingue également des blocs, chaque bloc correspond au remplissage d’un type de sous-
couche :
- Le bloc s correpond au remplissage de sous-couches s (colonnes 1 et 2).
- Le bloc p à celui des sous-couches p (colonnes 13 à 18)
- Le bloc d à celui des sous-couches d (colonnes 3 à 12)
- Le bloc f à celui des sous-couches f (les deux lignes sous le tableau) [7].
II.2.3. Qantification de l’énergie
Les nombres quantiques
En mécanique quantique, létat d’un électron d’un atome peut être décrit à l’aide de
qutre nombres dits quantique et notés: n, l, ml et ms.
- n est appelé nombre quantique principal. C’est un nombre entier positif.
- l est appelé nombre quantique secondaire ou azimutal. C’est un nombre entier positif ou nul
inférieur ou égal à n-1: 0 ≤ l ≤ n-1 [7].
Les valeurs du nombre quantique azimutal, l, sont désignées respectivement par des lettres
empruntées à la spectroscopie [6].
Le tableau périodique .Chapitre II
24
l 0 1 2 3 4
niveau d’énergie s p d f g
Tableau II.1 : Désignation des valeurs du nombre quantique azimutal, l [7].
II.2.4. Niveaux énergétiques des orbitales atomiques
Pour les atomes polyélectroniques, les niveaux énergétiques des orbitales atomiques
dépendent à la fois des valeurs de n et de l. Autrement dit, les orbitales caractérisées par la
même valeur de n mais par des valeurs différentes de l, possèdent des énergies différentes.
- les niveaux énergétiques des orbitales atomiques, précisés par une des valeurs de n, sont
appelés couches électroniques. Selon la valeur de n, les couches électroniques sont désignées
par une des lettres majuscules suivantes : K, L, M, N, O, P, Q.
- les niveaux énergétiques des orbitales atomiques, précisés par les diverses valeurs de l, sont
appelés sous-couches électroniques.
Couche
électronique
sous-couches électroniques
K (n = 1) l sous-couche s (l = 0)
L (n = 2) l sous-couche s (l = 0) et l sous-couche p (l = 1)
M (n = 3) l sous-couche s (l = 0), l sous-couche p (l = 1), l sous-couche d (l = 2)
N (n = 4) l sous-couche s (l = 0), l sous-couche p (l = 1), l sous-couche d (l = 2), et l sous-
couche f (l = 3)
Tableau II.2 : Niveaux énergétiques des orbitales atomiques [5].
II.2.5. La configuration électronique d’un atome
Pour établir la configuration électronique d’un atome polyélectronique dans son état
fondamental, trois règles doivent être appliquées: le principe de Pauli, la règle de
Klechkowski et la règle de Hund.
Le tableau périodique .Chapitre II
25
II.2.5.1. Principe d’exlusion de Pauli
Dans un édifice monoatomique, deux électrons ne peuvent pas avoir leurs quatre
nombres quantiques (n, l, ml, ms) identiques.
Ainsi, deux electrons qui occupent une sous-couche 1s sont décrits par le quadruplet (1, 0, 0,
+ 1/2) pour l’un et (1, 0, 0, − 1/2) pour l’autre.
Ils ont la même énergie, mais leurs nombres magnétiques sont de spin opposés; on dit que
leurs spins sont anti-parallèles ou appariés.
Une orbitale atomique ne peut donc pas décrire plus de deux électrons.
Ainsi, une sous-couche s peut contenir au plus deux électrons, une sous-couche p au
plus six électrons, une sous-couche d au plus dix électrons, une sous-couche f au plus
quatorze électrons.
- Une sous-couche qui contient le maximum d’électrons qui lui est permis de contenir est dite
saturée [7]. On peut résumer le principe d'exclusion de Pauli comme ceci: Dans chaque
couche, l'on peut mettre au maximum 2n² électrons. (où n est le numéro de la couche) [8].
II.2.5.2. La règle de Klechkowski
À l’état fondamental, l’énergie de l’atome est minimale : cela correspond à une
occupation des niveaux d’énergie électronique les plus bas. La règle de Klechkowski (Appelé
principe de stabilité) est une règle empirique qui permet de retrouver l’ordre de remplissage
des sous-couches afin d’obtenir la configuration électronique d’un atome dans son état
fondamental. Dans l'ordre :
1s < 2s < 2p < 3s < 3p < 4s < 3d < 4p < 5s < 4d < 5p < 6s < 4f < 5d < 6p < 7s < 5f < 6d < 7p
< 8s <... [9].
Dans un atome polyélectronique, l’ordre de remplissage des sous-couches
(caractérisées par les nombres quantiques n et l) est celui pour lequel la somme (n + l) croît.
Quand deux sous-couches ont la même valeur pour la somme (n + l), la sous-couche qui est
occupée la première est celle dont le nombre quantique principal n est le plus petit [7].
Remarque
La règle de Klechkowski est parfois appelée principe de construction (ou principe de
l’Aufbau) [7].
Le tableau périodique .Chapitre II
26
Figure. II.3. : Hiérarchie des niveaux énergétiques des orbitales atomiques (visualisée par la
règle de Klechkowski) [5].
II.2.5.3. Règle de Hund
Dans des orbitales de même énergie (dans une même couche), les électrons se placent
de préférence avec leurs spins parallèles (même chiffre) dans des orbitales différentes. Ceci
s'expliquant par un gain d'énergie [8].
II.3. Principe de la classification moderne
Cette classification comporte 7 lignes (ou périodes) et 18 colonnes. Les éléments sont
rangés dans chaque ligne par ordre croissant du numéro atomique Z, selon la configuration
électronique des atomes [10], suivant la règle de Klechkowski où le remplissage des orbitales
se fait par valeurs croissantes des niveaux énergétiques n + l.
Le tableau périodique .Chapitre II
27
II.3.1. La loi de la périodicité des propriétés
Bien avant la découverte de la nature atomique de la matière, les chimistes avaient
remarqué que, lorsque les éléments sont classés par ordre croissant des « masses équivalentes
» (masses atomiques), une périodicité de leurs propriétés apparaissait. C'est Mendeleiev qui
proposa la classification qui devait se trouver expliquée par la découverte de la structure
atomique de la matière.
La comparaison des couches de valence (C.V.) des différents éléments conduit très
vite a constater que leur structure électronique se répète pour des groupes d'éléments
(familles), la seule différence étant la valeur du nombre quantique principal « n » impliqué
dans la couche de valence. Ainsi, a une colonne donnée, correspondent des éléments ayant
une couche de valence de même type, c'est-à-dire possédant des propriétés comparables. La
structure du tableau périodique des éléments traduit ces propriétés remarquables. Dans ce
tableau, les éléments situés dans une même colonne constituent une famille d'éléments : ceux-
ci ont la même structure de la couche de valence. Ceux qui sont situés sur une même ligne
constituent une période : leur couche de valence correspond à une même valeur du nombre
quantique « n » [11].
Il existe une corrélation entre la position d’un élément chimique dans le tableau périodique et
sa configuration des électrons de valence (électrons de la couche la plus externe) [5].
Par ailleurs, quatre remarques permettent de comprendre 1'évolution des propriétés des
éléments en fonction de leur position dans le tableau :
1 - Les éléments possédant une couche de valence 0 sont particulièrement stables (gaz rares
ou gaz nobles). Une conséquence est que les éléments auront tendance à réaliser cette
configuration de couche de valence soit en captant, soit en perdant des électrons ; ils forment
alors des ions.
2 - Moins des éléments possèdent d'électrons sur leur couche de valence, plus ils ont tendance
à perdre des électrons pour réaliser la configuration de la couche de valence du gaz rare les
précédant dans la classification : ils ont donc tendance à donner des ions positifs (cations).
Ces éléments sont appelés« métaux ».
3 - Plus des éléments possèdent d'électrons sur leur couche de valence, plus ils ont tendance a
gagner des électrons pour réaliser la configuration de la couche de valence du gaz rare les
suivant dans la classification: ils ont tendance à donner des ions négatifs (anions). Ces
éléments sont les « non-métaux ».
Le tableau périodique .Chapitre II
28
4 - Plus un élément est « gros », c'est-à-dire plus il y a d'électrons dans son nuage électronique
entre un électron de valence et le noyau, moins l’intéraction entre noyau et électrons de
valence sera forte. Autrement dit, quand, dans une même famille, on se déplace de 1'élément
le plus léger vers les éléments plus lourds, le caractère métallique devient plus prononcé et
celui de non-metal l’est de moins en moins [11].
II.3.2. La loi périodique
La loi périodique indique qu’après certains intervalles réguliers, les éléments
chimiques montrent une répétition approximative dans leurs propriétés. Par exemple, le fluor,
le chlore, et le brome, qui appartiennent au groupe VII (des halogènes), partage la propriété de
former des sels cristallins blancs de formule générale NaX avec le sodium. Cette répétition
périodique de propriétés est le fait essentiel qui sous-tend tous les aspects du système
périodique. Cette présentation de la loi périodique soulève des questions philosophiques
intéressantes. Tout d'abord, la périodicité entre les éléments n’est ni constante ni exacte. La
première ligne comporte deux éléments, la deuxième et la troisième chacune contient huit, la
quatrième et la cinquième contient 18, et ainsi de suite. Parmi les éléments, cependant, non
seulement la longueur de période varie, mais également la périodicité n’est pas exacte. Les
éléments dans chaque colonne de la classification périodique ne sont pas en exacte
récurrences les uns des autres. Le système périodique est la notion la plus abstraite soutenant
qu'il existe une relation fondamentale entre les éléments [1].
II.3.3. La compréhension du système périodique
Les deux théories importantes de la physique moderne sont la théorie de la relativité
d'Einstein et la mécanique quantique. La théorie quantique est en fait née dans l'année 1900,
Environ 14 années avant la découverte du numéro atomique. Elle a été appliquée à des atomes
par Niels Bohr, qui a poursuivi la notion que les similitudes entre les éléments dans n’importe
quel groupe du tableau périodique pourrait s’expliquer qu'ils ont un nombre égal d’électrons
périphériques. L'explication la plus récente du système périodique est donnée en termes du
nombre d’orbitales peuplées par les électrons, cette explication dépend de la configuration
électronique de l'atome [1].
Le tableau périodique .Chapitre II
29
II.4. Analyse du tableau périodique:
II.4.1. Les anomalies du tableau périodique
L’Analyse par période du tableau périodique révèle quelques anomalies et
contradictions. Les anomalies du tableau périodique sont les éléments qui ne respectent pas la
règle de Klechkowski, dans le remplissage des orbitales par énergie croissante. Beaucoup
d'anomalies dans les groupes peuvent être expliquées par la taille, ou au privilège des
orbitales (d ou f) à moitié ou totalement remplies. Parmi ces éléments qui présentent des
configurations électroniques faisant exception à la norme:
La première période : H, He
Le nombre quantique principal n = 1 n’autorise que la sous-couche 1s, de nombre
quantique secondaire l=0. L’hydrogène 1H, de configuration électronique 1s1, et l’helium 2He,
de configuration électronique 1s2.
L’hydrogène se place dans la case de gauche, au-dessus de la famille des alcalins, bien que
ses propriétés diffèrent largement de celles des alcalins. L’hydrogène est particulier il n’est
confome à aucun groupe, dans certains tableaux il est placé au dessus du groupe 1, dans
d’autres dans le groupe 17, et d’autres encore le placent dans ces deux groupes. Dans certains
tableaux il n’est placé dans aucun groupe, on le place tout seul au sommet du tableau
périodique [6].
L’Hélium se trouve dans le bloc p avec les gazs « rares » (colonne 18), alors qu’il est
de type s, et qui devait être dans la seconde colonne comme l’inciterait un classement continu
par valeurs croissantes de Z.
La quatrième période :
Dans cette période deux éléments font exception à la règle de Klechkowski lors de
l’occupation du sous-niveau 3d : le chrome et le cuivre qui présentent respectivement les
configurations de valence 3d5 4s1 et 3d10 4s1 au lieu des configurations 3d4 4s2 et 3d9 4s2
attendues. Elles s’expliquent par le fait que les sous-couches saturées ou à demi remplies
procurent une stabilisation particulière aux configurations correspondantes.
La cinquième période :
Les exceptions à la règle de Klechkowski sont ici plus fréquentes qu’au cours de la
Quatrième période, puisqu’au nombre de six, car les énergies des orbitales 5s et 4d sont très
proches.
Le tableau périodique .Chapitre II
30
La sixième période :
Le lutécium et le lawrencium sont placés dans le bloc f, alors que leur couche f est
déjà saturée, ils contiennent 1 électron 5d ou 6d. Ils constituent bien le début des éléments de
transition.
II.4.2. Propriétés physiques et chimiques des éléments
II.4.2.1. L'électronégativité
II a été possible de chiffrer le comportement de l'élément, par rapport a 1'électron
grâce au concept d'électronégativité qui mesure la tendance d'un atome, à 1'état fondamental,
à retenir ses électrons de valence et à attirer des électrons supplémentaires [11].
L'électronégativité est une grandeur relative qui traduit l’aptitude d’un atome B à attirer vers
lui le doublet électronique qui l’associe à un autre atome A [7].
L. Pauling a introduit le concept d’électronégativité, qui est un concept fondamental pour la
chimie, dès 1932, il 1'a defini comme le pouvoir d’un atome, de capter un électron lorsqu'il
est impliqué dans une liaison chimique, au sein d'une molécule. Neanmoins, son expression
en fonction de grandeurs mesurables n'est pas évidente et un certain nombre de relations ont
éte proposées [12]. L'électronégativité croît lorsqu’on se déplace de la gauche vers la droite et
du bas vers le haut de la classification périodique.
Le fluor est l’élément le plus électronégatif et le césium le moins électronégatif. Bien qu’elle
ne soit déterminée qu’empiriquement, l’électronégativité constitue une notion fondamentale
en chimie, en particulier pour l’étude de la réactivité des composés [7]. L’électronégativité
gouverne une grande partie de la chimie des éléments [1].
L'effet de la diagonale peut être expliqué comme le résultat de plusieurs tendances
opposées. Quand on descend chaque groupe, l’électronégativité diminue. Mais, quand on se
déplace à travers le tableau, la même propriété augmente. Si l'on se déplace en diagonale les
deux tendances s’annulent mutuellement, et il ya peu de changement en électronégativité. De
même, les tendances de l'énergie d’ionisation et du rayon atomique changent légèrement selon
la diagonale [1].
II.4.2.2. Le rayon atomique
On peut tout d'abord considérer un atome libre et définir un rayon atomique comme
étant la distance au centre du noyau du maximum de la densité radiale de 1'orbitale occupée la
Le tableau périodique .Chapitre II
31
plus externe. Ces maxima ont été calculés par différents auteurs, selon la méthode de Hartree-
Fock-Slater. On trouve ainsi 110 pm pour le potassium dont 1'orbitale la plus externe est
1'orbitale 4s (rayon orbitalaire). Mais, les orbitales monoatomiques des atomes libres n'ont
aucune raison de se retrouver dans les descriptions de la molecule, et encore moins sous
forme liée dans un solide ; 1'atome peut perdre ou gagner partiellement des électrons et se
déformer sous 1'action d'un champ électrique, en particulier celui des entités chargées qui
1'entourent [11].
II.4.2.3. L’énergie (ou potentiel) d'ionisation
Les énergies d'ionisation des éléments chimiques dépendent de leur configuration
électronique à l’état fondamental. Autrement dit, les énergies de liaison des éléments ont un
caractère périodique.
Par définition, l’énergie d'ionisation, I, d'un atome neutre ou d’un ion est 1'énergie minimale
qu’il faut fournir à l’atome ou à l’ion, se trouvant à l’état gazeux dans son état fondamental,
pour leur arracher un électron, et former un ion positif [5].
C'est 1'énergie correspondant à la réaction :
A (gaz) → A+ (gaz) +e
Ce qu’on appèle 1'énergie ou le potentiel de première ionisation (I1) De même, I2, potentiel de
deuxième ionisation, est 1'énergie nécessaire pour expulser un deuxième électron, et ainsi de
suite [12].
- L’énergie de première ionisation est toujours positive, elle est d’autant plus grande que
l’électron arraché est plus fortement lié au noyau [7].
- Les énergies d'ionisation d’un atome gazeux augmentent dans l’ordre : I1 < I2 < I3< ...< In [5].
Remarque : Un atome gazeux est libre de toute intéraction.
II.4.2.4. L’affinité électronique
L’ affinité électronique A est égale à 1'énergie nécessaire pour arracher un électron à l’anion
gazeux.
C'est 1'énergie correspondant à la réaction :
A → A + e
Cette réaction peut être exothermique ou endothermique. Par convention, A est positive si la
reaction est exothermique.
Le tableau périodique .Chapitre II
32
II.5. Conclusion
À mesure qu'augmentait le nombre d'éléments connus, les chimistes du XIXe siècle
éprouvaient le besoin de les ordonner. On connaissait les masses atomiques et on avait déjà
l'habitude de classer les éléments d'après l'augmentation de cette caractéristique. La simple
progression des masses atomiques ne pouvait toutefois expliquer logiquement les différents
comportements des éléments [4].
Il est en effet une sorte de miracle que la mécanique quantique explique le tableau
périodique. Mais nous ne devrions pas se laisser séduire en croyant que c’est une explication
déductive. Une chose qui est claire: est que la tentative d'expliquer les détails de la
classification périodique continue à défier l'ingéniosité des physiciens quantiques et chimistes
quantiques et que le tableau périodique continuera de présenter un test concernant la
pertinence des nouvelles méthodes développées en chimie quantique. La réduction de la
chimie à la mécanique quantique n'a ni complètement échoué, comme certains philosophes de
la science ont revendiqué, et elle n'a pas été une réussite complète, comme certains historiens
contemporains ont revendiqué [1].
Le tableau périodique .Chapitre II
33
II.6. Références
[1] Eric R. Scerri, « The periodic table : its story and its significance », Published by Oxford
University Press, Inc, (2007).
[2] Bernadette Bensaude-Vincent, Jonathan Simon, « Chemistry the impure science »,
Imperial College Press, (2008), ISBN-13 978-1-84816-225-9.
[3] Union des professeurs de physique et de chimie, http://www.udppc.asso.fr/.
[4] Le repaire des sciences, http://www.lerepairedessciences.fr
[5] Melania Kiel, Chimie générale, ed. ESTEM, (2003). ISBN : 2 84371 219 X.
[6] Peter Atkins, Loretta Jones, « Chemistry. Molecules, Matter and Change », 3rd. ed., W.
H. Freeman and Company, New York, New York and Basingstoke (1997).
ISBN 2-7445-0028-3.
[7] André Durupthy, Jacques Estienne, Magali Giacino, Alain Jaubert, Claude Mesnil,
« Physique, Chimie et sciences de l’ingénieur » (PCSI), I.S.B.N. 978-2-0118-1752-5.
www.hachette-education.com
[8] Miseur Ludovic, « La Chimie.net », <http://www.lachimie.net>, (Novembre 2014).
[9] Andrew Ede, « The chemical element : a historical perspective », Greenwood Publishing
Group, Inc (2006). http://www.sciences-en-ligne.com. [10] http://www.web-sciences.com.
[11] Jacques Le Coarer, « Chimie le minimum à savoir », EDP Sciences, (2003).
[12] J. –F. Marucco, “Chimie des solides”, EDP Sciences, (2004), ISBN: 2-86883-673-9.
CHAPITRE III
Le data mining et ses techniques d'analyse de données
Chapitre III. Le data mining et ses techniques d’analyse de données
34
III. 1. Introduction
Le data mining, dans sa forme et compréhension actuelle, à la fois comme champ
scientifique et industriel, est apparu au début des années 90. On peut voir le data mining
comme une nécessité imposée par le besoin des entreprises de valoriser les données qu’elles
accumulent dans leurs bases. En effet, le développement des capacités de stockage et les
vitesses de transmission des réseaux ont conduit les utilisateurs à accumuler de plus en plus
de données. Certains experts estiment que le volume des données double tous les ans. Que
doit-on faire avec des données coûteuses à collecter et à conserver? [1].
L'exploration de données est le processus de découvrir les modèles pertinents,
intéressants et novatrices, ainsi que des modèles descriptifs, compréhensibles, et prédictifs de
données à grande échelle [2].
III.2. Différentes définitions du Data Mining
Première définition
Le Data Mining est un processus non-trivial d’identification de structures inconnues, valides
et potentiellement exploitables dans les bases de données (Fayyad, 1996) [3].
Deuxième définition
Le Data Mining est une partie (ou une étape) du processus d’extraction de connaissances à
partir de données (ECD) en Français, ou (KDD) (Knowledge discovery in Databases) en
anglais.
Troisième définition
Le data mining est un processus qui fait intervenir des méthodes et des outils issus de
différents domaines de l’informatique, de la statistique ou de l’intelligence artificielle en vue
de découvrir des connaissances utiles [2].
III.3. Historique
L’expression « data mining » est apparue vers le début des années 1960 et avait, à
cette époque, un sens péjoratif. En effet, les ordinateurs étaient de plus en plus utilisés pour
toutes sortes de calculs qu’il n’était pas envisageable d’effectuer manuellement jusque là.
Chapitre III. Le data mining et ses techniques d’analyse de données
35
Certains chercheurs ont commencé à traiter sans a priori statistiquement les tableaux de
données relatifs à des enquêtes ou des expériences dont ils disposaient. Comme ils
constataient que les résultats obtenus, loin d’être aberrants, étaient encourageants, ils furent
incités à systématiser cette approche opportuniste.
Cette attitude opportuniste face aux données coïncida en France avec la diffusion
dans le grand public de l’analyse de données dont les promoteurs, comme Jean-Paul
Benzecri, ont également dû subir dans les premiers temps les critiques venant des membres
de la communauté des statisticiens.
Le succès de cette démarche empirique ne s’est malgré tout pas démenti. L’analyse
des données s’est développée et son intérêt grandissait en même temps que la taille des bases
de données. Vers la fin des années 1980, des chercheurs en base de données, tel que Rakesh
Agrawal, ont commencé à travailler sur l’exploitation du contenu des bases de données
volumineuses, convaincus de pouvoir valoriser ces masses de données dormantes. Ils
utilisèrent l’expression « database mining » mais, celle-ci étant déjà déposée par une
entreprise (Database mining workstation), ce fut « data mining » qui s’imposa. En mars
1989, Shapiro Piatetski proposa le terme « knowledge discovery » à l’occasion d’un atelier
sur la découverte des connaissances dans les bases de données.
La communauté de « data mining » a initié sa première conférence en 1995 à la suite
de nombreux workshops sur le KDD entre 1989 et 1994. En 1998, s’est créé, sous les
auspices de l’ACM, un chapitre spécial baptisé ACM-SIGKDD, qui réunit la communauté
internationale du KDD. La première revue du domaine « Data mining and knowledge
discovery journal » publiée par « Kluwers » a été lancée en 1997 [2].
III.4. La démarche du Data Mining
Le Data Mining est une démarche plus qu’une théorie, et qui comprend les étapes suivantes :
1- Formalisation des objectifs
2- Acquisition des données
3- Préparation des données
4- Apprentissage – application des méthodes
5- Interprétation – explication
6- Evaluation et validation
7- Déploiement [4].
Chapitre III. Le data mining et ses techniques d’analyse de données
36
III.4.1. Valorisation des données
Au-delà de l’origine de la paternité de l’expression « data mining », nous allons
maintenant nous intéresser à l’émergence de ce champ à la fois technologique et scientifique.
L’exploitation des données pour en extraire des connaissances est une préoccupation
constante de l’être humain car elle est une condition essentielle de son évolution. L’homme a
toujours mémorisé sur des supports différents des informations qui lui ont permis d’inférer
des lois. La biologie, la physique, la chimie ou la sociologie, pour ne citer que ces
disciplines, font largement usage de l’approche empirique pour découvrir des lois et ou faire
ressortir des éléments structurants dans des populations. La statistique est devenue une
science dont l’objet est de donner un cadre rigoureux à la démarche empirique. C’est au sein
de la statistique et du domaine des bases de données que le data mining a puisé ses outils.
Les historiens des sciences, s’ils ne l’ont pas déjà fait, vont certainement nous proposer de
nombreuses théories pour mieux situer le data mining dans le domaine des sciences [2].
III.4.2. Définition d’un modèle
Construire des modèles a toujours été une activité des statisticiens. Un modèle est un
résumé global des relations entre les variables, permettant de comprendre des phénomènes,
et d’émettre des prévisions.
Le Data Mining ne traite pas d’estimation et de tests les modèles préspécifiés, mais elle
découvre des modèles à l’aide d’un processus de recherche algorithmique d’exploration de
modèles. En Data Mining les modèles ne sont pas issus d’une théorie mais de l’exploration
des données. [5]
Chapitre III. Le data mining et ses techniques d’analyse de données
37
Figure III.1 : Technologies et modèle général du data mining [2].
III.4.3. Les modèles prédictifs
Ils ont pour but de déterminer une fonction (ou un modèle) qui associe des entrées et
des sorties. Les régressions, les arbres de décision, sont les méthodes les plus utilisées. Ces
méthodes sont des méthodes supervisées en ce sens qu’il faut préciser quelles sont les
entrées et quelle est la sortie à prédire.
En fonction de la nature de la variable de sortie, deux sous catégories d’outils coexistent :
- Si la variable de sortie est de type discret, la classification aura pour rôle de construire
le modèle qui permettra de classifier correctement les enregistrements, c'est-à-dire d’assigner
des catégories prédéfinies aux données.
− Si la variable de sortie est de type continu, l’estimation consistera à compléter une
valeur manquante dans un champ particulier en fonction des autres champs de
l’enregistrement. Les outils statistiques usuels de régression sont les plus employés.
III.4.4. La segmentation
Est un apprentissage non supervisé (on ne définit pas ce qui est "entrées" et ce qui est
"sorties") qui vise à identifier des ensembles d’éléments qui partagent certaines similarités.
Les algorithmes de segmentation maximisent l’homogénéité à l’intérieur de chaque
ensemble et maximisent l’hétérogénéité entre les ensembles. Différentes méthodes sont
utilisées pour définir ces groupes.
Chapitre III. Le data mining et ses techniques d’analyse de données
38
III.4.5. La description (ou identification de modèles fréquents)
Elle consiste à expliquer les relations existantes dans les données.
- Les méthodes cherchent à identifier les associations entre des variables.
- L’analyse des liens et les techniques de visualisations sont couramment utilisées dans ce
but.
- Les techniques de visualisation sont utilisées pour simplifier la compréhension des données
à l’aide de représentations graphiques adaptées.
- Les règles d’associations représentent des combinaisons de variables avec des niveaux
prédéfinis de régularité [6].
III.4.6. Les deux types de techniques du Data Mining
III.4.6.1. Les techniques descriptives
- Visent à mettre en évidence des informations présentes mais cachées par le volume des
données.
- Réduisent, résument, synthétisent les données.
- Il n’y a pas de variable « cible » à prédire.
III.4.6.2. Les techniques prédictives
- Visent à extrapoler de nouvelles informations à partir des informations présentes (c’est le
cas du scoring).
- Expliquent les données.
- Il y a une variable « cible » à prédire [7].
III.4.6.3 Comparaison entre le data Mining et la statistique
Cependant on s’aperçoit bien vite que les principales applications du Data Mining
concernent plus la recherche de modèles que de structures comme les définit D.J.Hand « Un
modèle est une représentation simplifiée des relations existantes entre les variables dans un
but de synthèse et de prévision » [8 ,9]
Chapitre III. Le data mining et ses techniques d’analyse de données
39
Modéliser a toujours été une activité essentielle des statisticiens, et on peut se demander
en effet ce qu’il y’a de nouveau avec le Data Mining.
- La réponse est qu’en Data Mining le modèle provient des données et n’est pas choisi a
priori.
- Dans la pratique statistique habituelle, le modèle découle d’une théorie (économique,
physique, biologique….) et le but est d’estimer et de tester les paramètres du modèle.
- En Data Mining le modèle final vient après une exploration combinatoire d’un grand
nombre de modèles [10].
III.4.6.4 Que peut-on trouver et prouver réellement avec le Data Mining ?
Il faut donc se garder de certaines illusions : découvrir des structures « inattendues » est
également une idée trompeuse.
On a d’autant plus de chances de trouver quelque chose d’intéressant que l’on connaît
mieux ses données. [10]
III.4.6.5 Conclusions
- Le Data Mining est une discipline née en dehors de la statistique, dans le but de valoriser
les bases de données.
- Le Data Mining offre des perspectives nouvelles pour la statistique et répond au défi du
traitement des gigabases de données [5].
Chapitre III. Le data mining et ses techniques d’analyse de données
40
III.5. L’Analyse en Composantes Principales
III.5.1. Introduction
L'Analyse en Composantes Principales (Principal Component Analysis) est une
méthode statistique de projection de données multidimensionnelles, utilisée pour la réduction
de la dimension de données, elle fait partie du groupe des méthodes descriptives appelées
méthodes factorielles. La méthode est basée sur l'hypothèse qu'il existe de fortes corrélations
entre les données étudiées. Le but de l’ACP est de condenser les données originelles en de
nouveaux groupements, appelées nouvelles composantes, de façon à ce qu'elles ne présentent
plus de corrélation entre elles et soient ordonnées en terme de pourcentage de variance
apportée par chaque composante [11, 12, 13].
III.5.2. Historique
C’est H.Hotelling (1930) qui avait posé les fondements de l’analyse en composantes
principales [11], en développant les travaux de C.Spearman [14], et de K.Pearson [12] qui
dataient du début du siècle. Jusqu’aux années 60, en particulier par Jean-Paul Benzécri qui a
beaucoup exploité les aspects géométriques et les représentations graphiques. [15] ces
méthodes étaient perfectionnées et s’enrichissaient de variantes mais toutes restaient
inabordables pour les praticiens car elles nécessitaient une masse considérable de calculs.
Aujourd’hui, grâce à l’outil informatique, ces méthodes sont de plus en plus utilisées.
III.5.3. L’analyse de données
Aujourd’hui, l’analyse de données est couramment utilisée dans un bon nombre
d’activités et de disciplines de base comme : la physique, la chimie,…etc. [11,14], et qui
utilisent des « faits numériques » qu’on appelle données.
Avant toute analyse statistique, il est indispensable de consacrer du temps à examiner
les données et d’en faire un tableau facilement exploitable.
La statistique classique s’est axée sur l’étude d’un nombre restreint de paramètres
mesurés sur un petit ensemble d’individus .Elle a développé les notions d’estimations et de
tests fondés sur des hypothèses probabilistes très restrictives. Les méthodes d’analyse de
données permettent une étude globale des individus et des variables en utilisant
Chapitre III. Le data mining et ses techniques d’analyse de données
41
généralement des représentations graphiques suggestives. Les données peuvent être
analysées selon plusieurs points de vue. La recherche des ressemblances ou des différences
entre individus peut être un objet de l’analyse. En utilisant des méthodes factorielles comme
l’Analyse en Composantes Principales, il est possible de représenter les proximités entre
individus sur un même graphique [16].
III.5.4. La nature des données [17]
III.5.4.1. Définition des variables
Les variables correspondent aux intitulés des colonnes du tableau de données, elles sont
également appelées paramètres ou caractères ; elles forment un espace dans lequel chaque
individu est représenté par un point. Les coordonnées des points sont égales aux valeurs
respectives des variables.
III.5.4.2. Définition des individus
L’individu est l’entité de base sur laquelle l’observateur réalise un certain nombre de
mesures. Il est parfois appelé critère. Chaque individu est défini à partir de plusieurs
variables quantitatives et/ou qualitatives.
- Une variable est quantitative lorsqu’elle prend ses valeurs sur une échelle numérique, plus
précisément lorsque l’ensemble des valeurs qu’elle prend sur les individus est inclus dans
l’ensemble des nombres réels et que l’on peut effectuer sur cette variable des opérations
algébriques habituelles : additions, multiplications …etc.
- Une variable est qualitative lorsqu’elle prend des modalités non numériques : appréciations,
couleurs, descriptions, … etc.
III.5.4.3. Le centrage et la réduction des données brutes
Dans ce paragraphe, nous présentons un exemple de codage très fréquemment utilisé
dans le cadre de l’analyse de données : le codage des données brutes en données centrées et
centrées réduites.
- Pour obtenir des données centrées, il faut remplacer xij par (xij- xj) où xj représente la
moyenne arithmétique des valeurs prises par la variable xj.
Chapitre III. Le data mining et ses techniques d’analyse de données
42
- Pour obtenir des données centrées réduites notées X ij , on divise par l’écart type des valeurs
prises par la variable xj.
Ce qui donne : X ij = xij - xj σ (xj)
III. 5.4.3.1. Les paramètres de dispersion
Les paramètres de dispersion sont des nombres qui mesurent la dispersion (ou la
répartition) des individus autour d’un paramètre de position (par exemple la moyenne
arithmétique). Ils s’expriment dans la même unité que les données et permettent de comparer
des séries de même nature [18,19].
III. 5.4.3.2. Caractéristique de la tendance centrale
Pour chacune des valeurs Xij, on définit la moyenne arithmétique des valeurs observées ou
mesurées à partir de la formule :
n Xj = 1 ∑ xij n i = 1
III. 5.4.3.3. Caractéristique de la dispersion
La notion de dispersion complète les informations sur la tendance centrale. Il arrive que l’on
traduise la dispersion des données à partir de l’étendue :
Étendue = Xij max - Xij min
III. 5.4.3.4. La variance
La variance est un indicateur de dispersion reflétant l’importance des fluctuations des
valeurs prise par une variable xj de la série autour de leur moyenne arithmétique. Elle s’écrit :
n Var(Xj) = 1 ∑ (xij – xj)2
n i = 1
- Pour les données centrées réduites, la variance de chaque variable est égale à 1.
Chapitre III. Le data mining et ses techniques d’analyse de données
43
III. 5.4.3.5. L’écart type
Le calcul de l’étendue ne prend en compte que deux valeurs observées ; de plus il s’agit des
valeurs extrêmes. On préfère caractériser la dispersion à partir de l’écart type expérimental
σ (xj ) :
σ (xj) = [Var (xj)]1/2
III. 5.5. Qu'est-ce qu'une base de données ?
Une base de données (son abréviation est BD, en anglais DB, database) est une entité
dans laquelle il est possible de stocker des données de façon structurée et avec le moins de
redondance possible. Ces données doivent pouvoir être utilisées par des programmes, et par
des utilisateurs différents. [20]
Ces bases de données sont généralement construites dans le but soit d’archiver les
informations relatives à un domaine particulier, soit d’apporter une réponse à un problème
précis, à l’image des réponses issues de sondages.
III. 5.6. Principe de l'Analyse en Composantes Principales (ACP)
Les données sont rangées dans un tableau comportant souvent un grand nombre
d’individus n, et un grand nombre de variables p ; la simple lecture de ce tableau ne permet
pas de saisir l’essentiel des informations qu’il contient. L’analyse en composantes
principales est une méthode de projection qui résume et décrit ce tableau de données .Si un
tableau de données comporte p variables quantitatives, on dira que les individus sont
représentés dans un « espace à p dimensions ».
Le but de l’A.C.P est de trouver des « espaces de dimensions plus petites », dans
lesquels il est possible d’observer « au mieux » les individus [21], et de mieux connaître les
données sur lesquelles on travaille, et à détecter éventuellement des valeurs suspectes, et
aidera à formuler des hypothèses qu’il faudra étudier à l’aide de modèles et d’études
statistiques inférentielles.
Chapitre III. Le data mining et ses techniques d’analyse de données
44
III. 5.7. Le processus de l'Analyse en Composantes Principales [11, 12, 13]
Le processus d'Analyse en Composantes Principales consiste dans un premier temps à
calculer la matrice de covariance R entre les p vecteurs initiaux. Le terme général de la
matrice de covariance R s'écrit sous la forme :
Rij = ∑P (r ik - rk) (r jk - rk) (1) K
rik : Le coefficient de corrélation entre le vecteur i et le vecteur k
rik : La moyenne des coefficients rik; ∀ i.
La matrice de covariance R est alors diagonalisée :
R = V UV t (2)
V : Une matrice contenant les vecteurs propres vi de R, c'est-à-dire les coordonnées des p
nouveaux axes.
Ces vecteurs propres représentent les nouvelles composantes (Figure III.3. ).
U : Une matrice diagonale contenant les valeurs propres λi de R, c'est-à-dire la variance des p
nouvelles composantes (Figure III.2. et III.3 ). Les valeurs propres sont rangées par ordre
décroissant.
Figure III.2 : Illustration en 2D de la réduction de la dimension. La première composante
contient le maximum d’information (maximum de variance). [11, 12, 13]
Chapitre III. Le data mining et ses techniques d’analyse de données
45
Figure III.3 : Représentation en 2D des 2 vecteurs propres et des 2 valeurs propres associés
aux deux nouvelles composantes. [11, 12, 13]
- Enfin, les valeurs propres λi peuvent être normalisées pour obtenir les pourcentages de concentration δi de l'information dans chaque nouvelle composante : δi = λi x 100 (3) ∑K λK
- La nature de l'information contenue dans chaque composante principale peut être connue en
calculant la matrice de corrélation variables-composantes G.
Les éléments Gij de la matrice G représentent les coefficients de corrélation entre les
composantes initiales et les nouvelles composantes et se calculent à partir de :
Gij = (λi)1/2 vj (4)
Le processus de réduction de la dimension consiste à conserver les k (k < p)
premières nouvelles composantes, qui seront alors appelées composantes principales.
Aucune règle générale n'existe quant au choix du nombre k de composantes principales. La
valeur k peut être déterminée par l'étude des valeurs propres ou par l'étude visuelle des
images :
- Kaiser (1958) suggère de conserver les k premières composantes ayant une valeur propre
supérieure à 1.
III. 5.7.1. Construction des axes principaux, démarche géométrique
Les droites et les plans issus d’une ACP ne sont pas réalisés avec les variables initiales
mais avec des « indices synthétiques » obtenus à partir de « combinaisons linéaires » des
variables initiales. Parmi tous les indices possibles, l’ACP recherche d’abord celui qui
Chapitre III. Le data mining et ses techniques d’analyse de données
46
permet de voir au mieux les individus c’est–à-dire celui pour lequel la variance des individus
est maximale : cet indice est appelé 1ère composante principale portée par le 1er axe
principal appelé axe 1 ou PC1. Une certaine proportion de la variation totale des individus
est expliquée par cette composante principale.
Ensuite une deuxième composante principale est recherchée, la variance (PC2) doit
être, à son tour, la plus grande possible. Ainsi, cette deuxième composante principale fournit
la plus grande information possible complémentaire à la première.
Le processus se déroule jusqu’à l’obtention de la pième et dernière composante
principale, les parts d’informations expliquées par chacune d’elles devenant de plus en plus
faibles (avec p variables, on obtient p composantes principales).
- L’intersection de tous les axes principaux se situe au centre de gravité du nuage de points
[22].
Figure III.4 : Projection des individus dans le plan principal. [22]
III. 5.7.2. Calcul matriciel
Pour obtenir les composantes principales de façon analytique, on procéde en deux étapes :
1- Elaboration de la matrice des corrélations.
2- Faire une diagonalisation, qui permet d’obtenir une matrice de vecteurs propres, qui
contient les coefficients des combinaisons linéaires des p variables actives et la matrice
« diagonale » de valeurs propres [23].
Chapitre III. Le data mining et ses techniques d’analyse de données
47
Les valeurs propres qui représentent les variances des individus sur les axes principaux
correspondants.
Les vecteurs propres permettent le calcul des composantes principales et donc le calcul
des coordonnées des variables et des individus sur les nouveaux axes principaux [24].
III. 5.8. Conclusion
L'ACP est une technique mathématique qui réduit la dimensionnalité d'un système
complexe de corrélations à un nombre réduit de dimensions, néanmoins représentatives de la
majorité de la variance totale des données. On passe d'un certain nombre de variables
potentiellement corrélées à un plus petit nombre de variables décorrélées, les "Composantes
Principales".
Ensuite, un changement de base est effectué à la nouvelle base des "Composantes
Principales" afin de représenter les données dans le nouvel espace. L'utilisateur choisit le
nombre d'axes utilisés pour la représentation, en se basant par exemple sur le pourcentage de
variance représenté.
Chapitre III. Le data mining et ses techniques d’analyse de données
48
III.6. La méthode des moindres carrés partiels (PLS)
III.6.1. Introduction-Problématique
De nombreux problèmes peuvent être décrits sous la forme d'un modèle de régression, où
l'on possède des variables X sur lesquelles on peut plus ou moins agir et des variables Y que
l'on ne peut qu'observer.
L'objectif est alors de d’écrire les relations entre Y et X, en l'absence de modèle
théorique. Le problème est que le nombre de variables X est souvent très important par
rapport au nombre d'observations. La régression PLS est une méthode d'analyse des données
spécifiquement construite pour l'étude de ce type de problème. [25]
III.6.2. Historique
La régression PLS (Partial Least Squares regression) en anglais, ou (La régression des
moindres carrés partiels) en Français, est une technique d'analyse et de prédiction
relativement récente. Elle a été conçue pour faire face aux problèmes résultants de
l'insuffisance de l'utilisation de la régression linéaire classique, qui trouve ses limites dès lors
que l'on cherche à modéliser des relations entre des variables pour lesquelles il y a peu
d'individus, ou beaucoup de variables explicatives en comparaison au nombre d'individus, ou
encore lorsque les variables explicatives sont fortement corrélées entre elles.
La régression PLS tire son origine des sciences sociales (plus précisément des sciences
économiques, Herman Wold 1966 [27], mais devient très populaire en chimie grâce au fils
d'Herman, Svante.
1966 : Herman Wold publie un ouvrage introduisant le PLS, alors appelé (Non Linear
Iterative Partial Least Squares) NIPALS.
1983 : Svante Wold (le fils d'Herman) et Harold Mertens [27] adaptent NIPALS au problème
de régression avec trop de prédicteurs et appèlent PLS cette adaptation de l'algorithme.
1990 : Stone et Brooks [28] introduisent le PLS dans le contexte du "Continuum Regression"
En France, Michel Tenenhaus s'est beaucoup intéressé à cette méthode et a réalisé de
nombreux travaux à ce sujet. Par ailleurs, Tenenhaus M. pense que la régression PLS pourrait
connaître les mêmes succès qu'en chimie si elle était utilisée dans d'autres domaines. [25]
Chapitre III. Le data mining et ses techniques d’analyse de données
49
III.6.3. Définition de la régression PLS ?
La régression PLS est une méthode statistique permettant d'identifier des relations entre
plusieurs variables. Il y a toujours, d'une part, les variables explicatives (notées généralement
x1, ..., xp), et les variables expliquées (notées généralement y1, ..., yq). Ces variables sont,
dans une régression PLS, toutes étudiées sur les mêmes « individus ».
On distingue la régression PLS univariée, ou « régression PLS1 », de la régression PLS
multivariée, appelée également « régression PLS2 ». Dans le premier cas, la régression ne
porte que sur une seule variable expliquée. Dans le second, il peut y avoir plusieurs variables
expliquées. [25]
III.6.4. Les objectifs de la régression PLS
La régression PLS répond à deux objectifs :
-La prédiction : Relier un bloc de variables à expliquer Y à un bloc de variables explicatives
X.
- La description : Décrire simultanément les relations entre les variables composant le bloc
des X, et les variables composant le bloc des Y, et les liaisons entre X et Y. [25, 29, 30].
III.6.5. Les versions de la régression PLS
Il y’a différentes version de la régression PLS qui sont proposées en fonction de l’objectif
poursuivi:
PLS1 : Une variable cible Y quantitative est à expliquer, modéliser, prévoir par p variables
explicatives quantitatives Xj.
PLS2 : Version canonique. Mettre en relation un ensemble de q variables quantitatives Yk et
un ensemble de p variables quantitatives Xj.
PLS2 : Version régression. Chercher à expliquer, modéliser un ensemble de q variables Yk
par un ensemble de p variables explicatives quantitatives Xj.
PLS-DA : Version discriminante. Cas particulier du cas précédent. La variable Y qualitative
à q classes est remplacée par q variables indicatrices (dummy variables) de ces
classes [31].
Chapitre III. Le data mining et ses techniques d’analyse de données
50
III.7. Le principe de la régression PLS [32]
III.7.1. Données et notations
Les notations de la régression PLS sont relativement bien standardisées dans la littérature, et
sont :
N = Nombre d’individus
M = Nombre de variables indépendantes Xj
P = Nombre de variables dépendantes Yk
A = Nombre de composantes retenues
X = Matrice des données (NxM) pour les variables indépendantes
Y = Matrice des données (NxP) pour les variables dépendantes
E0 = Matrice des variables Xj centrées-réduites
F0 = Matrice des variables Yk centrées-réduites
Eh = Matrice des résidus de la décomposition de E0 en utilisant h composantes
Ehj = j-ième colonne de Eh
Fh = Matrice des résidus de la décomposition de F0 en utilisant h composantes
Fhk = k-ième colonne de Fh
III.7.2.La méthode PLS
Il s’agit d’étudier les liaisons entre les variables dépendantes Yk et les variables
indépendantes Xj en prenant en compte les relations internes entre les variables de chaque
groupe .L’algorithme de la régression PLS est itératif , il est décrit dans ce qui suit :
Etape 0 : On part des tableaux E0 et F0.
Etape 1 : On construit une combinaison linéaire u1 des colonnes F0 et une combinaison
linéaire t1 des colonnes E0, maximisant cov (u1, t1)=cor (u1, t1). [var (u1). var (u2)] 1/2
- On obtient donc deux variables u1 et t1 aussi corrélées que possible et résumant au mieux les
deux tableaux E0 et F0 .
- On construit ensuite les régressions :
E0 = t1 p’1 + E1
F0 = t1 r’1 + F1
Chapitre III. Le data mining et ses techniques d’analyse de données
51
Etape 2 : On reprend l’étape 1 en remplaçant les tableaux E0 et F0 par E1 et F1. On obtient
donc deux nouvelles composantes : u2, combinaison linéaire des colonnes de F1, t2 ,
combinaison linéaire des colonnes de E1 .
- D’où les décompositions obtenues par régression :
E0 = t1 p’1 + t2 p’2+ E2
F0 = t1 r’1 + t2 r’2 + F2
On itère la procédure jusqu’à ce que les composantes t1,..., tA expliquent suffisamment F0.
Les composantes th sont des combinaisons linéaires des colonnes d’E0, et non corrélées entre
elles.
De la décomposition F0 = t1 r’1 +……….. + th r’h + Fh, on peut donc déduire les équations
de régression PLS :
Yk = βk0 + βk1 X1 + ……. + β kM XM + FhK
III.7.3. Indépendance des composantes dans la régression PLS
L'une des propriétés primordiales d'une régression PLS est l'indépendance des
composantes t i, t2,…..., th formées à partir des variables explicatives. En effet, la première
composante t i est formée à partir des variables explicatives, en leur donnant certains
coefficients sur la base de leur covariance avec la variable expliquée « y » (ou de leur
coefficient de corrélation avec la variable y si les variables sont centrées réduites). Pour se
faire, la variable ti sera représentative d'une partie de la variance des variables explicatives.
Bien entendu, si « y » n’est pas une combinaison linéaire des variables explicatives, et
qu'il y a plus d'une variable explicative dans l'analyse (et qu'aucune de ces variables n'est
combinaison linéaire des autres), la variable t i sera insuffisante pour expliquer toute la
variance de « y », de même qu'elle sera insuffisante pour expliquer toute la variance des
variables explicatives, et toute la covariance des variables explicatives avec « y ».
Il en demeurera un résidu. La variance de « y » ne sera pas totalement expliquée par la
variance de ti . Il y a un moyen d'améliorer le pouvoir explicatif du modèle. Pour cela, on
s'intéresse aux résidus, qui ont été « oubliés » par la première composante. Cette première
composante est indépendante des résidus. Or, on se sert de ces résidus pour construire la
seconde composante t2, qui sera par la même occasion indépendante de t i. La composante t2
s'intéressera donc à la variance de « y » qui n'est pas expliquée par t i. Les résidus qui en
résulteront, qui sont donc indépendants de t2, et indépendants de t i (ils sont le résultat d'une
régression sur des résidus qui sont déjà indépendants de t i), serviront à la création de t3, (t3
Chapitre III. Le data mining et ses techniques d’analyse de données
52
sera donc indépendante de t i et t2). Il en ira de même pour toutes les composantes, qui seront
toutes indépendantes entre elles. [25]
III.8. Les avantages de la régression PLS
La régression PLS peut se caractériser comme étant une méthode robuste, fiable,
s'appliquant dans de nombreux cas, et étant plus générale que ne l'est la régression linéaire.
[33], c’est une technique très puissante pour la modélisation des relations structurelles sur
variables latentes (concepts, facteurs). [25, 29, 30].
Ses principaux avantages, peuvent se résumer ainsi :
- La régression PLS fonctionne bien sur un échantillon de taille faible, pouvant même être
inférieur au nombre de variables explicatives.
- La régression PLS permet de compenser, partiellement, une baisse de qualité de
l'échantillon.
- La régression PLS permet d'éviter certains problèmes engendrés par la multicolinéarité des
variables.
- La régression PLS, dans son approche multivariée, permet d'expliquer plusieurs variables
endogènes.
- La régression PLS, dans un algorithme plus général, permet de créer un modèle en tenant
compte des individus présentant certaines données manquantes, sans avoir recours à des
méthodes d'estimation des données manquantes. [33]
- Avec la régression PLS on a la possibilité de travailler sur des données individuelles et de
faire de la prévision. [25, 29, 30].
- La simplicité de son algorithme : ni inversion, ni diagonalisation de matrices, mais
seulement une succession de régressions simples, autrement dit des calculs de produits
scalaires. On peut donc traiter de très grands ensembles de données.
- La régression PLS donne en pratique d’excellentes prévisions, même dans le cas d’un petit
nombre d’observations et d’un grand nombre de variables. [34,35]
Chapitre III. Le data mining et ses techniques d’analyse de données
53
III.9. Conclusion
La régression PLS permet de rapprocher le statisticien du chercheur dans les problèmes
de modélisation. En général ce dernier souhaite en effet conserver dans son modèle toutes les
variables importantes tout en obtenant des équations de régression cohérentes. [32].
Bien que cette méthode ait connu la plupart de ses succès dans le domaine de la chimie,
on peut penser qu'elle pourrait facilement être transposée à d'autres domaines,
particulièrement dans ceux où le nombre d'individus actifs est faible (en comparaison au
nombre de variables explicatives) et où les variables explicatives sont significativement
corrélées entre-elles. [33]
Chapitre III. Le data mining et ses techniques d’analyse de données
54
III.10. Références
[1] Djamel Abdelkader ZIGHED, Ricco RAKOTOMALALA, « Extraction de connaissances
à partir de données (ECD) - Objet du data mining », Techniques de l’Ingénieur,
(2002).
[2] Mohammed J. Zaki andWagner Meira Jr., « Data mining and analysis, Fundamental
Concepts and Algorithms », Cambridge University Press, 1st ed., (2014).
[3] Fayyad U.M., Piatetsky-Shapiro G., Smyth P., and Uthurusamy R. (eds.) Advances in
Knowledge Discovery and Data Mining. Menlo Park, California: AAAI Press ,1996.
[4] Gilbert Saporta, Chaire de Statistique Appliquée, http://cedric.cnam.fr/~saporta/DM.
[5] Equipe de recherche en Ingénierie des Connaissances, Laboratoire ERIC,
http://chirouble.univ-lyon2.fr/~ricco/cours/ .
[6] Bruno Agard, Andrew Kusiak, “ Exploration des bases de données industrielles à l’aide
du data mining –Perspectives ”, 9ème Colloque National Aip Primeca, La Plagne - 5-8
avril 2005.
[7] Stéphane Tufféry - Data Mining – (2006) - http://data.mining.free.fr .
[8] Hand.D.J, “ Why Data Mining is more than statistics write large ”, Bulletin of
the International Statistical Institute, 52nd Session .Helsinki, Vol. 1, (1999) 433-436.
http://www.stat.fi/isi99/index.html
[9] Hand.D.J, “ Methodological issues in Data Mining ”, Compstat 2000 :
Proceedings in Computational Statistics .ed. J.G. Bethlehem and P.G.M.vau der
Heijden, Physica-Verlag, (2000) 77-85.
[10] Saporta G, “ Data Mining and Official Statistics ” .Quinta Conferenza Naionale
di Statistica, ISTAT, Roma (2000).
[11] H.Hotelling, “ Analysis of Complex Statistical Variables Into Principal Components ”,
Journal of Educational Psychology, 1933, vol. 24,417-441 ,408-520.
[12] K.Pearson, “ On Lines and Planes of Closest Fit to System of Points in Space ”,
Philos.Mag., (1901), n° 11,559-572.
[13] Kaiser H. “ The Varimax Criterion for Analytic Rotation in Factor Analysis”,
Psychometrika 23, (1958). 187-200.
[14] C.Spearman, “ General intelligence objectively determined and measured ”, American
Journal of Psychology, 1904, vol.28, 129-149.
[15] C. Duby, S. Robin, "Analyse en Composantes Principales", Département O.M.I.P
(2006).
Chapitre III. Le data mining et ses techniques d’analyse de données
55
[16] M.Volle, “ Analyse des données ”, Collection « économie et statistiques avancées »,
Ed, Economica .1993.
[17] J-M Bouroche, G.Saporta, “ L’analyse des données ”, Ed .Que sait- je ? , 2002, 3-4.
[18] P.Casin, “ Analyse des données et des panels de données ”, Ed. DeBoeck, Université
perspectives marketing, 1999.
[19] G.Chauvat, J-Preau, Statistiques descriptives, Ed Armand colin Editeur, 2002.
[20] Site internet : http://www.commentcamarche.net/ .
[21] P.Fenelon., “ Qu’est ce que l’analyse des données ? ”, Ed.Lefonen, Paris, 1981.
[22] G.Phillippeau, “ Comment interpréter les résultats d’une analyse en composantes
principales ? ”, Collection STAT-ITCF-Ed.1992.
[23] R.Rodriguez Herrerra, D.Salles.Le Gac, “ Initiation à l’analyse factorielle des
données ”, Ellipse, 2002.
[24] Site internet : http://www.lemoal.org/spss/ .
[25] Tenenhaus M., « La Régression PLS: Théorie et Pratique », Editions Technip, (2002).
[26] Wold, H. (1966), « Estimation of principal component and related models by iterative.
least squares, Multivariate Analysis », ed. P.R. Krishnaiah, Newyork : Academic Press,
391-420.
[27] Stone, M. & Brooks, R. (1990), « Continuum regression: Cross-validated sequentially
constructed prediction embracing ordinary least squares, partial least squares, and
principal components regression », Journal of the Royal Statistical Society, Series B,
52(2), 237-269.
[28] Wold, S., Martens, H. & Wold, H. (1983), « The multivariate calibration problem in
chemistry solved by the PLS method », in Proc. Conf. Matrix Pencils, Ruhe A..(Eds),
March 1982, Lecture Notes in Mathematics, Springer Verlag, Heidelberg, PP. 286-293.
[29] ECSI ‘2000: « Use of PLS Path Modelling to estimate the European Consumer
Satisfaction Index (ECSI) model », MP Bayol, C Tellier, MTenenhaus
(www.cisia.com/cisia/download/PLS_CISIA.doc).
[30] PLS' 2001 : « 2ème Symposium International sur les Méthodes PLS », Capri Palace, Île
de Capri (Naples, Italie), (2001), CISIA·CERESTA, HEC et l'Université de Naples
"Federico II".
[31] M. Tenenhaus, La régression PLS : théorie et applications, Technip, 1998.
[32] Tenenhaus, J.-P.Gauchi, C.Ménardo, « Régression PLS et applications », Revue de
statistique appliquée, tome 43, n°1,(1995) , P.7-63.
[33] Site internet : http://www.renaudloup.be/refinternet.htm .
Chapitre III. Le data mining et ses techniques d’analyse de données
56
[34] Tenenhaus M., « La Régression PLS: Théorie et Pratique », Editions Technip, (1998).
[35] Esposito Vinzi V., Lauro C., « PLS Regression and Classification, PLS and Related
Methods, Proceedings of the PLS’03 », International Symposium, 45-56,Decisia , Paris,
(2003).
CHAPITRE IV
Résultats et discussions
Chapitre IV. Résultats et discussions
57
Dans ce chapitre nous présentons, les résultats obtenus par l’application des techniques
de data mining telles que l’Analyse en composantes principales (ACP) et la régression (PLS),
qui sont des techniques d’analyse de données multivariées permettant d’étudier les
corrélations existantes entre les différentes variables des bases de données, Ce chapitre se
divise en quatre parties :
Dans la première partie nous avons réalisé une étude comparative des propriétés
physiques et mécaniques du Lutétium avec ceux des métaux de transition par l'approche de
datamining.
Tandis que dans la deuxième partie, on a étudié les propriétés physiques et
mécaniques de l’hydrogène, et on les a comparée avec ceux du groupe des métaux alcalins,
avec les éléments du groupe de carbone, et avec ceux du groupe des halogènes, en utilisant
l’approche data mining.
Enfin dans la troisième partie on a étudié les propriétés structurales et mécaniques des
hydrures alcalins en appliquant les calculs de premier principe et qu’on a analysé par
l'approche de datamining.
Première partie
IV.1. Une étude comparative des propriétés physiques et mécaniques du
lutétium avec celles des métaux de transition par l'approche du
datamining
IV.1.1. Introduction
La position du lutétium dans le tableau périodique a suscité beaucoup de critiques de
la part des chercheurs et a été considérée une de ses anomalies. Le but principal de ce travail
est de démontrer que le lutécium Lu (Z = 71) a des propriétés communes avec la troisième
rangée du bloc d des métaux de transition. Il y’a beaucoup de chercheurs qui ont examiné la
position de lutétium dans le tableau périodique, par différents moyens. En 1967, H. Merz et
K. Ulmer avaient effectué une étude spectroscopique de rayonnement X montrant
distinctement, que Lu, doit se placer à gauche de Hf (en dessous de l’yttrium), Les propriétés
de Lu sont plus similaires à ceux de Hf que La, le Lutétium (Lu) peut donc être considéré
comme un métal de transition et pas La [13]. Jensen (1982) a attribué Lu au groupe III, en
Chapitre IV. Résultats et discussions
58
dessous de Y [16]. Scerri (2009) a estimé que le lutétium, doit être placé dans la même
colonne du tableau périodique que le scandium, l'yttrium et le lawrencium [17].
Dans cette étude on a essayé d’aborder ce problème, en investiguant les propriétés physiques
et mécaniques du lutétium, et les comparer avec ceux de la troisième période des métaux de
transition. Pour réaliser ce travail on a constitué une base de données de 14 éléments y
compris le lutétium (Cs, Ba, Hf, Ta, W, Re, Os, Ir, Pt, Au, Tl, Pb, Bi, Lu ) et incluant les
variables (propriétés) suivantes : la polarizabilité (α), l’électronégativité (χ), la masse
atomique (m), le numéro atomique (Z), le rayon atomique (r), le volume atomique (V),
l’affinité électronique (EA), l’énergie d’ionization (I), l’énergie totale (Etot), l’énergie de
cohesion (Ecoh), le module de compressibilité (B), le module de cisaillement (G), le module
de Young (E), le coefficient de Poisson (µ), le rapport (B/G), les constantes élastiques (C11,
C12, C44), la pression de Cauchy (C12-C44) (Tableau IV.1.)
Chapitre IV. Résultats et discussions
59
IV.1.2. Base de données
Propriété Cs Ba Lu Hf Ta W Re Os Ir Pt Au Tl Pb Bi
α
59.42i 39,7i 21,9i 16,2i 13,1i 11,1i 9,7i 8,5i 7,6i 6,5i 5,8i 7,6i 6,8i 7,4i
χ 0,86h 0,97h 1,14h 1,23h 1,33h 1,40h 1,46h 1,52h 1,44h 1,44h 1,42h 1,44h 1,55h 1,67h
m 132,91a 137,33a 174,97a 178,49a 180,95a 183,84a 186,21a 190,23a 192,22a 195,08a 196,97a 204,38a 207,2a 208,98a
Z 55 56 71 72 73 74 75 76 77 78 79 81 82 83
r 2,60c 2,15c 1,734j 1,55c 1,45c 1,35c 1,35c 1,30c 1,35c 1,35c 1,35c 1,90c 1,80c 1,60c
V 115,89f 62,47f 29,53g 22,41f 18,31f 16,23f 14,99f 14,36f 14,62f 15,83f 18,19f 31,25f 31,93f 35,38g
EA 0,47i 0,15h 0,34i 0,1b 0,32h 0,82h 0,15h 1,1h 1,57h 2,13h 2,31i 0,2h 0,36h 0,95h
I 3,89a 5,21a 5,43a 6,83a 7,55a 7,86a 7,83a 8,44a 8,97a 8,96a 9,23a 6,11a 7,42a 7,29a
Etot [1] -7550,56 -7880,11 -13848,23 -14317,49 -14795,88 -15283,45 -15780,24 -16286,30 -16801,68 -17326,58 -17860,79 -18956,96 -19518,99 -20090,41
Ecoh 0,80d 1,90d 4,43d 6,44d 8,10d 8,90d 8,03d 8,17d 6,94d 5,84d 3,81d 1,88d 2,03d 2,18d
B
2,03e 10,3e 47,6i 108,9e 200,1e 323,2e 371,7e 417,8e 355e 278,3e 173,2e 35,9e 42,9e 31,5e
G 0,65h 4,84h 27,1h 53,0h 64,7h 152h 180h 223h 209h 60,9h 26h 2,67h 5,54h 12,8h
E 1,69h 12,8h 68,4h 138h 185h 407h 520h 559h 528h 170h 78h 7,89h 15,8h 34h
µ 0,30h
0,28h
0,27h
0,29h
0,35h
0,28h
0,26h
0,25h
0,26h
0,39h
0,42h
0,45h
0,44h
0,33h
B/G 3,12 2,13 1,76 2,05 3,09 2,13 2,07 1,87 1,70 4,57 6,66 13,45 7,74 2,46
C11 1,60h 12,6h 86,2h 181h 264h 523h 616h 729,6f 580h 347h 191h 41,9h 48,8h 63,4h
C12 0,99h 8,0h 32,0h 77h 158h 203h 273h 230,0f 242h 251h 162h 36,6h 41,4h 24,5h
C44 1,44h 9,5h 26,8h 55,7h 82,6h 160h 161h 251,5f 256h 76,5h 42,2h 7,20h 14,8h 11,5h
C12-C44
-0,45 -1,5 5,2 21,3 75,4 43 112 -21,5 -14 174,5 119,8 29,4 26,6 13
[1] Ref [1], a Ref [2], b Ref [3], cRef [4], d Ref [5], e Ref [6], f Ref [7], g Ref [8], h Ref [9], i Ref [10], j Ref [11]. Tableau IV.1.1. La base de données incluant les propriétés physiques et mécaniques des métaux de transition de la troisième
période y compris le lutétium.
Chapitre IV. Résultats et discussions
60
IV.1.3. Techniques de calculs
Dans ce travail, nous utilisons l’approche data mining afin d'explorer les corrélations
existantes entre les données. Ce qui exige de puissants outils d'analyse statistique tels que
l’ACP et la PLS. L’ACP est probablement la technique statistique multivariée la plus
populaire utilisée dans de nombreux domaines scientifiques, comme elle peut être utilisée
pour la classification des données, l'étude de similitudes, etc. [18-19]. L’ACP est une
approche statistique puissante pour l'analyse des propriétés des matériaux; elle a été
largement utilisée pour étudier de nombreux problèmes en physique et en science des
matériaux [20]. Il ya une relation étroite entre la PLS et l'ACP, car elles ont des informations
intéressantes en commun [21].
IV.1.4. L’analyse en composantes principales (ACP)
Parmi les résultats obtenus par l’analyse en composantes principales (ACP):
La matrice de corrélation, le graphe des observations, et le graphe des variables.
Ce travail a été réalisé en exécutant l’ACP en utilisant les données numériques structurées en
14 observations par rapport à 19 variables (α, χ, m, Z, r, V, EA, I, Etot, ECoh, B, G, E, µ, B/G,
C11, C12, C44, C12-C44). Pour une visualisation de la discrimination de données, l’ACP
représente les variables (dix-neuf propriétés) et les observations (n = 14) à l'aide du graphe
des observations et du graphe des variables dans les espaces de dimensions déterminées par
des PCs (composantes principales) ayant des valeurs propres > 1,0, selon la règle de Kaiser.
Le graphe des variables représente les variables les plus importantes, et le graphe des
observations montre les similitudes et les différences entre les échantillons ( les éléments
dans notre cas) [22]. L’ACP génère un ensemble de nouveaux axes orthogonaux ou
variables, appelé les composantes principales (PCs), à partir des variables d'origine. Les axes
générés sont orthogonaux et non corrélés entre eux. La premiére composante (PC1) explique
l'écart maximal (variance) dans l’ensemble de données ainsi que sa direction, et ainsi de
suite. Les PCs sont définis par des vecteurs qui sont les vecteurs propres de la matrice de
variance-covariance. L'écart (la variance) le long du vecteur est défini comme étant la valeur
propre. Les observations (ou les variables) correspondantes aux PCs sont obtenues à partir de
la matrice de corrélation. Chaque variable révèle la contribution de la variable d'origine par
rapport aux composantes principales. La réduction de la variance est atteinte lorsqu’on
néglige les directions selon lesquelles la variance des échantillons est insignifiante [22].
Chapitre IV. Résultats et discussions
61
L'idée principale de la technique ACP est de réduire la dimension d'un ensemble de données
qui contient un grand nombre de variables interdépendantes, en conservant autant que
possible la variation trouvée dans l'ensemble de données. Cela rend la visualisation, ainsi que
la prévision et la classification plus facile [23-24]. L’ACP résume les informations fournies
par les différentes variables dans un simple graphique avec une perte minimale d'information
pour évaluer les relations entre les variables et les échantillons (les éléments, dans notre cas)
[25], elle identifie les motifs dans un ensemble de données et comprime les données en
réduisant le nombre de dimensions en fonction de leurs similarités et de leur différences [21].
Quand une signification physique des composantes principales est trouvée, la technique ACP
peut découvrir la structure cachée des données et révéler les similitudes entre les variables et
les éléments [19].
La matrice des corrélations nous aident à déterminer les variables qui sont corrélées entre
elles, et le degré de leur corrélation.
En analysant la matrice des corrélations ci-dessus, on déduit l’existence de forte corrélation
entre les propriétés physiques (α, χ, m, Z, et r) (> 0,86) et entre les propriétés mécaniques (B,
G, et E) (> 0,94).
Chapitre IV. Résultats et discussions
62
Variables α χ m Z r V EA I Etot Ecoh B G E µ B/G C11 C12 C44 C12-C44
α 1 -0,92 -0,94 -0,94 0,86 0,93 -0,38 -0,84 0,92 -0,46 -0,49 -0,37 -0,37 -0,32 -0,25 -0,44 -0,54 -0,38 -0,37
χ -0,92 1 0,95 0,94 -0,73 -0,74 0,36 0,77 -0,95 0,31 0,43 0,35 0,35 0,31 0,24 0,41 0,45 0,36 0,25
m -0,94 0,95 1 1,00 -0,68 -0,75 0,35 0,71 -1,00 0,21 0,29 0,18 0,18 0,48 0,41 0,25 0,34 0,20 0,29
Z -0,94 0,94 1,00 1 -0,69 -0,76 0,36 0,71 -1,00 0,23 0,30 0,19 0,20 0,46 0,40 0,26 0,35 0,21 0,30
r 0,86 -0,73 -0,68 -0,69 1 0,94 -0,47 -0,91 0,64 -0,79 -0,77 -0,64 -0,66 0,08 0,18 -0,73 -0,80 -0,65 -0,42
V 0,93 -0,74 -0,75 -0,76 0,94 1 -0,31 -0,82 0,71 -0,69 -0,63 -0,52 -0,53 -0,06 -0,01 -0,59 -0,66 -0,52 -0,36
EA -0,38 0,36 0,35 0,36 -0,47 -0,31 1 0,70 -0,37 0,14 0,41 0,21 0,19 0,22 0,01 0,31 0,51 0,29 0,45
I -0,84 0,77 0,71 0,71 -0,91 -0,82 0,70 1 -0,69 0,60 0,74 0,57 0,57 0,14 -0,02 0,66 0,81 0,61 0,49
Etot 0,92 -0,95 -1,00 -1,00 0,64 0,71 -0,37 -0,69 1 -0,16 -0,25 -0,15 -0,15 -0,50 -0,43 -0,21 -0,31 -0,16 -0,29
Ecoh -0,46 0,31 0,21 0,23 -0,79 -0,69 0,14 0,60 -0,16 1 0,87 0,82 0,84 -0,47 -0,47 0,86 0,83 0,80 0,23
B -0,49 0,43 0,29 0,30 -0,77 -0,63 0,41 0,74 -0,25 0,87 1 0,94 0,95 -0,39 -0,35 0,99 0,97 0,93 0,27
G -0,37 0,35 0,18 0,19 -0,64 -0,52 0,21 0,57 -0,15 0,82 0,94 1 1,00 -0,59 -0,45 0,98 0,83 0,99 -0,05
E -0,37 0,35 0,18 0,20 -0,66 -0,53 0,19 0,57 -0,15 0,84 0,95 1,00 1 -0,59 -0,45 0,98 0,85 0,98 0,00
µ -0,32 0,31 0,48 0,46 0,08 -0,06 0,22 0,14 -0,50 -0,47 -0,39 -0,59 -0,59 1 0,87 -0,49 -0,23 -0,55 0,43
B/G -0,25 0,24 0,41 0,40 0,18 -0,01 0,01 -0,02 -0,43 -0,47 -0,35 -0,45 -0,45 0,87 1 -0,40 -0,26 -0,42 0,20
C11 -0,44 0,41 0,25 0,26 -0,73 -0,59 0,31 0,66 -0,21 0,86 0,99 0,98 0,98 -0,49 -0,40 1 0,91 0,96 0,13
C12 -0,54 0,45 0,34 0,35 -0,80 -0,66 0,51 0,81 -0,31 0,83 0,97 0,83 0,85 -0,23 -0,26 0,91 1 0,83 0,49
C44 -0,38 0,36 0,20 0,21 -0,65 -0,52 0,29 0,61 -0,16 0,80 0,93 0,99 0,98 -0,55 -0,42 0,96 0,83 1 -0,08
C12-C44 -0,37 0,25 0,29 0,30 -0,42 -0,36 0,45 0,49 -0,29 0,23 0,27 -0,05 0,00 0,43 0,20 0,13 0,49 -0,08 1
Tableau IV.1.2 : La matrice de corrélation des métaux de transition de la troisième période y compris le lutétium.
Chapitre IV. Résultats et discussions
63
Dans ce travail, l’analyse en composantes principales definit deux composantes
principales qui représentent toutes les deux 81.98 % de la variance totale dans la base de
données. PC1 capture 54.40% de la variance dans l'ensemble de données, et PC2 capture
27.58 % de la variance comme indiqué dans (Figure IV.1.1).
Figure IV.1.1. : Le graphe des observations des métaux de transition de la troisième période
y compris le lutétium.
Le graphe des observations pour PC1 vs PC2, (Figure IV.1.1), révèle cinq groupes
distincts d'éléments. Le groupe 1 (Cs, Ba) est lié aux éléments du bloc s, le groupe 2 (Ta, Hf,
Lu ) et le groupe 3 (Ir, Os, Re, W) contiennent des éléments appartenant au bloc d, le groupe 4
(Pt, Au)
contient des métaux précieux, et le groupe 5 (Tl, Pb, Bi) comprend des métaux post-transition,
dont leur propriétés sont déterminées par leurs sous-couches p partiellement remplies. Nous
notons que l’axe PC1 sépare les groupes 1, 2, 3 des groupes 4, 5. Il ya une grande similitude
entre les éléments de chaque groupe. En regardant le groupe 2 (Figure IV.1.1) et (Tableau
IV.1.1), nous notons que les distances séparant les points représentant les éléments (Ta, Hf,
Lu ) sont très petites, ce qui indique qu'ils ont des propriétés similaires à celles de l'hafnium
(et à celles des métaux de transition), ils partagent plusieurs caractéristiques entre eux, parce
qu'ils ont la même configuration de la couche de valence, qui est égal à 2.
Empiriquement, il a été démontré que l’électron externe du lutétium se situe dans la première
sous-couche 5d; il doit marquer le début de la troisième série d'éléments de transition (c’est à
Chapitre IV. Résultats et discussions
64
dire la sixième période du tableau périodique), et en dessous de l'yttrium (Y) dans le groupe 3
(IIIB), car il est un métal de type d1. L'emplacement d'un élément dans le tableau périodique
dépend de sa configuration électronique, de sorte que les éléments d'une même rangée ont la
même configuration de la couche de valence. Les électrons de valence déterminent la
structure et les propriétés chimiques, mais la configuration électronique détermine
l'organisation du tableau périodique des éléments ainsi que leur propriétés. Ce qui explique les
tendances périodiques dans le comportement des éléments chimiques. Les propriétés des
éléments sont déterminés par la taille (n), la forme (l) des orbitales, et le numéro atomique
(charge nucléaire). Il y’a plutôt un grand nombre de preuves chimiques et physiques indiquant
que le lutétium, doit être placé dans le même groupe que Sc et Y [12]. Cette question a été
débattue par plusieurs chercheurs ([13], [14] et [27] à [31]) et d'une manière plus
convaincante par Jensen en 1982 [14]. Une autre justification pour placer le lutétium (Lu) en
dessous de l'yttrium (Y) dans le groupe 3 (IIIB), est que cet arrangement donne des tendances
périodiques similaires dans plusieurs propriétés physiques (point de fusion, rayons atomiques,
somme des deux premiers potentiels d'ionisation, et l’électronégativité), comme on le voit en
(Tableau IV.1.3.). Sc, Y, et Lu ont tous une structure hexagonale compacte (hcp), à
température ambiante [12]. Placer les éléments dans le tableau périodique est actuellement
acceptée selon les observations empiriques suivantes: numéro atomique, les propriétés, les
tendances périodiques, et la configuration électronique de l'état fondamental des atomes [32].
Dans le graphe des variables (Figure IV.1.2), 4 principaux groupes peuvent être observés: le
groupe 1 contient principalement les propriétés physiques qui peuvent être décomposées en
deux sous-groupes, le premier sous-groupe contient les propriétés atomiques (m, Z, I, χ) et le
second contient la pression Cauchy C12-C44, et EA. Le deuxième groupe comprend les
propriétés mécaniques B, E, G et C11, C12, C44, y compris l’énergie de cohesion Ecoh. Le
troisième comporte des propriétés physiques telles que le rayon atomique r, le volume
atomique V, la polarisabilité α, et l'énergie totale Etot, et le quatrième groupe inclut le rapport
B/G, ainsi que le coefficient de Poisson µ. Les propriétés qui ont les valeurs des composantes
principales (PC) identiques sont significativement corrélées et sont similaires les unes aux
autres; Mais ceux qui ont des valeurs différentes de PC sont inversement corrélées et sont
donc différentes. Dans le groupe 1, une similitude significative est observée entre m et Z,
aussi dans le groupe 2 entre E, G et C44, les points indiquant les éléments sont proches les
uns des autres (Figure IV.1.2), ce qui révèle l'importance de ces propriétés. La PCA sépare
automatiquement les données. En effet, nous voyons que PC2 sépare clairement les propriétés
physiques des propriétés atomiques, ce qui signifie une forte différence entre ces deux types
Chapitre IV. Résultats et discussions
65
de propriétés. Les variables au sein du même groupe sont corrélées. Les groupes 1 et 3 sont
inversement corrélés, et ainsi pour les groupes 2 et 4. Une augmentation de la masse atomique
m et le numéro atomique Z se traduira par une augmentation de I, et χ et une diminution de r,
V, Etot, et α. Cependant, le module d'Young E, le module de cisaillement G, et le module de
compressibilité B sont significativement corrélés aux constantes élastiques C11, C12, C44 et à
l'énergie de cohesion Ecoh.
Propriété Sc Y Lu
Structure hcp hcp hcp
Point de fusion (Tmelt) 1,541k 1,522k 1,663k
Electronégativité (χ) 1,20h 1,11h 1,14h
Rayons atomique (r) 1,60c 1,80c 1,734j
1er potentiel d’ionisation
6,56h 6.22h 5,43a
2ème potentiel d’ionisation 12,80h 12,24h 13,9h
a Ref [2], cRef [4], h Ref [9], j Ref [11], k Ref [12].
Tableau IV.1.3. Les propriétés physiques du groupe 3 (IIIB), y compris le lutécium. Les
quantités indiquées dans le tableau sont les suivantes: l'électronégativité (χ),
le rayon atomique (r), 1er potentiel d’ionisation, 2ème potentiel d’ionisation
(eV), le point de fusion (° C).
Chapitre IV. Résultats et discussions
66
Figure IV.1.2 : Le graphe des variables des métaux de transition de la troisième période y
compris le lutétium.
IV.1.5. La régression par les Moindres Carrés Partiels (PLS)
Alors que l'APC est utile pour évaluer l'impact relatif de plusieurs paramètres sur les
propriétés, la régression PLS peut être utilisée comme un outil d'analyse exploratoire pour
sélectionner les variables prédictives appropriés et d'identifier les valeurs aberrantes avant la
régression linéaire classique. Une combinaison des techniques de l'APC et de la PLS permet
d'explorer un large intervalle de nouvelles tendances et de corrélations, qui n’ont pas été
établies avant [23]. La PLS comprend une large catégorie de méthodes de modélisation des
relations entre les ensembles de variables observées en utilisant les variables latentes. La
régression, inclut les tâches de classification, les techniques de réduction des dimensions et
les outils de modélisation. L'idée principale de la méthode PLS est que les données observées
sont générées par un système qui est entraîné par un petit nombre de variables latentes (i.e.
pas directement observé ou mesuré). L'algorithme PLS devient un outil réussi standard pour
traiter de larges problèmes de données chimiques. Généralement la PLS crée des vecteurs
d’observations orthogonaux (appelés vecteurs latents ou composantes), et qui contiennent la
covariance maximale entre les différents groupes de variables. Il existe différentes techniques
pour obtenir les vecteurs latents PLS, ce qui donne une variante de PLS [26].
Chapitre IV. Résultats et discussions
67
Nous étudions les relations entre les deux blocs de variables; entre les propriétés mécaniques
(E, B, G, µ, B/G, C11, C12, C44, C12-C44) et les propriétés structurales et atomiques (α, χ,
m, Z, r, V, EA, I, Ecoh, Etot) en utilisant l'approche PLS. Les résultats PLS, présentés dans
(Figure IV.1.3), indiquent le cercle de corrélation qui explore la relation entre les propriétés
mécaniques, atomiques et structurales, ainsi qu’entre les deux composantes PLS (t1, t2) qui
capturent le maximum de la variance dans la base de données. Les résultats peuvent être
expliqués de la même manière, comme dans l'analyse en composantes principales (ACP).
Pour les propriétés, tels que C12-C44 et l'affinité d'électrons EA, situées au centre de la carte
(le cercle de corrélation), où les corrélations sont faibles. Cela signifie que leurs propriétés ne
sont pas bien représentés sur les deux premières composantes. Les propriétés C12-C44 et EA
expliquent à peine les tendances des éléments; ils n’ont pas un effet important qui pourrait
facilement influencer les tendances des éléments; ils ne sont pas importantes. On constate de
fortes corrélations entre m et Z d'une part, ainsi qu'entre les constantes élastiques C11, C12,
C44, et E, G, B, d'autre part. En outre, une corrélation négative existe entre Etot et m, Z, ainsi
qu'entre l'énergie d'ionisation I et le volume atomique V. Les variables B/G et µ sont séparées
des autres variables parce qu'elles sont moins corrélées à ces variables d’un côté, et aux
composantes PLS (t1, t2) d’un autre côté. Les propriétés situées sur le périphérie du cercle de
corrélation sont significatives, c’est à dire, ils contribuent fortement à la discrimination.
Figure IV.1.3 : Le graphe des observations (t1, t2) des métaux de transition de la troisième
période y compris le lutétium.
Chapitre IV. Résultats et discussions
68
IV.1.6. Conclusion
Dans cette partie, nous avons introduit une nouvelle approche pour analyser
et comparer les propriétés physiques et mécaniques de lutétium avec des éléments de
transition de la troisième range du tableau périodique, en utilisant des méthodes
d'analyse multivariée tels que l’ACP et la régression PLS. L’ACP nous a permis de
classer les propriétés et les éléments, qui ont contribué à visualiser la position des
éléments l’un par rapport à l'autre, ainsi que les relations existantes entre leurs
propriétés. Les résultats obtenus par la PLS est en bonne coherence avec les résultats
obtenus par l’ACP. Un intérêt majeur dans cette méthodologie est donnée par le
cadre unitaire, fondée sur les principes de PLS, ce qui permet de découvrir les
relations structurelles existantes entre les données et les propriétés. Nos résultats
montrent que les propriétés de lutétium (Lu) sont semblables à ceux de l'hafnium
(Hf). Nous avons constaté que nos résultats sont généralement en bon accord avec
de nombreuses études déjà publiées sur ce sujet expérimentaux et théoriques. Il est
difficile pour les scientifiques de comprendre les interactions entre un grand nombre
de variables, donc nous avons utilisé l’ACP et la PLS comme des outils pour
identifier les structures existantes dans un ensemble de données, ainsi que pour le
dépistage, et d'extraire des informations utiles à partir de données.
Chapitre IV. Résultats et discussions
69
IV.1.7. Références
[1] NIST (National Institute of Standards and Technology), (2013). www.nist.gov>.
[2] R.A. Dragoset, A. Musgrove, C.W. Clark, and W.C. Martin, Periodic Table: Atomic
Properties of the Elements (Version 4), NIST SP 966 (2003).
<http://physics.nist.gov/PT>. NIST (National Institute of Standards and Technology),
Gaithersburg, MD.
[3] E.C.M. Chen, E.S. Chen, Molecular electron affinities and the calculation of the
temperaturedependence of the electron-capture detector response. Journal of
Chromatography A, 2004, vol. 1037, pp. 83–106.
[4] J.C. Slater, J. Chem. Phys, 1964, vol. 39, pp. 3199, http://www.webelements.com/.
[5] Charles Kittel, lntroduction to Solid State Physics, 8th ed., Hoboken, NJ: John Wiley &
Sons, Inc, 2005.
[6] Y. Makino, S. Miyake, Estimation of bulk moduli of compounds by empirical relations
between bulk modulus and interatomic distance. Journal of Alloys and Compounds,
2000, vol.313, pp. 235–241.
[7] S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S. Ganeshan, Y. Wang, Z.K.
Liu, First-principles calculations of pure elements: Equations of state and elastic
stiffness constants. Computational Materials Science, 2010, vol. 48, pp. 813–826.
[8] The Massachusetts Institute of Technology, 1996. <http://www.chemicool.com> (2013).
[9] Martienssen Warlimont., Springer handbook of condensed matter and materials Data,
Volume 1-Hans Warlimont, Springer Berlin Heidelberg, 2005.
[10] David R. Lide, ed., CRC Handbook of Chemistry and Physics, 90th Ed, CRC
Press/Taylor and Francis, Boca Raton, FL, 2010.
[11] S. Cotton, Lanthanide and Actinide Chemistry, John Wiley & Sons Ltd, England, 2006.
[12] K. A. Gschneidner, Jr., J.-C. G. Bünzli and V. K. Pecharsky, Handbook on the physics
and chemistry of rare earths, vol 41, North-Holland, Elsevier, 2011.
[13] H. Merz, K. Ulmer, Position of lanthanum and lutetium in the periodic table. Physics
Letters, 1967, vol. 26, pp. 1-2.
[14] Jensen, W. B. J. Chem. Educ, 1982, vol. 59, pp. 634–636.
[15] Glossaire de la modélisation des données, site: http://www.aiaccess.net/
[16] Michael Laing, A revised periodic table: with the lanthanides repositioned. Foundations
of Chemistry, 2005, vol. 7, pp. 203–233.
Chapitre IV. Résultats et discussions
70
[17] Eric Scerri, Explaining the periodic table, and the role of chemical triads. Found Chem.
2010, vol. 12, pp. 69–83.
[18] Hervé Abdi, Lynne J. Williams, Principal component analysis. WIREs Computational
Statistics. 2010, vol. 2, pp. 433-459.
[19] A. Lengyel, K.Héberger, L. Paksy, O.Bánhidi, R. Rajkó, Prediction of ozone
concentration in ambient air using multivariate methods. Chemosphere. 2004, vol. 57,
pp. 889– 896.
[20] Scott R. Broderick, Hafid Aourag, Krishna Rajan, Data mining of Ti–Al semi-empirical
parameters for developing reduced order models. Physica B, 2011, vol. 406, pp. 2055–
2060.
[21] Hai-Ni Qu, Guo-Zheng Li, Wei-Sheng Xu, An asymmetric classifier based on partial
least squares. Pattern Recognition, 2010, vol.43, pp. 3448–3457.
[22] Eui-Cheol Shin, Brian D. Craft, Ronald B. Pegg, R. Dixon Phillips, Ronald R.
Eitenmiller, Chemometric approach to fatty acid profiles in Runner-type peanut
cultivars by principal component analysis (PCA). Food Chemistry, 2010, vol. 119, pp.
1262– 1270.
[23] Krishna Rajan, Materials informatics. Materials Today. 2005, vol.8, pp. 38-45.
[24] I.T. Jolliffe, Principal Component Analysis, Springer series in statistics, 2nd ed, Springer-
Verlag New York, Inc, 2002.
[25] Ivano Marchi, Serge Rudaz, Maurice Selman, Jean-Luc Veuthey, Evaluation of the
influence of protein precipitation prior to on-line SPE–LC–API/MS procedures using
multivariate data analysis. Journal of Chromatography B. 2007, vol. 845, pp. 244–252.
[26] Roman Rosipal, Nicole Krämer, Overview and recent advances in partial least squares,
C. Saunders et al. (Eds.), 2006, pp. 34–51.
[27] Scerri, E. R. J. Chem. Educ, 1991, vol. 68, 122–126.
[28] Jensen, W. B. J. Chem. Educ, 2003 vol. 80, pp. 952–961.
[29] Luder, W. F., The Electron-Repulsion Theory of the Chemical Bond; Reinhold:New
York, 1967.
[30] Hamilton, D. C. Amer. J. Phys,1965, vol. 33, pp. 637–640.
[31] Matthias, B. T.; Zacharisen, W. H.; Webb, G. W.; Engelhardt. J. J. Phys. Rev. Letters,
1967, vol. 18, pp. 781–784.
[32] Laurence Lavelle, Lanthanum (La) and Actinium (Ac) Should Remain in the d- Block.
Journal of Chemical Education No 11, 2008, vol. 85, pp. 1482-1483.
Chapitre IV. Résultats et discussions
71
Deuxième partie
IV.2. Une étude comparative des propriétés physiques et mécaniques de
l’hydrogène en appliquant les techniques de recherche du
data mining
IV.2.1. Introduction
La position de l’hydrogène dans le tableau périodique a été le sujet de beaucoup de
recherches et de débats, c’est une de ses grandes contradictions. Parmi tous les éléments dans
la nature, l'hydrogène est le plus répandu sur terre c’est le dixième élément plus lourd en
classant les éléments par masse. L'hydrogène existe dans toutes les formes de vie [18]. Placer
l'hydrogène dans un tableau a été problématique depuis le premier tableau de Dmitri
Mendeleev en 1869, où l'hydrogène a été considéré comme un élément spécial. En 1871,
Mendeleev avait placé l’atome d'hydrogène au sommet de la première colonne du tableau
périodique. Bayley (1882) et Thomsen (1895) ont donné une forme pyramidale au tableau,
où ils ont placé l'hydrogène en haut au centre et ils l’ont isolé contre les éléments de la
deuxième période du tableau périodique. En 1922, Bohr avait ajouté les gaz nobles, en
mettant l’helium à côté de l’hydrogène. En 1967, Sanderson a utilisé l'électronégativité
comme un critère; il a placé l'hydrogène dans la partie supérieure du tableau périodique
chevauchant le bore et le carbone parce qu'il pensait que cette position était la plus
appropriée. Greenwood et Earnshaw (1984) ont placé H et He ensemble, en haut et à part du
reste des éléments et il a considéré l'hélium comme un gaz rare. En 2003, Kaesz et Atkins
ont placé séparément l’atome d'hydrogène, au milieu des groupes 7 et 8 des métaux de
transition. En 2003, Cronyn a placé l’hydrogène au-dessus du carbone [21]. Ainsi, après plus
de 130 ans, la position de l'hydrogène dans le tableau périodique est encore un sujet de
confusion [22].
Dans cette partie on va essayer de confronter ce problème, en comparant les
propriétés physiques et mécaniques de l’hydrogène avec ceux du groupe des métaux alcalins,
ceux du groupe du carbone, et avec ceux du groupe des halogènes, en utilisant les techniques
du data mining : l’Analyse en composantes principales (ACP) et la régression (PLS). Pour
cela nous avons construit trois bases de données (Tableau IV.2.1, Tableau IV.2.2, et le
Tableau IV.2.3). La première base de données est constituée de six (6) observations
(éléments), représentant les métaux alcalins, y compris l'hydrogène, et incluant 16 variables
Chapitre IV. Résultats et discussions
72
(propriétés) (les propriétés physiques et mécaniques des éléments de la base de données).
Les propriétés et leurs abréviations sont: la polarisabilité (α), l’électronégativité (χ), la masse
atomique (m), le numéro atomique (Z), le rayon atomique (r), le volume atomique (V),
l’affinité électronique (EA), l'énergie d'ionisation (I), l'énergie totale (Etot), la conductivité
électrique (σ), le module de compressibilité (B), le module de Young (E), les constantes
élastiques (C11, C12, C44), la pression de Cauchy (C12-C44). La deuxième base de données
est composée de six (6) observations. Elle contient les éléments du groupe de carbone, y
compris l'hydrogène, et seize 16 variables identiques à celles de la première base de données.
La troisième base de données contient six observations qui sont les éléments du groupe VII
(les halogènes), plus l'hydrogène, et dix (10) variables, représentant les propriétés physiques
et la conductivité électrique. Dans cette troisième base de données nous avons inclus
seulement ces propriétés à cause de la non-disponibilité des données pour les autres
propriétés.
L'objectif principal de ce travail est d'étudier les tendances dans les propriétés des matériaux
pour les trois bases de données en appliquant l'ACP qui va révèler la composition dissimulée
des données et montrera les similitudes existantes entre les variables et les éléments, afin
d'identifier le groupe qui partage le plus de propriétés avec l'hydrogène.
IV.2.2. Bases de données IV.2.2.1 La base de données des métaux alcalins y compris l’hydrogène
Propriété H Li Na K Rb Cs α 0.667h 24.33h 24.11h 43.4h 47.3h 59.42h χ 2.20g 0.97g 1.01g 0.91g 0.89g 0.86g m 1.00794a 6.941a 22.989770a 39.0983a 85.4678a 132.90545a Z 1 3 11 19 37 55 r 0.25b 1.45b 1.80b 2.20b 2.35b 2.60b V 92.23f 20.299e 37.144e 73.736e 90.810e 115.892e EA 0.754h 0.618h 0.5479h 0.5015h 0.4859h 0.4716h I 13.5984a 5.3917a 5.1391a 4.3407a 4.1771a 3.8939a Etot [1] -12.137 -199.600 -4393.105 -16278.245 -79903.602 -205465.784 σ 16 x 103i 11.7 x 106f 20.1 x 106f 16.4 x 106f 47.8 x 106f 5.3 x 106f B 0.2c 11.6d 6.81d 3.18d 3.14d 2.03d E 0.2g 11.5g 6.80g 3.52g 2.35g 1.69g C11 0.042g 13.4g 7.59g 3.69g 2.96g 1.60g C12 0.18g 11.3g 6.33g 3.18g 2.44g 0.99g C44 0.11g 9.6g 4.30g 1.90g 1.60g 1.44g C12-C44 0.07 1.70 2.03 1.28 0.84 -0.45
[1] Ref [5], a Ref [6] , b Ref [7] , cRef [8] , d Ref [9] , e Ref [4] , f Ref [10] , g Ref [11] , h Ref [12], i Ref [13] at 162 GPa and 6500 K. Tableau IV.2.1. La base de données incluant les propriétés physiques et mécaniques des
métaux alcalins y compris l’hydrogène.
Chapitre IV. Résultats et discussions
73
IV.2.2.2. L’analyse en composantes principales (ACP)
Figure IV.2.1. : Le graphe des observations des métaux alcalins y compris l’hydrogène.
Dans ce travail, l’analyse en composantes principales de cette base de données définit
deux composantes principales qui représentent toutes les deux 89.54% de la variance totale
dans la base de données, PC1 capture 50.99% de la variance dans l'ensemble de données, et
PC2 capture 38.55% de la variance comme indiqué dans (Figure IV.2.1.).
Les autres composantes principales ne sont pas prises en considération parce qu'elles ne
fournissent pas d’informations signifiantes. L'objectif du graphe des observations est de
visualiser les positions du comportement des variables dans un espace bidimensionnel, ainsi
que leurs relations équivalentes. Les variables à proximité l’une de l'autre et éloignées de
l'origine du graphe sont positivement corrélées; tandis que celles qui s’opposent les unes aux
autres sont négativement corrélées (ou inversement proportionnelles). Dans le graphe des
variables, les corrélations entre deux variables sont expliquées par l'intermédiaire de leur
angle par rapport au centre. Le coefficient de corrélation entre deux variables est déterminé au
moyen du cosinus de l'angle formée par leurs vecteurs correspondants sur le graphe. Étant
donné que le cosinus d'un angle plat est égale à -1, ils ont une corrélation divergente. Les
variables qui ne sont pas corrélées forment entre elles un angle droit dont le cosinus est nul.
De même, le cosinus d'un angle de degré 0 ° est 1, ce qui signifie que la corrélation est totale
entre les variables [16].
Chapitre IV. Résultats et discussions
74
Le graphe des observations pour PC1 vs PC2, (Figure IV.2.1.), révèle deux groupes distincts
d'éléments. Groupe 1 constitué des métaux alcalins (Li , Na, K, Rb, Cs), et le groupe 2 est
constitué de l’élément de l’hydrogène (H), Nous notons que l’axe PC1 sépare les groupes 1, 2.
Il ya une ressemblance significative entre les éléments dans le groupe 2. Une distance
importante est constatée entre le point représentant H et les points représentant les métaux
alcalins, ce qui signifie que l'hydrogène est bien différént des métaux alcalins, et qu'il n’est
pas conforme au premier groupe. Une nette différence entre l'hydrogène et les métaux alcalins
apparaît dans la profondeur de leurs puits d'énergie, avec leurs potentiels d'ionisation égaux à
13,6 eV et 5,3 eV pour l'hydrogène et le lithium, respectivement [1]. D'après les données
fournies dans le Tableau IV.2.1, toutes les propriétés de l'hydrogène (H) sont très différentes
de celles des métaux alcalins à l'exception de l’EA. L’emplacement de l'hydrogène dans le
tableau périodique avec les métaux alcalins est due à sa configuration électronique
(monovalent) et non à ses caractéristiques chimiques. Les électrons de valence determinant la
chimie, et la configuration électronique reflète l'organisation du tableau périodique. Les
métaux alcalins sont parmi les meilleurs donneurs d'électrons; ils ont à peu près la même
électronégativité χ, et qui est proche de 1 (Tableau IV.2.1). Le caractère métallique d'un
élément est principalement due à sa structure et ses caractéristiques physiques [2].
Figure IV.2.2 : Le graphe des variables des métaux alcalins y compris l’hydrogène.
Chapitre IV. Résultats et discussions
75
IV.2.2.3 La base de données du groupe de carbone y compris l’hydrogène
Propriété H C Si Ge Sn Pb
α 0.667h 1.76h 5.38h 6.07h 7.7h 6.8h
Χ 2.20g 2.50g 1.74g 2.02g 1.72g 1.55g
m 1.00794a 12.0107a 28.0855a 72.64a 118.710a 207.2a
Z 1 6 14 32 50 82
R 0.25b 0.70b 1.10b 1.25b 1.45b 1.80b
V 92.23f 5.68f 20.09f 22.58f 27.07f 31.931e
EA 0.754h 1.26g 1.39g 1.23g 1.11g 0.364g
I 13.5984a 11.2603a 8.1517a 7.8994a 7.3439a 7.4167a
Etot [1] -12.137 -1018.436 -7842.444 -56432.436 -163814.961 -531150.838
σ 16 x 103i 0.07 x 106f 4 x 102f 3f 8.7 x 106f 4.8 x 106f
B 0.2c 444g 98.0g 74.9g 56,6g 42.9d
E 0.2g 545g 112g 79.9g 52.9g 15.8g
C11 0.042g 1076.4g 165.77g 124.0g 72.30g 48.8g
C12 0.18g 124.5g 63.9g 48.3g 59.40g 41.4g
C44 0.11g 578g 79.6g 67.1g 22.03g 14.8g
C12-C44 0.07 -453.5 -15.7 -18.8 37.37 26.6
[1] Ref [5], a Ref [6] , b Ref [7] , cRef [8] , d Ref [9] , e Ref [4] , f Ref [10] , g Ref [11] , h Ref [12], i Ref [13] at 162 GPa and 6500 K.
Tableau IV.2.2 : La base de données incluant les propriétés physiques et mécaniques du
groupe de carbone y compris l’hydrogène.
IV.2.2.4. L’analyse en composantes principales (ACP)
D’après le graphe ACP des observations, représentant l'ensemble des données du
groupe de carbone (Figure IV.2.3), nous notons que les deux PC les plus importants
représentent 86,10% de l'ensemble de la variabilité dans l'ensemble de données (PC1 capte
62,00%, et PC2 24,10% de la variance totale. On remarque deux groupes distincts d'éléments;
le groupe 1 contenant l'hydrogène H, et le groupe 2 est constitué des éléments du groupe IV
(C, Si, Ge, Sn, Pb), celui-ci peut être divisée en trois sous-groupes. Le premier contient le
carbone C qui est un non-métal et un mauvais conducteur d'électricité, comme l'hydrogène.
La conductivité électrique est une propriété importante dans l'étude des matériaux elle nous
informe pas uniquement sur la conduction électrique d'un métal, mais aussi sur sa structure et
ses propriétés mécaniques. (Mais en dépit de l'absence d'électrons libres, l'hydrogène peut être
Chapitre IV. Résultats et discussions
76
métallisé sous des pressions extrêmement élevées, et des températures basses); dans cet état, il
est considéré comme métallique. Les propriétés atomiques déterminent si un élément
chimique dans le tableau périodique est un métal ou un non métal. L'hydrogène liquide est
considéré comme un métal, tandis que l'hydrogène solide n’atteint pas l'état métallique, même
à haute pression [3].
Les allotropes de certains éléments montrent plus visiblement le comportement métallique ou
non métallique que d'autres. Le diamant est une forme allotropique du carbone, il n’ est pas
métallique; cependant le carbone graphite est le seul élément non métallique et qui est
conducteur de l'électricité.
Le deuxième sous-groupe contient le silicium et le germanium Ge, Si (Figure IV.2.3). Les
propriétés physiques du germanium sont très similaires à ceux du silicium. Dans leur état
solide élémentaire, ils sont tous les deux métalloïdes, parce qu'ils se comportent comme des
semi-conducteurs, mais le silicium est principalement non-métallique. Leurs conductivités
électriques peuvent être affectées à des degrés divers par le dopage. Le troisième sous-groupe
contient l'étain (Sn) et le plomb Pb, qui sont certainement métalliques. Malgré leur adhésion
aux tendances périodiques, les propriétés du groupe de carbone varient considérablement. Le
carbone est un non-métal. L’étain et le plomb se comportent tout à fait comme des métaux. En
ce qui concerne la conductivité électrique, les éléments peuvent être divisés en trois classes:
‘les métaux’, ‘semi-métaux’ et ‘non-métaux' [2]. Les métaux ont une grande conductivité; elle
peut être supérieure à 105 Ω-1.m-1. Les semi-métaux ont des conductivités modérées à faibles;
ils sont donc des conducteurs électriques intermediaries [17]. Le semi-métal le plus courant
est le silicium Si. La propriété la plus utile des semi-métaux est leur capacité variable à
conduire le courant électrique. Les propriétés physiques des non-métaux sont opposées à
celles des métaux. En regardant (Figure IV.2.3), nous notons que la distance entre le point
représentant l'hydrogène H et les points représentant le groupe de carbone est plus courte que
celle qui se trouve dans (Figure IV.2.1) avec les métaux alcalins. Cela signifie que
l'hydrogène H partage plusieurs propriétés avec les éléments du groupe de carbone et a de
nombreuses similitudes avec eux. L'hydrogène partage plusieurs caractéristiques chimiques
avec le carbone et la famille du silicium. D’après le Tableau IV.2.2, l'hydrogène et les
éléments du groupe IV ont des électronégativités similaires.
En thermodynamique, il est bien connu que l'électronégativité affecte les propriétés
chimiques des éléments. On remarque que les propriétés d’hydrogène tel que l'énergie
d'ionisation et l’affinité électronique sont similaires à ceux des éléments du groupe de
Chapitre IV. Résultats et discussions
77
carbone. L’objectif de la classification périodique est de refléter les propriétés des éléments en
fonction de leur nombre atomique et de leur périodicité [1].
Figure IV.2.3. : Le graphe des observations du groupe du carbone y compris l’hydrogène.
Figure IV.2.4. : Le graphe des variables du groupe du carbone y compris l’hydrogène.
Chapitre IV. Résultats et discussions
78
IV.2.2.5. La bases de données des halogènes y compris l’hydrogène
Propriété H F Cl Br I At
α 0.667h 0.557h 2.18h 3.05h 4.7h 6.0h
χ 2.20g 4.10g 2.83g 2.74g 2.21g 1.90g
m 1.00794a 18.9984a 35.453a 79.904a 126.9045a 210a
Z 1 9 17 35 53 85
r 0.25b 0.50b 1.00b 1.15b 1.40b 1.27b
V 23.92f 28.39f 37.69f 39.03f 42.74f 49.82f
EA 0.754h 3.40g 3.61g 3.36g 3.06g 2.8g
I 13.5984a 17.4228a 12.9676a 11.8138a 10.4513a 9.5352b
Etot [1] -12.137 -2696.709 -12481.164 -69951.739 -188164.803 -578569.435
σ 16 x 103i 1.0 x 10-4j 1.0 x 10-14k 1.0 x 10-4j 1.0 x 10-4j 0j
[1] Ref [5], a Ref [6] , b Ref [7] , f Ref [10] , g Ref [11] , h Ref [12], i Ref [13] at 162 GPa and 6500 K, j Ref [14], k Ref [15] at 203,15 K.
Tableau IV.2.3. La base de données incluant les propriétés physiques et mécaniques des
halogènes y compris l’hydrogène.
IV.2.2.6. L’analyse en composantes principales (ACP)
Figure IV.2.5: Le graphe des observations du groupe des halogènes y compris l’hydrogène. Le graphe des observations du groupe des halogènes y compris l’hydrogène (Figure IV.2.5)
génère deux pertinentes composantes principales qui représentent 94,02% de l'ensemble de la
Chapitre IV. Résultats et discussions
79
variance dans la base de données; la première composante principale (PC1) capture 69,90% et
la seconde (PC2) caractérise 24,12% de la variance totale.
D’après la (Figure IV.2.5) l’analyse ACP révèle deux groupes distincts d'éléments,
l'hydrogène H que nous appellerons le groupe 1, et les halogènes (F, Cl, Br, I, A) le groupe 2.
Il apparaît que l'hydrogène est très éloigné des halogènes. Cela signifie que l'hydrogène et les
halogènes sont différents, et qu’ils ne partagent pas les mêmes propriétés (Tableau IV.2.3.), à
l'exception de l'électronégativité χ et de l’énergie d'ionisation I. En plus, l'hydrogène a une
conductivité électrique σ supérieure à celle des halogènes, qui sont de mauvais conducteurs de
l'électricité.
Figure IV.2.6. Le graphe des variables du groupe des halogènes y compris l’hydrogène.
En regardant le graphe des variables ACP des métaux alcalins y compris l’hydrogène
dans (Figure IV.2.2.) quatre groupes distincts peuvent être observés: le Groupe 1, qui
contient en particulier les propriétés physiques, et qui peut être décomposé en deux sous-
groupes; le premier est constitué des propriétés atomiques tels que l'énergie d'ionisation I et
l’électronégativité χ, et le second de l'affinité d'électrons EA et de l'énergie totale Etot; le
deuxième groupe (Groupe 2) inclut les propriétés mécaniques B, E et C11, C12, C44 et la
pression de Cauchy C12-C44, le troisième (groupe 3) se compose des propriétés physiques
comme le rayon atomique r, le volume atomique V, la polarisabilité α ainsi que la masse
atomique m, et du numéro atomique Z. le quatrième groupe (groupe 4) contient seulement la
Chapitre IV. Résultats et discussions
80
conductivité électrique σ. PC2 sépare clairement les propriétés physiques des propriétés
atomiques (Figure IV.2.2). Les propriétés qui ont les mêmes valeurs de PC, tel que déterminé
par les différents groupes, sont étroitement liées, tandis que celles avec des valeurs opposées
de PC ont une corrélation divergente. Dans le groupe des métaux alcalins, les propriétés
varient comme suit: une ressemblance importante peut être observée entre m, Z, V dans le
Groupe 3, et entre toutes les propriétés du groupe 2; les points présentant les éléments sont
très proches les uns des autres (Figure IV.2.2). Le point de m est le plus proche de celui de Z,
indiquant son importance; La même remarque peut être faite pour le point de C11 et celui de
E. Les groupes 1 et 3 sont inversement corrélés, donc pour les groupes 1 et 4, plusieurs
corrélations peuvent être identifiées. Une augmentation de χ et I se traduira par une
augmentation d’EA et Etot et une diminution de r, V, α, m, Z et σ. En même temps, E et B sont
corrélées et étroitement liées aux constantes élastiques C11, C12, C44 et à la pression de
Cauchy C12-C44.
Dans le graphe des variables du groupe de carbone y compris l’hydrogène la (Figure IV.2.4),
quatre groupes distincts peuvent être observés: le premier (groupe 1) contient C11, C12, et
C44, en plus de B et E. Le deuxième groupe (Groupe 2) peut être décomposé en deux sous-
groupes; un contient EA et χ, et l'autre I et Etot. Dans le troisième groupe (groupe 3) il y’a
deux sous-groupes; l’un comprend r, α, m et Z et l'autre σ; Le quatrième groupe (groupe 4)
contient V et C12-C44. Dans le groupe de carbone, les propriétés varient comme suit: dans le
groupe 1, une forte corrélation est observée entre B, E et C11, C12, C44; tandis que E et B
sont corrélées et étroitement liées aux constantes élastiques C11, C12, C44. De même, m et Z
dans le groupe 3 sont également fortement corrélées. Le point de m est le plus proche de celui
de Z; La même remarque peut être faite pour le point de E et ceux de C11, C44. Les groupes 1
et 4 sont inversement corrélés. De même, les groupes 2 et 3 présentent une corrélation
inverse, et plusieurs corrélations peuvent être mentionnées. Une augmentation de χ et EA se
traduira par une hausse des I et Etot et une baisse de r, α, m, Z et σ. Par conséquent, une
augmentation de V conduira à une diminution de B, et une augmentation de E provoquera une
augmentation de B. En outre, une augmentation de B donne une diminution de C12-C44.
En regardant le graphe ACP des variables du groupe des halogènes y compris l’hydrogène
(Figure IV.2.6), trois groupes distincts peuvent être spécifiés: le premier groupe (Groupe 1)
contient les propriétés I, χ et Etot, le deuxième groupe (Groupe 2) contient σ; tandis que le
(groupe 3) peut être décomposé en deux sous-groupes, l’un contient les propriétés r, V, α, m,
et Z, et l'autre EA.
Chapitre IV. Résultats et discussions
81
Après examinination de la figure IV.2.6, nous remarquons que les propriétés I, χ et Etot sont
fortement corrélées à σ; tandis que les groupes 2 et 3 ont des valeurs inverses de PC, ce qui
signifie que les propriétés contenues dans le groupe 3 sont inversement corrélées à σ. Il est
facile de noter que ces propriétés sont liées à la conductivité électrique, qui est une
caractéristique importante dans le tableau périodique des éléments.
IV.2.3. La régression par les Moindres Carrés Partiels (PLS)
Cette régression est basée sur la relation entre les propriétés mécaniques (E, B, σ, C11,
C12, C44, C12-C44) et les propriétés physiques (α, χ, m, Z, r, V, EA, I, Etot). L'approche PLS
est appliquée pour élucider les relations entre ces propriétés. Elle crée un ensemble de
composantes, en commençant par une base de données composées de diverses observations
caractérisées par différentes variables. C’est une technique de réduction des données, pour
réduire les variables X à une série de composantes non apparentées qui illustrent la variation
dans les données. La régression PLS est d'un intérêt particulier car elle peut analyser les
données corrélées et les variables redondantes; elle peut aussi modéliser les différentes
caractéristiques en même temps. Les résultats de la PLS pour les trois bases de données sont
présentés dans les figures : (Figure IV.2.7, Figure IV.2.8 et Figure IV.2.9). Ils sont obtenus
en utilisant le deux premières composantes (t1,t2). Le nombre de facteurs est automatiquement
sélectionné; la première composante PLS est plus fiable que les composantes suivantes.
Finalement, le choix des deux composantes PLS permet de faire de pratiques visualisations.
Les variables X et Y sont visualisées sur un graphe, nommé '' le cercle de corrélation '', en
fonction de leurs relations avec les facteurs PLS, t1 et t2, qui pourrait être interprété de la
même manière que pour le graphe des variables dans l'ACP; les cosinus des angles formés par
les vecteurs-variables dans le plan indiquent les corrélations entre les variables d'origine [19].
Les variables les plus importantes se trouvent à la périphérie du cercle de corrélation, alors
que les variables, qui n’apportent que de petites ou aucune contribution à la discrimination,
sont à proximité du centre du cercle [20].
Pour la base de données des métaux alcalins, une régression PLS des 7 variables Y en
fonction des 9 variables X, en utilisant les deux premiers facteurs t1 et t2, est réalisée comme
le montre la Figure IV.2.7. Le graphe obtenu est le cercle de corrélation entre les variables
des propriétés mécaniques, et celles des propriétés physiques dans les deux composantes PLS
(t1,t2). Ceci permet la visualisation des similitudes entre les propriétés physiques des variables
(xi) et les deux facteurs PLS t1 et t2 d'une part, et entre les propriétés physiques des variables
Chapitre IV. Résultats et discussions
82
(Yi) et t1, t2 d'autre part. Nous trouvons de fortes corrélations entre m, Z, V, d'une part, et χ, I
de l'autre part; ainsi entre les constantes d'élasticité C11, C12, et C44 d’un côté et E, B et la
pression de Cauchy C12-C44 d’un autre côté. Une corrélation négative est également notée
entre Etot et m, Z, et la même tendance est observée entre r et EA. En ce qui concerne les
variables explicatives (xi), la conductivité σ électrique n’est pas bien représentée dans les
deux premières composantes; elle est à proximité du centre du cercle de corrélation. Ceci peut
s’expliquer par le fait que cette variable définit à peine les tendances des propriétés des
éléments. Elle est moins corrélée aux variables X, et donc semble être moins corrélée aux
facteurs PLS t1 et t2. En regardant le graphe PLS représentant la base de données du groupe de
carbone (Figure IV.2.8), il y’a de fortes corrélations observées entre m, Z d'un côté et entre
les constantes élastiques C11, C12, C44, et E, B d’un autre côté. Il semble également en
(Figure IV.2.8) qu’Etot est corrélée négativement à m et Z. Une tendance similaire est
observée entre V et EA. La conductivité électrique σ est à proximité du centre du cercle de
corrélation, donc elle apporte une contribution réduite à la discrimination.
Pour la base de données des halogènes, la régression PLS dont la variable Y est la
conductivité électrique σ est en fonction des variables X, qui sont les 9 propriétés physiques
(α, χ, m, Z, r, V, EA, I, Etot), avec t1 et t2, les résultats sont visualisés dans le cercle de
corrélation dans la Figure IV.2.9. Un premier aperçu indique que toutes les propriétés se
situent à la périphérie du cercle, ce qui signifie qu'elles sont toutes des variables
discriminantes et participantes.
Chapitre IV. Résultats et discussions
83
Figure IV.2.7. Le cercle de corrélation entre les propriétés mécaniques, et les propriétés
physiques dans les deux composantes PLS (t1, t2) (la base de données des
métaux alcalins).
Figure IV.2.8. Le cercle de corrélation entre les propriétés mécaniques, et les propriétés
physiques dans les deux composantes PLS (t1, t2) (la base de données du
groupe de carbone).
Chapitre IV. Résultats et discussions
84
Figure IV.2.9. Le cercle de corrélation entre les propriétés mécaniques, et les propriétés
physiques dans les deux composantes PLS (t1, t2) (la base de données des
halogènes).
Chapitre IV. Résultats et discussions
85
IV.2.4. Conclusion
L'atome d'hydrogène a un seul électron, donc on pourrait penser que ses propriétés
chimiques sont limitées, mais il a diverses propriétés chimiques et peut être combiné avec
presque tous les éléments. L'hydrogène est différent des autres éléments de la classification
périodique, car il possède des propriétés exceptionnelles, il a été placé à la tête du groupe des
alcalins, car il a un seul électron de valence. Cependant, cette position ne révèle pas ses
propriétés chimiques et physiques [18].
Par conséquent, d'après les résultats représentés par les graphes des observations dans les
figures IV.2.1, IV.2.3., et IV.2.5, on peut en déduire que l'hydrogène partage certaines
propriétés avec certains éléments et groupes du tableau périodique, tels que le groupe du
carbone, mais pas totalement; à vrai dire l'hydrogène est un élément à part, et ne s’ajuste
harmonieusement à aucun groupe.
Dans cette étude, la méthode d'extraction des données a été utilisée comme une analyse
exploratoire des données. C’est une approche qui devient de plus en plus importante dans la
recherche, en utilisant les différentes méthodes statistiques multivariées telles que l’ACP et la
régression PLS pour visualiser les positions des éléments l’un par rapport à l'autre dans
chaque base de données, et pour étudier les relations entre leurs propriétés. Ce travail montre
que les outils statistiques tels que l’ACP combinée avec la PLS peuvent être très utiles pour
identifier les corrélations entre les groupes de variables dans un ensemble de données afin de
déterminer les variables (propriétés) qui devraient être utilisées pour classer les éléments.
Cette étude présente une nouvelle méthode pour étudier le comportement d'un élément dans le
tableau périodique, et les tendances de leurs propriétés à l'aide de l'exploration de données et
de ses techniques appropriées. Nous avons trouvé que l'hydrogène partage certaines
similitudes avec certains éléments et groupes dans le tableau périodique tels que le groupe de
carbone. En fait, l'hydrogène est toujours considéré comme un élément à part, distinct et
spécial.
Chapitre IV. Résultats et discussions
86
IV.2.5. Références
[1] Marshall W. Cronyn, The Proper Place for Hydrogen in the Periodic Table, Journal of
Chemical Education. No 8. 80, 947-951 (2003).
[2] Albert Hérold, An arrangement of the chemical elements in several classes inside the
periodic table according to their common properties, C. R. Chimie. 9 (2006) 148–153.
[3] P. P. Edwards, M. T. J. Lodge, F. Hensel and R. Redmer, a metal conducts and a non-
metal doesn't'…', 941-965368 Phil. Trans. R. Soc. A. 368 (2010) 941-965.
[4] S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S. Ganeshan, Y. Wang, Z.K.
Liu, First-principles calculations of pure elements: Equations of state and elastic stiffness
constants, Computational Materials Science. 48 (2010) 813–826.
[5] NIST (National Institute of Standards and Technology), www.nist.gov (Accessed June
10, 2012).
[6] R.A. Dragoset, A. Musgrove, C.W. Clark, and W.C. Martin, (2003), Periodic Table:
Atomic Properties of the Elements (Version 4), NIST SP 966.
<http://physics.nist.gov/PT> . NIST (National Institute of Standards and Technology),
Gaithersburg, MD, (2012).
[7] J.C. Slater, J. Chem. Phys. 39 (1964) 3199, http://www.webelements.com/
[8] Charles Kittel, lntroduction to Solid State Physics, 8th edition. Hoboken, (NJ: John Wiley
& Sons), Inc, 2005.
[9] Y. Makino, S. Miyake, Estimation of bulk moduli of compounds by empirical relations
between bulk modulus and interatomic distance, Journal of Alloys and Compounds. 313
(2000) 235–241.
[10] The Massachusetts Institute of Technology. <http://www.chemicool.com>. (Accessed 20
July 2012).
[11] Martienssen Warlimont, Springer handbook of condensed matter and materials data
Volume 1- Hans Warlimont, Springer Berlin Heidelberg (2005).
[12] David R. Lide, ed., CRC Handbook of Chemistry and Physics, 90th Edition, (CRC
Press/Taylor and Francis, Boca Raton, FL), 2010.
[13] V. Ya. Ternovoi, A. A. Pyalling, D. N. Nikolaev, and S. V. Kvitov, Conductivity of
multiple shock compressed hydrogen along 135 and 180 GPa isobars, CP1195, shock
compression of condensed matter. (2009) 915-918.
[14] http://easycalculation.com/chemistry/periodic-table.php. (Accessed 29 June 2013).
Chapitre IV. Résultats et discussions
87
[15] Peter Schmittinger, Chlorine, Principles and industrial practice, 1st Edition (2000),
(Wiley-VCH Verlag GmbH, D-69469 Weinheim) Germany.
[16] Shin, E. C., Craft, B. D., Pegg, R. B., R. Phillips, D., and Eitenmiller, R. R. (2010),
“Chemometric approach to fatty acid profiles in Runner-type peanut cultivars by
principal component analysis (PCA)”, Food Chemistry, 119, 1262–1270.
[17] Wiberg, E., Wiberg, N., and Holleman, A. F. (2001), « Inorganic chemistry », Academic
Press.
[18] Atkins, P.W., Overton, T.L., Rourke, J.P., Weller, M.T., and Armstrong, F.A. (2010).
Inorganic Chemistry, 5th ed, (Oxford University Press).
[19] Tenenhaus, M., Pagès, J., Ambroisine, L., and Guinot, C. (2005), « PLS methodology to
study relationships between hedonic judgements and product characteristics », Food
Quality and Preference, 16, 315–325.
[20] Sjöström, M., and Wold, S. (1986), “Partial Least Square Discriminant Plots”, Pattern
Recognition In Practice II. pp. 461-470.
[21] Laing, M. (2007), « Where to put hydrogen in a periodic table?, Foundations of
Chemistry », 9, 127–137.
[22] Cronyn, M. W. (2003), « The Proper Place for Hydrogen in the Periodic Table », Journal
of Chemical Education, No 8. 80, 947-951.
Chapitre IV. Résultats et discussions
88
Troisième partie
IV.3. Investigation des propriétés structurales et mécaniques des hydrures
alcalins par les calculs ab initio et l'approche du datamining
IV.3.1. Introduction Les hydrures sont des matériaux prometteurs; qui peuvent être utilisés dans les
batteries rechargeables, les cellules, les réfrigérateurs, les capteurs, les commutateurs
optiques, ainsi que dans le stockage de chaleur, en industrie nucléaire et dans la purification
de l'hydrogène. Par conséquent, il est nécessaire d'étudier leurs propriétés, pour pouvoir
concevoir des hydrures appropriés pour les applications spéciales [1].
L'étude des hydrures métalliques est importante car elle peut aider à comprendre les
propriétés de l'hydrogène qui améliore les propriétés de stockage [2]. Les hydrures que
l'hydrogène forme par réaction avec les métaux alcalins (Li , Na, K, Rb, et Cs) sont
stoechiométriquement stable. Les hydrures alcalins MH (M = Li , Na, K, Rb, et Cs)
représentent un domaine intéressant de la recherche, parce qu'ils sont utiles dans la fusion ce
qui permet d'acquérir des carburants de haute énergie [3]. Depuis la première étude
expérimentale par rayonnement X, en 1931, il a été démontré [4] que les hydrures alcalins
cristallisent dans la structure NaCl (B1) à température ambiante et pression ambiante,
comme la structure de Li , Na, K, Rb, et Cs [5; 6].
Figure IV.3.1. Structure cristalline de la structure NaCl (B1) des hydrures alcalins MH dans
les conditions ambiantes. Les cercles bleus représentent M = Li , Na, K, Rb,
Cs, et les cercles violets représentent les atomes d'hydrogène.
Chapitre IV. Résultats et discussions
89
L'objectif de ce travail est d'éxaminer les propriétés structurales et mécaniques des
hydrures alcalins obtenues par les calculs ab initio en utilisant l’approche datamining, et la
technique d’Analyse en Composantes Principales (ACP) pour explorer de nouvelles relations
afin de révèler les tendances dans la base de données et montrer les similitudes et les
corrélations existantes entre les variables (les propriétés) et les hydrures alcalins.
Pour réaliser cette étude, nous avons construit une base de données (Tableau IV.3.2)
à partir des propriétés mécaniques calculées, par les calculs ab initio implémentés dans le
code VASP [7; 8] dans le cadre de la Théorie de la Fonctionnelle de la Densité DFT [9; 10],
les énergies d’échange et de corrélation des structures ont été traitées par l’approximation du
gradient généralisé (GGA) [11] et le procédé de projection des ondes augmentées (PAW)
[12; 13; 14], ça confirme la précision des méthodes tout électrons, avec l'efficacité de la
méthode des pseudo-potentiels [15]. La fonctionnelle d'échange et de corrélation est adoptée
pour décrire l'interaction d'échange-corrélation. Le test de convergence a donné une énergie
de coupure de 312,50 eV lorsque la base d'onde plane est utilisée. Suivant le schéma
Monkhorst-Pack [16], pour l'intégration nous avons utilisé une maille de (13×13×13) points-
k dans la première zone de Brillouin, et qui a été utilisé pour tous les calculs. Dans tous les
cas, les optimisations de géométrie ont été effectuées et les convergences ont été assumées
lorsque les forces sur les atomes étaient inférieures à 1 MeV / Å.
IV.3.2. Base de données
LiH NaH KH RbH CsH
a0(Å) 4.02a 4.057[53] b
4.02 [54]c
4.833 a 4.870[55]b
4.834[56]c
5.699 a 5.70[57]b
5.699 [58]c
6.068 a 6.04[59]b
6.075 [60]c
6.437 a 6.388 [61]b
6.429 [62]c
B0(GPa) 34.614 a 34.7[55]b
34.30[58]c
22.507 a 19.40 [55]b
22.60[62]c
13.017 a 15.6 [66]b
13.30 [58]c
10.944 a 10.00[66]b
11.1 [62]c
8.686 a 8.00 [61]b 8.80 [58]c
B’0 3.141 a
3.40 [67]b
3.3[68]c
3.522 a 4.40 [55]b
3.62 [69]c
3.539 a 4.00 [66]b
3.70 [58]c
3.649 a 3.9 [66]b
3.47 [58]c
3.508 a 4.00 [70]b 3.0365 [71]c
a Le présent travail b Valeurs experimentales c Valeurs théoriques Tableau IV.3.1:Les valeurs calculées du paramètre de maille a0 (Ǻ), le module de
compressibilité (B0) (GPa) et la dérivé première de la pression (B’0) des hydrures alcalins dans la structure NaCl (B1), avec quelques autres ésultats.
Chapitre IV. Résultats et discussions
90
LiH NaH KH RbH CsH
C11(GPa) 56.97 a 65.31 [72]b
49.90 a 47.3 [73]b
48.3 [74]c
23.49 a 23.0 [60]c
21.914 a 24.6 [58]c
15.817 a 16.4 [60]c
C12(GPa) 23.43 a 17.5 [75]b
22.3 [76]c
8.81a 8.0[60]c
7.78 a 8.35 [71]c
5.458 a 4.6 [58]c
5.12 a 6.761 [71]c
C44(GPa) 46.156 a 46.2 [73]b
46.0 [54]c
22.969 a 22.5 [73]b 22.7 [58]c
11.804 a 12.9 [58]c
9.299 a 8.2 [58]c
7.397 a 6.7 [60]c
G(GPa) 30.768 a
21.966 a
23 [71]c
10.025 a
13 [71]c 8.85 a
10.2 [71]c 6.49 a
9.15 [71]c
E(GPa) 71.20 a
49.72 a
53 [71]c
23.931 a
20.91a
15.587 a
ν 0.157 a
0.11 [71]c 0.13 a
0.13 [71]c 0.19 a
0.21 [71]c 0.18 a
0.23 [71]c 0.20 a
0.22 [71]c
A 2.75 a 1.11a
0.88 [71]c 1.50 a
1.27 [71]c 1.13 a
1.18 [71]c 1.38 a
1.18 [71]c
B/G 1.125 a
1.024 a
1.13 [71]c
1.29 a
1.2 [71]c
1.236 a
1.37 [71]c
1.33 a
1.31 [71]c
a Le présent travail b Valeurs experimentales c Valeurs théoriques
Tableau IV.3.2: Les Constantes mécaniques et élastiques des hydrures alcalins dans la
structure NaCl (B1), avec quelques autres résultants, le module de
compressibilité (B0), module de cisaillement (G), constantes élastiques (Cij),
le module d'Young (E) sont en (GPa). Le rapport B/G, le facteur
d'anisotropie (A) et le coefficient de Poisson (ν) sont des paramètres sans
dimension.
Chapitre IV. Résultats et discussions
91
IV.3.3. L’analyse en composantes principales (ACP)
IV.3.3.1. Les propriétés structurales
Les paramètres structuraux des hydrures alcalins (LiH, NaH, KH, RbH et CsH) ont
été optimizes, et l'énergie totale a été étudiée en fonction du volume. Les paramètres de la
structure, module de compressibilité (B0), la dérivé première de la pression (B’0) ont été
déterminés en ajustant les énergies totales à l'équation d'état de Murnaghan [17]; les valeurs
sont données dans le (Tableau IV.3.1). A partir de ces valeurs, on peut noter que les valeurs
calculées sont en bon accord avec ceux obtenues dans les travaux expérimentaux et
théoriques précédents; cela prouve la validité de notre modèle théorique. L'approximation du
gradient généralisé (GGA) estime la fiabilité de l'énergie totale à la fois sur la densité
d'électrons et de son gradient. La GGA améliore généralement les paramètres structuraux du
matériau [18].
IV.3.3.2. Les propriétés mecaniques
Le cristal cubique possède trois constantes élastiques indépendantes, C11, C12 et C44
[19] qui ont été déterminées par ajustement des énergies totales d'un cristal contraint à une
equation de contraintes polynomiale du quatrième ordre, selon la loi de Hooke [20]. Trois
types de contraintes, à savoir la variation de volume, les contraintes de cisaillement
tétragonal et rhomboédrique et le volume conservé, ont été appliquées à la structure
optimisée. Les constantes élastiques sont calculées et rapportées dans le (Tableau IV.3.2),
avec quelques autres données disponibles, qui indiquent que les structures cubiques pour
chaque hydrure alcalin sont mécaniquement stables parce qu'elles satisfont les critères de
stabilité du cristal cubique [21].
C44> 0 (IV-1)
C11> | C12 | (IV- 2)
C11 + 2C12> 0 (IV-3)
Le module de cisaillement (Tableau IV.3.2) joue un rôle dominant dans la prédiction de la
dureté du matériau. Il a été trouvé que LiH a le module de cisaillement le plus élevé parmi
les hydrures alcalins, ce qui signifie que LiH a une grande dureté. Par conséquent, LiH est
plus résistant que les autres hydrures alcalins. Le rapport B/G est généralement utilisé pour
prédire le comportement ductile et fragile des matériaux. Le matériau est ductile lorsque
Chapitre IV. Résultats et discussions
92
B/G > 1,75 [22], et il a un caractère fragile quand B/G ≤ 1,75 [23]. Un tel comportement est
indirectement lié au facteur d'anisotropie. D’après les valeurs de B/G calculées, présentées
dans le (Tableau IV.3.2), on constate qu'elles sont toutes inférieures à 1,75, ce qui indique
que les hydrures alcalins se comportent d'une manière fragile dans les conditions ambiantes,
et peuvent être donc considérés comme des matériaux fragiles. Le module d'Young E est
connue comme une quantité de mesure de la rigidité d'un matériau élastique [24]. En
analysant les valeurs de E présentées dans le (Tableau IV.3.2), on peut noter que le LiH est
le plus rigide parmi les hydrures alcalins. La rigidité des hydrures alcalins diminue de LiH à
CsH. Comme le montrent les tableaux IV.3.1 et IV.3.2, les valeurs calculées du module de
compressibilité, du module de cisaillement, et du module d'Young diminuent selon l'ordre
LiH < NaH < KH < RbH < CsH. Le rapport de Poisson ν, qui varie généralement de -1 à 0,5,
est utilisé pour estimer la stabilité du cristal contre le cisaillement [38], ν mesure la
résistance du matériau au cisaillement [36], il fournit plus d'informations sur les
caractéristiques des forces de liaison que tout autre constante élastique [48]; il est
généralement égale à 1/3 pour les matériaux ductiles et moins de 1/3 pour les matériaux
fragiles [49]. Les valeurs du rapport de Poisson ν, figurant dans le tableau IV.3.2, sont
inférieures à 1/3, ce qui indique que les hydrures alcalins sont des matériaux fragiles.
L'anisotropie A (également appelée le rapport d'anisotropie de Zener) est une mesure du
degré d'anisotropie dans les solides [25]. Elle est égale à 1 pour un matériau isotrope.
Lorsque A est inférieur ou supérieur à 1, A est utilisée pour mesurer le degré d'anisotropie
élastique [19]. Selon les valeurs d'anisotropie calculées et indiqués dans le tableau IV.3.2,
on peut noter que les hydrures alcalins sont caractérisés par une anisotropie élastique.
IV.3.4. Analyse par l’approche data mining
Les valeurs du module de compressibilité (B), le module de cisaillement (G), le module de
Young (E), le coefficient de Poisson (ν), le rapport d'anisotropie (A), le rapport B/G, et les
constantes élastiques (C11, C12 et C44) calculées par les calculs ab initio et affichées dans le
tableau IV.3.2, les hydrures alcalins (LiH, NaH, KH, RbH et CsH) constituent la base de
données analysées par l’approche data mining et la technique d’ACP. L'analyse en
composantes principales (ACP) effectuée sur la base de données, a donné deux importantes
composantes principales PC, où PC1 capture 83,07% de la variance totale dans la base de
données, alors que PC2 capture 16,84%, comme le montre (Figure IV.3.2). Le graphe des
observations des deux premières composantes principales pour les hydrures alcalins (Figure
Chapitre IV. Résultats et discussions
93
IV.3.2), révèle deux groupes distincts d'hydrures. Groupe 1 comprend LiH et NaH ayant une
valeur positive de PC1, tandis que le groupe 2 contient KH, RbH et CsH qui ont une valeur
négative de PC1. Il est à noter que l'axe de PC2 sépare le groupe 1 du groupe 2. Le groupe 1
contient les hydrures alcalins avec des valeurs élevées du module de B, du module de
cisaillement, du module d’Young, et des constantes élastiques (C11, C12 et C44) et de
faibles valeurs du coefficient de Poisson et du ratio B/G; contrairement au groupe 2 qui
contient les hydrures ayant de faibles valeurs du module de compressibilité, du module de
cisaillement, du module d’Young, des constantes élastiques (C11, C12 et C44) et des valeurs
élevées du coefficient de Poisson et du rapport B/G. En outre, les hydrures alcalins du
groupe 2 ont des valeurs très proches de B, G, E, C11, C12, C44, ν, et B/G. En regardant le
graphe d’ACP des variables (Figure IV.3.3), on peut noter que les propriétés mécaniques, à
savoir B, G, E, C11, C12, C44, et A, ont les même valeurs de la composante principale
(PCs), ce qui signifie qu’elles sont fortement corrélées parce que leurs points sont proches
les uns des autres; cela révèle l'importance de ces propriétés. Celles-ci sont inversement
corrélées à ν et B/G, car elles ont des valeurs de PC opposées. L’axe PC2 sépare clairement
B, G, E, C11, C12, C44, A de ν et B/G; cela exprime la forte différence entre elles. G
représente la dureté contrairement à B/G et ν qui expriment la ductilité; donc une
augmentation de la dureté, conduira à une diminution de la ductilité (soit une augmentation
de la fragilité), ce qui prouve que les hydrures alcalins sont des matériaux fragiles. Aussi, si
B/G diminue et le module d’Young augmente, le matériau se transformerait en moins
ductile. Cela nécessite d'augmenter la rigidité et à diminuer la fragilité. Le biplot montré en
(Figure IV.3. 4) révèle que le premier groupe des hydrures (LiH, NaH) est lié à B, G et E,
indiquant leur grande dureté et rigidité, tandis que ceux du groupes 2 (KH, RbH, CsH) sont
corrélés à B/G et ν; ce qui indique la faible ductilité et la haute fragilité de ces hydrures. Les
résultats de l'analyse de données ACP sont en bon accord avec les résultats obtenus par les
calculs ab initio et avec ceux déterminés théoriquement et experimentalement.
Chapitre IV. Résultats et discussions
94
Figure IV.3.2. Le graphe des observations des hydrures alcalins
Figure IV.3.3. Le graphe des variables des hydrures alcalins.
Chapitre IV. Résultats et discussions
95
Figure IV.3.4. Le graphe de « Biplot » représentant les hydrures alcalins et les propriétés.
Chapitre IV. Résultats et discussions
96
IV.3.5. Conclusion
En résumé, les propriétés structurales et mécaniques des hydrures alcalins (LiH, NaH,
KH, RbH et CsH) ont été étudiées par les calculs ab initio. Les calculs des énergies totales,
des géométries optimisées et des constantes élastiques ont été effectuées en utilisant le
logiciel VASP, ainsi que la méthode PAW GGA. Le data mining est une nouvelle approche
qui a été employée pour analyser les résultats obtenus, il est considéré comme l'une des
approches fiables pour les problèmes d'optimisation, l’ACP est une des techniques de data
mining largement utilisée pour l’analyse des données. Les propriétés calculées sont en bon
accord avec les données expérimentales et théoriques disponibles. Les constantes élastiques
calculées indiquent que les hydrures alcalins sont mécaniquement stables. L'analyse de G/B
révèle que les hydrures alcalins sont des matériaux fragiles dans les conditions ambiantes.
Compte tenu des valeurs du module de cisaillement (G), du module de compressibilité (B), et
du module d’Young (E), il a été constaté que LiH est le plus rigide et le plus fragile parmi les
hydrures étudiés. Les résultats obtenus montrent que les hydrures possèdent des propriétés
intéressantes qui peuvent être très utiles dans certaines applications industrielles, en
particulier LiH qui est un matériau prometteur.
Ce document présente l'aptitude des techniques d'exploration de données, telles que l’ACP, à
analyser et à obtenir des informations précieuses à partir d'un ensemble de données. En outre,
il peut être conclu que les résultats de l'analyse des données, sont en bon accord avec les
résultats obtenus par les calculs ab initio et ceux rapportés dans la littérature.
Chapitre IV. Résultats et discussions
97
IV.3.6. Références
[1] L. George, R. Hrubiak, K. Rajan, S. K. Saxena, Principal component analysis on
properties of binary and ternary hydrides and a comparison of metal versus metal hydride
properties, Journal of Alloys and Compounds 478 (2009) 731–735.
[2] L. George, S. K. Saxena, Structural stability of metal hydrides, alanates and borohydrides
of alkali and alkali- earth elements: A review, International Journal of Hydrogen Energy 35
(2010) 5454-5470.
[3] X.W. Sun, Q.F. Chen, X.R. Chen, L.C. Cai, F.Q. Jing, Ab initio study of phase transition
and bulk modulus of NaH, Journal of Solid State Chemistry 184 (2011) 427–431.
[4] E. Zintl, A. Harder, Z. Phys. Chem. Abt. B 14 (1931) 265.
[5] X.W. Sun, L.C. Cai, Q.F. Chen, X.R. Chen, F.Q. Jing, Structural, thermodynamic,
electronic, and optical properties of NaH from first-principles calculations, Materials
Chemistry and Physics 133 (2012) 346– 355.
[6] D. Colognesi, M. Zoppi, Hydrogen vibrational dynamics in ionic metal hydrides revealed
through inelastic neutron scattering, Notiziari Neutroni E Luce Disincrotrone, 11 (2006) 4-
13.
[7] G. Kresse, J. Furthmuller, Comput. Mater. Sci.6 (1996) 15.
[8] <http://cms.mpi.univie.ac.at/vasp>.
[9] P. Hohenberg, W. Kohn, Physical Review 136 (1964) B864–B871.
[10] W. Kohn, L.J. Sham, Physical Review 140 (1965) A1133–A1138.
[11] J. Perdew, J.A. Chevary, S.H. Vosko, K.A. Jackson, M.R. Pederson, D.J. Singh, C.
Fiolhais, Phys. Rev. B 46, 6671 (1992).
[12] G. Kresse, D. Joubert, Phys. Rev. B59 (1999) 1758.
[13] S. Shang, A.J. Bottger, M.P. Steenvoorden, M.W.J. Craje, Acta Mater. 54 (2006) 2407–
2417.
[14] P.E. Blöchl, O. Jepsen, O.K. Andersen, Physical Review B 49 (1994) 16223–16233.
[15] S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S. Ganeshan, Y. Wang,
Z.K. Liu, First-principles calculations of pure elements: Equations of state and elastic
stiffness constants, Computational Materials Science 48 (2010) 813–826.
[16] H.J. Monkhorst, J.D. Pack, Phys. Rev. B13 (1976) 5188–5192.
[17] F.D. Murnaghan, Proc. Natl. Acad. Sci. USA Vol. 30, (1944) 244.
Chapitre IV. Résultats et discussions
98
[18] R. Miloua, Z. Kebbab, N. Benramdane, M. Khadraoui, F. Chiker, Ab initio prediction of
elastic and thermal properties of cubic TiO2, Computational Materials Science 50 (2011)
2142–2147.
[19] S. Boucetta, F. Zegrar, Density functional study of elastic, mechanical and
thermodynamic properties of MgCu with a CsCl-type structure, Journal of Magnesium
and Alloys 1 (2013) 128-133.
[20] J.F. Nye, Propriétés Physiques des Matériaux, Dunod, Paris, 1961.
[21] D.C. Wallace, Thermodynamics of Crystals, Wiley, New York, (1972).
[22] S.F. Pugh, Philos. Mag. 45 (1954) 823.
[23] P. Ravindran, L. Fast, P.A. Korzhavyi, B. Johansson, J. Wills, O. Eriksson, J. Appl.
Phys. 84 (1998) 4891.
[24] M.F. Yan, H.T. Chen, Structural, elastic and electronic properties of Cr2N: A first-
principles study, Computational Materials Science 88 (2014) 81–85.
[25] C. Zener, Elasticity and Anelasticity of Metals, University of Chicago Press, Chicago,
1948.
CONCLUSION GÉNÉRALE
Conclusion générale
99
Dans ce travail on déduit comment la combinaison de deux domaines importants : la
mécanique quantique et le data mining et ses méthodes (ACP et PLS), nous a permi d’étudier
un phénomène qui reste insoluble jusque-là pour les physiciens et les chimistes, qui est les
contradictions du tableau périodique avec la mécanique quantique. Le placement de certains
éléments dans le tableau périodique a été problématique depuis le premier tableau de Dimitri
Mendeleev en 1869.
Le tableau périodique des éléments, est la généralisation la plus importante en chimie,
il est souvent considéré comme un cas représentatif particulier dans l’étude de la relation entre
la chimie et la physique, et comme l'une des idées les plus unificatrices dans toute la science
moderne.
La tentative d'expliquer les détails du tableau périodique continue à défier l'ingéniosité
des physiciens quantiques et chimistes quantiques [2]. La mécanique quantique a la capacité
d’expliquer et reproduire la chimie, ce qui a permis aux physiciens d’aller au-delà du tableau
périodique des atomes neutres à l’état fondamental, et ce qui pourrait être interprété comme
une déclaration obtenue d'une réduction de la chimie à la physique [1]. La classification
périodique n'a pas encore sa forme définitive, et n'est pas entièrement cohérente avec la
mécanique quantique, à cause des anomalies qu'elle contient.
L’originalité de ce travail persiste dans l’usage de l’approche data mining et de ses
techniques, l’Analyse en composantes principales (ACP) et la régression (PLS), qui sont
appliquées pour la première fois dans l’étude de ce problème, et qui nous ont permi de
visualiser les corrélations existantes dans chaque base de données, et de voir de prés le
problème.
Par conséquent, les résultats obtenus montrent que le lutétium partage beaucoup de
similitudes avec les métaux de transition de la troisième période du tableau périodique, par
contre l'hydrogène partage certaines propriétés avec certains groupes du tableau périodique,
tel que le groupe du carbone, mais pas tout à fait; à vrai dire l'hydrogène est un élément à part,
et n’est conforme à aucun groupe.
Enfin on a calculé les propriétés structurales et mécaniques des hydrures alcalins par
les calculs ab initio implémentées dans le code VASP, dans le cadre de la Théorie de la
Fonctionnelle de la Densité DFT, les résultats obtenus ont été analysés en utilisant l’approche
Conclusion générale
100
datamining, et la technique d’Analyse en Composantes Principales (ACP) pour explorer les
similitudes et les corrélations existantes entre ce type d’hydrures. On a trouvé que les
hydrures alcalins sont des matériaux fragiles dans les conditions ambiantes, et que LiH est le
plus rigide et le plus fragile parmi ces hydrures, LiH est un matériau prometteur en industrie
des batteries rechargeables, et dans le stockage d’énergie.
Les résultats obtenus sont très intéressants, du point de vue scientifique, ils ont été
approuvés par de grands chercheurs travaillant sur ce problème. Cela prouve l’importance de
l’approche data mining et de ses techniques, l’Analyse en composantes principales (ACP) et
la régression (PLS) dans l’analyse et traitement de données.
Ce travail ouvre des horizons à l’usage de l’approche data mining et les techniques
d'analyse multivariée pour explorer et étudier des problèmes qui semblent sans issue.
Conclusion générale
101
Références
[1] V. N. Ostrovsky, « Physical Explanation of the Periodic Table », Ann. N. Y. Acad. Sci.
988 (2003) 182-192.
[2] Eric R. Scerri, « Collected papers on philosophy of chemistry », Imperial College Press,
(2008). ISBN-13 978- 1-84816- 137-5.
Le résumé
102
La découverte de la structure de l’atome au début du vingtième siècle a
marqué une grande étape dans l’avancée des connaissances. De nombreux
phénomènes physiques et chimiques demeuraient sans interprétation tels que l’effet
Compton, l’effet Zeeman,…etc. Ce qui a conduit les physiciens et chimistes à
abandonner le modèle classique de la mécanique newtonienne et à introduire un
nouveau modèle qui est la mécanique quantique, ce qui a permis une interprétation
nouvelle de la classification périodique [1].
La mécanique quantique a été la théorie la plus spectaculaire réussi dans
l'histoire de la science. L'impact de la théorie a été ressenti dans des domaines tels que
la physique du solide, et la science des matériaux [2].
Bien qu'il soit évident que les tentatives pour expliquer la chimie en termes de
la théorie quantique ne peuvent apparaître suite au développement de la mécanique
quantique
au XXe siècle, ce type de réductionnisme ne date pas d'aujourd'hui. En général, le
réductionnisme est l'idée qu’une science, telle que la chimie, peut être réduite plus à
une science "fondamentale", dans ce cas, à la physique. la conception même du
réductionnisme supposant une hiérarchie dans les sciences entre les sciences plus
fondamentales, généralement la physique et les mathématiques, et ceux qui sont
considérées comme des dérivés ou des épiphénomènes, à commencer par la chimie, et
passant par la biologie aux sciences humaines comme la sociologie ou la psychologie
[9].
On objectera aisément à ce qui précède que même si la réduction n’existe pas
pour le moment elle peut jouer le rôle d’un idéal, d’un but à atteindre. N’a-t-elle pas
stimulé le développement de la chimie et de la physique au 19e siècle ? N’inspire-t-
elle pas aujourd’hui la biologie? Examinons cela. L’idée d’une réduction verticale
qui, de l’antiquité aux lumières, a été une thèse philosophique (l’atomisme) s’incarne
au 19e siècle dans l’hypothèse atomique des chimistes, puis dans la théorie cinétique
des gaz, dans la mécanique statistique, et finalement dans la “réalité moléculaire”
(selon l’expression de Jean Perrin). La théorie des quanta puis la mécanique quantique
donnent à l’atomisme des physiciens et des chimistes une justification plus profonde ;
elles expliquent que, comme le disait Bohr, il existe dans la nature une tendance à
produire des formes déterminées et à les faire réapparaître, encore et toujours, même
lorsqu’elles ont été perturbées ou détruites. Mais, en triomphant, l’atomisme a perdu
Le résumé
103
sa simplicité originelle. Les atomes ne sont plus insécables et inaltérables. L’existence
des molécules n’est plus un postulat de base de la chimie, mais un résultat de la
théorie quantique, valable sous certaines réserves. La postérité de l’atomisme s’est
scindée en deux branches bien distinctes : d’un côté la théorie savante, et les
techniques récentes de manipulation d’atomes ou de molécules presque isolées ; de
l’autre, l’idée de réduction verticale qui n’est plus une thèse philosophique ou une
hypothèse scientifique, mais est devenue une croyance.
Imaginons que la chimie, la physique du solide, la thermodynamique, la
mécanique classique enfin, soient toutes remplacées par la mécanique quantique,
devenue entièrement calculable après l’avènement d’ordinateurs d’un type nouveau.
L’industrie informatique réaliserait des chiffres d’affaires fabuleux. Mais l’idéal
d’intelligibilité qui a présidé à la naissance de la science serait mort et enterré, au
moins dans les sciences physiques ; car la mécanique quantique, qui calcule par ses
propres moyens et fournit des résultats d’une exactitude numérique étonnante, ne peut
guère se passer des béquilles de la physique classique quand on lui demande de nous
faire comprendre ce qui se passe. Par suite, les sciences physiques, débarrassées
désormais de toute incertitude et de toute nouveauté véritable, sombreraient dans un
océan d’ennui. En somme, même si la réduction devenait possible dans les sciences
physiques, elle ne les aiderait pas à remplir ce qui doit rester la tâche fondamentale de
toute science : nous aider à comprendre les phénomènes [10]. La mécanique
quantique a montré à quel point la séparation entre la physique et la chimie était
arbitraire [11].
Friedrich Paneth a clairement défini le statut épistémologique du concept
chimique de l'élément dans une conférence portant ce titre qu'il a donné en 1931. Ici,
il a soulevé deux questions. La première rappelle le problème d'Aristote avec « les
mixtes véritables », en quel sens peut-on supposer que les éléments persistent dans les
composés? " Sa réponse - basée sur une étude historique des notions d’éléments et
des atomes - est claire: puisque la chimie est concernée par les qualités secondaires
des substances, les chimistes devraient assumer la persistance des qualités dans les
composés. Il a proposé d'appeler ce qui persiste " substance de base " alors qu'il
réservait le terme " substance simple " pour la matière montrant des manifestations
phénoménologiques associées à cette substance de base abstraite, renouvelant de ce
fait la distinction conceptuelle de Mendeleev. La deuxième question de Paneth était: «
s’il est vrai ou non que la chimie doit et va se dissoudre dans la physique? " Ici, il a
Le résumé
104
traité la possibilité de reduire la chimie à la physique, un développement qui avait été
déjà prédit par certains physiciens.
La théorie quantique offre clairement des avantages considérables pour
l'enseignement de la chimie et, en particulier, pour la présentation du tableau
périodique, avec son explication du comment et du pourquoi les propriétés chimiques
des divers éléments obéissent à un modèle global. Néanmoins, ceci ne signifie pas que
les chimistes peuvent s'en sortir seuls avec la mécanique quantique. Le chimiste ne
peut pas s'isoler de ces développements et de se contenter d'exécuter et de décrire les
réactions. Il ne pourra pas tirer parti de ses succès précédents à moins qu'il assimile
les disciplines du physicien ou accepte de collaborer avec lui. Cette évolution de la
chimie vers la physico-chimie est est le trait le plus caractéristique de ces vingt
dernières années [9].
Le tableau périodique se classe comme l'une des idées les plus fécondes et
unificatrices dans toute la science moderne [12]. L'élément chimique est proche
d'une abstraction mathématique. Ainsi, il devient un instrument qui nous permet de
construire une série qui est supposée se cacher derrière. Cette abstraction permet au
chimiste de decrier l'ordre qui existe derrière la multiplicité apparente chaotique du
monde phénoménal. La plus grande valeur du concept de Mendeleev d'un élément
est sa puissance de construire la série apparentée. Les éléments chimiques sont
efficacement "désincarnés" les entités abstraites qui sont attachées au vrai monde par
le réseau des rapports décrits par le système périodique. Ce rapport abstrait-concret
est représenté par la position de l'élément dans le tableau périodique, qui forme
alternativement la base pour une multiplicité d'interprétation [13].
À mesure qu'augmentait le nombre d'éléments connus, les chimistes du XIXe
siècle éprouvaient le besoin de les ordonner. On connaissait les masses atomiques et
on avait déjà l'habitude de classer les éléments d'après l'augmentation de cette
caractéristique. La simple progression des masses atomiques ne pouvait toutefois
expliquer logiquement les différents comportements des éléments [14].
Il est en effet une sorte de miracle que la mécanique quantique explique le
tableau périodique. Mais nous ne devrions pas se laisser séduire en croyant que c’est
une explication déductive. Une chose qui est claire: est que la tentative d'expliquer les
détails de la classification périodique continue à défier l'ingéniosité des physiciens
quantiques et chimistes quantiques et que le tableau périodique continuera de
Le résumé
105
présenter un test concernant la pertinence des nouvelles méthodes développées en
chimie quantique. La réduction de la chimie à la mécanique quantique n'a ni
complètement échoué, comme certains philosophes de la science ont revendiqué, et
elle n'a pas été une réussite complète, comme certains historiens contemporains ont
revendiquée [12].
Le tableau périodique se classe comme l'une des idées les plus fécondes et
unificatrices dans toute la science moderne [9]. L'élément chimique est proche d'une
abstraction mathématique. Ainsi, il devient un instrument qui nous permet de
construire une série qui est supposée se cacher derrière. Cette abstraction permet au
chimiste de decrier l'ordre qui existe derrière la multiplicité apparente chaotique du
monde phénoménal. La plus grande valeur du concept de Mendeleev d'un élément
est sa puissance de construire la série apparentée. Les éléments chimiques sont
efficacement "désincarnés" les entités abstraites qui sont attachées au vrai monde par
le réseau des rapports décrits par le système périodique. Ce rapport abstrait-concret
est représenté par la position de l'élément dans le tableau périodique, qui forme
alternativement la base pour une multiplicité d'interprétation [10].
À mesure qu'augmentait le nombre d'éléments connus, les chimistes du XIXe
siècle éprouvaient le besoin de les ordonner. On connaissait les masses atomiques et
on avait déjà l'habitude de classer les éléments d'après l'augmentation de cette
caractéristique. La simple progression des masses atomiques ne pouvait toutefois
expliquer logiquement les différents comportements des éléments [12].
Il est en effet une sorte de miracle que la mécanique quantique explique le
tableau périodique. Mais nous ne devrions pas se laisser séduire en croyant que c’est
une explication déductive. Une chose qui est claire: est que la tentative d'expliquer les
détails de la classification périodique continue à défier l'ingéniosité des physiciens
quantiques et chimistes quantiques et que le tableau périodique continuera de
présenter un test concernant la pertinence des nouvelles méthodes développées en
chimie quantique. La réduction de la chimie à la mécanique quantique n'a ni
complètement échoué, comme certains philosophes de la science ont revendiqué, et
elle n'a pas été une réussite complète, comme certains historiens contemporains ont
revendiquée [9].
Le résumé
106
L’évolution de l’histoire de la chimie au XIXe siècle nous montre à quel point
une classification devenait nécessaire. La classification telle que Mendeleiev l’a
publiée en 1869 puis en 1871 a stimulé la recherche en chimie et de nombreuses
questions fondamentales se sont appuyées sur cette formidable base théorique que
renferme ce tableau. C’est actuellement un point de repère universel pour la
communauté des chimistes [3].
Le tableau périodique reste, après plus d’un siècle, le plus important moyen de
comparaison entre les éléments chimiques. Il nous permet d'étudier rationnellement la
grande variété des substances que nous trouvons dans la nature [4].
La matière condensée est formée par l'agrégation d'atomes, et les propriétés de
l'agrégat dépendent de la structure électronique des atomes qui le constituent. Elle est
donc d’une grande importance, ce qui est essentiel pour la classification des propriétés
physiques des éléments solides comme il l’est pour ses atomes constitutifs [5].
La classification périodique des éléments exprime une profonde vérité
physique et permet d'unifier un grand nombre de connaissances portant sur la matière.
Ce classement facilite la compréhension des groupes d'éléments en montrant la
relation entre leurs propriétés chimiques et leur structure atomique. De plus, la
connaissance du tableau périodique permet de prévoir les formules des composés et
les types de liaisons unissant les composants d'une molécule [4]. Les éléments dans le
tableau périodique sont rangés par ordre croissant du numéro atomique Z, selon la
configuration électronique des atomes [6], en respectant la règle de Klechkowski dans
le remplissage des orbitales par énergie croissante.
Le tableau périodique est pour nous, de toute évidence, le guide le plus sûr
dans l’étude de la chimie. Mais il comporte certaines anomalies ou contradictions, qui
sont les éléments qui ne respectent pas la règle de Klechkowski, et qui présentent des
configurations électroniques faisant exception à la norme, tels que :
- L’hydrogène qui ne s’ajuste harmonieusement à aucun groupe, c’est un non-
métal est il est placé généralement dans la même colonne que le lithium qui est
un métal très réactif. L’hydrogène est parfois placé en tête du groupe 7, avec les
halogènes. Dans certains tableaux périodiques, il est même placé dans les deux
groupes à la fois [7].
Le résumé
107
- L’Hélium se trouve dans le bloc p alors qu’il est de type s.
- Le lutécium et le lawrencium sont placés dans le bloc f, alors que leur couche f
est déjà saturée, ils contiennent 1 électron 5d ou 6d. Ils constituent bien le début
des éléments de transition.
Les tableaux périodiques habituels de Mendeleïev des éléments chimiques
sont déjà à 97% en accord avec la mécanique quantique. Trois éléments seulement qui
ne le sont pas, et sont en désaccord avec le principe d'exclusion de Pauli. Afin
d'assurer la cohérence, il est proposé de placer l'hélium à côté de l’hydrogène dans le
bloc s. Le lutécium et le lawrencium dans le bloc d des métaux de transition, pour que
le tableau périodique soit conforme à 100% avec la mécanique quantique [8].
Dans cette thèse on a étudié les contradictions existantes dans le tableau
périodique, et on les a confronté moyennant l’approche du data mining et ses
techniques, telles que l'analyse en composantes principales (ACP) et la régression
(PLS), qui sont employées pour la première fois pour l’étude de ce problème, et ce qui
fait l’originalité de ce travail.
Le data mining, dans sa forme et compréhension actuelle, à la fois comme
champ scientifique et industriel, est apparu au début des années 90. On peut voir le
data mining comme une nécessité imposée par le besoin des entreprises de valoriser
les données qu’elles accumulent dans leurs bases. En effet, le développement des
capacités de stockage et les vitesses de transmission des réseaux ont conduit les
utilisateurs à accumuler de plus en plus de données. Certains experts estiment que le
volume des données double tous les ans. Que doit-on faire avec des données
coûteuses à collecter et à conserver? [15].
L'ACP est une technique mathématique qui réduit la dimensionnalité d'un
système complexe de corrélations à un nombre réduit de dimensions, néanmoins
représentatives de la majorité de la variance totale des données. On passe d'un certain
nombre de variables potentiellement corrélées à un plus petit nombre de variables
décorrélées, les "Composantes Principales".
Ensuite, un changement de base est effectué à la nouvelle base des "Composantes
Principales" afin de représenter les données dans le nouvel espace. L'utilisateur
Le résumé
108
choisit le nombre d'axes utilisés pour la représentation, en se basant par exemple sur
le pourcentage de variance représenté.
L'exploration de données est le processus de découvrir les modèles pertinents,
intéressants et novatrices, ainsi que des modèles descriptifs, compréhensibles, et
prédictifs de données à grande échelle [16].
La régression PLS permet de rapprocher le statisticien du chercheur dans les
problèmes de modélisation. En général ce dernier souhaite en effet conserver dans son
modèle toutes les variables importantes tout en obtenant des équations de régression
cohérentes. [17].
Bien que cette méthode ait connu la plupart de ses succès dans le domaine de la
chimie, on peut penser qu'elle pourrait facilement être transposée à d'autres domaines,
particulièrement dans ceux où le nombre d'individus actifs est faible (en comparaison
au nombre de variables explicatives) et où les variables explicatives sont
significativement corrélées entre-elles. [18]
De nombreux problèmes peuvent être décrits sous la forme d'un modèle de
régression, où l'on possède des variables X sur lesquelles on peut plus ou moins agir
et des variables Y que l'on ne peut qu'observer.
L'objectif est alors de d’écrire les relations entre Y et X, en l'absence de
modèle théorique. Le problème est que le nombre de variables X est souvent très
important par rapport au nombre d'observations. La régression PLS est une méthode
d'analyse des données spécifiquement construite pour l'étude de ce type de problème.
[19]
Cette thèse est organisée comme suit:
- Le premier chapitre est consacré à la présentation générale du réductionnisme en
chimie quantique, ses différentes formes, ses aspects, les types de réduction, la
comparaison entre la physique et la chimie, la réduction de la chimie à la mécanique
quantique, et le lien existant entre le tableau périodique et le réductionnisme en
chimie quantique.
Le résumé
109
- Le deuxième chapitre est consacré à l’étude du tableau périodique, son historique, la
loi de la périodicité des propriétés, son évolution, et ses anomalies.
- Le troisième chapitre est consacré à la définition du datamining et ses différentes
techniques, l’analyse en composantes principales (ACP) et la régression PLS (la
régression par les moindres carrés partiels), le principe de ces méthodes, et leurs
objectifs.
- Le quatrième chapitre présente les résultats liés à l’application de l’approche
du datamining, et ses techniques telles que : l’analyse en composantes principales
(ACP) et la régression (PLS), qui ont été appliqué sur les différentes bases de données
contenant les différentes familles du tableau périodique qui présentent des
contradictions avec la mécanique quantique. Ce chapitre se divise en trois parties:
Dans la première partie nous avons réalisé une étude comparative des
propriétés physiques et mécaniques du lutétium avec ceux des métaux de transition
par l'approche de datamining.
Tandis que dans la deuxième partie, on a étudié les propriétés physiques et
mécaniques de l’hydrogène, et on les a comparée avec ceux du groupe des métaux
alcalins, avec les éléments du groupe de carbone, et avec ceux du groupe des
halogènes, en utilisant l’approche de data mining.
Enfin dans la troisième partie on a étudié les propriétés structurales et
mécaniques des hydrures alcalins en appliquant les calculs de premier principe et
qu’on a analysé par l'approche de datamining.
Dans ce travail on déduit comment la combinaison de deux domaines
importants : la mécanique quantique et le data mining et ses méthodes (ACP et PLS),
nous a permi d’étudier un phénomène qui reste insolubles jusque-là pour les
physiciens et les chimistes, qui est les contradictions du tableau périodique avec la
mécanique quantique. Le placement de certains éléments dans le tableau périodique a
été problématique depuis le premier tableau de Dimitri Mendeleev en 1869.
Le tableau périodique des éléments, est la généralisation la plus importante en
chimie, il est souvent considéré comme un cas représentatif particulier dans l’étude de
Le résumé
110
la relation entre la chimie et la physique, et comme l'une des idées les plus
unificatrices dans toute la science moderne.
La tentative d'expliquer les détails du tableau périodique continue à défier
l'ingéniosité des physiciens quantiques et chimistes quantiques [21]. La mécanique
quantique a la capacité d’expliquer et reproduire la chimie, ce qui a permis aux
physiciens d’aller au-delà du tableau périodique des atomes neutres à l’état
fondamental, et ce qui pourrait être interprétée comme une déclaration obtenue d'une
réduction de la chimie à la physique [20]. La classification périodique n'a pas encore
sa forme définitive, et n'est pas entièrement cohérente avec la mécanique quantique, à
cause des anomalies qu'elle contient.
L’originalité de ce travail persiste dans l’usage de l’approche du data mining et
de ses techniques, l’Analyse en composantes principales (ACP) et la régression
(PLS), qui sont appliquées pour la première fois dans l’étude de ce problème, et qui
nous ont permi de visualiser les corrélations existantes dans chaque base de données,
et de voir de prés le problème.
Par conséquent, les résultats obtenus montrent que le lutétium partage
beaucoup de similitudes avec les métaux de transition de la troisième période du
tableau périodique, par contre l'hydrogène partage certaines propriétés avec certains
groupes du tableau périodique, tels que le groupe du carbone, mais pas tout à fait; à
vrai dire l'hydrogène est un élément à part, et n’est conforme à aucun groupe.
Enfin on a calculé les propriétés structurales et mécaniques des hydrures
alcalins par les calculs ab initio implémentées dans le code VASP, dans le cadre de la
Théorie de la Fonctionnelle de la Densité DFT, les résultats obtenus ont été analysés
en utilisant l’approche de datamining, et la technique d’Analyse en Composantes
Principales (ACP) pour explorer les similitudes et les corrélations existantes entre ce
type d’hydrures. On a trouvé que les hydrures alcalins sont des matériaux fragiles
dans les conditions ambiantes, et que LiH est le plus rigide et le plus fragile parmi ces
hydrures, LiH est un matériau prometteur en industrie des batteries rechargeables, et
dans le stockage d’énergie.
Le résumé
111
Les résultats obtenus sont très intéressants, du point de vue scientifique, ils ont
été approuvés par de grands chercheurs travaillant sur ce problème. Cela prouve
l’importance de l’approche du data mining et de ses techniques, l’Analyse en
composantes principales (ACP) et la régression (PLS) dans l’analyse et traitement de
données.
Ce travail ouvre des horizons à l’usage de l’approche de data mining et les
techniques d'analyse multivariée pour explorer et étudier des problèmes qui semblent
sans issue.
Le résumé
112
Références
[1] André Durupthy, Jacques Estienne, Magali Giacino, Alain Jaubert, Claude
Mesnil, « Physique, Chimie et sciences de l’ingénieur » (PCSI), I.S.B.N. 978-2-
0118-1752-5. www.hachette-education.com.
[2] Eric R. Scerri, « Collected papers on philosophy of chemistry », Imperial
College Press, (2008). ISBN-13 978- 1-84816- 137-5.
[3] Jean-François Le Maréchal, « La classification périodique des éléments
chimiques », Université Lyon 2 - UMR GRIC équipe COAST (1999).
[4] Le repaire des sciences, http://www.lerepairedessciences.fr
[5] H.P. Myers, « Introductory Solid State Physics », 2nd ed, Taylor & Francis e-
Library, (2009), ISBN 0-203-21255-X.
[6] http://www.web-sciences.com.
[7] Carole McQuarrie,Donald A. McQuarrie,Peter A. Rock, « Chimie générale »,
Editions De Boeck Université 1st ed., (1992).
[8] Bernard SCHAEFFER, Periodic table quantum mechanics consistent,
https://www.scribd.com/doc/5994795/Periodic-table-quantum-mechanics-
consistent.
[9] Bernadette Bensaude-Vincent, Jonathan Simon, « CHEMISTRY THE IMPURE
SCIENCE », Imperial College Press, (2008), ISBN-13 978-1-84816-225-9.
[10] À René Thom, « Passion des formes : dynamique qualitative, sémiophysique et
intelligibilité », Vol 1, ENS Editions, (1994) 828 p.
[11] Champ Vallon, « La totalité », vol 5, (2002), Ed. Champ Vallon, Presses
Universitaires de France, ISBN 2-87673-355-2.
[12] Eric R. Scerri, « The periodic table : its story and its significance », Published
by Oxford University Press, Inc, (2007).
[13] Bernadette Bensaude-Vincent, Jonathan Simon, « Chemistry the impure
science », Imperial College Press, (2008), ISBN-13 978-1-84816-225-9.
[14] Le repaire des sciences, http://www.lerepairedessciences.fr
[15] Djamel Abdelkader ZIGHED, Ricco RAKOTOMALALA, « Extraction de
connaissances à partir de données (ECD) - Objet du data mining », Techniques
de l’Ingénieur, (2002).
Le résumé
113
[16] Mohammed J. Zaki andWagner Meira Jr., « Data mining and analysis,
Fundamental Concepts and Algorithms », Cambridge University Press, 1st
ed., (2014).
[17] Tenenhaus, J.-P.Gauchi, C.Ménardo, « Régression PLS et applications », Revue
de statistique appliquée, tome 43, n°1,(1995) , P.7-63.
[18] Site internet : http://www.renaudloup.be/refinternet.htm .
[19] Tenenhaus M., « La Régression PLS: Théorie et Pratique », Editions Technip,
(2002).
[20] V. N. Ostrovsky, « Physical Explanation of the Periodic Table », Ann. N. Y.
Acad. Sci. 988 (2003) 182-192.
[21] Eric R. Scerri, « Collected papers on philosophy of chemistry », Imperial
College Press, (2008). ISBN-13 978- 1-84816- 137-5.
A Study of the Physical and Mechanical Propertiesof Lutetium Compared with Those of Transition Metals:A Data Mining Approach
NADERA SETTOUTI1,2 and HAFID AOURAG1
1.—LEPM, URMER, Department of Physics, University Abou Bakr Belkaid, 13000 Tlemcen,Algeria. 2.—e-mail: nadera_settouti@yahoo.fr
In this article, we study the physical and mechanical properties of lutetium,which will be compared with the elements of the third-row transition metals(Cs, Ba, Hf, Ta, W, Re, Os, Ir, Pt, Au, Tl, Pb, and Bi). Data mining is an idealapproach for analyzing the information and exploring the hidden knowledgeamong the data. The purpose of the data mining scheme is to identify andclassify the effects of the relationships existing between properties. Theresults of the investigation are presented by means of multivariate modelingmethods, such as the principal component analysis and the partial leastsquares regression to discover the implicit, yet meaningful, relationshipbetween the elements of the data set, and to locate correlations between theproperties of the materials. In this study, we present a data mining approachto discover such unusual correlations between properties of the elements.When comparing the properties of the transition metals with those of lute-tium, our results show that lutetium shares many properties and similaritieswith the transition metals of the sixth row in the periodic table and can be welldescribed as a transition metal.
INTRODUCTION
The classification of the chemical elements is aprecise and clear result of the periodic table, despitethe few anomalies that still persist. The periodictable is a physical representation of two laws: theperiodic law and the periodic system, which aremore fundamental than the periodic table.1
The periodic table of elements reflects a distin-guished example of classification; each column con-tains a series of elements that have the samenumber of valence electrons. Therefore, the study ofthe arrangement of the elements in differentgroups, according to their principal common prop-erties, is scientifically and practically interestingand should be carried out.2
The transition elements, also called transitionmetals, are not very different from each other. Theyhave similar properties and behave similarly.3
Their d subshell is partially filled of electrons, andthis represents the difference between a transitionmetal and the other elements in the periodic table.The transition metals are arranged in four rows
that correspond to the principal energy levels of dsubshells that are progressively filled with elec-trons.4 The main purpose of this work is to demon-strate that lutetium Lu (Z = 71) has commonproperties with the third row of the d-block transi-tion metals.
Many researchers have considered the position oflutetium in the periodic table before, by differentways. In 1967, H. Merz and K. Ulmer carried out anx-ray spectroscopic investigation showing, dis-tinctly, that Lu, to the left of Hf (below Yttrium), fitsmuch better with its properties than La does, and soit may be considered as a transition metal but notLa.5 Jensen (1982) assigned Lu to Group III, belowY.6 Scerri (2009) believed that lutetium should beplaced in the same column of the periodic table asscandium, yttrium, and lawrencium.7
In this work, we use a data mining approach toexpose the correlations between the data. Thisapproach needs powerful statistical analysis toolssuch as principal component analysis (PCA) andpartial least squares regression (PLS) to studythe correlations between the properties and the
JOM
DOI: 10.1007/s11837-014-1247-x 2014 The Minerals, Metals & Materials Society
relationships between elements. PCA is probablythe most popular multivariate statistical techniqueused in many scientific fields, as it can be used fordata classification, investigation of similarities,etc.8,9 PCA is a powerful statistical approach for theanalysis of material properties; it has been widelyused to study many problems in physics and mate-rials science.10 There is a close connection betweenPLS and PCA, as they have some interestinginformation in common.11
DATA AND COMPUTATIONAL DETAILS
Data Description
To identify the trends and clusters in materialsproperties data, we build a database for 14 elementsof the third-row transition elements (Cs, Ba, Hf, Ta,W, Re, Os, Ir, Pt, Au, Tl, Pb, and Bi), includinglutetium, with their physical and mechanical prop-erties, as seen in (Table I).
The properties and their abbreviations are as fol-lows: polarizability (a), electronegativity (v), atomicweight (m), atomic number (Z), atomic radius (r),atomic volume (V), electron affinity (EA), and ioniza-tion energy (I), as well as total energy (Etot), cohesiveenergy (Ecoh), bulk modulus (B), shear modulus (G),Young’s modulus (E), Poisson number (l), ratio (B/G),elastic stiffness constants (C11, C12, and C44), andCauchy pressure (C12–C44). We have included onlythese properties in the current study due to theunavailability of enough data on other properties.
Data Mining Methods
The data mining tasks can be classified into twogroups: descriptive and predictive. This can beaccomplished using different techniques based ondata mining functionalities such as clustering,classification, and so on, to determine the types ofpatterns to be mined. In this work, we use thedescriptive data mining method, which entailsexploration of patterns and relationships existingamong data. The fundamental descriptive functionsare summarization, clustering, association, anddiscovery.12 PCA and PLS are appropriate tech-niques to carry out this data mining task.
Principal Component Analysis Technique
This was achieved by running PCA using thenumerical data structured in 14 observations versus19 variables (a, v, m, Z, r, V, EA, I, Etot, Ecoh, B, G, E,l, B/G, C11, C12, C44, and C12–C44). For a visu-alization of the data discrimination, PCA plotsmapped variables (19 properties) and observations(n = 14) using loadings and scores in dimensionalspaces determined by principal components (PCs)with eigenvalues >1.0, based on Kaiser’s rule. Theloading plot depicts the most important variables,and the score plot shows similarities and differencesbetween samples (i.e., the elements in our dataset).13 PCA generates a set of new orthogonal axes
or variables, called the PCs, from the original vari-ables. The generated axes are orthogonal anduncorrelated with one another. The first PC (PC1)explains the maximal variance in the data set aswell as its direction, and so on. The PCs are definedby vectors that are the eigenvectors of the variance–covariance matrix. The variance along the vector isdefined as the eigenvalue. The loadings and thescores corresponding to the PCs are obtained fromthe correlation matrix. Each loading of variablesreveals the contribution of the original variable tothe PC. A variance reduction is reached whenneglecting the directions along which the varianceof samples is insignificant.13
The key idea of PCA technique is to reduce thedimensionality of a data set that contains a largenumber of interrelated variables by retaining asmuch as possible of the variation encountered in thedata set. This reduction is achieved by transformingthe original variables into a smaller new set ofvariables called the principal components, whichare uncorrelated and ordered in such a way that thefirst principal component captures most of the var-iation present in all the original variables. Thismakes visualization, prediction, and classificationeasier.14,15 PCA summarizes the information pro-vided by various variables in a simple graphicaldisplay with minimal loss of information to assessthe relationships between variables and samples.16
PCA identifies patterns in a data set and com-presses the data by reducing the number of dimen-sions based on their similarities and differences.11
When a physical significance to principal compo-nents is found, the PCA technique can discover thehidden data structure and reveal similarities amongvariables and elements.9
Partial Least Squares Regression
Although PCA is useful in estimating the relativeimpact of multiple parameters on properties, PLSregression can be used as an exploratory analysis toolto select suitable predictor variables and identifyoutliers before the classic linear regression. Using acombination of PCA and PLS techniques helpsexplore a broader range of new trends and correla-tions, which have not been established before.14 PLScomprises a wide category of methods for modelingrelations between sets of observed variables by usingthe latent variables. It includes regression, classifi-cation tasks, dimension reduction techniques, andmodeling tools. The main idea of PLS methods is thatthe observed data are generated by a system that isdriven by a small number of latent (not directlyobserved or measured) variables. The PLS algorithmbecomes a successful standard tool for processingwide chemical data problems; it facilitates manyapplications in other scientific fields. Generally, PLScreates orthogonal score vectors (called latent vec-tors or components) by finding the latent vectors thatcontain the maximal covariance between different
Settouti and Aourag
Ta
ble
I.P
hy
sica
la
nd
mech
an
ica
lp
ro
perti
es
of
the
thir
d-r
ow
tra
nsi
tio
nele
men
tsin
clu
din
glu
teti
um
Pro
perty
Cs
Ba
Lu
Hf
Ta
WR
e
a59.4
2(R
ef.
27)
39.7
(Ref
.27)
21.9
(Ref
.27)
16.2
(Ref
.27)
13.1
(Ref
.27)
11.1
(Ref
.27)
9.7
(Ref
.27)
v0.8
6(R
ef.
28)
0.9
7(R
ef.
28)
1.1
4(R
ef.
28)
1.2
3(R
ef.
28)
1.3
3(R
ef.
28)
1.4
0(R
ef.
28)
1.4
6(R
ef.
28)
m132.9
1(R
ef.
29)
137.3
3(R
ef.
29)
174.9
7(R
ef.
29)
178.4
9(R
ef.
29)
180.9
5(R
ef.
29)
183.8
4(R
ef.
29)
186.2
1(R
ef.
29)
Z55
56
71
72
73
74
75
r2.6
0(R
ef.
30)
2.1
5(R
ef.
30)
1.7
34
(Ref
.31)
1.5
5(R
ef.
30)
1.4
5(R
ef.
30)
1.3
5(R
ef.
30)
1.3
5(R
ef.
30)
V115.8
9(R
ef.
32)
62.4
7(R
ef.
32)
29.5
3(R
ef.
33)
22.4
1(R
ef.
32)
18.3
1(R
ef.
32)
16.2
3(R
ef.
32)
14.9
9(R
ef.
32)
EA
0.4
7(R
ef.
27)
0.1
5(R
ef.
28)
0.3
4(R
ef.
27)
0.1
(Ref
.34)
0.3
2(R
ef.
28)
0.8
2(R
ef.
28)
0.1
5(R
ef.
28)
I3.8
9(R
ef.
29)
5.2
1(R
ef.
29)
5.4
3(R
ef.
29)
6.8
3(R
ef.
29)
7.5
5(R
ef.
29)
7.8
6(R
ef.
29)
7.8
3(R
ef.
29)
Eto
t35
–7550.5
6–7880.1
1–13848.2
3–14317.4
9–14795.8
8–15283.4
5–15780.2
4E
coh
0.8
0(R
ef.
36)
1.9
0(R
ef.
36)
4.4
3(R
ef.
36)
6.4
4(R
ef.
36)
8.1
0(R
ef.
36)
8.9
0(R
ef.
36)
8.0
3(R
ef.
36)
B2.0
3(R
ef.
37)
10.3
(Ref
.37)
47.6
(Ref
.27)
108.9
(Ref
.37)
200.1
(Ref
.37)
323.2
(Ref
.37)
371.7
(Ref
.37)
G0.6
5(R
ef.
28)
4.8
4(R
ef.
28)
27.1
(Ref
.28)
53.0
(Ref
.28)
64.7
(Ref
.28)
152
(Ref
.28)
180
(Ref
.28)
E1.6
9(R
ef.
28)
12.8
(Ref
.28)
68.4
(Ref
.28)
138
(Ref
.28)
185
(Ref
.28)
407
(Ref
.28)
520
(Ref
.28)
l0.3
0(R
ef.
28)
0.2
8(R
ef.
28)
0.2
7(R
ef.
28)
0.2
9(R
ef.
28)
0.3
5(R
ef.
28)
0.2
8(R
ef.
28)
0.2
6(R
ef.
28)
B/G
3.1
22.1
31.7
62.0
53.0
92.1
32.0
7C
11
1.6
0(R
ef.
28)
12.6
(Ref
.28)
86.2
(Ref
.28)
181
(Ref
.28)
264
(Ref
.28)
523
(Ref
.28)
616
(Ref
.28)
C12
0.9
9(R
ef.
28)
8.0
(Ref
.28)
32.0
(Ref
.28)
77
(Ref
.28)
158
(Ref
.28)
203
(Ref
.28)
273
(Ref
.28)
C44
1.4
4(R
ef.
28)
9.5
(Ref
.28)
26.8
(Ref
.28)
55.7
(Ref
.28)
82.6
(Ref
.28)
160
(Ref
.28)
161
(Ref
.28)
C12–C
44
–0.4
5–1.5
5.2
21.3
75.4
43
112
Pro
perty
Os
IrP
tA
uT
lP
bB
i
a8.5
(Ref
.27)
7.6
(Ref
.27)
6.5
(Ref
.27)
5.8
(Ref
.27)
7.6
(Ref
.27)
6.8
(Ref
.27)
7.4
(Ref
.27)
v1.5
2(R
ef.
28)
1.4
4(R
ef.
28)
1.4
4(R
ef.
28)
1.4
2(R
ef.
28)
1.4
4(R
ef.
28)
1.5
5(R
ef.
28)
1.6
7(R
ef.
28)
m190.2
3(R
ef.
29
192.2
2(R
ef.
29)
195.0
8(R
ef.
29)
196.9
7(R
ef.
29)
204.3
8(R
ef.
29)
207.2
(Ref
.29)
208.9
8(R
ef.
29)
Z76
77
78
79
81
82
83
r1.3
0(R
ef.
30)
1.3
5(R
ef.
30)
1.3
5(R
ef.
30)
1.3
5(R
ef.
30)
1.9
0(R
ef.
30)
1.8
0(R
ef.
30)
1.6
0(R
ef.
30)
V14.3
6(R
ef.
32)
14.6
2(R
ef.
32)
15.8
3(R
ef.
32)
18.1
9(R
ef.
32)
31.2
5(R
ef.
32)
31.9
3(R
ef.
32)
35.3
8(R
ef.
33)
EA
1.1
(Ref
.28)
1.5
7(R
ef.
28)
2.1
3(R
ef.
28)
2.3
1(R
ef.
27)
0.2
(Ref
.28)
0.3
6(R
ef.
28)
0.9
5(R
ef.
28)
I8.4
4(R
ef.
29)
8.9
7(R
ef.
29)
8.9
6(R
ef.
29)
9.2
3(R
ef.
29)
6.1
1(R
ef.
29)
7.4
2(R
ef.
29)
7.2
9(R
ef.
29)
Eto
t35
–16286.3
0–16801.6
8–17326.5
8–17860.7
9–18956.9
6–19518.9
9–20090.4
1E
coh
8.1
7(R
ef.
36)
6.9
4(R
ef.
36)
5.8
4(R
ef.
36)
3.8
1(R
ef.
36)
1.8
8(R
ef.
36)
2.0
3(R
ef.
36)
2.1
8(R
ef.
36)
B417.8
(Ref
.37)
355
(Ref
.37)
278.3
(Ref
.37)
173.2
(Ref
.37)
35.9
(Ref
.37)
42.9
(Ref
.37)
31.5
(Ref
.37)
G223
(Ref
.28)
209
(Ref
.28)
60.9
(Ref
.28)
26
(Ref
.28)
2.6
7(R
ef.
28)
5.5
4(R
ef.
28)
12.8
(Ref
.28)
E559
(Ref
.28)
528
(Ref
.28)
170
(Ref
.28)
78
(Ref
.28)
7.8
9(R
ef.
28)
15.8
(Ref
.28)
34
(Ref
.28)
l0.2
5(R
ef.
28)
0.2
6(R
ef.
28)
0.3
9(R
ef.
28)
0.4
2(R
ef.
28)
0.4
5(R
ef.
28)
0.4
4(R
ef.
28)
0.3
3(R
ef.
28)
B/G
1.8
71.7
04.5
76.6
613.4
57.7
42.4
6C
11
729.6
(Ref
.32)
580
(Ref
.28)
347
(Ref
.28)
191
(Ref
.28)
41.9
(Ref
.28)
48.8
(Ref
.28)
63.4
(Ref
.28)
C12
230.0
(Ref
.32)
242
(Ref
.28)
251
(Ref
.28)
162
(Ref
.28)
36.6
(Ref
.28)
41.4
(Ref
.28)
24.5
(Ref
.28)
C44
251.5
(Ref
.32)
256
(Ref
.28)
76.5
(Ref
.28)
42.2
(Ref
.28)
7.2
0(R
ef.
28)
14.8
(Ref
.28)
11.5
(Ref
.28)
C12–C
44
–21.5
–14
174.5
119.8
29.4
26.6
13
Th
equ
an
titi
esgiv
enin
the
table
are
as
foll
ows:
ais
the
pol
ari
zabil
ity
(A3),
vis
the
elec
tron
egati
vit
y(e
V),
mis
the
ato
mic
wei
gh
t(a
mu
)U
,Z
isth
eato
mic
nu
mber
,r
isth
eato
mic
rad
ius
(A),
Vis
the
ato
mic
vol
um
e(A´
3/a
tom
),E
Ais
the
elec
tron
affi
nit
y(e
V),
Iis
the
ion
izati
onen
ergy
(eV
),E
totis
the
tota
len
ergy
(eV
),E
coh
isth
eco
hes
ive
ener
gy
(eV
),B
isth
ebu
lkm
odu
lus
(GP
a),
Gis
the
shea
rm
odu
lus
(GP
a),
Eis
the
You
ng’s
mod
ulu
s(G
Pa),
lis
the
Poi
sson
nu
mber
,th
era
tio
B/G
,el
ast
icst
iffn
ess
(C11,
C12,
an
dC
44)
(GP
a),
an
dth
eC
au
chy
pre
ssu
reC
12–C
44
(GP
a).
A Study of the Physical and Mechanical Properties of Lutetium Comparedwith Those of Transition Metals: A Data Mining Approach
sets of variables. Various PLS techniques are used toobtain latent vectors, which gives a variant of PLS.17
RESULTS AND DISCUSSION
Principal Component Analysis (PCA)
In this work, PCA of the database yielded two sig-nificant PCs that together account for 81.98% of thetotal variance in the data set, where PC1 contributes
to 54.40% of the total, whereas PC2 contributes27.58%, as shown in (Fig. 1). The objective of theloading plot is to visualize the position of the vari-ables (i.e., the properties in our data set), with respectto one another in a two-dimensional space, and theircorresponding correlations. By comparing the dis-tances between the points representing the proper-ties, we can deduce that the variables, represented bypoints that are close to each other and far from theorigin, are positively correlated, whereas thoseopposite one another on the plot are negatively cor-related (or inversely proportional). For instance,variables like Etot, m, and Z can be seen in (Fig. 2).The loading explains the relationships relating twovariables by their angles at center on the plot. Thecorrelation coefficient between two variables repre-sents the cosine of the angle between their corre-sponding vectors on the plot. In Fig. 2, the cosine of180 (i.e., the angle between I and V on the PC1–PC2plot) is 1, which means that they are negativelycorrelated. Based on this mathematical rule, theuncorrelated variables are at right angles to eachother (cosine 90 = 0, therefore not correlated). Sim-ilarly, the cosine of 0 is 1, which indicates a positivecorrelation between the variables.13 The plot of thescores for PC1 versus PC2, shown in Fig. 1 revealsfive distinct groups of elements. Group 1 (Cs and Ba)is related to elements of block s, groups 2 (Ta, Hf, andLu) and 3 (Ir, Os, Re, and W) contain elements thatbelong to block d, group 4 (Pt, Au) contains elementsthat are precious metals, and group 5 (Tl, Pb, and Bi)
Fig. 2. PCA loadings plot from the database of Table I, with 19 properties.
Fig. 1. PCA scores plot from the database of Table I containing 14elements of the third-row transition elements, including lutetium.
Settouti and Aourag
includes elements of post-transition metals, whoseproperties are determined by their partially filledp-subshells. We note that the axis PC1 separatesclusters 1, 2, and 3 from 4 and 5. There is a closesimilarity between elements in each group. Lookingat group 2 in Fig. 1 and Table I, we note that thedistances separating the points representing theelements Ta, Hf, and Lu are small, which indicatesthat they have properties similar to those of hafnium(i.e., transition metals), and they share severalattributes with them because they have the samevalence shell configuration, which is equal to 2.Empirically, it was shown that lutetium’s outermostelectron is the first electron in the 5d subshell; it mustmark the beginning of the third series of transitionelements (i.e., the sixth row of the periodic table),below yttrium (Y) in group 3 (IIIB) because it is a d1
metal. The location of an element on the periodic tableis based on its electron configuration, so the elementsin the same row (family) have the same valence shellconfiguration. The valence electrons determine thechemistry, but the electron configurations determinethe organization of the periodic table as well as theproperties of the elements. These are the reasons forthe periodic trends in the behavior of chemical ele-ments. The properties of the elements are determinedby the size (n), shape (l) of orbitals, and atomicnumber (nuclear charge). A great deal of chemicaland physical evidence shows that lutetium should beplaced in the same group as Sc and Y.18 This issue wasdebated by several researchers (Refs.5 and 19–24)and discussed in a more persuasive way by Jensen in1982.19 Another justification for placing lutetium(Lu) below yttrium (Y) in group 3 (IIIB) is that thisarrangement gives similar periodic trends in severalphysical properties (melting point, atomic radii, sumof the first two ionization potentials, and electroneg-ativity), as seen in (Table II). Sc, Y, and Lu all have anhexagonal closed-packed (hcp) structure at an ambi-ent temperature.18
Placing the elements in the periodic table is cur-rently accepted according to the following empiricalobservations: atomic number, properties, periodictrends, and ground-state electron configuration ofatoms.25
In the PCA loadings plot (Fig. 2), four main clus-ters can be observed: Cluster 1 contains mainly the
physical properties that can be decomposed into twosubgroups. The first subgroup contains the atomicproperties (m, Z, I, and v) and the second one containsthe Cauchy pressure C12–C44, and EA. The secondcluster group involves the mechanical properties B,E, G, C11, C12, and C44 including the structuralproperty Ecoh. The third one comprises physicalproperties such as the atomic radius r, atomic volumeV, polarizability a, and total energy Etot, and thefourth cluster group consists of the ratios B/G as wellas the Poisson’s ratio l. The properties that haveidentical PC values are significantly correlated andare similar to each other; however those which havedifferent PC values are inversely correlated and aretherefore different. Within group 1, the closestresemblance can be observed between m and Z on theone hand, and among E, G and C44 on the other hand.In group 2, their points are close to each other (Fig. 2),which reveals the importance of these properties. ThePCA automatically separates data. Indeed, we seethat PC2 clearly separates the physical from theatomic properties, which means a strong differencebetween these two properties. Variables within thesame cluster group are correlated. Groups 1 and 3 areinversely correlated, as are groups 2 and 4. It is pos-sible to identify several relationships. An increase inthe atomic weight m and the atomic number Z willresult in an increase in I and v, as well as a decrease inr, V, Etot, and a. However, Young’s modulus E, theshear modulus G, and the bulk modulus B are cor-related and tightly bound to the elastic stiffness C11,C12, C44, and the cohesive energy Ecoh. By means ofPCA, we create a map that indicates how theparameters and properties will qualitatively changewhen changing the chemical elements.
Partial Least Squares
We study the relationships between two blocks ofvariables, that is, between the mechanical proper-ties (E, B, G, l, B/G, C11, C12, C44, and C12–C44)and the atomic and structural properties (a, v, m, Z,r, V, EA, I, Ecoh,and Etot), using the PLS approach.The PLS results, which were presented in (Fig. 3),show the correlation circle that explores the rela-tionship among the mechanical, atomic, and struc-tural properties, as well as between the two PLS
Table II. Physical properties of group 3 (IIIB), including lutetium
Property Sc Y LuStructure hcp hcp hcp
Tmelt 1.541 (Ref. 18) 1.522 (Ref. 18) 1.663 (Ref. 18)v 1.20 (Ref. 28) 1.11 (Ref. 28) 1.14 (Ref. 28)r 1.60 (Ref. 30) 1.80 (Ref. 30) 1.734 (Ref. 31)First ionization energy 6.56 (Ref. 28) 6.22 (Ref. 28) 5.43 (Ref. 29)Second ionization energy 12.80 (Ref. 28) 12.24 (Ref. 28) 13.9 (Ref. 28)
The quantities given in the table are as follows: the melting point (C), v is the electronegativity (eV), r is the atomic radius (A), and theionization energy (eV).
A Study of the Physical and Mechanical Properties of Lutetium Comparedwith Those of Transition Metals: A Data Mining Approach
components (t1, t2), which captured the maximum ofthe variance within the data set. The results can beexplained in the same way, as in the PCA. The co-sines of the angles of the vectors representing thevariables (properties) in the plane of the graph inFig. 3 designate the correlations that exist betweenthe properties.26 We can see that for properties suchas C12–C44 and the electron affinity EA, displayedat the center of the map (the correlation circle), thecorrelations are low. This means that their proper-ties are not well represented on the first twodimensions. The properties C12–C44 and EA barelyexplain the trends of the elements; they do not havea strong effect that could easily influence the ele-ments’ trend; they are not important. We noticestrong correlations between m and Z on the onehand, as well as between the elastic constants C11,C12, and C44, and E, G, and B, on the other hand.Furthermore, a negative correlation is found be-tween Etot and m, Z, as well as between the ioni-zation energy I and the atomic volume V. Thevariables B/G and l are separated from the othervariables because they are less correlated to thesevariables and to PLS components (t1, t2). The prop-erties located on the periphery of the correlationcircle are significant; i.e., they strongly contribute tothe discrimination.
CONCLUSION
In this work, we introduced a new approach toanalyze and compare the physical and mechanicalproperties of lutetium with elements belonging tothe third-row transition elements, using multivari-ate analysis methods such as PCA and PLSregression. PCA allowed classifying both the prop-erties and the elements, which helped us to visual-ize the position of the elements relative to eachother, as well as the relationships existing betweentheir properties. The use of PLS regression fits well
with PCA results. A major interest in this method-ology is given by the unitary framework, based onPLS principles, which allows to uncover the struc-tural relationships existing among data and prop-erties. Our results show that the properties oflutetium (Lu) are similar to those of hafnium (Hf).We found that our results are generally in goodagreement with many research studies previouslypublished on these subjects. It is difficult for scien-tists to understand the interactions between largenumbers of variables, so we used PCA and PLS astools for identifying the structures existing in a dataset, as well as for screening and extracting usefulinformation from data.
REFERENCES
1. E.R. Scerri, J. Sci. Educ. 12, 4 (2011).2. A. Herold, C. R. Chim. 9, 148 (2006).3. M-L. Kamberg, The Transition Elements: The 37 Transition
Metals, 1st ed. (New York: The Rosen Publishing Group Inc.,2010).
4. M. Halka and B. Nordstrom, Periodic Table of the Ele-ments—Transition Metals (New York: Facts On File Inc,2011).
5. H. Merz and K. Ulmer, Phys. Lett. 26, 1 (1967).6. M. Laing, Found. Chem. 7, 203 (2005).7. E. Scerri, Found. Chem. 12, 69 (2010).8. H. Abdi and L.J. Williams, WIREs Comput. Stat. 2, 433
(2010).9. A. Lengyel, K. Heberger, L. Paksy, O. Banhidi, and R. Rajko,
Chemosphere 57, 889 (2004).10. S.R. Broderick, H. Aourag, and K. Rajan, Phys. B 406, 2055
(2011).11. H.-N. Qu, G.-Z. Li, and W.-S. Xu, Pattern Recognit. 43, 3448
(2010).12. G. Koksal, I. Batmaz, and M.C. Testik, Exp. Syst. Appl. 38,
13448 (2011).13. E.-C. Shin, B.D. Craft, R.B. Pegg, R.D. Phillips, and R.R.
Eitenmiller, Food Chem. 119, 1262 (2010).14. K. Rajan, Mater. Today 8, 38 (2005).15. I.T. Jolliffe, Principal Component Analysis, Springer series
in statistics, 2nd ed. (New York: Springer, 2002).16. I. Marchi, S. Rudaz, M. Selman, and J.-L. Veuthey,
J. Chromatogr. B 845, 244 (2007).17. R. Rosipal and N. Kramer, Subspace, Latent Structure and
Feature Selection Lecture Notes in Computer Science, Vol.3940, eds. C. Saunders, M. Grobelnik, S. Gunn, and J.S.Taylor (New York: Springer, 2006), pp. 34–51.
18. K.A. Gschneidner Jr, J.-C.G. Bunzli, and V.K. Pecharsky,Handbook on the Physics and Chemistry of Rare Earths, Vol.41 (Dordrecht, The Netherlands: North-Holland, Elsevier,2011).
19. W.B.J. Jensen, Chem. Educ. 59, 634 (1982).20. E.R.J. Scerri, Chem. Educ. 68, 122 (1991).21. W.B.J. Jensen, Chem. Educ. 80, 952 (2003).22. W.F. Luder, The Electron-Repulsion Theory of the Chemical
Bond (New York: Reinhold, 1967).23. D.C. Hamilton, Am. J. Phys. 33, 637 (1965).24. B.T. Matthias, W.H. Zacharisen, G.W. Webb, and J.J.
Engelhardt, Phys. Rev. Lett. 18, 781–784 (1967).25. L. Lavelle, J. Chem. Educ. 85, 1482 (2008).26. M. Tenenhaus, J. Pages, L. Ambroisine, and C. Guinot, Food
Qual. Prefer. 16, 315 (2005).27. D.R. Lide, eds., CRC Handbook of Chemistry and Physics,
90th ed. (Boca Raton, FL: CRC Press/Taylor and Francis,2010).
28. W. Martienssen and H. Warlimont, eds., Springer Hand-book of Condensed Matter and Materials Data, Vol. 1 (Ber-lin/Heidelberg, Germany: Springer, 2005).
Fig. 3. Variable map in PLS regression of mechanical propertiesaccording to atomic and structural properties.
Settouti and Aourag
29. R.A. Dragoset, A. Musgrove, C.W. Clark, and W.C. Martin,Periodic Table: Atomic Properties of the Elements (Version 4),NIST SP 966 (Gaithersburg, MD: National Institute ofStandards and Technology, 2003), http://physics.nist.gov/PT.
30. J.C. Slater, J. Chem. Phys. 39, 3199 (1964), http://www.webelements.com/.
31. S. Cotton, Lanthanide and Actinide Chemistry (London,U.K.: Wiley, 2006).
32. S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S.Ganeshan, and Y. Wang, Comput. Mater. Sci. 48, 813 (2010).
33. D. Stewart, Chemicool Periodic Table (Cambridge, MA: TheMassachusetts Institute of Technology, 2013), http://www.chemicool.com.
34. E.C.M. Chen and E.S. Chen, J. Chromatogr. A 1037, 83(2004).
35. NIST (National Institute of Standards and Technology),(2013), www.nist.gov.
36. C. Kittel, Introduction to Solid State Physics, 8th ed.(Hoboken, NJ: Wiley, 2005).
37. Y. Makino and S. Miyake, J. Alloy. Compd. 313, 235 (2000).
A Study of the Physical and Mechanical Properties of Lutetium Comparedwith Those of Transition Metals: A Data Mining Approach
Abstract
The periodic table of elements, is the most important generalization in chemistry, it is often considered as a special representative case in the study of the relationship between chemistry and physics. The study of the anomalies in the periodic table has been the subject of many researches, such as the study of the positions of lutetium and hydrogen, but no one could clear up the problem. In this work we tried to confront this problem, by applying the data mining approach and its techniques of multivariate analysis such as Principal Component Analysis (PCA) and regression (PLS). The obtained results indicate the significative similarity shared between lutetium and transition metals of the third row of the periodic table, which shows that the position of lutetium must be below yttrium and next hafnium, while for hydrogen it was found that it did not conform to any group of the periodic table, it is a special element. Key words: Periodic table- Hydrogen- Lutetium- data mining approach– PCA– PLS
Résumé
Le tableau périodique des éléments, est la généralisation la plus importante en chimie, il est souvent considéré comme un cas représentatif particulier dans l’étude de la relation entre la chimie et la physique. L’étude des contradictions dans le tableau périodique a été le sujet de beaucoup de recherches, tels que l’étude de la position du lutétium et la position de l’hydrogène, mais sans pouvoir éclaircir le problème. Dans ce travail on a essayé de confronter ce problème, moyennant l’approche data mining, et en appliquant les techniques de l’analyse multivariée telles que l’Analyse en composantes principales (ACP) et la régression (PLS). Les résultats obtenus indiquent la grande similitude entre le lutétium et les métaux de transition de la troisième période du tableau périodique, ce qui montre que la position du lutétium doit être en dessous de l’yttrium à côté du hafnium, tandis que pour l’hydrogène on a trouvé qu’il n’est conforme à aucun groupe du tableau périodique, c’est un élément spécial.
Mots clés : Le tableau périodique– Le lutétium– l’hydrogène- Le data mining- L’ACP- La PLS
,+ أ*(ا )ن &% $#ا"ء، و ا آ أه ا ه، ( periodic table)اوري اول( - ا=ي - >عاوري ا اول ا.:ت ا8دة را6د وآ*4 .وا23$ء ا"ء 01 /.
1@، 0 ا#?ث" )و ه=ا ا@ .دون 8وى، و"(H) 0واDرو(Lu) 08اBCم"ن درا6D8ا F=ه،"G61ل ا +إ?@ ا @ Lاتد ا HCت ا?@ و(data mining) J#KC ا6اج ا#*ت Hر1
ا ا+ ادن و اBCم و1GC 01 JQ( وGC اOP إ+،(PLS) ااM8و (PCA) "*ت أ66H*RاSو (Y) %*1 اT$$م أ36@ 0 $% أن $"ن اBCم أن "ن، $ل ,+ 0 اول اوري اKB ا
.,V -ص، 1@ ه اول اوري أي , R 0 $اM J اDرو08 )0 . و8 أن ، (Hf)اDم
ا6اج ا#*ت Hر1اDرو08 ، ،اBCم ،اوري اول :آت
Recommended