DIVISION ETUDE ET PREDICTION DES MATERIAUX...

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE ABOU BEKR BELKA ΪD DE TLEMCEN

FACULTE DES SCIENCES DEPARTEMENT DE PHYSIQUE

DIVISION ETUDE ET PREDICTION DES MATERIAUX UNITE DE RECHERCHE MATERIAUX ET ENERGIES

RENOUVELABLES (URMER)

THÈSE

Pour obtenir le grade de

Docteur en physique Spécialité : Physique et chimie de la matière condensée

Présentée par :

M elle. Nadéra Settouti

Sur le Thème

Le réductionnisme en chimie quantique et les grandes contradictions du tableau périodique avec la mécanique

quantique et le rôle du data mining

Soutenue le : / / 2015 devant le jury composé de:

Président Pr. Ghouti MERAD (Univ. Tlemcen)

Directeur de Thèse Pr. Hafid AOURAG (Univ. Tlemcen)

Examinateur Pr. Houda Imane FARAOUN (Univ. Tlemcen)

Examinateur Pr. Tahar SAHRAOUI (Univ. Blida)

Examinateur Pr. Mohammed HADJI (Univ. Blida)

Examinateur Pr. Lahcene Larabi (Univ. Tlemcen)

Remerciements

En tout premier lieu, je remercie ALLAH le Tout-puissant de m’avoir donné la santé et tout dont je nécessitais pour l’accomplissement de cette thèse, et de m’avoir aidé à dépasser toutes les difficultés. Je tiens à remercier mon directeur de thèse, Monsieur le Professeur Hafid AOURAG Professeur à l’université de Tlemcen et directeur général de la recherche scientifique et du développement technologique pour m’avoir donné l’opportunité de travailler dans son équipe en me proposant le sujet, ainsi pour ses conseils qui m’ont été d’une grande utilité et clairvoyance dans la rédaction de cette thèse. En plus ce travail m’a permis de prendre contact avec le monde de la recherche, qui a été pour moi extrêmement enrichissant sur bien des plans. Je remercie aussi Mr le Professeur Ghouti MERAD professeur à l’université de Tlemcen et Directeur du Laboratoire d’Etude et Prédiction des matériaux, de m’avoir accepté au sein de son laboratoire, qui nous a initiés à la recherche, on a bénéficié de son savoir et de son savoir-faire au cours de nombreuses années, et qui m’a fait l’honneur de présider ce jury. Mes remerciements les plus sincères vont à l’ensemble des membres du jury ; tout d’abord à Melle Houda Imane FARAOUN Professeur à l’Université de Tlemcen, Mr Tahar SAHRAOUI Professeur à l’Université de Blida, et à Mr Mohammed HADJI Professeur à l’Université de Blida, et à Mr Lahcene Larabi Professeur à l’Université de Tlemcen d’avoir accepté d’examiner ce travail et de faire partie de ce jury. J’adresse aussi mes remerciements à tous mes collègues de l’URMER. Mes plus grand remerciements vont naturellement aussi à mes très chers parents, mes chers frères et sœurs, qui m’ont toujours encouragé et soutenu en toutes circonstances.

A mon père et ma mère

la lumière de ma vie

qui m’ont appris dès mon très jeune âge

la foi et le respect de la science

A mes sœurs et mes frères qui m’ont

toujours encouragé et soutenu

A mes très chers neveux et nièces

Je dédie ce modeste travail

« La connaissance pratique, c’est d’acquérir un contenu de pensée relative

à l’agir. » (Avicenne, Ibn Sina)

« Une théorie qui ne serait pas réfutable n’appartient pas au domaine

scientifique » Karl Popper

« Ce qu’il faut, c’est voir. Et voir c’est chercher à voir, derrière toutes les

images, toutes les représentations, derrière toutes les visions, ce qui ne se

laisse pas voir, mais qui se laisse chercher. » (Philippe Quéau)

« Aucune loi de la nature n’a d’importance scientifique, à moins qu’elle ne

soulève des questions auxquelles l’expérience puisse répondre ».

Dimitri I. Mendeleiev

« Personne ne croit une nouvelle théorie sauf le théoricien qui l'a

développée. Tout le monde croit des résultats expérimentaux sauf

l'expérimentateur qui les a obtenus. »

J.C.H Spence (1992)

Table des matières

Introduction générale

Chapitre I : Le réductionnisme en chimie quantique

I.1. Introduction …………………………………………………………………………. 05

I.2. Définition du réductionnisme……...………………………………………………… 05

I.3. Les différentes formes de réductionnisme………..……………………..................... 05

I.4. Réductionnisme et complexité ………………..…………………………………….. 06

I.5. Aspects du réductionnisme ……….………………………………….……………… 07

I.6. Le réductionnisme, une démarche incontournable………...………………………… 07

I.7. L’idée de réductionnisme……………………………... ……………………………. 08

I.8. Les types de réduction…………. …………………......…………………………….. 09

I.8.1.Réduction verticale……………………………………………………………... 09

I.8.2.Réduction horizontale………………...………………………………………... 10

I. 9. Comparaison entre la physique et la chimie………………………………………… 10

I. 10. Le monde quantique…...………………………………………………………….. 11

I.10.1. La réduction de la chimie à la mécanique quantique…………………………. 12

I.10.2. Le tableau périodique et le réductionnisme en chimie quantique…………..... 14

I. 11. Conclusion…………………………………………………………………………. 15

I. 12. Références...........................……………………………………………………..... 18

Chapitre II: Le Tableau périodique

II. 1. Introduction………………………………………………………………………... 20

II. 2. Historique ………………………………………………………………………..... 20

II.2.1. Lothar Meyer ou Dimitri Mendeleïev…………………………….................. 20

II.2.2. Le tableau périodique des éléments………………………………………...... 21

II.2.3. Qantification de l’énergie............................................................................... 23

II.2.4. Niveaux énergétiques des orbitales atomiques................................................ 24

II.2.5. La configuration électronique d’un atome………………………………........ 24

II.2.5.1. Principe d’exlusion de Pauli............................................................... 25

II.2.5.2. La règle de Klechkowski........................................................................ 25

II.2.5.3. Règle de Hund................................................................................... 26

II. 3. Principe de la classification moderne............………………………….................... 26

II.3.1. La loi de la périodicité des propriétés.………………................................... 27

II.3.2. La loi périodique.............................................................................................. 28

II.3.3. La compréhension du système périodique....................................................... 28

II.4. Analyse du tableau périodique……………………………………………………… 29

II.4.1. Les anomalies du tableau périodique............................................................ 29

II. 4.2. Propriétés physiques et chimiques des éléments......................................... 30

II.4.2.1. L'électronégativité............................................................................. 30

II.4.2.2. Le rayon atomique ………………………………............................. 30

II.4.2.3. L’énergie (ou potentiel) d'ionisation ……………............................. 31

II.4.2.4. L’affinité électronique......................................... ................................ 31

II.5. Conclusion................................................……….………………………………….. 32

II.6. Références .........................………………………………………………………... 33

Chapitre III: Le data mining et ses techniques d’analyse de données

III.1. Introduction………………………………………………………………………. 34

III.2. Différentes définitions du Data Mining..........………………………………....... 34

III.3. Historique................................................................................................................ 34

III.4. La démarche du Data Mining……………………………………………............. 35

III.4.1. Valorisation des données……………………………………………......... 36

III.4.2. Définition d’un modèle ………………………………………................. 36

III.4.3. Les modèles prédictifs …………………………………………................. 37

III.4.4. La segmentation......................................................................................... 37

III.4.5. La description (ou identification de modèles fréquents)….....….................. 38

III.4.6. Les deux types de techniques du Data Mining………………………......... 38

III.4.6.1. Les techniques descriptives…………………………………......... 38

III.4.6.2. Les techniques prédictives…………………………….……......... 38

III.4.6.3. Comparaison entre le Data Mining et la statistique………............. 38

III.4.6.4 Que peut-on trouver et prouver réellement avec le Data Mining ?… 39

III.4.6.5 Conclusions ............................………………………………........ 39

III.5. L’Analyse en Composantes Principales…………………………………………. 40

III.5.1. Introduction…….……………………………………................................ 40

III.5.2. Historique…………………………………………………………............... 40

III.5.3. L’analyse de données……………………………………………….............. 40

III.5.4. La nature des données………………………………………………............. 41

III.5.4.1. Définition des variables………………………………….............. 41

III.5.4.2. Définition des individus…………………………………………... 41

III.5.4.3. Le centrage et la réduction des données brutes……....................... 41

III. 5.4.3.1. Les paramètres de dispersion……………………….......... 42

III. 5.4.3.2. Caractéristique de la tendance centrale.………………….. 42

III. 5.4.3.3. Caractéristique de la dispersion……………...................... 42

III. 5.4.3.4. La variance…………….................................................... 42

III. 5.4.3.5. L’écart type ………………………................................... 43

III. 5.5. Qu'est-ce qu'une base de données ?………………………………........... 43

III. 5.6. Principe de l'Analyse en Composantes Principales (ACP)………............ 43

III. 5.7. Le processus de l'Analyse en Composantes Principales…........................... 44

III. 5.7.1. Construction des axes principaux, démarche géométrique.... 45

III. 5.7.2. Calcul matriciel……………………………………………... 46

III. 5.8. Conclusion…………………………………………………….... 47

III. 6. La méthode des moindres carrés partiels (PLS)…………………………………. 48

III.6.1. Introduction-Problématique ……………………………………………... 48

III.6.2. Historique …………………………………………………………........... 48

III.6.3. Définition de la régression PLS ?.................................................................. 49

III.6.4. Les objectifs de la régression PLS……………………………………...... 49

III.6.5. Les versions de la régression PLS............................................................ 49

III.7. Le principe de la régression PLS……………………........................................... 50

III.7.1. Données et notations………………………………………………………. 50

III.7.2. La méthode PLS …………………………………………………………… 50

III.7.3.Indépendance des composantes dans la régression PLS………………...... 51

III.8. Les avantages de la régression PLS……………………………………………….. 52

III.9. Conclusion ………………………………………………………………………... 53

III.10. Références ……………………………………………........................................... 54

Chapitre IV: Résultats et discussions

IV.1. Une étude comparative des propriétés physiques et mécaniques du lutétium avec

celles des métaux de transition par l'approche du datamining…………................

IV.1.1. Introduction.................................................................................................. 57

IV.1.2. La base de données……………………………………………................... 59

IV.1.3. Techniques de calculs………………………………………………...........

IV.1.4. L’analyse en composantes principales (ACP) ………………….................

IV.1.5. La régression par les Moindres Carrés Partiels (PLS)……........................... 66

IV.1.6. Conclusion…………………………………………………....................... 68

IV.1.7. Références................................................................................................ 69

IV.2.Une étude comparative des propriétés physiques et mécaniques de l’hydrogène en

appliquant les techniques de recherche du data mining..…....................................

IV.2.1. Introduction…………………………………………………………….... 71

IV.2.2. Les bases de données ……………………………………………………. 72

IV.2.2.1 La bases de données des métaux alcalins y compris l’hydrogène 72

IV.2.2.2. L’analyse en composantes principales (ACP)........................... 73

IV.2.2.3 La bases de données du groupe de carbone y compris

l’hydrogène.……………..…………….....................................

IV.2.2.4. L’analyse en composantes principales (ACP) ….................... 75

IV.2.2.5. La bases de données des halogènes y compris l’hydrogène….... 78

IV.2.2.6. L’analyse en composantes principales (ACP) …...................... 78

IV.2.3. La régression par les Moindres Carrés Partiels (PLS)................................. 81

IV.2.4. Conclusion ……………………………………………………….……..... 85

IV.2.5. Références ............................................................………………..…….. ... 86

IV.3. Investigation des propriétés structurales et mécaniques des hydrures alcalins par

les calculs ab initio et l'approche du datamining......................................................

IV.3.1. Introduction.................................................................................................... 104

IV.3.2. Base de données ........................................................................................... 105

IV.3.3. L’analyse en composantes principales (ACP)............................................... 107

IV.3.3.1. Les propriétés structurales ......................................................... 107

IV.3.3.2. Les propriétés mécaniques........................................................ 107

IV.3.4. Analyse par l’approche data mining…………………………………. 108

IV.3.5. Conclusion………………………………………………………………... 112

IV.3.6. Références………………………………………………………………… 113

Conclusion générale……………………………………………………………….. 112

Table des figures

Figures Titres Pages

Figure II.1 La première forme du système périodique de Mendeleev

datant du 17 février 1869, intitulée « une tentative au

système d’éléments, se basant sur leur masse ».

Figure II.2 Dimitri Ivanovitch Mendeleev 22

Figure II.3 Hiérarchie des niveaux énergétiques des orbitales

atomiques (visualisée par la règle de Klechkowski).

Figure III.1 Technologies et modèle général du data mining. 37

Figure III.2 Illustration en 2D de la réduction de la dimension. La

première composante contient le maximum

d’information (maximum de variance).

Figure III.3 Représentation en 2D des 2 vecteurs propres et des 2

valeurs propres associés aux deux nouvelles

composantes.

Figure III.4 Projection des individus dans le plan principal. 46

Figure IV.1.1 Le graphe des observations des métaux de transition de

la troisième période y compris le lutétium.

Figure IV.1.2 Le graphe des variables des métaux de transition de la

troisième période y compris le lutétium.

Figure IV.1.3 Le graphe des observations (t1, t2) des métaux de

transition de la troisième période y compris le lutétium.

Figure IV.2.1 Le graphe des observations des métaux alcalins y

compris l’hydrogène.

Figure IV.2.2 Le graphe des variables des métaux alcalins y compris

l’hydrogène.

Figure IV.2.3 Le graphe des observations du groupe du carbone y

Figure IV.2.4 Le graphe des variables du groupe du carbone y compris

l’hydrogène.

Figure IV.2.5 Le graphe des observations du groupe des halogènes y

Figure IV.2.6 Le graphe des variables du groupe des halogènes y

Figure IV.2.7 Le cercle de corrélation entre les propriétés mécaniques,

et les propriétés physiques dans les deux composantes

PLS (t1, t2) (la base de données des métaux alcalins).

PLS (t1, t2) (la base de données du groupe de carbone).

PLS (t1, t2) (la base de données des halogènes).

Figure IV.3.1 Structure cristalline de la structure NaCl (B1) des

hydrures alcalins MH dans les conditions ambiantes. Les

cercles bleus représentent M = Li, Na, K, Rb, Cs, et les

cercles violets représentent les atomes d'hydrogène.

Figure IV.3.2 Le graphe des observations des hydrures alcalins. 108

Figure IV.3.3 Le graphe des variables des hydrures alcalins. 108

Figure IV.3. 4 Le graphe de «Biplot » représentant les hydrures alcalins

et les propriétés.

Liste des tableaux

Tableaux Titres Pages

Tableau II.1 Désignation des valeurs du nombre quantique azimutal, l. 24

Tableau II.2 Niveaux énergétiques des orbitales atomiques. 24

Tableau IV.1.1 La base de données incluant les propriétés physiques et

mécaniques des métaux de transition de la troisième

période y compris le lutétium.

Tableau IV.1.2 La matrice de corrélation des métaux de transition de la

troisième période y compris le lutétium.

Tableau IV.1.3 Les propriétés physiques du groupe 3 (IIIB), y compris le

lutécium. Les quantités indiquées dans le tableau sont les

suivantes: l'électronégativité (χ), le rayon atomique (r), 1er

potentiel d’ionisation (eV), 2ème potentiel d’ionisation

(eV), le point de fusion (° C).

mécaniques des métaux alcalins y compris l’hydrogène.

mécaniques du groupe de carbone y compris l’hydrogène.

mécaniques des halogènes y compris l’hydrogène.

Tableau IV.3.1 Les valeurs calculées de paramètre de maille a0 (Ǻ), le

module de compressibilité (B0) (GPa) et la dérivé

première de la pression (B’0) des hydrures alcalins dans la

structure NaCl (B1), avec quelques autres résultats.

Tableau IV.3.2 Les Constantes mécaniques et élastiques des hydrures

alcalins dans la structure NaCl (B1), avec quelques autres

résultats, le module de compressibilité (B0), module de

cisaillement (G), constantes élastiques (Cij)), le module

d'Young (E) sont en (GPa). Le rapport B/G, le facteur

d'anisotropie (A) et le coefficient de Poisson (ν) sont des

paramètres sans dimension.

INTRODUCTION GENERALE

La découverte de la structure de l’atome au début du vingtième siècle a marqué une

grande étape dans l’avancée des connaissances. De nombreux phénomènes physiques et

chimiques demeuraient sans interprétation tels que l’effet Compton, l’effet Zeeman,…etc. Ce

qui a conduit les physiciens et chimistes à abandonner le modèle classique de la mécanique

newtonienne et à introduire un nouveau modèle qui est la mécanique quantique, ce qui a

permis une interprétation nouvelle de la classification périodique [1].

La mécanique quantique a été la théorie la plus spectaculaire réussi dans l'histoire de la

science. L'impact de la théorie a été ressenti dans des domaines tels que la physique du solide,

et la science des matériaux [2].

L’évolution de l’histoire de la chimie au XIXe siècle nous montre à quel point une

classification devenait nécessaire. La classification telle que Mendeleiev l’a publiée en 1869

puis en 1871 a stimulé la recherche en chimie et de nombreuses questions fondamentales se

sont appuyées sur cette formidable base théorique que renferme ce tableau. C’est actuellement

un point de repère universel pour la communauté des chimistes [3].

Le tableau périodique reste, après plus d’un siècle, le plus important moyen de

comparaison entre les éléments chimiques. Il nous permet d'étudier rationnellement la grande

variété des substances que nous trouvons dans la nature [4].

La matière condensée est formée par l'agrégation d'atomes, et les propriétés de

l'agrégat dépendent de la structure électronique des atomes qui le constituent. Elle est donc

d’une grande importance, ce qui est essentiel pour la classification des propriétés physiques

des éléments solides comme il l’est pour ses atomes constitutifs [5].

La classification périodique des éléments exprime une profonde vérité physique et

permet d'unifier un grand nombre de connaissances portant sur la matière. Ce classement

facilite la compréhension des groupes d'éléments en montrant la relation entre leurs propriétés

chimiques et leur structure atomique. De plus, la connaissance du tableau périodique permet

de prévoir les formules des composés et les types de liaisons unissant les composants d'une

molécule [4]. Les éléments dans le tableau périodique sont rangés par ordre croissant du

numéro atomique Z, selon la configuration électronique des atomes [6], en respectant la règle

de Klechkowski dans le remplissage des orbitales par énergie croissante.

Le tableau périodique est pour nous, de toute évidence, le guide le plus sûr dans

l’étude de la chimie. Mais il comporte certaines anomalies ou contradictions, qui sont les

éléments qui ne respectent pas la règle de Klechkowski, et qui présentent des configurations

électroniques faisant exception à la norme, tels que :

- L’hydrogène qui ne s’ajuste harmonieusement à aucun groupe, c’est un non-métal est

il est placé généralement dans la même colonne que le lithium qui est un métal très

réactif. L’hydrogène est parfois placé en tête du groupe 7, avec les halogènes. Dans

certains tableaux périodiques, il est même placé dans les deux groupes à la fois [7].

- L’Hélium se trouve dans le bloc p alors qu’il est de type s.

- Le lutécium et le lawrencium sont placés dans le bloc f, alors que leur couche f est

déjà saturée, ils contiennent 1 électron 5d ou 6d. Ils constituent bien le début des

éléments de transition.

Les tableaux périodiques habituels de Mendeleïev des éléments chimiques sont déjà à

97% en accord avec la mécanique quantique. Trois éléments seulement qui ne le sont pas, et

sont en désaccord avec le principe d'exclusion de Pauli. Afin d'assurer la cohérence, il est

proposé de placer l'hélium à côté de l’hydrogène dans le bloc s. Le lutécium et le lawrencium

dans le bloc d des métaux de transition, pour que le tableau périodique soit conforme à 100%

avec la mécanique quantique [8].

Dans cette thèse on a étudié les contradictions existantes dans le tableau périodique, et

on les a confronté moyennant l’approche data mining et ses techniques, telles que l'analyse en

composantes principales (ACP) et la régression (PLS), qui sont employées pour la première

fois pour l’étude de ce problème, et ce qui fait l’originalité de ce travail.

Cette thèse est organisée comme suit:

- Le premier chapitre est consacré à la présentation générale du réductionnisme en chimie

quantique, ses différentes formes, ses aspects, les types de réduction, la comparaison entre la

physique et la chimie, la réduction de la chimie à la mécanique quantique, et le lien existant

entre le tableau périodique et le réductionnisme en chimie quantique.

- Le deuxième chapitre est consacré à l’étude du tableau périodique, son historique, la loi de

la périodicité des propriétés, son évolution, et ses anomalies.

- Le troisième chapitre est consacré à la définition du datamining et ses différentes techniques,

l’analyse en composantes principales (ACP) et la régression PLS (la régression par les

moindres carrés partiels), le principe de ces méthodes, et leurs objectifs.

- Le quatrième chapitre présente les résultats liés à l’application de l’approche datamining, et

ses techniques telles que : l’analyse en composantes principales (ACP) et la régression (PLS),

qui ont été appliquées sur les différentes bases de données contenant les différentes familles

du tableau périodique qui présentent des contradictions avec la mécanique quantique.

À la fin de cette thèse, une conclusion générale fait un récapitulatif de l’essentiel des

principaux résultats obtenus tout en dégageant des perspectives pour la poursuite de cette

investigation.

Références

[1] André Durupthy, Jacques Estienne, Magali Giacino, Alain Jaubert, Claude Mesnil,

« Physique, Chimie et sciences de l’ingénieur » (PCSI), I.S.B.N. 978-2-0118-1752-5.

www.hachette-education.com.

[2] Eric R. Scerri, « Collected papers on philosophy of chemistry », Imperial College Press,

(2008). ISBN-13 978- 1-84816- 137-5.

[3] Jean-François Le Maréchal, « La classification périodique des éléments chimiques »,

Université Lyon 2 - UMR GRIC équipe COAST (1999).

[4] Le repaire des sciences, http://www.lerepairedessciences.fr

[5] H.P. Myers, « Introductory Solid State Physics », 2nd ed, Taylor & Francis e-Library,

(2009), ISBN 0-203-21255-X.

[6] http://www.web-sciences.com.

[7] Carole McQuarrie,Donald A. McQuarrie,Peter A. Rock, « Chimie générale », Editions

De Boeck Université 1st ed., (1992).

[8] Bernard SCHAEFFER, Periodic table quantum mechanics consistent,

https://www.scribd.com/doc/5994795/Periodic-table-quantum-mechanics-consistent.

CHAPITRE I

Le réductionnisme en chimie quantique

Chapitre I. Le réductionnisme en chimie quantique

I.1. Introduction

Bien qu'il soit évident que les tentatives pour expliquer la chimie en termes de

la théorie quantique ne peuvent apparaître suite au développement de la mécanique quantique

au XXe siècle, ce type de réductionnisme ne date pas d'aujourd'hui.

En général, le réductionnisme est l'idée qu’une science, telle que la chimie, peut être réduite

plus à une science "fondamentale", dans ce cas, à la physique.

Comme nous le verrons dans ce qui suit, la conception même du réductionnisme supposant

une hiérarchie dans les sciences entre les sciences plus fondamentales, généralement la

physique et les mathématiques, et ceux qui sont considérées comme des dérivés ou des

épiphénomènes, à commencer par la chimie, et passant par la biologie aux sciences humaines

comme la sociologie ou la psychologie [1].

I. 2. Définition du réductionnisme

Le réductionnisme consiste à rendre compte de la grande variété des phénomènes naturels

par un petit nombre d'entités « élémentaires » et de lois « fondamentales ». Son but, selon le

physicien français Jean Perrin, est d'« expliquer le visible compliqué par de l'invisible

simple», faisant de la simplicité une marque de vérité [2].

Réduire, dans un sens général, c’est rapetisser ; pour les sciences, on comprend le plus

souvent que réduire, c’est rendre compte d’une réalité dans les termes des propriétés des

éléments qui la constituent [3].

I. 3. Les différentes formes de réductionnisme

Le réductionnisme est un des thèmes les plus importants de l’épistémologie. Il existe

plusieurs formes de réductionnisme :

- La première, dite ontologique, consiste simplement à admettre que les lois d’une discipline

s'appliquent à une autre. (Dans le cadre qui nous intéresse ici, cela veut dire admettre que

toutes les lois de la physique, et elles seules, sont valables dans les systèmes chimiques et

dans l'ensemble de la chimie.)

- Le deuxième un niveau de réduction méthodologique, qui consiste à admettre que l'on peut

tout déduire dans une discipline à partir d'une autre. (Ici cela voudrait dire que l'on peut

analyser et comprendre le comportement d'un système chimique à partir des seules lois de la

physique.)

- Il y a enfin un réductionnisme épistémologique (qui consisterait à admettre que la chimie

n'est qu'une branche de la physique). Il n'est jamais simple de mettre tout le monde d'accord

sur les réductions existantes entre deux champs disciplinaires. On peut cependant reconnaître

que la chimie est réductible à la physique du point de vue ontologique et méthodologique,

mais pas du point de vue épistémologique. La chimie n'est certainement pas une branche de la

physique, mais la mécanique quantique, et elle seule, permet de calculer avec une grande

précision les liaisons chimiques [4].

I. 4. Réductionnisme et complexité

L'essence des débats sur le réductionnisme est la question suivante: la connaissance d'un

objet complexe se réduit-elle à la seule connaissance de ses composants? Cette conception de

la réduction du complexe au simple a déjà été réfutée par Aristote (dans la métaphysique), qui

remarquait que la syllabe BA n'était pas identique à B et A, mais avait un contenu informatif

qui allait au-delà de celui des deux lettres qui la composent. Elle est autre chose. Il y a

émergence d’une propriété nouvelle. La définition de ce que sont des objets ou des systèmes

complexes demande à être précisée. Pour Gallacher et Apenzeller, dans leur introduction au

dossier déjà mentionné de Science (1999): «Un système complexe est celui dont les propriétés

ne sont pas complètement expliquées par la connaissance et la compréhension de ses

composants.» Cette définition identifie les objets complexes et les objets pour lesquels il est

nécessaire d'aller au-delà d'une analyse purement réductionniste pour les comprendre. Selon

cette définition, une syllabe ou un mot sont déjà des objets complexes.

Une autre définition empirique d'un système complexe est celle, d'un système dont les

composants sont nombreux et en interaction. D’autres définitions sont données dans un

dossier («Complex systems», Nature 410, 2001, p. 241-284.) consacré aux systèmes

complexes, principalement physiques, paru dans Nature, comme par exemple celle d’un

système opérant à la limite du chaos. On trouve de nombreux exemples de complexité dans un

livre récent, totalement consacré à ce thème (Réda Benkirane, 2002). En fait, il semble que

l’on parle de choses assez différentes quand un physicien, un informaticien ou un biologiste

utilisent le terme de complexité. Ce qui est commun est sans doute ce que Chaitin, dans cet

ouvrage, appelle complexité algorithmique, qui est essentiellement la quantité d’informations

(les composants mais aussi toutes les interactions pouvant exister entre eux) nécessaires pour

décrire le système.

L’un des objectifs de la science est d’essayer de surmonter les problèmes posés par cette

complexité. En physique, dans le cas du problème à N corps, la théorie du chaos permet de

surmonter la complexité.

La complexité est, comme dit plus haut, une notion très ancienne; mais elle a connu

récemment un développement important dont témoigne la publication, en décembre 2003,

dans la revue Pour la science, d’un numéro spécial qui lui est totalement consacré sous le titre

«La complexité: la science du XXIe siècle». Ce concept a des applications dans tous les

domaines, y compris les sciences humaines [4].

I. 5. Aspects du réductionnisme

La question du réductionnisme s’est posée à tous les niveaux de la classification des

sciences: peut-on réduire les mathématiques à la logique, la chimie à la physique, les sciences

de la vie à la physico-chimie, la psychologie et la sociologie à la biologie? Historiquement,

elle a acquis son vocabulaire propre («réduire», «ramener», tant en langue française

qu’allemande) au milieu du XIXe siècle.

Quelles sont les raisons de la persistance, aujourd’hui, de la querelle du réductionnisme,

entamée il y a au moins un siècle et demi? Cette querelle assurément n’est pas vide de tout

contenu, car elle possède des motivations clairement identifiées. Il est pourtant difficile d’en

déceler le fondement réel, et plus difficile encore d’en démontrer l’utilité [4].

I.6. Le réductionnisme, une démarche incontournable

La physique corpusculaire, et la mécanique quantique ont conduit à diversifier les

concepts et les critères mêmes de la réalité, eu égard notamment à la « non-séparabilité »

absolue entre l’espace et le temps, entre la matière et l’énergie…

Il n’empêche, toute description de la réalité semble rester fidèle à un principe hiérarchique

visant à définir des niveaux supérieurs à partir de niveaux plus fondamentaux. Ainsi, et pour

rester dans le domaine de la physique, « toute la réalité matérielle est censée s’expliquer au

niveau fondamental par des quarks, des leptons (électrons, muons et tauons) et quatre

interactions fondamentales qui rendent compte des forces exercées entre les particules de la

matière ». Il en va de même pour la chimie, pour la biologie, qui peuvent être donc «

réduites» selon cette même logique à la physique. Le réductionnisme gouverne aujourd’hui

toute démarche scientifique ; ce qui permet en outre d’effectuer les ponts nécessaires entre les

diverses disciplines que croise par exemple la modélisation moléculaire : physique, chimie,

biologie, médecine… ce qui lui vaut d'être un mode de réduction emblématique.

La conception réductionniste vise donc toujours plus l'élémentaire, le niveau fondamental,

afin d'assurer toujours davantage une « maîtrise du réel », et par suite, une efficacité de

l'intervention humaine sur ce même réel [5].

I.7. L’idée de réductionnisme

Les réductionnistes, ont la vertu d’essayer d’être aussi clairs et explicites que possibles.

La première précision qu’ils apportent est qu’il ne faut pas parler de concepts ou de propriétés

(comme par exemple la température) sans les placer à l’intérieur d’une théorie. Ce que l’on

met en rapport, ce sont toujours des théories. La réduction d’une théorie T à une théorie S

établit une telle relation entre deux théories.

De façon informelle, on peut dire qu’une théorie T est réductible à une théorie S si toute

observation que l’on peut expliquer par T peut être expliquée aussi par S. (C’est une relation

asymétrique ; toute observation explicable par S n’est pas nécessairement explicable par T.)

Il faut ajouter, pour qu’il y ait un sens à parler de réduction, que l’on suppose que le

vocabulaire de T (la théorie que l’on réduit) contient des termes que S ne contient pas, c'est-

à-dire que T parle d’objets dont S ne parle pas et/ou à l’aide de concepts que S ne connaît pas.

C’est, de nouveau, une de ces trivialités dont les conséquences ne sont pas triviales.

Evidemment, le vocabulaire de S peut contenir des termes que celui de T ne contient pas, de

sorte que l’on peut dire plus simplement que ce qu’on demande est que le vocabulaire de T ne

soit pas inclus dans celui de S.

Les réductionnistes admettent l’existence de niveaux et, associée à chaque niveau, une

liste de propriétés caractéristiques de ce niveau. Nous pouvons alors, en suivant Broad1 et en

utilisant une terminologie modifiée, distinguer trois sortes de lois. (i) Les lois ‘intra-niveaux’

qui concernent les propriétés caractéristiques d’un niveau. Elles sont valables à ce niveau et à

des niveaux supérieurs, mais pas à des niveaux inférieurs (par exemple une loi qui relie la

température et l’entropie d’un système). (ii) Les lois ‘inter-niveaux’ qui relient des propriétés

__________________________ 1

BROAD, C.D. The mind and its place in anture. London : Routledge & Kegan Paul, (1925) pp. 77-78.

définies à un niveau i donné à celles définies au niveau i-1 (par exemple une loi qui relie

l’énergie cinétique à la température). (iii) Des lois ‘trans-niveaux’ qui seraient valables non

pas pour un niveau spécifique, ni pour une paire spécifique de niveaux adjacents, mais pour

tout niveau et toute paire de niveaux adjacents.

Les premières (‘intra’) n’offrent à mon avis pas de problèmes de principe, mais bien les

dernières (‘trans’). En voici un exemple. Oppenheim et Putnam proposent l’échelle suivante

comme « système de niveaux réductifs » : (1) particules élémentaires, (2) atomes, (3)

molécules, (4) cellules, (5) êtres vivants multicellulaires, (6) groupes sociaux. Laissant de côté

tout ce que les niveaux supérieurs peuvent avoir de problématique, constatons qu’ils obéissent

manifestement aux deux lois trans-niveaux : (i) toute entité d’un niveau quelconque, excepté

le niveau le plus bas, peut être décomposée en des entités du niveau sous-jacent, (ii) aucune

entité d’un niveau quelconque ne possède des parties qui appartiennent à un niveau supérieur.

Ce sont sans doute des lois ‘trans’ pour système de niveaux, qui d’ailleurs été construit

conformément à ces lois. Ce ci montre simplement que la notion de lois trans-niveaux n’est

pas absurde même si l’on n’en trouve pas d’intéressantes.

Les lois ‘inter-niveaux’ de quelle nature sont-elles, quels sont leurs ingrédients?

Contentons nous ici de prendre comme exemple une loi qui relie la mécanique à la

thermodynamique, et intéressons nous plus particulièrement et de façon tout à fait sommaire à

cette loi des gaz parfaits, selon laquelle le produit de la pression, P, et du volume, V, d’une

quantité donnée de gaz est proportionnel à sa température, T : PV α T. Comment peut-on

déduire cette loi de la mécanique à laquelle obéissent les molécules qui composent le gaz ?

Quels sont les ingrédients de cette déduction ? [6].

I.8.Les types de réduction

Il semble raisonnable de distinguer, la réduction “horizontale” d’une théorie à une autre

plus englobante, dont la première devient un cas particulier, et la réduction “verticale” d’une

théorie à une autre portant sur des objets considérés comme plus fondamentaux parce que plus

élémentaires.

I.8.1.Réduction verticale

La réduction de la chimie à la mécanique quantique est un des exemples le plus

souvent cités. « Les lois physiques fondamentales nécessaires pour la théorie mathématique

de la plus grande partie de la physique et de la totalité de la chimie sont ainsi complètement

connues, et la difficulté est seulement que l’application de ces lois conduit à des équations

beaucoup trop compliquées pour qu’on puisse les résoudre » (Dirac, 1929).

I.8.2.Réduction horizontale

Pour prendre un exemple connu, la mécanique quantique a-t-elle englobé la mécanique

classique en sorte de la rendre superflue, ou en tout cas de la réduire au statut d’un cas

particulier, d’un cas limite? On sait que Bohr2 n’était pas de cet avis. Il attachait une

importance considérable au passage à la limite où la constante de Planck tend vers zéro, qu’il

avait théorisé sous le nom de principe de correspondance. Mais ce n’était pour lui que l’une

des faces de la relation entre la mécanique quantique et la physique classique : l’autre face

étant que les concepts classiques restaient, et devaient rester indispensables à la description

des expériences. « En fait, nous devons comprendre que l’interprétation non ambiguë de

n’importe quelle mesure doit être articulée essentiellement en termes des théories physiques

classiques, et nous pouvons dire en ce sens que le langage de Newton et Maxwell restera

toujours le langage des physiciens » [7].

I. 9. Comparaison entre la physique et la chimie

En 1669, Bernard Le Bovier De Fontenelle, le premier et le plus célèbre secrétaire

perpétuel de l'académie royale des sciences à Paris, avait proposé la comparaison suivante:

Par ses opérations évidentes, la chimie résout les corps en un certain nombre de principes

réels et bruts; les sels, les soufres, etc. tandis que par ses spéculations délicates, la physique

agit conformément aux principes comme agit la chimie sur les corps, les résolvant en d'autres

principes encore plus simples, petits corps façonnés et déplacés dans un nombre infini de

manières: c'est la différence principale entre la physique et la chimie, l'esprit de la chimie est

plus confus, plus dense; où les principes sont mélangés l'un avec l'autre, tandis que l'esprit de

la physique est plus clair, plus simple, moins encombré, et, enfin, va droit aux origines des

choses, tandis que l'esprit de la chimie ne va pas à la fin.

Ainsi, alors que la chimie est souvent perçue comme visant à fournir les principes

généraux régissant les transformations matérielles, c'est la physique qui est engagée dans la

recherche des constituants finaux de la nature et des lois fondamentales régissant leur

comportement.

2 BOHR N, 1931, Maxwell and modern theoretical physics, in Nature (Suppl.) 128, 691-692. Et Niels Bohr, Collected

Works, Amsterdam, North-Holland, vol. 6, 1985, pp. 357-360.

En effet, comme une série d'études récentes sur la chimie du XVIIe siècle a montré,

ces positions ont été considérées comme étant entièrement compatibles. Ainsi, Daniel

Sennert, par exemple, explique un certain nombre d'opérations chimiques en termes d’ajout

ou de retrait d'atomes qui possèdent leurs propres propriétés chimiques caractéristiques. Nous

devons donc conclure, que ni la discontinuité ni l’homogénéité des matières sous-entendues

par atomisme ne fournit les raisons suffisantes pour distinguer une vue philosophique

caractéristique du physicien de celle du chimiste.

C’est trop superficiel d’essayer de distinguer la chimie de la physique suivant la ligne

des éléments contre les atomes, entre une philosophie de matière caractérisée par des

principes inhérents ou une vision basée sur la matière homogène mais discontinue. D'abord, le

désaccord entre ces deux traditions a précédé l'apparition des disciplines modernes de la

physique et de la chimie. En second lieu, et de manière plus significative, les chimistes ont

toujours été confrontés à une multiplicité d'interprétations des phénomènes chimiques, et un

grand nombre d'entre eux n'ont pas hésité à allier la doctrine corpusculaire avec celle des

éléments ou des principes.

Au milieu du dix-neuvième siècle, la définition d'un composé par la nature et la proportion de

ses constituants étaient défiées par un paradigme structural qui a tenu compte de

l'arrangement des atomes en molécules. Sur ce modèle, c'est l'arrangement physique des

éléments constitutifs qui explique les propriétés du composé [1].

I. 10. Le monde quantique

La révolution quantique, conduite vers le milieu des années vingt par de jeunes

physiciens est peut-être, parmi les nombreuses révolutions dont est jalonnée l’histoire des

sciences, celle qui a le plus radicalement et profondément bouleversé l’image que les

physiciens se faisaient du monde. La difficulté qu’ils eurent à l’accepter fut parfois si grande

que certains, et non des moindres puisque Einstein fut l’un d’entre eux, ne parvinrent pas à la

surmonter. « Celui qui n’est pas choqué par la théorie quantique », disait Bohr, « ne l’a pas

comprise ». Elle remettait profondément en question les concepts auxquels les avait habitués

la mécanique rationnelle et que la relativité n’avait pas vraiment bousculés : un monde fait de

points matériels doués à tout moment d’une masse, d’une position et d’une vitesse bien

définies. Elle introduisait à sa place la notion d’état d’un système et en faisait l’élément de

base de son processus d’abstraction et de mathématisation.

Aujourd’hui, si elle est toujours aussi choquante et indigeste – et par conséquent

difficile à enseigner aux jeunes étudiants – elle est unanimement acceptée par les hommes de

science. Les anciens concepts de la mécanique rationnelle sont compris comme n’étant que

des approximations, en quelque sorte des illusions de la mécanique quantique. Il a fallu, pour

parvenir à ce résultat, des années d’observations et d’expériences qui ont donné de la théorie

tant d’éclatantes confirmations que le doute n’est plus permis [8].

I. 10. 1. La réduction de la chimie à la mécanique quantique

Les concepts et théories que les chimistes ont développés, sans contradiction avec la

mécanique quantique mais en renonçant aux solutions exactes et en usant d’approximations

justifiées par les données expérimentales, sont-ils légitimes ?

Même avec les techniques actuelles, on ne peut obtenir des solutions exactes de

l’équation de Schrödinger que dans des cas extrêmement particuliers : atomes à un électron,

molécules diatomiques homonucléaires à un électron. De plus, la fonction d’onde, définie

dans un espace de configuration abstrait, n’a pas de signification physique simple : elle oblige

le chimiste à renoncer à toute tentative de voir ce que les atomes et les molécules sont en train

de « faire » – et qui serait possible seulement dans l’espace à trois dimensions. Il en résulte

une curieuse dichotomie en chimie quantique : les approches ad hoc, simples et qualitatives,

très utilisées par les chimistes, coexistent avec des approches rigoureuses ou ab initio,

dépourvues de concepts et d’images simples. Il n’y a guère d’espoir, concluaient ces auteurs,

que l’abîme séparant ces deux types d’approches puisse être jamais franchi (« There appears

hardly any hope of ever bridging the chasm between the two »). Autrement dit, la réduction

de la chimie à la mécanique quantique est impossible, jusqu’à nouvel ordre. Certes, la

mécanique quantique joue un rôle fondamental en chimie, mais le concept de réduction est

incapable de décrire ce rôle. Non seulement les solutions exactes des équations quantiques

sont presque toujours inaccessibles, mais encore si nous les possédions nous ne saurions pas

quoi en faire. Les solutions approchées, élaborées en tenant compte des données empiriques,

nous aident bien mieux à comprendre. Pourquoi tenter de calculer exactement telle grandeur

chimique, quand on peut la mesurer ?

Un autre physicien, Philip W. Anderson, a publié une intéressante critique du

réductionnisme sous le titre More is different (Anderson. 1972). Il est vrai qu’il se dit

“réductionniste” : mais cela ne signifie pour lui rien de plus que la compatibilité au sens de

Leggtt : les lois de la physique sont universelles, en ce sens qu’aucun phénomène connu ne

leur échappe. Mais, ajoute Anderson, on ne peut en aucune manière passer du réductionnisme

au “constructionnisme” : « La capacité de tout réduire à des lois fondamentales simples

n’implique pas la capacité de partir de ces lois pour reconstruire l’univers. En fait, plus la

physique des particules élémentaires nous dit de choses sur la nature des lois fondamentales,

moins celles-ci semblent pertinentes pour les problèmes bien réels du reste de la science, et

moins encore pour ceux de la société ». Après avoir analysé divers exemples (molécules,

solides, noyaux), Anderson énonce qu’en général la relation entre un système et ses parties à

sens unique : la synthèse est presque impossible, tandis que l’analyse peut être non seulement

possible, mais féconde à tous égards. Et il conclut : « L’arrogance du physicien des particules

est peut-être derrière nous (“ le reste est de la chimie”, a dit le découvreur du positron) [7].

En 1929, Paul Dirac, l’un des créateurs de la mécanique quantique, avait déclaré que

les lois physiques fondamentales nécessaires pour la théorie mathématique d'une grande partie

de physique et de la totalité de la chimie sont maintenant complètement connues. La seule

difficulté, selon Dirac, c’était que l'application exacte de ces lois a mené aux équations

beaucoup trop compliquées pour être soluble. Ceci et d'autres déclarations similaires ont

clairement démontré l'ambition des physiciens pour réduire tous les phénomènes chimiques

aux mécanismes de la mécanique quantique des atomes. L'argument lui-même est tout à fait

franc. En principe, la chimie est entièrement circonscrite par la description de la distribution

d'électron exprimée par l'équation de Schrödinger. Avec le principe établi, le reste de la

chimie est une question de détails. Quoique des solutions exactes pour l'équation de

Schrödinger ne sont connues que pour les atomes simples comme l'hydrogène et l’hélium

avec seulement un ou deux électrons, il est raisonnable de supposer qu’avec l'amélioration des

outils mathématiques, et en particulier, l'énorme multiplication de la puissance de calcul

apportée par l'ère numérique, approximations ou solutions de mieux en mieux pour tous les

autres éléments et composés suivra. Ainsi, la chimie pourrait, en principe au moins, être

déduite de la mécanique quantique. Les concepts d’électrons, des protons, des orbitales, et les

niveaux d'énergie qui sont déployés pour expliquer les phénomènes chimiques réussissent à

le faire seulement grâce à l'utilisation judicieuse des hypothèses complémentaires. Selon la

théorie quantique, le carbone devrait être bivalent, mais ceci n'arrête pas la majeure partie de

ses combinaisons étant tétravalent. L'hypothèse de l'hybridation des orbitales explique cette

tétravalence, mais, tout en étant compatible avec la théorie quantique, elle demeure ad hoc. En

outre, alors que la systématisation des théories en physique pourrait bien avoir réussi à

intégrer certains éléments de chimie, il n'a pas mis un terme au développement des théories

chimiques indépendantes. C'est pourquoi Monique Lévy discute à la fin d’une " réduction par

synthèse " qui est une forme de réduction qui réserve un rôle fondamental pour la discipline

"réduite " la relation entre la microstructure et les propriétés macroscopiques qui forme l'axe

central de la physique de l'état solide, et qui a profondément modifié l'approche de tous les

chimistes travaillant sur des matériaux solides [1].

Ces dernières années, la réduction de la chimie a été traitée de différentes façons. De

nombreuses études se sont concentrées sur la réduction inter-théorique entre les théories de la

chimie et les théories de la physique (Bunge, 1982; Primas, 1983). D'autres ont discuté de la

réduction de la chimie d'une manière naturaliste, en examinant la question comment certaines

propriétés généralement moléculaires tels que les angles de liaison peuvent être déduites de la

mécanique quantique dans un modèle ab initio ou si le système périodique peut être déduit de

la même façon de la mécanique quantique [9].

I. 10. 2. Le tableau périodique et le réductionnisme en chimie quantique

Le tableau périodique des éléments a eu une influence profonde sur le développement de

la chimie et de la physique moderne. Dans la chimie son influence est bien connue et

indéniable. Les fonctions du système périodique comme un principe unificateur continue à

guider la recherche des chimistes de jour en jour dans de nombreux domaines spécialisés.

L'influence de la classification périodique sur le développement de la physique et en

particulier la mécanique quantique n’est pas si bien connue mais également indéniable. La

mécanique quantique fait partie de la tradition réductionniste dans la science moderne [9].

En 1939, Georges Champetier a suggéré que le tableau périodique avait efficacement été

réinventé en raison de la théorie atomique. Selon ses propres paroles, "la théorie atomique est

maintenant devenue le fondement le plus solide de la chimie théorique et expérimentale. La

classification périodique a pris une importance beaucoup plus grande à la suite de la

clarification de nos idées concernant la structure atomique". Champetier a suggéré que la

réforme pourrait être poussée plus loin en redéfinissant l'élément en termes de nombre

combiné de protons et de neutrons dans le noyau, donnant à chaque " isotope " sa propre place

dans un nouveau tableau. En dépit de cette réorientation proposée du tableau périodique

autour des découvertes en physique atomique, Champetier n'a jamais suggéré qu'il pourrait

être possible de déduire la chimie de la physique, voyant le futur rapport entre les deux

disciplines en termes de collaboration plutôt que de domination. Ainsi, la chimie des solides

continue à devenir de plus en plus orientée vers la science des matériaux, qui étudie - ou, de

plus en plus, conçoit - des matériaux en termes de leurs propriétés, développant les matériaux

qui sont particulièrement bien adaptés à des applications données. De ce point de vue, le

chimiste peut voir le tableau périodique comme une boîte à outils bien organisée, où chaque

colonne est comme un tiroir, avec chaque élément fournissant un certain réseau de propriétés.

Tandis qu'un groupe fournit une gamme des métaux ioniques qui sont de bons conducteurs, ils

peuvent être employés en même temps que les oxydes d'un autre groupe pour faire une pile.

D'autres groupes fournissent des semi-conducteurs, et les halogènes, par exemple, assurent

une gamme d’additifs pour faire les lampes fluorescentes de diverses couleurs. Le tableau

périodique peut être vu comme un entrepôt accessiblement organisé, ou un catalogue à partir

duquel on peut commander les éléments de base pour construire de nouveaux matériaux qui

remplissent les fonctions désirées. C'est certainement l'impression donnée par le chimiste

Michel Pouchard: Le chimiste est principalement l'architecte de la matière aussi bien que son

maçon ; sa balance est celle du nanomètre, ses briques environ les cent éléments dans le

système périodique de Mendeleïev, et son ciment est leurs électrons de valence [1].

I. 11 Conclusion

On objectera aisément à ce qui précède que même si la réduction n’existe pas pour le

moment elle peut jouer le rôle d’un idéal, d’un but à atteindre. N’a-t-elle pas stimulé le

développement de la chimie et de la physique au 19e siècle ? N’inspire-t-elle pas aujourd’hui

la biologie? Examinons cela. L’idée d’une réduction verticale qui, de l’antiquité aux lumières,

a été une thèse philosophique (l’atomisme) s’incarne au 19e siècle dans l’hypothèse atomique

des chimistes, puis dans la théorie cinétique des gaz, dans la mécanique statistique, et

finalement dans la “réalité moléculaire” (selon l’expression de Jean Perrin). La théorie des

quanta puis la mécanique quantique donnent à l’atomisme des physiciens et des chimistes une

justification plus profonde ; elles expliquent que, comme le disait Bohr, il existe dans la

nature une tendance à produire des formes déterminées et à les faire réapparaître, encore et

toujours, même lorsqu’elles ont été perturbées ou détruites. Mais, en triomphant, l’atomisme a

perdu sa simplicité originelle. Les atomes ne sont plus insécables et inaltérables. L’existence

des molécules n’est plus un postulat de base de la chimie, mais un résultat de la théorie

quantique, valable sous certaines réserves. La postérité de l’atomisme s’est scindée en deux

branches bien distinctes : d’un côté la théorie savante, et les techniques récentes de

manipulation d’atomes ou de molécules presque isolées ; de l’autre, l’idée de réduction

verticale qui n’est plus une thèse philosophique ou une hypothèse scientifique, mais est

devenue une croyance.

Imaginons que la chimie, la physique du solide, la thermodynamique, la mécanique

classique enfin, soient toutes remplacées par la mécanique quantique, devenue entièrement

calculable après l’avènement d’ordinateurs d’un type nouveau. L’industrie informatique

réaliserait des chiffres d’affaires fabuleux. Mais l’idéal d’intelligibilité qui a présidé à la

naissance de la science serait mort et enterré, au moins dans les sciences physiques ; car la

mécanique quantique, qui calcule par ses propres moyens et fournit des résultats d’une

exactitude numérique étonnante, ne peut guère se passer des béquilles de la physique

classique quand on lui demande de nous faire comprendre ce qui se passe. Par suite, les

sciences physiques, débarrassées désormais de toute incertitude et de toute nouveauté

véritable, sombreraient dans un océan d’ennui. En somme, même si la réduction devenait

possible dans les sciences physiques, elle ne les aiderait pas à remplir ce qui doit rester la

tâche fondamentale de toute science : nous aider à comprendre les phénomènes [7]. La

mécanique quantique a montré à quel point la séparation entre la physique et la chimie était

arbitraire [10].

Friedrich Paneth a clairement défini le statut épistémologique du concept chimique de

l'élément dans une conférence portant ce titre qu'il a donné en 1931. Ici, il a soulevé deux

questions. La première rappelle le problème d'Aristote avec « les mixtes véritables », en quel

sens peut-on supposer que les éléments persistent dans les composés? " Sa réponse - basée

sur une étude historique des notions d’éléments et des atomes - est claire: puisque la chimie

est concernée par les qualités secondaires des substances, les chimistes devraient assumer la

persistance des qualités dans les composés. Il a proposé d'appeler ce qui persiste " substance

de base " alors qu'il réservait le terme " substance simple " pour la matière montrant des

manifestations phénoménologiques associées à cette substance de base abstraite, renouvelant

de ce fait la distinction conceptuelle de Mendeleev. La deuxième question de Paneth était: «

s’il est vrai ou non que la chimie doit et va se dissoudre dans la physique? " Ici, il a traité la

possibilité de reduire la chimie à la physique, un développement qui avait été déjà prédit par

certains physiciens.

La théorie quantique offre clairement des avantages considérables pour l'enseignement de la

chimie et, en particulier, pour la présentation du tableau périodique, avec son explication du

comment et du pourquoi les propriétés chimiques des divers éléments obéissent à un modèle

global. Néanmoins, ceci ne signifie pas que les chimistes peuvent s'en sortir seuls avec la

mécanique quantique. Le chimiste ne peut pas s'isoler de ces développements et de se

contenter d'exécuter et de décrire les réactions. Il ne pourra pas tirer parti de ses succès

précédents à moins qu'il assimile les disciplines du physicien ou accepte de collaborer avec

lui. Cette évolution de la chimie vers la physico-chimie est est le trait le plus caractéristique

de ces vingt dernières années [1].

I. 12.Références

[1] Bernadette Bensaude-Vincent, Jonathan Simon, « CHEMISTRY THE IMPURE

SCIENCE », Imperial College Press, (2008), ISBN-13 978-1-84816-225-9.

[2] J. Perrin, « Les Atomes », Flammarion, (1991).

[3] Charles Widmer, «Droits de l’homme et sciences de l’homme pour une Ethique

anthropologique», Librairie Droz S. A., Genève - Paris (2007).

[4] Bernard JACROT, Eva PEBAY-PEYROULA, Régis MACHE, Claude DEBRU,

« PHYSIQUE ET BIOLOGIE, UNE INTERDISCIPLINARITÉ COMPLEXE », EDP

Sciences, (2006), ISBN 2-86883-892-8.

[5] Lambert D., 1999. « Sciences et théologie Les figures d'un dialogue », Ed. Lessius,

Presses Universitaires de Namur, 220p.

[6] Edgar Ascher, « L’idée d’émergence », Archives de psychologie, 52, (1984), 175-193.

[7] À René Thom, « Passion des formes : dynamique qualitative, sémiophysique et

intelligibilité », Vol 1, ENS Editions, (1994) 828 p.

[8] Pierre Darriulat, « Réflexions sur la science contemporaine », EDP Sciences (2007),

ISBN 978-2-86883-964-0.

(2008). ISBN-13 978- 1-84816- 137-5.

[10] Champ Vallon, « La totalité », vol 5, (2002), Ed. Champ Vallon, Presses Universitaires

de France, ISBN 2-87673-355-2.

CHAPITRE II

Le tableau périodique

Le tableau périodique .Chapitre II

II.1. Introduction

Le tableau périodique se classe comme l'une des idées les plus fécondes et

unificatrices dans toute la science moderne [1]. L'élément chimique est proche d'une

abstraction mathématique. Ainsi, il devient un instrument qui nous permet de construire une

série qui est supposée se cacher derrière. Cette abstraction permet au chimiste de décrire

l'ordre qui existe derrière la multiplicité apparente chaotique du monde phénoménal. La plus

grande valeur du concept de Mendeleev d'un élément est sa puissance de construire la série

apparentée. Les éléments chimiques sont efficacement "désincarnés" les entités abstraites qui

sont attachées au vrai monde par le réseau des rapports décrits par le système périodique. Ce

rapport abstrait-concret est représenté par la position de l'élément dans le tableau périodique,

qui forme alternativement la base pour une multiplicité d'interprétation [2].

II.2. Historique

Tout a commencé par la notion d’élément, puis l'analyse de la réactivité des éléments

chimiques a amené bon nombre de scientifiques à proposer des systèmes de classement basés

sur l'analogie des réactivités. Le tout premier système de classement, publié en 1829, celui de

Johann Döbereiner de l'Université de Iéna et Sa "Loi des triades". La première

classification périodique qu'il nomma "la vis tellurique", fut celle de Beguyer de

Chancourtois en 1862. Dés 1857, William Odling s'intéressa au classement des éléments

connus en développant la règle des triades. Il publia en 1864 une classification assez proche

de celle que Dmitri Mendeleïev publia cinq ans plus tard.

En 1863, John Newlands publia dans "Chemical News" une classification de 56

éléments en 11 groupes basés sur la similitude de leurs propriétés chimiques, il observa aussi

que dans un même groupe deux éléments consécutifs avait une masse atomique différente

d'un multiple de huit, Newlands introduisit une loi des octaves laissant entendre que tous les

huit éléments on retrouve des propriétés chimiques similaires.

II.2.1. Lothar Meyer ou Dimitri Mendeleïev ?

L'allemand Meyer et le russe Mendeleïev ont établi, chacun de leur côté, un

classement des éléments chimiques. Meyer proposa une classification périodique dès 1864,

mais celle-ci ne fut publiée qu'en 1870, un an après celle de Mendeleïev.

Le classement se fit sur la base de la masse atomique croissante (les numéros atomiques

n'étaient pas encore inventés) en conjonction avec la similitude des propriétés chimiques.

L'originalité des tableaux de Mendeleïev et de Meyer fut de laisser des emplacements vides,

prévoyant ainsi la prochaine découverte de nouveaux éléments [3].

C'est au chimiste russe, Dimitri Ivanovitch Mendeleïev (1834-1907), que revient le

mérite d'avoir structuré une classification cohérente de l'ensemble des éléments. En rédigeant

un volume de chimie, il se rend compte qu'en plaçant les éléments en ordre croissant de leur

masse atomique, il apparaît une tendance en ce qui concerne les propriétés, tendance qui se

répète à plusieurs reprises. En 1869, il présenta une première version de son tableau

périodique. Celui-ci contient alors les 63 éléments connus à cette époque. Mendeleïev disposa

son tableau de manière que la périodicité apparût nettement. En classant les éléments

verticalement (ils sont disposés horizontalement dans la classification actuelle). Les rangées

horizontales se succèdent régulièrement au fur et à mesure que certaines propriétés chimiques

et physiques se répètent. Dans les rangées verticales, on retrouve des éléments possédant à

peu près les mêmes propriétés chimiques et des ressemblances dans leurs propriétés

physiques. Pour respecter la loi périodique à laquelle Mendeleïev croyait fermement, il dut

parfois modifier l'ordre déterminé par la progression des masses atomiques et laisser certaines

cases vides. Jusque là, très peu de scientifiques acceptaient les idées de Mendeleïev. Mais

lorsque ces éléments prédits par ce dernier furent découverts, présentant de surcroît des

propriétés très proches de celles qu'il avait prévues, les scientifiques reconnurent l'utilité de

son tableau périodique. Bien que la classification de Mendeleïev marquât un net progrès sur

tous les autres essais de classification d'alors, il reste qu'elle contenait certaines anomalies

dues à des masses atomiques encore mal déterminées à l'époque [4].

II.2.2. Le tableau périodique des éléments

Le tableau périodique des éléments répertorie les éléments chimiques selon l’ordre

croissant de leur nombre atomique. Le tableau périodique est constitué de rangées

horizontales, nommées periodes et de rangées verticales, nommées colonnes (groupes

d’éléménts).

Il est important de noter que:

- les périodes sont en nombre de 7;

- les groupes d’éléménts sont en nombre de 18; dont les propriétés présentent certaines

tendances [5].

Figure. II.1 : La première forme du système périodique de Mendeleev datant du 17 février

1869, intitulée « une tentative au système d’éléments, se basant sur leur masse.

Figure. II. 2 : Dimitri Ivanovitch Mendeleev [1].

Il en résulte que nous pouvons acquérir une connaissance raisonnable d’un élément si nous

savons à quel groupe il appartient et quels sont ses voisins [6].

- les groupes d’éléménts contiennent des éléments chimiques qui présentent des

propriétés chimiques similaires;

- le 1er groupe d’éléménts regroupe les métaux alcalins ;

- le 2e groupe d’éléménts regroupe les métaux alcalino-terreux ;

- le 17e groupe d’éléménts regroupe les halogènes ;

- le 18e groupe d’éléménts regroupe les gaz rares ;

- les groupes d’éléménts 3 à 12 compris regroupent les métaux de transition [5].

- Le long bloc situé au-dessous est constitué par les métaux de transition interne. La

rangée supérieure de ce bloc la 6e période, est constituée par les lanthanides et La

rangée inférieure la 7e période, par les actinides [6].

Les colonnes sont occupées de telle manière que chacune d’entre elles renferme tous les

éléménts dont les atomes ont la même configuration électronique de valence. Comme ce sont

les électrons de valence qui sont reponsables des propriétés chimiques des éléments, une

colonne regroupe tous les membres d’une même famille chimique.

On distingue également des blocs, chaque bloc correspond au remplissage d’un type de sous-

couche :

- Le bloc s correpond au remplissage de sous-couches s (colonnes 1 et 2).

- Le bloc p à celui des sous-couches p (colonnes 13 à 18)

- Le bloc d à celui des sous-couches d (colonnes 3 à 12)

- Le bloc f à celui des sous-couches f (les deux lignes sous le tableau) [7].

II.2.3. Qantification de l’énergie

Les nombres quantiques

En mécanique quantique, létat d’un électron d’un atome peut être décrit à l’aide de

qutre nombres dits quantique et notés: n, l, ml et ms.

- n est appelé nombre quantique principal. C’est un nombre entier positif.

- l est appelé nombre quantique secondaire ou azimutal. C’est un nombre entier positif ou nul

inférieur ou égal à n-1: 0 ≤ l ≤ n-1 [7].

Les valeurs du nombre quantique azimutal, l, sont désignées respectivement par des lettres

empruntées à la spectroscopie [6].

l 0 1 2 3 4

niveau d’énergie s p d f g

Tableau II.1 : Désignation des valeurs du nombre quantique azimutal, l [7].

II.2.4. Niveaux énergétiques des orbitales atomiques

Pour les atomes polyélectroniques, les niveaux énergétiques des orbitales atomiques

dépendent à la fois des valeurs de n et de l. Autrement dit, les orbitales caractérisées par la

même valeur de n mais par des valeurs différentes de l, possèdent des énergies différentes.

- les niveaux énergétiques des orbitales atomiques, précisés par une des valeurs de n, sont

appelés couches électroniques. Selon la valeur de n, les couches électroniques sont désignées

par une des lettres majuscules suivantes : K, L, M, N, O, P, Q.

- les niveaux énergétiques des orbitales atomiques, précisés par les diverses valeurs de l, sont

appelés sous-couches électroniques.

Couche

électronique

sous-couches électroniques

K (n = 1) l sous-couche s (l = 0)

L (n = 2) l sous-couche s (l = 0) et l sous-couche p (l = 1)

M (n = 3) l sous-couche s (l = 0), l sous-couche p (l = 1), l sous-couche d (l = 2)

N (n = 4) l sous-couche s (l = 0), l sous-couche p (l = 1), l sous-couche d (l = 2), et l sous-

couche f (l = 3)

Tableau II.2 : Niveaux énergétiques des orbitales atomiques [5].

II.2.5. La configuration électronique d’un atome

Pour établir la configuration électronique d’un atome polyélectronique dans son état

fondamental, trois règles doivent être appliquées: le principe de Pauli, la règle de

Klechkowski et la règle de Hund.

II.2.5.1. Principe d’exlusion de Pauli

Dans un édifice monoatomique, deux électrons ne peuvent pas avoir leurs quatre

nombres quantiques (n, l, ml, ms) identiques.

Ainsi, deux electrons qui occupent une sous-couche 1s sont décrits par le quadruplet (1, 0, 0,

+ 1/2) pour l’un et (1, 0, 0, − 1/2) pour l’autre.

Ils ont la même énergie, mais leurs nombres magnétiques sont de spin opposés; on dit que

leurs spins sont anti-parallèles ou appariés.

Une orbitale atomique ne peut donc pas décrire plus de deux électrons.

Ainsi, une sous-couche s peut contenir au plus deux électrons, une sous-couche p au

plus six électrons, une sous-couche d au plus dix électrons, une sous-couche f au plus

quatorze électrons.

- Une sous-couche qui contient le maximum d’électrons qui lui est permis de contenir est dite

saturée [7]. On peut résumer le principe d'exclusion de Pauli comme ceci: Dans chaque

couche, l'on peut mettre au maximum 2n² électrons. (où n est le numéro de la couche) [8].

II.2.5.2. La règle de Klechkowski

À l’état fondamental, l’énergie de l’atome est minimale : cela correspond à une

occupation des niveaux d’énergie électronique les plus bas. La règle de Klechkowski (Appelé

principe de stabilité) est une règle empirique qui permet de retrouver l’ordre de remplissage

des sous-couches afin d’obtenir la configuration électronique d’un atome dans son état

fondamental. Dans l'ordre :

1s < 2s < 2p < 3s < 3p < 4s < 3d < 4p < 5s < 4d < 5p < 6s < 4f < 5d < 6p < 7s < 5f < 6d < 7p

< 8s <... [9].

Dans un atome polyélectronique, l’ordre de remplissage des sous-couches

(caractérisées par les nombres quantiques n et l) est celui pour lequel la somme (n + l) croît.

Quand deux sous-couches ont la même valeur pour la somme (n + l), la sous-couche qui est

occupée la première est celle dont le nombre quantique principal n est le plus petit [7].

Remarque

La règle de Klechkowski est parfois appelée principe de construction (ou principe de

l’Aufbau) [7].

Figure. II.3. : Hiérarchie des niveaux énergétiques des orbitales atomiques (visualisée par la

règle de Klechkowski) [5].

II.2.5.3. Règle de Hund

Dans des orbitales de même énergie (dans une même couche), les électrons se placent

de préférence avec leurs spins parallèles (même chiffre) dans des orbitales différentes. Ceci

s'expliquant par un gain d'énergie [8].

II.3. Principe de la classification moderne

Cette classification comporte 7 lignes (ou périodes) et 18 colonnes. Les éléments sont

rangés dans chaque ligne par ordre croissant du numéro atomique Z, selon la configuration

électronique des atomes [10], suivant la règle de Klechkowski où le remplissage des orbitales

se fait par valeurs croissantes des niveaux énergétiques n + l.

II.3.1. La loi de la périodicité des propriétés

Bien avant la découverte de la nature atomique de la matière, les chimistes avaient

remarqué que, lorsque les éléments sont classés par ordre croissant des « masses équivalentes

» (masses atomiques), une périodicité de leurs propriétés apparaissait. C'est Mendeleiev qui

proposa la classification qui devait se trouver expliquée par la découverte de la structure

atomique de la matière.

La comparaison des couches de valence (C.V.) des différents éléments conduit très

vite a constater que leur structure électronique se répète pour des groupes d'éléments

(familles), la seule différence étant la valeur du nombre quantique principal « n » impliqué

dans la couche de valence. Ainsi, a une colonne donnée, correspondent des éléments ayant

une couche de valence de même type, c'est-à-dire possédant des propriétés comparables. La

structure du tableau périodique des éléments traduit ces propriétés remarquables. Dans ce

tableau, les éléments situés dans une même colonne constituent une famille d'éléments : ceux-

ci ont la même structure de la couche de valence. Ceux qui sont situés sur une même ligne

constituent une période : leur couche de valence correspond à une même valeur du nombre

quantique « n » [11].

Il existe une corrélation entre la position d’un élément chimique dans le tableau périodique et

sa configuration des électrons de valence (électrons de la couche la plus externe) [5].

Par ailleurs, quatre remarques permettent de comprendre 1'évolution des propriétés des

éléments en fonction de leur position dans le tableau :

1 - Les éléments possédant une couche de valence 0 sont particulièrement stables (gaz rares

ou gaz nobles). Une conséquence est que les éléments auront tendance à réaliser cette

configuration de couche de valence soit en captant, soit en perdant des électrons ; ils forment

alors des ions.

2 - Moins des éléments possèdent d'électrons sur leur couche de valence, plus ils ont tendance

à perdre des électrons pour réaliser la configuration de la couche de valence du gaz rare les

précédant dans la classification : ils ont donc tendance à donner des ions positifs (cations).

Ces éléments sont appelés« métaux ».

3 - Plus des éléments possèdent d'électrons sur leur couche de valence, plus ils ont tendance a

gagner des électrons pour réaliser la configuration de la couche de valence du gaz rare les

suivant dans la classification: ils ont tendance à donner des ions négatifs (anions). Ces

éléments sont les « non-métaux ».

4 - Plus un élément est « gros », c'est-à-dire plus il y a d'électrons dans son nuage électronique

entre un électron de valence et le noyau, moins l’intéraction entre noyau et électrons de

valence sera forte. Autrement dit, quand, dans une même famille, on se déplace de 1'élément

le plus léger vers les éléments plus lourds, le caractère métallique devient plus prononcé et

celui de non-metal l’est de moins en moins [11].

II.3.2. La loi périodique

La loi périodique indique qu’après certains intervalles réguliers, les éléments

chimiques montrent une répétition approximative dans leurs propriétés. Par exemple, le fluor,

le chlore, et le brome, qui appartiennent au groupe VII (des halogènes), partage la propriété de

former des sels cristallins blancs de formule générale NaX avec le sodium. Cette répétition

périodique de propriétés est le fait essentiel qui sous-tend tous les aspects du système

périodique. Cette présentation de la loi périodique soulève des questions philosophiques

intéressantes. Tout d'abord, la périodicité entre les éléments n’est ni constante ni exacte. La

première ligne comporte deux éléments, la deuxième et la troisième chacune contient huit, la

quatrième et la cinquième contient 18, et ainsi de suite. Parmi les éléments, cependant, non

seulement la longueur de période varie, mais également la périodicité n’est pas exacte. Les

éléments dans chaque colonne de la classification périodique ne sont pas en exacte

récurrences les uns des autres. Le système périodique est la notion la plus abstraite soutenant

qu'il existe une relation fondamentale entre les éléments [1].

II.3.3. La compréhension du système périodique

Les deux théories importantes de la physique moderne sont la théorie de la relativité

d'Einstein et la mécanique quantique. La théorie quantique est en fait née dans l'année 1900,

Environ 14 années avant la découverte du numéro atomique. Elle a été appliquée à des atomes

par Niels Bohr, qui a poursuivi la notion que les similitudes entre les éléments dans n’importe

quel groupe du tableau périodique pourrait s’expliquer qu'ils ont un nombre égal d’électrons

périphériques. L'explication la plus récente du système périodique est donnée en termes du

nombre d’orbitales peuplées par les électrons, cette explication dépend de la configuration

électronique de l'atome [1].

II.4. Analyse du tableau périodique:

II.4.1. Les anomalies du tableau périodique

L’Analyse par période du tableau périodique révèle quelques anomalies et

contradictions. Les anomalies du tableau périodique sont les éléments qui ne respectent pas la

règle de Klechkowski, dans le remplissage des orbitales par énergie croissante. Beaucoup

d'anomalies dans les groupes peuvent être expliquées par la taille, ou au privilège des

orbitales (d ou f) à moitié ou totalement remplies. Parmi ces éléments qui présentent des

configurations électroniques faisant exception à la norme:

La première période : H, He

Le nombre quantique principal n = 1 n’autorise que la sous-couche 1s, de nombre

quantique secondaire l=0. L’hydrogène 1H, de configuration électronique 1s1, et l’helium 2He,

de configuration électronique 1s2.

L’hydrogène se place dans la case de gauche, au-dessus de la famille des alcalins, bien que

ses propriétés diffèrent largement de celles des alcalins. L’hydrogène est particulier il n’est

confome à aucun groupe, dans certains tableaux il est placé au dessus du groupe 1, dans

d’autres dans le groupe 17, et d’autres encore le placent dans ces deux groupes. Dans certains

tableaux il n’est placé dans aucun groupe, on le place tout seul au sommet du tableau

périodique [6].

L’Hélium se trouve dans le bloc p avec les gazs « rares » (colonne 18), alors qu’il est

de type s, et qui devait être dans la seconde colonne comme l’inciterait un classement continu

par valeurs croissantes de Z.

La quatrième période :

Dans cette période deux éléments font exception à la règle de Klechkowski lors de

l’occupation du sous-niveau 3d : le chrome et le cuivre qui présentent respectivement les

configurations de valence 3d5 4s1 et 3d10 4s1 au lieu des configurations 3d4 4s2 et 3d9 4s2

attendues. Elles s’expliquent par le fait que les sous-couches saturées ou à demi remplies

procurent une stabilisation particulière aux configurations correspondantes.

La cinquième période :

Les exceptions à la règle de Klechkowski sont ici plus fréquentes qu’au cours de la

Quatrième période, puisqu’au nombre de six, car les énergies des orbitales 5s et 4d sont très

proches.

La sixième période :

Le lutécium et le lawrencium sont placés dans le bloc f, alors que leur couche f est

déjà saturée, ils contiennent 1 électron 5d ou 6d. Ils constituent bien le début des éléments de

transition.

II.4.2. Propriétés physiques et chimiques des éléments

II.4.2.1. L'électronégativité

II a été possible de chiffrer le comportement de l'élément, par rapport a 1'électron

grâce au concept d'électronégativité qui mesure la tendance d'un atome, à 1'état fondamental,

à retenir ses électrons de valence et à attirer des électrons supplémentaires [11].

L'électronégativité est une grandeur relative qui traduit l’aptitude d’un atome B à attirer vers

lui le doublet électronique qui l’associe à un autre atome A [7].

L. Pauling a introduit le concept d’électronégativité, qui est un concept fondamental pour la

chimie, dès 1932, il 1'a defini comme le pouvoir d’un atome, de capter un électron lorsqu'il

est impliqué dans une liaison chimique, au sein d'une molécule. Neanmoins, son expression

en fonction de grandeurs mesurables n'est pas évidente et un certain nombre de relations ont

éte proposées [12]. L'électronégativité croît lorsqu’on se déplace de la gauche vers la droite et

du bas vers le haut de la classification périodique.

Le fluor est l’élément le plus électronégatif et le césium le moins électronégatif. Bien qu’elle

ne soit déterminée qu’empiriquement, l’électronégativité constitue une notion fondamentale

en chimie, en particulier pour l’étude de la réactivité des composés [7]. L’électronégativité

gouverne une grande partie de la chimie des éléments [1].

L'effet de la diagonale peut être expliqué comme le résultat de plusieurs tendances

opposées. Quand on descend chaque groupe, l’électronégativité diminue. Mais, quand on se

déplace à travers le tableau, la même propriété augmente. Si l'on se déplace en diagonale les

deux tendances s’annulent mutuellement, et il ya peu de changement en électronégativité. De

même, les tendances de l'énergie d’ionisation et du rayon atomique changent légèrement selon

la diagonale [1].

II.4.2.2. Le rayon atomique

On peut tout d'abord considérer un atome libre et définir un rayon atomique comme

étant la distance au centre du noyau du maximum de la densité radiale de 1'orbitale occupée la

plus externe. Ces maxima ont été calculés par différents auteurs, selon la méthode de Hartree-

Fock-Slater. On trouve ainsi 110 pm pour le potassium dont 1'orbitale la plus externe est

1'orbitale 4s (rayon orbitalaire). Mais, les orbitales monoatomiques des atomes libres n'ont

aucune raison de se retrouver dans les descriptions de la molecule, et encore moins sous

forme liée dans un solide ; 1'atome peut perdre ou gagner partiellement des électrons et se

déformer sous 1'action d'un champ électrique, en particulier celui des entités chargées qui

1'entourent [11].

II.4.2.3. L’énergie (ou potentiel) d'ionisation

Les énergies d'ionisation des éléments chimiques dépendent de leur configuration

électronique à l’état fondamental. Autrement dit, les énergies de liaison des éléments ont un

caractère périodique.

Par définition, l’énergie d'ionisation, I, d'un atome neutre ou d’un ion est 1'énergie minimale

qu’il faut fournir à l’atome ou à l’ion, se trouvant à l’état gazeux dans son état fondamental,

pour leur arracher un électron, et former un ion positif [5].

C'est 1'énergie correspondant à la réaction :

A (gaz) → A+ (gaz) +e

Ce qu’on appèle 1'énergie ou le potentiel de première ionisation (I1) De même, I2, potentiel de

deuxième ionisation, est 1'énergie nécessaire pour expulser un deuxième électron, et ainsi de

suite [12].

- L’énergie de première ionisation est toujours positive, elle est d’autant plus grande que

l’électron arraché est plus fortement lié au noyau [7].

- Les énergies d'ionisation d’un atome gazeux augmentent dans l’ordre : I1 < I2 < I3< ...< In [5].

Remarque : Un atome gazeux est libre de toute intéraction.

II.4.2.4. L’affinité électronique

L’ affinité électronique A est égale à 1'énergie nécessaire pour arracher un électron à l’anion

gazeux.

C'est 1'énergie correspondant à la réaction :

A → A + e

Cette réaction peut être exothermique ou endothermique. Par convention, A est positive si la

reaction est exothermique.

II.5. Conclusion

À mesure qu'augmentait le nombre d'éléments connus, les chimistes du XIXe siècle

éprouvaient le besoin de les ordonner. On connaissait les masses atomiques et on avait déjà

l'habitude de classer les éléments d'après l'augmentation de cette caractéristique. La simple

progression des masses atomiques ne pouvait toutefois expliquer logiquement les différents

comportements des éléments [4].

Il est en effet une sorte de miracle que la mécanique quantique explique le tableau

périodique. Mais nous ne devrions pas se laisser séduire en croyant que c’est une explication

déductive. Une chose qui est claire: est que la tentative d'expliquer les détails de la

classification périodique continue à défier l'ingéniosité des physiciens quantiques et chimistes

quantiques et que le tableau périodique continuera de présenter un test concernant la

pertinence des nouvelles méthodes développées en chimie quantique. La réduction de la

chimie à la mécanique quantique n'a ni complètement échoué, comme certains philosophes de

la science ont revendiqué, et elle n'a pas été une réussite complète, comme certains historiens

contemporains ont revendiqué [1].

II.6. Références

[1] Eric R. Scerri, « The periodic table : its story and its significance », Published by Oxford

University Press, Inc, (2007).

[2] Bernadette Bensaude-Vincent, Jonathan Simon, « Chemistry the impure science »,

Imperial College Press, (2008), ISBN-13 978-1-84816-225-9.

[3] Union des professeurs de physique et de chimie, http://www.udppc.asso.fr/.

[5] Melania Kiel, Chimie générale, ed. ESTEM, (2003). ISBN : 2 84371 219 X.

[6] Peter Atkins, Loretta Jones, « Chemistry. Molecules, Matter and Change », 3rd. ed., W.

H. Freeman and Company, New York, New York and Basingstoke (1997).

ISBN 2-7445-0028-3.

[7] André Durupthy, Jacques Estienne, Magali Giacino, Alain Jaubert, Claude Mesnil,

« Physique, Chimie et sciences de l’ingénieur » (PCSI), I.S.B.N. 978-2-0118-1752-5.

www.hachette-education.com

[8] Miseur Ludovic, « La Chimie.net », <http://www.lachimie.net>, (Novembre 2014).

[9] Andrew Ede, « The chemical element : a historical perspective », Greenwood Publishing

Group, Inc (2006). http://www.sciences-en-ligne.com. [10] http://www.web-sciences.com.

[11] Jacques Le Coarer, « Chimie le minimum à savoir », EDP Sciences, (2003).

[12] J. –F. Marucco, “Chimie des solides”, EDP Sciences, (2004), ISBN: 2-86883-673-9.

CHAPITRE III

Le data mining et ses techniques d'analyse de données

Chapitre III. Le data mining et ses techniques d’analyse de données

III. 1. Introduction

Le data mining, dans sa forme et compréhension actuelle, à la fois comme champ

scientifique et industriel, est apparu au début des années 90. On peut voir le data mining

comme une nécessité imposée par le besoin des entreprises de valoriser les données qu’elles

accumulent dans leurs bases. En effet, le développement des capacités de stockage et les

vitesses de transmission des réseaux ont conduit les utilisateurs à accumuler de plus en plus

de données. Certains experts estiment que le volume des données double tous les ans. Que

doit-on faire avec des données coûteuses à collecter et à conserver? [1].

L'exploration de données est le processus de découvrir les modèles pertinents,

intéressants et novatrices, ainsi que des modèles descriptifs, compréhensibles, et prédictifs de

données à grande échelle [2].

III.2. Différentes définitions du Data Mining

Première définition

Le Data Mining est un processus non-trivial d’identification de structures inconnues, valides

et potentiellement exploitables dans les bases de données (Fayyad, 1996) [3].

Deuxième définition

Le Data Mining est une partie (ou une étape) du processus d’extraction de connaissances à

partir de données (ECD) en Français, ou (KDD) (Knowledge discovery in Databases) en

anglais.

Troisième définition

Le data mining est un processus qui fait intervenir des méthodes et des outils issus de

différents domaines de l’informatique, de la statistique ou de l’intelligence artificielle en vue

de découvrir des connaissances utiles [2].

III.3. Historique

L’expression « data mining » est apparue vers le début des années 1960 et avait, à

cette époque, un sens péjoratif. En effet, les ordinateurs étaient de plus en plus utilisés pour

toutes sortes de calculs qu’il n’était pas envisageable d’effectuer manuellement jusque là.

Certains chercheurs ont commencé à traiter sans a priori statistiquement les tableaux de

données relatifs à des enquêtes ou des expériences dont ils disposaient. Comme ils

constataient que les résultats obtenus, loin d’être aberrants, étaient encourageants, ils furent

incités à systématiser cette approche opportuniste.

Cette attitude opportuniste face aux données coïncida en France avec la diffusion

dans le grand public de l’analyse de données dont les promoteurs, comme Jean-Paul

Benzecri, ont également dû subir dans les premiers temps les critiques venant des membres

de la communauté des statisticiens.

Le succès de cette démarche empirique ne s’est malgré tout pas démenti. L’analyse

des données s’est développée et son intérêt grandissait en même temps que la taille des bases

de données. Vers la fin des années 1980, des chercheurs en base de données, tel que Rakesh

Agrawal, ont commencé à travailler sur l’exploitation du contenu des bases de données

volumineuses, convaincus de pouvoir valoriser ces masses de données dormantes. Ils

utilisèrent l’expression « database mining » mais, celle-ci étant déjà déposée par une

entreprise (Database mining workstation), ce fut « data mining » qui s’imposa. En mars

1989, Shapiro Piatetski proposa le terme « knowledge discovery » à l’occasion d’un atelier

sur la découverte des connaissances dans les bases de données.

La communauté de « data mining » a initié sa première conférence en 1995 à la suite

de nombreux workshops sur le KDD entre 1989 et 1994. En 1998, s’est créé, sous les

auspices de l’ACM, un chapitre spécial baptisé ACM-SIGKDD, qui réunit la communauté

internationale du KDD. La première revue du domaine « Data mining and knowledge

discovery journal » publiée par « Kluwers » a été lancée en 1997 [2].

III.4. La démarche du Data Mining

Le Data Mining est une démarche plus qu’une théorie, et qui comprend les étapes suivantes :

1- Formalisation des objectifs

2- Acquisition des données

3- Préparation des données

4- Apprentissage – application des méthodes

5- Interprétation – explication

6- Evaluation et validation

7- Déploiement [4].

III.4.1. Valorisation des données

Au-delà de l’origine de la paternité de l’expression « data mining », nous allons

maintenant nous intéresser à l’émergence de ce champ à la fois technologique et scientifique.

L’exploitation des données pour en extraire des connaissances est une préoccupation

constante de l’être humain car elle est une condition essentielle de son évolution. L’homme a

toujours mémorisé sur des supports différents des informations qui lui ont permis d’inférer

des lois. La biologie, la physique, la chimie ou la sociologie, pour ne citer que ces

disciplines, font largement usage de l’approche empirique pour découvrir des lois et ou faire

ressortir des éléments structurants dans des populations. La statistique est devenue une

science dont l’objet est de donner un cadre rigoureux à la démarche empirique. C’est au sein

de la statistique et du domaine des bases de données que le data mining a puisé ses outils.

Les historiens des sciences, s’ils ne l’ont pas déjà fait, vont certainement nous proposer de

nombreuses théories pour mieux situer le data mining dans le domaine des sciences [2].

III.4.2. Définition d’un modèle

Construire des modèles a toujours été une activité des statisticiens. Un modèle est un

résumé global des relations entre les variables, permettant de comprendre des phénomènes,

et d’émettre des prévisions.

Le Data Mining ne traite pas d’estimation et de tests les modèles préspécifiés, mais elle

découvre des modèles à l’aide d’un processus de recherche algorithmique d’exploration de

modèles. En Data Mining les modèles ne sont pas issus d’une théorie mais de l’exploration

des données. [5]

Figure III.1 : Technologies et modèle général du data mining [2].

III.4.3. Les modèles prédictifs

Ils ont pour but de déterminer une fonction (ou un modèle) qui associe des entrées et

des sorties. Les régressions, les arbres de décision, sont les méthodes les plus utilisées. Ces

méthodes sont des méthodes supervisées en ce sens qu’il faut préciser quelles sont les

entrées et quelle est la sortie à prédire.

En fonction de la nature de la variable de sortie, deux sous catégories d’outils coexistent :

- Si la variable de sortie est de type discret, la classification aura pour rôle de construire

le modèle qui permettra de classifier correctement les enregistrements, c'est-à-dire d’assigner

des catégories prédéfinies aux données.

− Si la variable de sortie est de type continu, l’estimation consistera à compléter une

valeur manquante dans un champ particulier en fonction des autres champs de

l’enregistrement. Les outils statistiques usuels de régression sont les plus employés.

III.4.4. La segmentation

Est un apprentissage non supervisé (on ne définit pas ce qui est "entrées" et ce qui est

"sorties") qui vise à identifier des ensembles d’éléments qui partagent certaines similarités.

Les algorithmes de segmentation maximisent l’homogénéité à l’intérieur de chaque

ensemble et maximisent l’hétérogénéité entre les ensembles. Différentes méthodes sont

utilisées pour définir ces groupes.

III.4.5. La description (ou identification de modèles fréquents)

Elle consiste à expliquer les relations existantes dans les données.

- Les méthodes cherchent à identifier les associations entre des variables.

- L’analyse des liens et les techniques de visualisations sont couramment utilisées dans ce

- Les techniques de visualisation sont utilisées pour simplifier la compréhension des données

à l’aide de représentations graphiques adaptées.

- Les règles d’associations représentent des combinaisons de variables avec des niveaux

prédéfinis de régularité [6].

III.4.6. Les deux types de techniques du Data Mining

III.4.6.1. Les techniques descriptives

- Visent à mettre en évidence des informations présentes mais cachées par le volume des

données.

- Réduisent, résument, synthétisent les données.

- Il n’y a pas de variable « cible » à prédire.

III.4.6.2. Les techniques prédictives

- Visent à extrapoler de nouvelles informations à partir des informations présentes (c’est le

cas du scoring).

- Expliquent les données.

- Il y a une variable « cible » à prédire [7].

III.4.6.3 Comparaison entre le data Mining et la statistique

Cependant on s’aperçoit bien vite que les principales applications du Data Mining

concernent plus la recherche de modèles que de structures comme les définit D.J.Hand « Un

modèle est une représentation simplifiée des relations existantes entre les variables dans un

but de synthèse et de prévision » [8 ,9]

Modéliser a toujours été une activité essentielle des statisticiens, et on peut se demander

en effet ce qu’il y’a de nouveau avec le Data Mining.

- La réponse est qu’en Data Mining le modèle provient des données et n’est pas choisi a

priori.

- Dans la pratique statistique habituelle, le modèle découle d’une théorie (économique,

physique, biologique….) et le but est d’estimer et de tester les paramètres du modèle.

- En Data Mining le modèle final vient après une exploration combinatoire d’un grand

nombre de modèles [10].

III.4.6.4 Que peut-on trouver et prouver réellement avec le Data Mining ?

Il faut donc se garder de certaines illusions : découvrir des structures « inattendues » est

également une idée trompeuse.

On a d’autant plus de chances de trouver quelque chose d’intéressant que l’on connaît

mieux ses données. [10]

III.4.6.5 Conclusions

- Le Data Mining est une discipline née en dehors de la statistique, dans le but de valoriser

les bases de données.

- Le Data Mining offre des perspectives nouvelles pour la statistique et répond au défi du

traitement des gigabases de données [5].

III.5. L’Analyse en Composantes Principales

III.5.1. Introduction

L'Analyse en Composantes Principales (Principal Component Analysis) est une

méthode statistique de projection de données multidimensionnelles, utilisée pour la réduction

de la dimension de données, elle fait partie du groupe des méthodes descriptives appelées

méthodes factorielles. La méthode est basée sur l'hypothèse qu'il existe de fortes corrélations

entre les données étudiées. Le but de l’ACP est de condenser les données originelles en de

nouveaux groupements, appelées nouvelles composantes, de façon à ce qu'elles ne présentent

plus de corrélation entre elles et soient ordonnées en terme de pourcentage de variance

apportée par chaque composante [11, 12, 13].

III.5.2. Historique

C’est H.Hotelling (1930) qui avait posé les fondements de l’analyse en composantes

principales [11], en développant les travaux de C.Spearman [14], et de K.Pearson [12] qui

dataient du début du siècle. Jusqu’aux années 60, en particulier par Jean-Paul Benzécri qui a

beaucoup exploité les aspects géométriques et les représentations graphiques. [15] ces

méthodes étaient perfectionnées et s’enrichissaient de variantes mais toutes restaient

inabordables pour les praticiens car elles nécessitaient une masse considérable de calculs.

Aujourd’hui, grâce à l’outil informatique, ces méthodes sont de plus en plus utilisées.

III.5.3. L’analyse de données

Aujourd’hui, l’analyse de données est couramment utilisée dans un bon nombre

d’activités et de disciplines de base comme : la physique, la chimie,…etc. [11,14], et qui

utilisent des « faits numériques » qu’on appelle données.

Avant toute analyse statistique, il est indispensable de consacrer du temps à examiner

les données et d’en faire un tableau facilement exploitable.

La statistique classique s’est axée sur l’étude d’un nombre restreint de paramètres

mesurés sur un petit ensemble d’individus .Elle a développé les notions d’estimations et de

tests fondés sur des hypothèses probabilistes très restrictives. Les méthodes d’analyse de

données permettent une étude globale des individus et des variables en utilisant

généralement des représentations graphiques suggestives. Les données peuvent être

analysées selon plusieurs points de vue. La recherche des ressemblances ou des différences

entre individus peut être un objet de l’analyse. En utilisant des méthodes factorielles comme

l’Analyse en Composantes Principales, il est possible de représenter les proximités entre

individus sur un même graphique [16].

III.5.4. La nature des données [17]

III.5.4.1. Définition des variables

Les variables correspondent aux intitulés des colonnes du tableau de données, elles sont

également appelées paramètres ou caractères ; elles forment un espace dans lequel chaque

individu est représenté par un point. Les coordonnées des points sont égales aux valeurs

respectives des variables.

III.5.4.2. Définition des individus

L’individu est l’entité de base sur laquelle l’observateur réalise un certain nombre de

mesures. Il est parfois appelé critère. Chaque individu est défini à partir de plusieurs

variables quantitatives et/ou qualitatives.

- Une variable est quantitative lorsqu’elle prend ses valeurs sur une échelle numérique, plus

précisément lorsque l’ensemble des valeurs qu’elle prend sur les individus est inclus dans

l’ensemble des nombres réels et que l’on peut effectuer sur cette variable des opérations

algébriques habituelles : additions, multiplications …etc.

- Une variable est qualitative lorsqu’elle prend des modalités non numériques : appréciations,

couleurs, descriptions, … etc.

III.5.4.3. Le centrage et la réduction des données brutes

Dans ce paragraphe, nous présentons un exemple de codage très fréquemment utilisé

dans le cadre de l’analyse de données : le codage des données brutes en données centrées et

centrées réduites.

- Pour obtenir des données centrées, il faut remplacer xij par (xij- xj) où xj représente la

moyenne arithmétique des valeurs prises par la variable xj.

- Pour obtenir des données centrées réduites notées X ij , on divise par l’écart type des valeurs

prises par la variable xj.

Ce qui donne : X ij = xij - xj σ (xj)

III. 5.4.3.1. Les paramètres de dispersion

Les paramètres de dispersion sont des nombres qui mesurent la dispersion (ou la

répartition) des individus autour d’un paramètre de position (par exemple la moyenne

arithmétique). Ils s’expriment dans la même unité que les données et permettent de comparer

des séries de même nature [18,19].

III. 5.4.3.2. Caractéristique de la tendance centrale

Pour chacune des valeurs Xij, on définit la moyenne arithmétique des valeurs observées ou

mesurées à partir de la formule :

n Xj = 1 ∑ xij n i = 1

III. 5.4.3.3. Caractéristique de la dispersion

La notion de dispersion complète les informations sur la tendance centrale. Il arrive que l’on

traduise la dispersion des données à partir de l’étendue :

Étendue = Xij max - Xij min

III. 5.4.3.4. La variance

La variance est un indicateur de dispersion reflétant l’importance des fluctuations des

valeurs prise par une variable xj de la série autour de leur moyenne arithmétique. Elle s’écrit :

n Var(Xj) = 1 ∑ (xij – xj)2

n i = 1

- Pour les données centrées réduites, la variance de chaque variable est égale à 1.

III. 5.4.3.5. L’écart type

Le calcul de l’étendue ne prend en compte que deux valeurs observées ; de plus il s’agit des

valeurs extrêmes. On préfère caractériser la dispersion à partir de l’écart type expérimental

σ (xj ) :

σ (xj) = [Var (xj)]1/2

III. 5.5. Qu'est-ce qu'une base de données ?

Une base de données (son abréviation est BD, en anglais DB, database) est une entité

dans laquelle il est possible de stocker des données de façon structurée et avec le moins de

redondance possible. Ces données doivent pouvoir être utilisées par des programmes, et par

des utilisateurs différents. [20]

Ces bases de données sont généralement construites dans le but soit d’archiver les

informations relatives à un domaine particulier, soit d’apporter une réponse à un problème

précis, à l’image des réponses issues de sondages.

III. 5.6. Principe de l'Analyse en Composantes Principales (ACP)

Les données sont rangées dans un tableau comportant souvent un grand nombre

d’individus n, et un grand nombre de variables p ; la simple lecture de ce tableau ne permet

pas de saisir l’essentiel des informations qu’il contient. L’analyse en composantes

principales est une méthode de projection qui résume et décrit ce tableau de données .Si un

tableau de données comporte p variables quantitatives, on dira que les individus sont

représentés dans un « espace à p dimensions ».

Le but de l’A.C.P est de trouver des « espaces de dimensions plus petites », dans

lesquels il est possible d’observer « au mieux » les individus [21], et de mieux connaître les

données sur lesquelles on travaille, et à détecter éventuellement des valeurs suspectes, et

aidera à formuler des hypothèses qu’il faudra étudier à l’aide de modèles et d’études

statistiques inférentielles.

III. 5.7. Le processus de l'Analyse en Composantes Principales [11, 12, 13]

Le processus d'Analyse en Composantes Principales consiste dans un premier temps à

calculer la matrice de covariance R entre les p vecteurs initiaux. Le terme général de la

matrice de covariance R s'écrit sous la forme :

Rij = ∑P (r ik - rk) (r jk - rk) (1) K

rik : Le coefficient de corrélation entre le vecteur i et le vecteur k

rik : La moyenne des coefficients rik; ∀ i.

La matrice de covariance R est alors diagonalisée :

R = V UV t (2)

V : Une matrice contenant les vecteurs propres vi de R, c'est-à-dire les coordonnées des p

nouveaux axes.

Ces vecteurs propres représentent les nouvelles composantes (Figure III.3. ).

U : Une matrice diagonale contenant les valeurs propres λi de R, c'est-à-dire la variance des p

nouvelles composantes (Figure III.2. et III.3 ). Les valeurs propres sont rangées par ordre

décroissant.

Figure III.2 : Illustration en 2D de la réduction de la dimension. La première composante

contient le maximum d’information (maximum de variance). [11, 12, 13]

Figure III.3 : Représentation en 2D des 2 vecteurs propres et des 2 valeurs propres associés

aux deux nouvelles composantes. [11, 12, 13]

- Enfin, les valeurs propres λi peuvent être normalisées pour obtenir les pourcentages de concentration δi de l'information dans chaque nouvelle composante : δi = λi x 100 (3) ∑K λK

- La nature de l'information contenue dans chaque composante principale peut être connue en

calculant la matrice de corrélation variables-composantes G.

Les éléments Gij de la matrice G représentent les coefficients de corrélation entre les

composantes initiales et les nouvelles composantes et se calculent à partir de :

Gij = (λi)1/2 vj (4)

Le processus de réduction de la dimension consiste à conserver les k (k < p)

premières nouvelles composantes, qui seront alors appelées composantes principales.

Aucune règle générale n'existe quant au choix du nombre k de composantes principales. La

valeur k peut être déterminée par l'étude des valeurs propres ou par l'étude visuelle des

images :

- Kaiser (1958) suggère de conserver les k premières composantes ayant une valeur propre

supérieure à 1.

III. 5.7.1. Construction des axes principaux, démarche géométrique

Les droites et les plans issus d’une ACP ne sont pas réalisés avec les variables initiales

mais avec des « indices synthétiques » obtenus à partir de « combinaisons linéaires » des

variables initiales. Parmi tous les indices possibles, l’ACP recherche d’abord celui qui

permet de voir au mieux les individus c’est–à-dire celui pour lequel la variance des individus

est maximale : cet indice est appelé 1ère composante principale portée par le 1er axe

principal appelé axe 1 ou PC1. Une certaine proportion de la variation totale des individus

est expliquée par cette composante principale.

Ensuite une deuxième composante principale est recherchée, la variance (PC2) doit

être, à son tour, la plus grande possible. Ainsi, cette deuxième composante principale fournit

la plus grande information possible complémentaire à la première.

Le processus se déroule jusqu’à l’obtention de la pième et dernière composante

principale, les parts d’informations expliquées par chacune d’elles devenant de plus en plus

faibles (avec p variables, on obtient p composantes principales).

- L’intersection de tous les axes principaux se situe au centre de gravité du nuage de points

Figure III.4 : Projection des individus dans le plan principal. [22]

III. 5.7.2. Calcul matriciel

Pour obtenir les composantes principales de façon analytique, on procéde en deux étapes :

1- Elaboration de la matrice des corrélations.

2- Faire une diagonalisation, qui permet d’obtenir une matrice de vecteurs propres, qui

contient les coefficients des combinaisons linéaires des p variables actives et la matrice

« diagonale » de valeurs propres [23].

Les valeurs propres qui représentent les variances des individus sur les axes principaux

correspondants.

Les vecteurs propres permettent le calcul des composantes principales et donc le calcul

des coordonnées des variables et des individus sur les nouveaux axes principaux [24].

III. 5.8. Conclusion

L'ACP est une technique mathématique qui réduit la dimensionnalité d'un système

complexe de corrélations à un nombre réduit de dimensions, néanmoins représentatives de la

majorité de la variance totale des données. On passe d'un certain nombre de variables

potentiellement corrélées à un plus petit nombre de variables décorrélées, les "Composantes

Principales".

Ensuite, un changement de base est effectué à la nouvelle base des "Composantes

Principales" afin de représenter les données dans le nouvel espace. L'utilisateur choisit le

nombre d'axes utilisés pour la représentation, en se basant par exemple sur le pourcentage de

variance représenté.

III.6. La méthode des moindres carrés partiels (PLS)

III.6.1. Introduction-Problématique

De nombreux problèmes peuvent être décrits sous la forme d'un modèle de régression, où

l'on possède des variables X sur lesquelles on peut plus ou moins agir et des variables Y que

l'on ne peut qu'observer.

L'objectif est alors de d’écrire les relations entre Y et X, en l'absence de modèle

théorique. Le problème est que le nombre de variables X est souvent très important par

rapport au nombre d'observations. La régression PLS est une méthode d'analyse des données

spécifiquement construite pour l'étude de ce type de problème. [25]

III.6.2. Historique

La régression PLS (Partial Least Squares regression) en anglais, ou (La régression des

moindres carrés partiels) en Français, est une technique d'analyse et de prédiction

relativement récente. Elle a été conçue pour faire face aux problèmes résultants de

l'insuffisance de l'utilisation de la régression linéaire classique, qui trouve ses limites dès lors

que l'on cherche à modéliser des relations entre des variables pour lesquelles il y a peu

d'individus, ou beaucoup de variables explicatives en comparaison au nombre d'individus, ou

encore lorsque les variables explicatives sont fortement corrélées entre elles.

La régression PLS tire son origine des sciences sociales (plus précisément des sciences

économiques, Herman Wold 1966 [27], mais devient très populaire en chimie grâce au fils

d'Herman, Svante.

1966 : Herman Wold publie un ouvrage introduisant le PLS, alors appelé (Non Linear

Iterative Partial Least Squares) NIPALS.

1983 : Svante Wold (le fils d'Herman) et Harold Mertens [27] adaptent NIPALS au problème

de régression avec trop de prédicteurs et appèlent PLS cette adaptation de l'algorithme.

1990 : Stone et Brooks [28] introduisent le PLS dans le contexte du "Continuum Regression"

En France, Michel Tenenhaus s'est beaucoup intéressé à cette méthode et a réalisé de

nombreux travaux à ce sujet. Par ailleurs, Tenenhaus M. pense que la régression PLS pourrait

connaître les mêmes succès qu'en chimie si elle était utilisée dans d'autres domaines. [25]

III.6.3. Définition de la régression PLS ?

La régression PLS est une méthode statistique permettant d'identifier des relations entre

plusieurs variables. Il y a toujours, d'une part, les variables explicatives (notées généralement

x1, ..., xp), et les variables expliquées (notées généralement y1, ..., yq). Ces variables sont,

dans une régression PLS, toutes étudiées sur les mêmes « individus ».

On distingue la régression PLS univariée, ou « régression PLS1 », de la régression PLS

multivariée, appelée également « régression PLS2 ». Dans le premier cas, la régression ne

porte que sur une seule variable expliquée. Dans le second, il peut y avoir plusieurs variables

expliquées. [25]

III.6.4. Les objectifs de la régression PLS

La régression PLS répond à deux objectifs :

-La prédiction : Relier un bloc de variables à expliquer Y à un bloc de variables explicatives

- La description : Décrire simultanément les relations entre les variables composant le bloc

des X, et les variables composant le bloc des Y, et les liaisons entre X et Y. [25, 29, 30].

III.6.5. Les versions de la régression PLS

Il y’a différentes version de la régression PLS qui sont proposées en fonction de l’objectif

poursuivi:

PLS1 : Une variable cible Y quantitative est à expliquer, modéliser, prévoir par p variables

explicatives quantitatives Xj.

PLS2 : Version canonique. Mettre en relation un ensemble de q variables quantitatives Yk et

un ensemble de p variables quantitatives Xj.

PLS2 : Version régression. Chercher à expliquer, modéliser un ensemble de q variables Yk

par un ensemble de p variables explicatives quantitatives Xj.

PLS-DA : Version discriminante. Cas particulier du cas précédent. La variable Y qualitative

à q classes est remplacée par q variables indicatrices (dummy variables) de ces

classes [31].

III.7. Le principe de la régression PLS [32]

III.7.1. Données et notations

Les notations de la régression PLS sont relativement bien standardisées dans la littérature, et

sont :

N = Nombre d’individus

M = Nombre de variables indépendantes Xj

P = Nombre de variables dépendantes Yk

A = Nombre de composantes retenues

X = Matrice des données (NxM) pour les variables indépendantes

Y = Matrice des données (NxP) pour les variables dépendantes

E0 = Matrice des variables Xj centrées-réduites

F0 = Matrice des variables Yk centrées-réduites

Eh = Matrice des résidus de la décomposition de E0 en utilisant h composantes

Ehj = j-ième colonne de Eh

Fh = Matrice des résidus de la décomposition de F0 en utilisant h composantes

Fhk = k-ième colonne de Fh

III.7.2.La méthode PLS

Il s’agit d’étudier les liaisons entre les variables dépendantes Yk et les variables

indépendantes Xj en prenant en compte les relations internes entre les variables de chaque

groupe .L’algorithme de la régression PLS est itératif , il est décrit dans ce qui suit :

Etape 0 : On part des tableaux E0 et F0.

Etape 1 : On construit une combinaison linéaire u1 des colonnes F0 et une combinaison

linéaire t1 des colonnes E0, maximisant cov (u1, t1)=cor (u1, t1). [var (u1). var (u2)] 1/2

- On obtient donc deux variables u1 et t1 aussi corrélées que possible et résumant au mieux les

deux tableaux E0 et F0 .

- On construit ensuite les régressions :

E0 = t1 p’1 + E1

F0 = t1 r’1 + F1

Etape 2 : On reprend l’étape 1 en remplaçant les tableaux E0 et F0 par E1 et F1. On obtient

donc deux nouvelles composantes : u2, combinaison linéaire des colonnes de F1, t2 ,

combinaison linéaire des colonnes de E1 .

- D’où les décompositions obtenues par régression :

E0 = t1 p’1 + t2 p’2+ E2

F0 = t1 r’1 + t2 r’2 + F2

On itère la procédure jusqu’à ce que les composantes t1,..., tA expliquent suffisamment F0.

Les composantes th sont des combinaisons linéaires des colonnes d’E0, et non corrélées entre

elles.

De la décomposition F0 = t1 r’1 +……….. + th r’h + Fh, on peut donc déduire les équations

de régression PLS :

Yk = βk0 + βk1 X1 + ……. + β kM XM + FhK

III.7.3. Indépendance des composantes dans la régression PLS

L'une des propriétés primordiales d'une régression PLS est l'indépendance des

composantes t i, t2,…..., th formées à partir des variables explicatives. En effet, la première

composante t i est formée à partir des variables explicatives, en leur donnant certains

coefficients sur la base de leur covariance avec la variable expliquée « y » (ou de leur

coefficient de corrélation avec la variable y si les variables sont centrées réduites). Pour se

faire, la variable ti sera représentative d'une partie de la variance des variables explicatives.

Bien entendu, si « y » n’est pas une combinaison linéaire des variables explicatives, et

qu'il y a plus d'une variable explicative dans l'analyse (et qu'aucune de ces variables n'est

combinaison linéaire des autres), la variable t i sera insuffisante pour expliquer toute la

variance de « y », de même qu'elle sera insuffisante pour expliquer toute la variance des

variables explicatives, et toute la covariance des variables explicatives avec « y ».

Il en demeurera un résidu. La variance de « y » ne sera pas totalement expliquée par la

variance de ti . Il y a un moyen d'améliorer le pouvoir explicatif du modèle. Pour cela, on

s'intéresse aux résidus, qui ont été « oubliés » par la première composante. Cette première

composante est indépendante des résidus. Or, on se sert de ces résidus pour construire la

seconde composante t2, qui sera par la même occasion indépendante de t i. La composante t2

s'intéressera donc à la variance de « y » qui n'est pas expliquée par t i. Les résidus qui en

résulteront, qui sont donc indépendants de t2, et indépendants de t i (ils sont le résultat d'une

régression sur des résidus qui sont déjà indépendants de t i), serviront à la création de t3, (t3

sera donc indépendante de t i et t2). Il en ira de même pour toutes les composantes, qui seront

toutes indépendantes entre elles. [25]

III.8. Les avantages de la régression PLS

La régression PLS peut se caractériser comme étant une méthode robuste, fiable,

s'appliquant dans de nombreux cas, et étant plus générale que ne l'est la régression linéaire.

[33], c’est une technique très puissante pour la modélisation des relations structurelles sur

variables latentes (concepts, facteurs). [25, 29, 30].

Ses principaux avantages, peuvent se résumer ainsi :

- La régression PLS fonctionne bien sur un échantillon de taille faible, pouvant même être

inférieur au nombre de variables explicatives.

- La régression PLS permet de compenser, partiellement, une baisse de qualité de

l'échantillon.

- La régression PLS permet d'éviter certains problèmes engendrés par la multicolinéarité des

variables.

- La régression PLS, dans son approche multivariée, permet d'expliquer plusieurs variables

endogènes.

- La régression PLS, dans un algorithme plus général, permet de créer un modèle en tenant

compte des individus présentant certaines données manquantes, sans avoir recours à des

méthodes d'estimation des données manquantes. [33]

- Avec la régression PLS on a la possibilité de travailler sur des données individuelles et de

faire de la prévision. [25, 29, 30].

- La simplicité de son algorithme : ni inversion, ni diagonalisation de matrices, mais

seulement une succession de régressions simples, autrement dit des calculs de produits

scalaires. On peut donc traiter de très grands ensembles de données.

- La régression PLS donne en pratique d’excellentes prévisions, même dans le cas d’un petit

nombre d’observations et d’un grand nombre de variables. [34,35]

III.9. Conclusion

La régression PLS permet de rapprocher le statisticien du chercheur dans les problèmes

de modélisation. En général ce dernier souhaite en effet conserver dans son modèle toutes les

variables importantes tout en obtenant des équations de régression cohérentes. [32].

Bien que cette méthode ait connu la plupart de ses succès dans le domaine de la chimie,

on peut penser qu'elle pourrait facilement être transposée à d'autres domaines,

particulièrement dans ceux où le nombre d'individus actifs est faible (en comparaison au

nombre de variables explicatives) et où les variables explicatives sont significativement

corrélées entre-elles. [33]

III.10. Références

[1] Djamel Abdelkader ZIGHED, Ricco RAKOTOMALALA, « Extraction de connaissances

à partir de données (ECD) - Objet du data mining », Techniques de l’Ingénieur,

(2002).

[2] Mohammed J. Zaki andWagner Meira Jr., « Data mining and analysis, Fundamental

Concepts and Algorithms », Cambridge University Press, 1st ed., (2014).

[3] Fayyad U.M., Piatetsky-Shapiro G., Smyth P., and Uthurusamy R. (eds.) Advances in

Knowledge Discovery and Data Mining. Menlo Park, California: AAAI Press ,1996.

[4] Gilbert Saporta, Chaire de Statistique Appliquée, http://cedric.cnam.fr/~saporta/DM.

[5] Equipe de recherche en Ingénierie des Connaissances, Laboratoire ERIC,

http://chirouble.univ-lyon2.fr/~ricco/cours/ .

[6] Bruno Agard, Andrew Kusiak, “ Exploration des bases de données industrielles à l’aide

du data mining –Perspectives ”, 9ème Colloque National Aip Primeca, La Plagne - 5-8

avril 2005.

[7] Stéphane Tufféry - Data Mining – (2006) - http://data.mining.free.fr .

[8] Hand.D.J, “ Why Data Mining is more than statistics write large ”, Bulletin of

the International Statistical Institute, 52nd Session .Helsinki, Vol. 1, (1999) 433-436.

http://www.stat.fi/isi99/index.html

[9] Hand.D.J, “ Methodological issues in Data Mining ”, Compstat 2000 :

Proceedings in Computational Statistics .ed. J.G. Bethlehem and P.G.M.vau der

Heijden, Physica-Verlag, (2000) 77-85.

[10] Saporta G, “ Data Mining and Official Statistics ” .Quinta Conferenza Naionale

di Statistica, ISTAT, Roma (2000).

[11] H.Hotelling, “ Analysis of Complex Statistical Variables Into Principal Components ”,

Journal of Educational Psychology, 1933, vol. 24,417-441 ,408-520.

[12] K.Pearson, “ On Lines and Planes of Closest Fit to System of Points in Space ”,

Philos.Mag., (1901), n° 11,559-572.

[13] Kaiser H. “ The Varimax Criterion for Analytic Rotation in Factor Analysis”,

Psychometrika 23, (1958). 187-200.

[14] C.Spearman, “ General intelligence objectively determined and measured ”, American

Journal of Psychology, 1904, vol.28, 129-149.

[15] C. Duby, S. Robin, "Analyse en Composantes Principales", Département O.M.I.P

(2006).

[16] M.Volle, “ Analyse des données ”, Collection « économie et statistiques avancées »,

Ed, Economica .1993.

[17] J-M Bouroche, G.Saporta, “ L’analyse des données ”, Ed .Que sait- je ? , 2002, 3-4.

[18] P.Casin, “ Analyse des données et des panels de données ”, Ed. DeBoeck, Université

perspectives marketing, 1999.

[19] G.Chauvat, J-Preau, Statistiques descriptives, Ed Armand colin Editeur, 2002.

[20] Site internet : http://www.commentcamarche.net/ .

[21] P.Fenelon., “ Qu’est ce que l’analyse des données ? ”, Ed.Lefonen, Paris, 1981.

[22] G.Phillippeau, “ Comment interpréter les résultats d’une analyse en composantes

principales ? ”, Collection STAT-ITCF-Ed.1992.

[23] R.Rodriguez Herrerra, D.Salles.Le Gac, “ Initiation à l’analyse factorielle des

données ”, Ellipse, 2002.

[24] Site internet : http://www.lemoal.org/spss/ .

[25] Tenenhaus M., « La Régression PLS: Théorie et Pratique », Editions Technip, (2002).

[26] Wold, H. (1966), « Estimation of principal component and related models by iterative.

least squares, Multivariate Analysis », ed. P.R. Krishnaiah, Newyork : Academic Press,

391-420.

[27] Stone, M. & Brooks, R. (1990), « Continuum regression: Cross-validated sequentially

constructed prediction embracing ordinary least squares, partial least squares, and

principal components regression », Journal of the Royal Statistical Society, Series B,

52(2), 237-269.

[28] Wold, S., Martens, H. & Wold, H. (1983), « The multivariate calibration problem in

chemistry solved by the PLS method », in Proc. Conf. Matrix Pencils, Ruhe A..(Eds),

March 1982, Lecture Notes in Mathematics, Springer Verlag, Heidelberg, PP. 286-293.

[29] ECSI ‘2000: « Use of PLS Path Modelling to estimate the European Consumer

Satisfaction Index (ECSI) model », MP Bayol, C Tellier, MTenenhaus

(www.cisia.com/cisia/download/PLS_CISIA.doc).

[30] PLS' 2001 : « 2ème Symposium International sur les Méthodes PLS », Capri Palace, Île

de Capri (Naples, Italie), (2001), CISIA·CERESTA, HEC et l'Université de Naples

"Federico II".

[31] M. Tenenhaus, La régression PLS : théorie et applications, Technip, 1998.

[32] Tenenhaus, J.-P.Gauchi, C.Ménardo, « Régression PLS et applications », Revue de

statistique appliquée, tome 43, n°1,(1995) , P.7-63.

[33] Site internet : http://www.renaudloup.be/refinternet.htm .

[34] Tenenhaus M., « La Régression PLS: Théorie et Pratique », Editions Technip, (1998).

[35] Esposito Vinzi V., Lauro C., « PLS Regression and Classification, PLS and Related

Methods, Proceedings of the PLS’03 », International Symposium, 45-56,Decisia , Paris,

(2003).

CHAPITRE IV

Résultats et discussions

Chapitre IV. Résultats et discussions

Dans ce chapitre nous présentons, les résultats obtenus par l’application des techniques

de data mining telles que l’Analyse en composantes principales (ACP) et la régression (PLS),

qui sont des techniques d’analyse de données multivariées permettant d’étudier les

corrélations existantes entre les différentes variables des bases de données, Ce chapitre se

divise en quatre parties :

Dans la première partie nous avons réalisé une étude comparative des propriétés

physiques et mécaniques du Lutétium avec ceux des métaux de transition par l'approche de

datamining.

Tandis que dans la deuxième partie, on a étudié les propriétés physiques et

mécaniques de l’hydrogène, et on les a comparée avec ceux du groupe des métaux alcalins,

avec les éléments du groupe de carbone, et avec ceux du groupe des halogènes, en utilisant

l’approche data mining.

Enfin dans la troisième partie on a étudié les propriétés structurales et mécaniques des

hydrures alcalins en appliquant les calculs de premier principe et qu’on a analysé par

l'approche de datamining.

Première partie

IV.1. Une étude comparative des propriétés physiques et mécaniques du

lutétium avec celles des métaux de transition par l'approche du

datamining

IV.1.1. Introduction

La position du lutétium dans le tableau périodique a suscité beaucoup de critiques de

la part des chercheurs et a été considérée une de ses anomalies. Le but principal de ce travail

est de démontrer que le lutécium Lu (Z = 71) a des propriétés communes avec la troisième

rangée du bloc d des métaux de transition. Il y’a beaucoup de chercheurs qui ont examiné la

position de lutétium dans le tableau périodique, par différents moyens. En 1967, H. Merz et

K. Ulmer avaient effectué une étude spectroscopique de rayonnement X montrant

distinctement, que Lu, doit se placer à gauche de Hf (en dessous de l’yttrium), Les propriétés

de Lu sont plus similaires à ceux de Hf que La, le Lutétium (Lu) peut donc être considéré

comme un métal de transition et pas La [13]. Jensen (1982) a attribué Lu au groupe III, en

dessous de Y [16]. Scerri (2009) a estimé que le lutétium, doit être placé dans la même

colonne du tableau périodique que le scandium, l'yttrium et le lawrencium [17].

Dans cette étude on a essayé d’aborder ce problème, en investiguant les propriétés physiques

et mécaniques du lutétium, et les comparer avec ceux de la troisième période des métaux de

transition. Pour réaliser ce travail on a constitué une base de données de 14 éléments y

compris le lutétium (Cs, Ba, Hf, Ta, W, Re, Os, Ir, Pt, Au, Tl, Pb, Bi, Lu ) et incluant les

variables (propriétés) suivantes : la polarizabilité (α), l’électronégativité (χ), la masse

atomique (m), le numéro atomique (Z), le rayon atomique (r), le volume atomique (V),

l’affinité électronique (EA), l’énergie d’ionization (I), l’énergie totale (Etot), l’énergie de

cohesion (Ecoh), le module de compressibilité (B), le module de cisaillement (G), le module

de Young (E), le coefficient de Poisson (µ), le rapport (B/G), les constantes élastiques (C11,

C12, C44), la pression de Cauchy (C12-C44) (Tableau IV.1.)

IV.1.2. Base de données

Propriété Cs Ba Lu Hf Ta W Re Os Ir Pt Au Tl Pb Bi

59.42i 39,7i 21,9i 16,2i 13,1i 11,1i 9,7i 8,5i 7,6i 6,5i 5,8i 7,6i 6,8i 7,4i

χ 0,86h 0,97h 1,14h 1,23h 1,33h 1,40h 1,46h 1,52h 1,44h 1,44h 1,42h 1,44h 1,55h 1,67h

m 132,91a 137,33a 174,97a 178,49a 180,95a 183,84a 186,21a 190,23a 192,22a 195,08a 196,97a 204,38a 207,2a 208,98a

Z 55 56 71 72 73 74 75 76 77 78 79 81 82 83

r 2,60c 2,15c 1,734j 1,55c 1,45c 1,35c 1,35c 1,30c 1,35c 1,35c 1,35c 1,90c 1,80c 1,60c

V 115,89f 62,47f 29,53g 22,41f 18,31f 16,23f 14,99f 14,36f 14,62f 15,83f 18,19f 31,25f 31,93f 35,38g

EA 0,47i 0,15h 0,34i 0,1b 0,32h 0,82h 0,15h 1,1h 1,57h 2,13h 2,31i 0,2h 0,36h 0,95h

I 3,89a 5,21a 5,43a 6,83a 7,55a 7,86a 7,83a 8,44a 8,97a 8,96a 9,23a 6,11a 7,42a 7,29a

Etot [1] -7550,56 -7880,11 -13848,23 -14317,49 -14795,88 -15283,45 -15780,24 -16286,30 -16801,68 -17326,58 -17860,79 -18956,96 -19518,99 -20090,41

Ecoh 0,80d 1,90d 4,43d 6,44d 8,10d 8,90d 8,03d 8,17d 6,94d 5,84d 3,81d 1,88d 2,03d 2,18d

2,03e 10,3e 47,6i 108,9e 200,1e 323,2e 371,7e 417,8e 355e 278,3e 173,2e 35,9e 42,9e 31,5e

G 0,65h 4,84h 27,1h 53,0h 64,7h 152h 180h 223h 209h 60,9h 26h 2,67h 5,54h 12,8h

E 1,69h 12,8h 68,4h 138h 185h 407h 520h 559h 528h 170h 78h 7,89h 15,8h 34h

µ 0,30h

B/G 3,12 2,13 1,76 2,05 3,09 2,13 2,07 1,87 1,70 4,57 6,66 13,45 7,74 2,46

C11 1,60h 12,6h 86,2h 181h 264h 523h 616h 729,6f 580h 347h 191h 41,9h 48,8h 63,4h

C12 0,99h 8,0h 32,0h 77h 158h 203h 273h 230,0f 242h 251h 162h 36,6h 41,4h 24,5h

C44 1,44h 9,5h 26,8h 55,7h 82,6h 160h 161h 251,5f 256h 76,5h 42,2h 7,20h 14,8h 11,5h

C12-C44

-0,45 -1,5 5,2 21,3 75,4 43 112 -21,5 -14 174,5 119,8 29,4 26,6 13

[1] Ref [1], a Ref [2], b Ref [3], cRef [4], d Ref [5], e Ref [6], f Ref [7], g Ref [8], h Ref [9], i Ref [10], j Ref [11]. Tableau IV.1.1. La base de données incluant les propriétés physiques et mécaniques des métaux de transition de la troisième

IV.1.3. Techniques de calculs

Dans ce travail, nous utilisons l’approche data mining afin d'explorer les corrélations

existantes entre les données. Ce qui exige de puissants outils d'analyse statistique tels que

l’ACP et la PLS. L’ACP est probablement la technique statistique multivariée la plus

populaire utilisée dans de nombreux domaines scientifiques, comme elle peut être utilisée

pour la classification des données, l'étude de similitudes, etc. [18-19]. L’ACP est une

approche statistique puissante pour l'analyse des propriétés des matériaux; elle a été

largement utilisée pour étudier de nombreux problèmes en physique et en science des

matériaux [20]. Il ya une relation étroite entre la PLS et l'ACP, car elles ont des informations

intéressantes en commun [21].

IV.1.4. L’analyse en composantes principales (ACP)

Parmi les résultats obtenus par l’analyse en composantes principales (ACP):

La matrice de corrélation, le graphe des observations, et le graphe des variables.

Ce travail a été réalisé en exécutant l’ACP en utilisant les données numériques structurées en

14 observations par rapport à 19 variables (α, χ, m, Z, r, V, EA, I, Etot, ECoh, B, G, E, µ, B/G,

C11, C12, C44, C12-C44). Pour une visualisation de la discrimination de données, l’ACP

représente les variables (dix-neuf propriétés) et les observations (n = 14) à l'aide du graphe

des observations et du graphe des variables dans les espaces de dimensions déterminées par

des PCs (composantes principales) ayant des valeurs propres > 1,0, selon la règle de Kaiser.

Le graphe des variables représente les variables les plus importantes, et le graphe des

observations montre les similitudes et les différences entre les échantillons ( les éléments

dans notre cas) [22]. L’ACP génère un ensemble de nouveaux axes orthogonaux ou

variables, appelé les composantes principales (PCs), à partir des variables d'origine. Les axes

générés sont orthogonaux et non corrélés entre eux. La premiére composante (PC1) explique

l'écart maximal (variance) dans l’ensemble de données ainsi que sa direction, et ainsi de

suite. Les PCs sont définis par des vecteurs qui sont les vecteurs propres de la matrice de

variance-covariance. L'écart (la variance) le long du vecteur est défini comme étant la valeur

propre. Les observations (ou les variables) correspondantes aux PCs sont obtenues à partir de

la matrice de corrélation. Chaque variable révèle la contribution de la variable d'origine par

rapport aux composantes principales. La réduction de la variance est atteinte lorsqu’on

néglige les directions selon lesquelles la variance des échantillons est insignifiante [22].

L'idée principale de la technique ACP est de réduire la dimension d'un ensemble de données

qui contient un grand nombre de variables interdépendantes, en conservant autant que

possible la variation trouvée dans l'ensemble de données. Cela rend la visualisation, ainsi que

la prévision et la classification plus facile [23-24]. L’ACP résume les informations fournies

par les différentes variables dans un simple graphique avec une perte minimale d'information

pour évaluer les relations entre les variables et les échantillons (les éléments, dans notre cas)

[25], elle identifie les motifs dans un ensemble de données et comprime les données en

réduisant le nombre de dimensions en fonction de leurs similarités et de leur différences [21].

Quand une signification physique des composantes principales est trouvée, la technique ACP

peut découvrir la structure cachée des données et révéler les similitudes entre les variables et

les éléments [19].

La matrice des corrélations nous aident à déterminer les variables qui sont corrélées entre

elles, et le degré de leur corrélation.

En analysant la matrice des corrélations ci-dessus, on déduit l’existence de forte corrélation

entre les propriétés physiques (α, χ, m, Z, et r) (> 0,86) et entre les propriétés mécaniques (B,

G, et E) (> 0,94).

Variables α χ m Z r V EA I Etot Ecoh B G E µ B/G C11 C12 C44 C12-C44

α 1 -0,92 -0,94 -0,94 0,86 0,93 -0,38 -0,84 0,92 -0,46 -0,49 -0,37 -0,37 -0,32 -0,25 -0,44 -0,54 -0,38 -0,37

χ -0,92 1 0,95 0,94 -0,73 -0,74 0,36 0,77 -0,95 0,31 0,43 0,35 0,35 0,31 0,24 0,41 0,45 0,36 0,25

m -0,94 0,95 1 1,00 -0,68 -0,75 0,35 0,71 -1,00 0,21 0,29 0,18 0,18 0,48 0,41 0,25 0,34 0,20 0,29

Z -0,94 0,94 1,00 1 -0,69 -0,76 0,36 0,71 -1,00 0,23 0,30 0,19 0,20 0,46 0,40 0,26 0,35 0,21 0,30

r 0,86 -0,73 -0,68 -0,69 1 0,94 -0,47 -0,91 0,64 -0,79 -0,77 -0,64 -0,66 0,08 0,18 -0,73 -0,80 -0,65 -0,42

V 0,93 -0,74 -0,75 -0,76 0,94 1 -0,31 -0,82 0,71 -0,69 -0,63 -0,52 -0,53 -0,06 -0,01 -0,59 -0,66 -0,52 -0,36

EA -0,38 0,36 0,35 0,36 -0,47 -0,31 1 0,70 -0,37 0,14 0,41 0,21 0,19 0,22 0,01 0,31 0,51 0,29 0,45

I -0,84 0,77 0,71 0,71 -0,91 -0,82 0,70 1 -0,69 0,60 0,74 0,57 0,57 0,14 -0,02 0,66 0,81 0,61 0,49

Etot 0,92 -0,95 -1,00 -1,00 0,64 0,71 -0,37 -0,69 1 -0,16 -0,25 -0,15 -0,15 -0,50 -0,43 -0,21 -0,31 -0,16 -0,29

Ecoh -0,46 0,31 0,21 0,23 -0,79 -0,69 0,14 0,60 -0,16 1 0,87 0,82 0,84 -0,47 -0,47 0,86 0,83 0,80 0,23

B -0,49 0,43 0,29 0,30 -0,77 -0,63 0,41 0,74 -0,25 0,87 1 0,94 0,95 -0,39 -0,35 0,99 0,97 0,93 0,27

G -0,37 0,35 0,18 0,19 -0,64 -0,52 0,21 0,57 -0,15 0,82 0,94 1 1,00 -0,59 -0,45 0,98 0,83 0,99 -0,05

E -0,37 0,35 0,18 0,20 -0,66 -0,53 0,19 0,57 -0,15 0,84 0,95 1,00 1 -0,59 -0,45 0,98 0,85 0,98 0,00

µ -0,32 0,31 0,48 0,46 0,08 -0,06 0,22 0,14 -0,50 -0,47 -0,39 -0,59 -0,59 1 0,87 -0,49 -0,23 -0,55 0,43

B/G -0,25 0,24 0,41 0,40 0,18 -0,01 0,01 -0,02 -0,43 -0,47 -0,35 -0,45 -0,45 0,87 1 -0,40 -0,26 -0,42 0,20

C11 -0,44 0,41 0,25 0,26 -0,73 -0,59 0,31 0,66 -0,21 0,86 0,99 0,98 0,98 -0,49 -0,40 1 0,91 0,96 0,13

C12 -0,54 0,45 0,34 0,35 -0,80 -0,66 0,51 0,81 -0,31 0,83 0,97 0,83 0,85 -0,23 -0,26 0,91 1 0,83 0,49

C44 -0,38 0,36 0,20 0,21 -0,65 -0,52 0,29 0,61 -0,16 0,80 0,93 0,99 0,98 -0,55 -0,42 0,96 0,83 1 -0,08

C12-C44 -0,37 0,25 0,29 0,30 -0,42 -0,36 0,45 0,49 -0,29 0,23 0,27 -0,05 0,00 0,43 0,20 0,13 0,49 -0,08 1

Tableau IV.1.2 : La matrice de corrélation des métaux de transition de la troisième période y compris le lutétium.

Dans ce travail, l’analyse en composantes principales definit deux composantes

principales qui représentent toutes les deux 81.98 % de la variance totale dans la base de

données. PC1 capture 54.40% de la variance dans l'ensemble de données, et PC2 capture

27.58 % de la variance comme indiqué dans (Figure IV.1.1).

Figure IV.1.1. : Le graphe des observations des métaux de transition de la troisième période

y compris le lutétium.

Le graphe des observations pour PC1 vs PC2, (Figure IV.1.1), révèle cinq groupes

distincts d'éléments. Le groupe 1 (Cs, Ba) est lié aux éléments du bloc s, le groupe 2 (Ta, Hf,

Lu ) et le groupe 3 (Ir, Os, Re, W) contiennent des éléments appartenant au bloc d, le groupe 4

(Pt, Au)

contient des métaux précieux, et le groupe 5 (Tl, Pb, Bi) comprend des métaux post-transition,

dont leur propriétés sont déterminées par leurs sous-couches p partiellement remplies. Nous

notons que l’axe PC1 sépare les groupes 1, 2, 3 des groupes 4, 5. Il ya une grande similitude

entre les éléments de chaque groupe. En regardant le groupe 2 (Figure IV.1.1) et (Tableau

IV.1.1), nous notons que les distances séparant les points représentant les éléments (Ta, Hf,

Lu ) sont très petites, ce qui indique qu'ils ont des propriétés similaires à celles de l'hafnium

(et à celles des métaux de transition), ils partagent plusieurs caractéristiques entre eux, parce

qu'ils ont la même configuration de la couche de valence, qui est égal à 2.

Empiriquement, il a été démontré que l’électron externe du lutétium se situe dans la première

sous-couche 5d; il doit marquer le début de la troisième série d'éléments de transition (c’est à

dire la sixième période du tableau périodique), et en dessous de l'yttrium (Y) dans le groupe 3

(IIIB), car il est un métal de type d1. L'emplacement d'un élément dans le tableau périodique

dépend de sa configuration électronique, de sorte que les éléments d'une même rangée ont la

même configuration de la couche de valence. Les électrons de valence déterminent la

structure et les propriétés chimiques, mais la configuration électronique détermine

l'organisation du tableau périodique des éléments ainsi que leur propriétés. Ce qui explique les

tendances périodiques dans le comportement des éléments chimiques. Les propriétés des

éléments sont déterminés par la taille (n), la forme (l) des orbitales, et le numéro atomique

(charge nucléaire). Il y’a plutôt un grand nombre de preuves chimiques et physiques indiquant

que le lutétium, doit être placé dans le même groupe que Sc et Y [12]. Cette question a été

débattue par plusieurs chercheurs ([13], [14] et [27] à [31]) et d'une manière plus

convaincante par Jensen en 1982 [14]. Une autre justification pour placer le lutétium (Lu) en

dessous de l'yttrium (Y) dans le groupe 3 (IIIB), est que cet arrangement donne des tendances

périodiques similaires dans plusieurs propriétés physiques (point de fusion, rayons atomiques,

somme des deux premiers potentiels d'ionisation, et l’électronégativité), comme on le voit en

(Tableau IV.1.3.). Sc, Y, et Lu ont tous une structure hexagonale compacte (hcp), à

température ambiante [12]. Placer les éléments dans le tableau périodique est actuellement

acceptée selon les observations empiriques suivantes: numéro atomique, les propriétés, les

tendances périodiques, et la configuration électronique de l'état fondamental des atomes [32].

Dans le graphe des variables (Figure IV.1.2), 4 principaux groupes peuvent être observés: le

groupe 1 contient principalement les propriétés physiques qui peuvent être décomposées en

deux sous-groupes, le premier sous-groupe contient les propriétés atomiques (m, Z, I, χ) et le

second contient la pression Cauchy C12-C44, et EA. Le deuxième groupe comprend les

propriétés mécaniques B, E, G et C11, C12, C44, y compris l’énergie de cohesion Ecoh. Le

troisième comporte des propriétés physiques telles que le rayon atomique r, le volume

atomique V, la polarisabilité α, et l'énergie totale Etot, et le quatrième groupe inclut le rapport

B/G, ainsi que le coefficient de Poisson µ. Les propriétés qui ont les valeurs des composantes

principales (PC) identiques sont significativement corrélées et sont similaires les unes aux

autres; Mais ceux qui ont des valeurs différentes de PC sont inversement corrélées et sont

donc différentes. Dans le groupe 1, une similitude significative est observée entre m et Z,

aussi dans le groupe 2 entre E, G et C44, les points indiquant les éléments sont proches les

uns des autres (Figure IV.1.2), ce qui révèle l'importance de ces propriétés. La PCA sépare

automatiquement les données. En effet, nous voyons que PC2 sépare clairement les propriétés

physiques des propriétés atomiques, ce qui signifie une forte différence entre ces deux types

de propriétés. Les variables au sein du même groupe sont corrélées. Les groupes 1 et 3 sont

inversement corrélés, et ainsi pour les groupes 2 et 4. Une augmentation de la masse atomique

m et le numéro atomique Z se traduira par une augmentation de I, et χ et une diminution de r,

V, Etot, et α. Cependant, le module d'Young E, le module de cisaillement G, et le module de

compressibilité B sont significativement corrélés aux constantes élastiques C11, C12, C44 et à

l'énergie de cohesion Ecoh.

Propriété Sc Y Lu

Structure hcp hcp hcp

Point de fusion (Tmelt) 1,541k 1,522k 1,663k

Electronégativité (χ) 1,20h 1,11h 1,14h

Rayons atomique (r) 1,60c 1,80c 1,734j

1er potentiel d’ionisation

6,56h 6.22h 5,43a

2ème potentiel d’ionisation 12,80h 12,24h 13,9h

a Ref [2], cRef [4], h Ref [9], j Ref [11], k Ref [12].

Tableau IV.1.3. Les propriétés physiques du groupe 3 (IIIB), y compris le lutécium. Les

quantités indiquées dans le tableau sont les suivantes: l'électronégativité (χ),

le rayon atomique (r), 1er potentiel d’ionisation, 2ème potentiel d’ionisation

(eV), le point de fusion (° C).

Figure IV.1.2 : Le graphe des variables des métaux de transition de la troisième période y

compris le lutétium.

IV.1.5. La régression par les Moindres Carrés Partiels (PLS)

Alors que l'APC est utile pour évaluer l'impact relatif de plusieurs paramètres sur les

propriétés, la régression PLS peut être utilisée comme un outil d'analyse exploratoire pour

sélectionner les variables prédictives appropriés et d'identifier les valeurs aberrantes avant la

régression linéaire classique. Une combinaison des techniques de l'APC et de la PLS permet

d'explorer un large intervalle de nouvelles tendances et de corrélations, qui n’ont pas été

établies avant [23]. La PLS comprend une large catégorie de méthodes de modélisation des

relations entre les ensembles de variables observées en utilisant les variables latentes. La

régression, inclut les tâches de classification, les techniques de réduction des dimensions et

les outils de modélisation. L'idée principale de la méthode PLS est que les données observées

sont générées par un système qui est entraîné par un petit nombre de variables latentes (i.e.

pas directement observé ou mesuré). L'algorithme PLS devient un outil réussi standard pour

traiter de larges problèmes de données chimiques. Généralement la PLS crée des vecteurs

d’observations orthogonaux (appelés vecteurs latents ou composantes), et qui contiennent la

covariance maximale entre les différents groupes de variables. Il existe différentes techniques

pour obtenir les vecteurs latents PLS, ce qui donne une variante de PLS [26].

Nous étudions les relations entre les deux blocs de variables; entre les propriétés mécaniques

(E, B, G, µ, B/G, C11, C12, C44, C12-C44) et les propriétés structurales et atomiques (α, χ,

m, Z, r, V, EA, I, Ecoh, Etot) en utilisant l'approche PLS. Les résultats PLS, présentés dans

(Figure IV.1.3), indiquent le cercle de corrélation qui explore la relation entre les propriétés

mécaniques, atomiques et structurales, ainsi qu’entre les deux composantes PLS (t1, t2) qui

capturent le maximum de la variance dans la base de données. Les résultats peuvent être

expliqués de la même manière, comme dans l'analyse en composantes principales (ACP).

Pour les propriétés, tels que C12-C44 et l'affinité d'électrons EA, situées au centre de la carte

(le cercle de corrélation), où les corrélations sont faibles. Cela signifie que leurs propriétés ne

sont pas bien représentés sur les deux premières composantes. Les propriétés C12-C44 et EA

expliquent à peine les tendances des éléments; ils n’ont pas un effet important qui pourrait

facilement influencer les tendances des éléments; ils ne sont pas importantes. On constate de

fortes corrélations entre m et Z d'une part, ainsi qu'entre les constantes élastiques C11, C12,

C44, et E, G, B, d'autre part. En outre, une corrélation négative existe entre Etot et m, Z, ainsi

qu'entre l'énergie d'ionisation I et le volume atomique V. Les variables B/G et µ sont séparées

des autres variables parce qu'elles sont moins corrélées à ces variables d’un côté, et aux

composantes PLS (t1, t2) d’un autre côté. Les propriétés situées sur le périphérie du cercle de

corrélation sont significatives, c’est à dire, ils contribuent fortement à la discrimination.

Figure IV.1.3 : Le graphe des observations (t1, t2) des métaux de transition de la troisième

IV.1.6. Conclusion

Dans cette partie, nous avons introduit une nouvelle approche pour analyser

et comparer les propriétés physiques et mécaniques de lutétium avec des éléments de

transition de la troisième range du tableau périodique, en utilisant des méthodes

d'analyse multivariée tels que l’ACP et la régression PLS. L’ACP nous a permis de

classer les propriétés et les éléments, qui ont contribué à visualiser la position des

éléments l’un par rapport à l'autre, ainsi que les relations existantes entre leurs

propriétés. Les résultats obtenus par la PLS est en bonne coherence avec les résultats

obtenus par l’ACP. Un intérêt majeur dans cette méthodologie est donnée par le

cadre unitaire, fondée sur les principes de PLS, ce qui permet de découvrir les

relations structurelles existantes entre les données et les propriétés. Nos résultats

montrent que les propriétés de lutétium (Lu) sont semblables à ceux de l'hafnium

(Hf). Nous avons constaté que nos résultats sont généralement en bon accord avec

de nombreuses études déjà publiées sur ce sujet expérimentaux et théoriques. Il est

difficile pour les scientifiques de comprendre les interactions entre un grand nombre

de variables, donc nous avons utilisé l’ACP et la PLS comme des outils pour

identifier les structures existantes dans un ensemble de données, ainsi que pour le

dépistage, et d'extraire des informations utiles à partir de données.

IV.1.7. Références

[1] NIST (National Institute of Standards and Technology), (2013). www.nist.gov>.

[2] R.A. Dragoset, A. Musgrove, C.W. Clark, and W.C. Martin, Periodic Table: Atomic

Properties of the Elements (Version 4), NIST SP 966 (2003).

<http://physics.nist.gov/PT>. NIST (National Institute of Standards and Technology),

Gaithersburg, MD.

[3] E.C.M. Chen, E.S. Chen, Molecular electron affinities and the calculation of the

temperaturedependence of the electron-capture detector response. Journal of

Chromatography A, 2004, vol. 1037, pp. 83–106.

[4] J.C. Slater, J. Chem. Phys, 1964, vol. 39, pp. 3199, http://www.webelements.com/.

[5] Charles Kittel, lntroduction to Solid State Physics, 8th ed., Hoboken, NJ: John Wiley &

Sons, Inc, 2005.

[6] Y. Makino, S. Miyake, Estimation of bulk moduli of compounds by empirical relations

between bulk modulus and interatomic distance. Journal of Alloys and Compounds,

2000, vol.313, pp. 235–241.

[7] S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S. Ganeshan, Y. Wang, Z.K.

Liu, First-principles calculations of pure elements: Equations of state and elastic

stiffness constants. Computational Materials Science, 2010, vol. 48, pp. 813–826.

[8] The Massachusetts Institute of Technology, 1996. <http://www.chemicool.com> (2013).

[9] Martienssen Warlimont., Springer handbook of condensed matter and materials Data,

Volume 1-Hans Warlimont, Springer Berlin Heidelberg, 2005.

[10] David R. Lide, ed., CRC Handbook of Chemistry and Physics, 90th Ed, CRC

Press/Taylor and Francis, Boca Raton, FL, 2010.

[11] S. Cotton, Lanthanide and Actinide Chemistry, John Wiley & Sons Ltd, England, 2006.

[12] K. A. Gschneidner, Jr., J.-C. G. Bünzli and V. K. Pecharsky, Handbook on the physics

and chemistry of rare earths, vol 41, North-Holland, Elsevier, 2011.

[13] H. Merz, K. Ulmer, Position of lanthanum and lutetium in the periodic table. Physics

Letters, 1967, vol. 26, pp. 1-2.

[14] Jensen, W. B. J. Chem. Educ, 1982, vol. 59, pp. 634–636.

[15] Glossaire de la modélisation des données, site: http://www.aiaccess.net/

[16] Michael Laing, A revised periodic table: with the lanthanides repositioned. Foundations

of Chemistry, 2005, vol. 7, pp. 203–233.

[17] Eric Scerri, Explaining the periodic table, and the role of chemical triads. Found Chem.

2010, vol. 12, pp. 69–83.

[18] Hervé Abdi, Lynne J. Williams, Principal component analysis. WIREs Computational

Statistics. 2010, vol. 2, pp. 433-459.

[19] A. Lengyel, K.Héberger, L. Paksy, O.Bánhidi, R. Rajkó, Prediction of ozone

concentration in ambient air using multivariate methods. Chemosphere. 2004, vol. 57,

pp. 889– 896.

[20] Scott R. Broderick, Hafid Aourag, Krishna Rajan, Data mining of Ti–Al semi-empirical

parameters for developing reduced order models. Physica B, 2011, vol. 406, pp. 2055–

[21] Hai-Ni Qu, Guo-Zheng Li, Wei-Sheng Xu, An asymmetric classifier based on partial

least squares. Pattern Recognition, 2010, vol.43, pp. 3448–3457.

[22] Eui-Cheol Shin, Brian D. Craft, Ronald B. Pegg, R. Dixon Phillips, Ronald R.

Eitenmiller, Chemometric approach to fatty acid profiles in Runner-type peanut

cultivars by principal component analysis (PCA). Food Chemistry, 2010, vol. 119, pp.

1262– 1270.

[23] Krishna Rajan, Materials informatics. Materials Today. 2005, vol.8, pp. 38-45.

[24] I.T. Jolliffe, Principal Component Analysis, Springer series in statistics, 2nd ed, Springer-

Verlag New York, Inc, 2002.

[25] Ivano Marchi, Serge Rudaz, Maurice Selman, Jean-Luc Veuthey, Evaluation of the

influence of protein precipitation prior to on-line SPE–LC–API/MS procedures using

multivariate data analysis. Journal of Chromatography B. 2007, vol. 845, pp. 244–252.

[26] Roman Rosipal, Nicole Krämer, Overview and recent advances in partial least squares,

C. Saunders et al. (Eds.), 2006, pp. 34–51.

[27] Scerri, E. R. J. Chem. Educ, 1991, vol. 68, 122–126.

[28] Jensen, W. B. J. Chem. Educ, 2003 vol. 80, pp. 952–961.

[29] Luder, W. F., The Electron-Repulsion Theory of the Chemical Bond; Reinhold:New

York, 1967.

[30] Hamilton, D. C. Amer. J. Phys,1965, vol. 33, pp. 637–640.

[31] Matthias, B. T.; Zacharisen, W. H.; Webb, G. W.; Engelhardt. J. J. Phys. Rev. Letters,

1967, vol. 18, pp. 781–784.

[32] Laurence Lavelle, Lanthanum (La) and Actinium (Ac) Should Remain in the d- Block.

Journal of Chemical Education No 11, 2008, vol. 85, pp. 1482-1483.

Deuxième partie

IV.2. Une étude comparative des propriétés physiques et mécaniques de

l’hydrogène en appliquant les techniques de recherche du

data mining

IV.2.1. Introduction

La position de l’hydrogène dans le tableau périodique a été le sujet de beaucoup de

recherches et de débats, c’est une de ses grandes contradictions. Parmi tous les éléments dans

la nature, l'hydrogène est le plus répandu sur terre c’est le dixième élément plus lourd en

classant les éléments par masse. L'hydrogène existe dans toutes les formes de vie [18]. Placer

l'hydrogène dans un tableau a été problématique depuis le premier tableau de Dmitri

Mendeleev en 1869, où l'hydrogène a été considéré comme un élément spécial. En 1871,

Mendeleev avait placé l’atome d'hydrogène au sommet de la première colonne du tableau

périodique. Bayley (1882) et Thomsen (1895) ont donné une forme pyramidale au tableau,

où ils ont placé l'hydrogène en haut au centre et ils l’ont isolé contre les éléments de la

deuxième période du tableau périodique. En 1922, Bohr avait ajouté les gaz nobles, en

mettant l’helium à côté de l’hydrogène. En 1967, Sanderson a utilisé l'électronégativité

comme un critère; il a placé l'hydrogène dans la partie supérieure du tableau périodique

chevauchant le bore et le carbone parce qu'il pensait que cette position était la plus

appropriée. Greenwood et Earnshaw (1984) ont placé H et He ensemble, en haut et à part du

reste des éléments et il a considéré l'hélium comme un gaz rare. En 2003, Kaesz et Atkins

ont placé séparément l’atome d'hydrogène, au milieu des groupes 7 et 8 des métaux de

transition. En 2003, Cronyn a placé l’hydrogène au-dessus du carbone [21]. Ainsi, après plus

de 130 ans, la position de l'hydrogène dans le tableau périodique est encore un sujet de

confusion [22].

Dans cette partie on va essayer de confronter ce problème, en comparant les

propriétés physiques et mécaniques de l’hydrogène avec ceux du groupe des métaux alcalins,

ceux du groupe du carbone, et avec ceux du groupe des halogènes, en utilisant les techniques

du data mining : l’Analyse en composantes principales (ACP) et la régression (PLS). Pour

cela nous avons construit trois bases de données (Tableau IV.2.1, Tableau IV.2.2, et le

Tableau IV.2.3). La première base de données est constituée de six (6) observations

(éléments), représentant les métaux alcalins, y compris l'hydrogène, et incluant 16 variables

(propriétés) (les propriétés physiques et mécaniques des éléments de la base de données).

Les propriétés et leurs abréviations sont: la polarisabilité (α), l’électronégativité (χ), la masse

atomique (m), le numéro atomique (Z), le rayon atomique (r), le volume atomique (V),

l’affinité électronique (EA), l'énergie d'ionisation (I), l'énergie totale (Etot), la conductivité

électrique (σ), le module de compressibilité (B), le module de Young (E), les constantes

élastiques (C11, C12, C44), la pression de Cauchy (C12-C44). La deuxième base de données

est composée de six (6) observations. Elle contient les éléments du groupe de carbone, y

compris l'hydrogène, et seize 16 variables identiques à celles de la première base de données.

La troisième base de données contient six observations qui sont les éléments du groupe VII

(les halogènes), plus l'hydrogène, et dix (10) variables, représentant les propriétés physiques

et la conductivité électrique. Dans cette troisième base de données nous avons inclus

seulement ces propriétés à cause de la non-disponibilité des données pour les autres

propriétés.

L'objectif principal de ce travail est d'étudier les tendances dans les propriétés des matériaux

pour les trois bases de données en appliquant l'ACP qui va révèler la composition dissimulée

des données et montrera les similitudes existantes entre les variables et les éléments, afin

d'identifier le groupe qui partage le plus de propriétés avec l'hydrogène.

IV.2.2. Bases de données IV.2.2.1 La base de données des métaux alcalins y compris l’hydrogène

Propriété H Li Na K Rb Cs α 0.667h 24.33h 24.11h 43.4h 47.3h 59.42h χ 2.20g 0.97g 1.01g 0.91g 0.89g 0.86g m 1.00794a 6.941a 22.989770a 39.0983a 85.4678a 132.90545a Z 1 3 11 19 37 55 r 0.25b 1.45b 1.80b 2.20b 2.35b 2.60b V 92.23f 20.299e 37.144e 73.736e 90.810e 115.892e EA 0.754h 0.618h 0.5479h 0.5015h 0.4859h 0.4716h I 13.5984a 5.3917a 5.1391a 4.3407a 4.1771a 3.8939a Etot [1] -12.137 -199.600 -4393.105 -16278.245 -79903.602 -205465.784 σ 16 x 103i 11.7 x 106f 20.1 x 106f 16.4 x 106f 47.8 x 106f 5.3 x 106f B 0.2c 11.6d 6.81d 3.18d 3.14d 2.03d E 0.2g 11.5g 6.80g 3.52g 2.35g 1.69g C11 0.042g 13.4g 7.59g 3.69g 2.96g 1.60g C12 0.18g 11.3g 6.33g 3.18g 2.44g 0.99g C44 0.11g 9.6g 4.30g 1.90g 1.60g 1.44g C12-C44 0.07 1.70 2.03 1.28 0.84 -0.45

[1] Ref [5], a Ref [6] , b Ref [7] , cRef [8] , d Ref [9] , e Ref [4] , f Ref [10] , g Ref [11] , h Ref [12], i Ref [13] at 162 GPa and 6500 K. Tableau IV.2.1. La base de données incluant les propriétés physiques et mécaniques des

métaux alcalins y compris l’hydrogène.

IV.2.2.2. L’analyse en composantes principales (ACP)

Figure IV.2.1. : Le graphe des observations des métaux alcalins y compris l’hydrogène.

Dans ce travail, l’analyse en composantes principales de cette base de données définit

deux composantes principales qui représentent toutes les deux 89.54% de la variance totale

dans la base de données, PC1 capture 50.99% de la variance dans l'ensemble de données, et

PC2 capture 38.55% de la variance comme indiqué dans (Figure IV.2.1.).

Les autres composantes principales ne sont pas prises en considération parce qu'elles ne

fournissent pas d’informations signifiantes. L'objectif du graphe des observations est de

visualiser les positions du comportement des variables dans un espace bidimensionnel, ainsi

que leurs relations équivalentes. Les variables à proximité l’une de l'autre et éloignées de

l'origine du graphe sont positivement corrélées; tandis que celles qui s’opposent les unes aux

autres sont négativement corrélées (ou inversement proportionnelles). Dans le graphe des

variables, les corrélations entre deux variables sont expliquées par l'intermédiaire de leur

angle par rapport au centre. Le coefficient de corrélation entre deux variables est déterminé au

moyen du cosinus de l'angle formée par leurs vecteurs correspondants sur le graphe. Étant

donné que le cosinus d'un angle plat est égale à -1, ils ont une corrélation divergente. Les

variables qui ne sont pas corrélées forment entre elles un angle droit dont le cosinus est nul.

De même, le cosinus d'un angle de degré 0 ° est 1, ce qui signifie que la corrélation est totale

entre les variables [16].

Le graphe des observations pour PC1 vs PC2, (Figure IV.2.1.), révèle deux groupes distincts

d'éléments. Groupe 1 constitué des métaux alcalins (Li , Na, K, Rb, Cs), et le groupe 2 est

constitué de l’élément de l’hydrogène (H), Nous notons que l’axe PC1 sépare les groupes 1, 2.

Il ya une ressemblance significative entre les éléments dans le groupe 2. Une distance

importante est constatée entre le point représentant H et les points représentant les métaux

alcalins, ce qui signifie que l'hydrogène est bien différént des métaux alcalins, et qu'il n’est

pas conforme au premier groupe. Une nette différence entre l'hydrogène et les métaux alcalins

apparaît dans la profondeur de leurs puits d'énergie, avec leurs potentiels d'ionisation égaux à

13,6 eV et 5,3 eV pour l'hydrogène et le lithium, respectivement [1]. D'après les données

fournies dans le Tableau IV.2.1, toutes les propriétés de l'hydrogène (H) sont très différentes

de celles des métaux alcalins à l'exception de l’EA. L’emplacement de l'hydrogène dans le

tableau périodique avec les métaux alcalins est due à sa configuration électronique

(monovalent) et non à ses caractéristiques chimiques. Les électrons de valence determinant la

chimie, et la configuration électronique reflète l'organisation du tableau périodique. Les

métaux alcalins sont parmi les meilleurs donneurs d'électrons; ils ont à peu près la même

électronégativité χ, et qui est proche de 1 (Tableau IV.2.1). Le caractère métallique d'un

élément est principalement due à sa structure et ses caractéristiques physiques [2].

Figure IV.2.2 : Le graphe des variables des métaux alcalins y compris l’hydrogène.

IV.2.2.3 La base de données du groupe de carbone y compris l’hydrogène

Propriété H C Si Ge Sn Pb

α 0.667h 1.76h 5.38h 6.07h 7.7h 6.8h

Χ 2.20g 2.50g 1.74g 2.02g 1.72g 1.55g

m 1.00794a 12.0107a 28.0855a 72.64a 118.710a 207.2a

Z 1 6 14 32 50 82

R 0.25b 0.70b 1.10b 1.25b 1.45b 1.80b

V 92.23f 5.68f 20.09f 22.58f 27.07f 31.931e

EA 0.754h 1.26g 1.39g 1.23g 1.11g 0.364g

I 13.5984a 11.2603a 8.1517a 7.8994a 7.3439a 7.4167a

Etot [1] -12.137 -1018.436 -7842.444 -56432.436 -163814.961 -531150.838

σ 16 x 103i 0.07 x 106f 4 x 102f 3f 8.7 x 106f 4.8 x 106f

B 0.2c 444g 98.0g 74.9g 56,6g 42.9d

E 0.2g 545g 112g 79.9g 52.9g 15.8g

C11 0.042g 1076.4g 165.77g 124.0g 72.30g 48.8g

C12 0.18g 124.5g 63.9g 48.3g 59.40g 41.4g

C44 0.11g 578g 79.6g 67.1g 22.03g 14.8g

C12-C44 0.07 -453.5 -15.7 -18.8 37.37 26.6

[1] Ref [5], a Ref [6] , b Ref [7] , cRef [8] , d Ref [9] , e Ref [4] , f Ref [10] , g Ref [11] , h Ref [12], i Ref [13] at 162 GPa and 6500 K.

Tableau IV.2.2 : La base de données incluant les propriétés physiques et mécaniques du

groupe de carbone y compris l’hydrogène.

D’après le graphe ACP des observations, représentant l'ensemble des données du

groupe de carbone (Figure IV.2.3), nous notons que les deux PC les plus importants

représentent 86,10% de l'ensemble de la variabilité dans l'ensemble de données (PC1 capte

62,00%, et PC2 24,10% de la variance totale. On remarque deux groupes distincts d'éléments;

le groupe 1 contenant l'hydrogène H, et le groupe 2 est constitué des éléments du groupe IV

(C, Si, Ge, Sn, Pb), celui-ci peut être divisée en trois sous-groupes. Le premier contient le

carbone C qui est un non-métal et un mauvais conducteur d'électricité, comme l'hydrogène.

La conductivité électrique est une propriété importante dans l'étude des matériaux elle nous

informe pas uniquement sur la conduction électrique d'un métal, mais aussi sur sa structure et

ses propriétés mécaniques. (Mais en dépit de l'absence d'électrons libres, l'hydrogène peut être

métallisé sous des pressions extrêmement élevées, et des températures basses); dans cet état, il

est considéré comme métallique. Les propriétés atomiques déterminent si un élément

chimique dans le tableau périodique est un métal ou un non métal. L'hydrogène liquide est

considéré comme un métal, tandis que l'hydrogène solide n’atteint pas l'état métallique, même

à haute pression [3].

Les allotropes de certains éléments montrent plus visiblement le comportement métallique ou

non métallique que d'autres. Le diamant est une forme allotropique du carbone, il n’ est pas

métallique; cependant le carbone graphite est le seul élément non métallique et qui est

conducteur de l'électricité.

Le deuxième sous-groupe contient le silicium et le germanium Ge, Si (Figure IV.2.3). Les

propriétés physiques du germanium sont très similaires à ceux du silicium. Dans leur état

solide élémentaire, ils sont tous les deux métalloïdes, parce qu'ils se comportent comme des

semi-conducteurs, mais le silicium est principalement non-métallique. Leurs conductivités

électriques peuvent être affectées à des degrés divers par le dopage. Le troisième sous-groupe

contient l'étain (Sn) et le plomb Pb, qui sont certainement métalliques. Malgré leur adhésion

aux tendances périodiques, les propriétés du groupe de carbone varient considérablement. Le

carbone est un non-métal. L’étain et le plomb se comportent tout à fait comme des métaux. En

ce qui concerne la conductivité électrique, les éléments peuvent être divisés en trois classes:

‘les métaux’, ‘semi-métaux’ et ‘non-métaux' [2]. Les métaux ont une grande conductivité; elle

peut être supérieure à 105 Ω-1.m-1. Les semi-métaux ont des conductivités modérées à faibles;

ils sont donc des conducteurs électriques intermediaries [17]. Le semi-métal le plus courant

est le silicium Si. La propriété la plus utile des semi-métaux est leur capacité variable à

conduire le courant électrique. Les propriétés physiques des non-métaux sont opposées à

celles des métaux. En regardant (Figure IV.2.3), nous notons que la distance entre le point

représentant l'hydrogène H et les points représentant le groupe de carbone est plus courte que

celle qui se trouve dans (Figure IV.2.1) avec les métaux alcalins. Cela signifie que

l'hydrogène H partage plusieurs propriétés avec les éléments du groupe de carbone et a de

nombreuses similitudes avec eux. L'hydrogène partage plusieurs caractéristiques chimiques

avec le carbone et la famille du silicium. D’après le Tableau IV.2.2, l'hydrogène et les

éléments du groupe IV ont des électronégativités similaires.

En thermodynamique, il est bien connu que l'électronégativité affecte les propriétés

chimiques des éléments. On remarque que les propriétés d’hydrogène tel que l'énergie

d'ionisation et l’affinité électronique sont similaires à ceux des éléments du groupe de

carbone. L’objectif de la classification périodique est de refléter les propriétés des éléments en

fonction de leur nombre atomique et de leur périodicité [1].

Figure IV.2.3. : Le graphe des observations du groupe du carbone y compris l’hydrogène.

Figure IV.2.4. : Le graphe des variables du groupe du carbone y compris l’hydrogène.

IV.2.2.5. La bases de données des halogènes y compris l’hydrogène

Propriété H F Cl Br I At

α 0.667h 0.557h 2.18h 3.05h 4.7h 6.0h

χ 2.20g 4.10g 2.83g 2.74g 2.21g 1.90g

m 1.00794a 18.9984a 35.453a 79.904a 126.9045a 210a

Z 1 9 17 35 53 85

r 0.25b 0.50b 1.00b 1.15b 1.40b 1.27b

V 23.92f 28.39f 37.69f 39.03f 42.74f 49.82f

EA 0.754h 3.40g 3.61g 3.36g 3.06g 2.8g

I 13.5984a 17.4228a 12.9676a 11.8138a 10.4513a 9.5352b

Etot [1] -12.137 -2696.709 -12481.164 -69951.739 -188164.803 -578569.435

σ 16 x 103i 1.0 x 10-4j 1.0 x 10-14k 1.0 x 10-4j 1.0 x 10-4j 0j

[1] Ref [5], a Ref [6] , b Ref [7] , f Ref [10] , g Ref [11] , h Ref [12], i Ref [13] at 162 GPa and 6500 K, j Ref [14], k Ref [15] at 203,15 K.

Tableau IV.2.3. La base de données incluant les propriétés physiques et mécaniques des

halogènes y compris l’hydrogène.

Figure IV.2.5: Le graphe des observations du groupe des halogènes y compris l’hydrogène. Le graphe des observations du groupe des halogènes y compris l’hydrogène (Figure IV.2.5)

génère deux pertinentes composantes principales qui représentent 94,02% de l'ensemble de la

variance dans la base de données; la première composante principale (PC1) capture 69,90% et

la seconde (PC2) caractérise 24,12% de la variance totale.

D’après la (Figure IV.2.5) l’analyse ACP révèle deux groupes distincts d'éléments,

l'hydrogène H que nous appellerons le groupe 1, et les halogènes (F, Cl, Br, I, A) le groupe 2.

Il apparaît que l'hydrogène est très éloigné des halogènes. Cela signifie que l'hydrogène et les

halogènes sont différents, et qu’ils ne partagent pas les mêmes propriétés (Tableau IV.2.3.), à

l'exception de l'électronégativité χ et de l’énergie d'ionisation I. En plus, l'hydrogène a une

conductivité électrique σ supérieure à celle des halogènes, qui sont de mauvais conducteurs de

l'électricité.

Figure IV.2.6. Le graphe des variables du groupe des halogènes y compris l’hydrogène.

En regardant le graphe des variables ACP des métaux alcalins y compris l’hydrogène

dans (Figure IV.2.2.) quatre groupes distincts peuvent être observés: le Groupe 1, qui

contient en particulier les propriétés physiques, et qui peut être décomposé en deux sous-

groupes; le premier est constitué des propriétés atomiques tels que l'énergie d'ionisation I et

l’électronégativité χ, et le second de l'affinité d'électrons EA et de l'énergie totale Etot; le

deuxième groupe (Groupe 2) inclut les propriétés mécaniques B, E et C11, C12, C44 et la

pression de Cauchy C12-C44, le troisième (groupe 3) se compose des propriétés physiques

comme le rayon atomique r, le volume atomique V, la polarisabilité α ainsi que la masse

atomique m, et du numéro atomique Z. le quatrième groupe (groupe 4) contient seulement la

conductivité électrique σ. PC2 sépare clairement les propriétés physiques des propriétés

atomiques (Figure IV.2.2). Les propriétés qui ont les mêmes valeurs de PC, tel que déterminé

par les différents groupes, sont étroitement liées, tandis que celles avec des valeurs opposées

de PC ont une corrélation divergente. Dans le groupe des métaux alcalins, les propriétés

varient comme suit: une ressemblance importante peut être observée entre m, Z, V dans le

Groupe 3, et entre toutes les propriétés du groupe 2; les points présentant les éléments sont

très proches les uns des autres (Figure IV.2.2). Le point de m est le plus proche de celui de Z,

indiquant son importance; La même remarque peut être faite pour le point de C11 et celui de

E. Les groupes 1 et 3 sont inversement corrélés, donc pour les groupes 1 et 4, plusieurs

corrélations peuvent être identifiées. Une augmentation de χ et I se traduira par une

augmentation d’EA et Etot et une diminution de r, V, α, m, Z et σ. En même temps, E et B sont

corrélées et étroitement liées aux constantes élastiques C11, C12, C44 et à la pression de

Cauchy C12-C44.

Dans le graphe des variables du groupe de carbone y compris l’hydrogène la (Figure IV.2.4),

quatre groupes distincts peuvent être observés: le premier (groupe 1) contient C11, C12, et

C44, en plus de B et E. Le deuxième groupe (Groupe 2) peut être décomposé en deux sous-

groupes; un contient EA et χ, et l'autre I et Etot. Dans le troisième groupe (groupe 3) il y’a

deux sous-groupes; l’un comprend r, α, m et Z et l'autre σ; Le quatrième groupe (groupe 4)

contient V et C12-C44. Dans le groupe de carbone, les propriétés varient comme suit: dans le

groupe 1, une forte corrélation est observée entre B, E et C11, C12, C44; tandis que E et B

sont corrélées et étroitement liées aux constantes élastiques C11, C12, C44. De même, m et Z

dans le groupe 3 sont également fortement corrélées. Le point de m est le plus proche de celui

de Z; La même remarque peut être faite pour le point de E et ceux de C11, C44. Les groupes 1

et 4 sont inversement corrélés. De même, les groupes 2 et 3 présentent une corrélation

inverse, et plusieurs corrélations peuvent être mentionnées. Une augmentation de χ et EA se

traduira par une hausse des I et Etot et une baisse de r, α, m, Z et σ. Par conséquent, une

augmentation de V conduira à une diminution de B, et une augmentation de E provoquera une

augmentation de B. En outre, une augmentation de B donne une diminution de C12-C44.

En regardant le graphe ACP des variables du groupe des halogènes y compris l’hydrogène

(Figure IV.2.6), trois groupes distincts peuvent être spécifiés: le premier groupe (Groupe 1)

contient les propriétés I, χ et Etot, le deuxième groupe (Groupe 2) contient σ; tandis que le

(groupe 3) peut être décomposé en deux sous-groupes, l’un contient les propriétés r, V, α, m,

et Z, et l'autre EA.

Après examinination de la figure IV.2.6, nous remarquons que les propriétés I, χ et Etot sont

fortement corrélées à σ; tandis que les groupes 2 et 3 ont des valeurs inverses de PC, ce qui

signifie que les propriétés contenues dans le groupe 3 sont inversement corrélées à σ. Il est

facile de noter que ces propriétés sont liées à la conductivité électrique, qui est une

caractéristique importante dans le tableau périodique des éléments.

IV.2.3. La régression par les Moindres Carrés Partiels (PLS)

Cette régression est basée sur la relation entre les propriétés mécaniques (E, B, σ, C11,

C12, C44, C12-C44) et les propriétés physiques (α, χ, m, Z, r, V, EA, I, Etot). L'approche PLS

est appliquée pour élucider les relations entre ces propriétés. Elle crée un ensemble de

composantes, en commençant par une base de données composées de diverses observations

caractérisées par différentes variables. C’est une technique de réduction des données, pour

réduire les variables X à une série de composantes non apparentées qui illustrent la variation

dans les données. La régression PLS est d'un intérêt particulier car elle peut analyser les

données corrélées et les variables redondantes; elle peut aussi modéliser les différentes

caractéristiques en même temps. Les résultats de la PLS pour les trois bases de données sont

présentés dans les figures : (Figure IV.2.7, Figure IV.2.8 et Figure IV.2.9). Ils sont obtenus

en utilisant le deux premières composantes (t1,t2). Le nombre de facteurs est automatiquement

sélectionné; la première composante PLS est plus fiable que les composantes suivantes.

Finalement, le choix des deux composantes PLS permet de faire de pratiques visualisations.

Les variables X et Y sont visualisées sur un graphe, nommé '' le cercle de corrélation '', en

fonction de leurs relations avec les facteurs PLS, t1 et t2, qui pourrait être interprété de la

même manière que pour le graphe des variables dans l'ACP; les cosinus des angles formés par

les vecteurs-variables dans le plan indiquent les corrélations entre les variables d'origine [19].

Les variables les plus importantes se trouvent à la périphérie du cercle de corrélation, alors

que les variables, qui n’apportent que de petites ou aucune contribution à la discrimination,

sont à proximité du centre du cercle [20].

Pour la base de données des métaux alcalins, une régression PLS des 7 variables Y en

fonction des 9 variables X, en utilisant les deux premiers facteurs t1 et t2, est réalisée comme

le montre la Figure IV.2.7. Le graphe obtenu est le cercle de corrélation entre les variables

des propriétés mécaniques, et celles des propriétés physiques dans les deux composantes PLS

(t1,t2). Ceci permet la visualisation des similitudes entre les propriétés physiques des variables

(xi) et les deux facteurs PLS t1 et t2 d'une part, et entre les propriétés physiques des variables

(Yi) et t1, t2 d'autre part. Nous trouvons de fortes corrélations entre m, Z, V, d'une part, et χ, I

de l'autre part; ainsi entre les constantes d'élasticité C11, C12, et C44 d’un côté et E, B et la

pression de Cauchy C12-C44 d’un autre côté. Une corrélation négative est également notée

entre Etot et m, Z, et la même tendance est observée entre r et EA. En ce qui concerne les

variables explicatives (xi), la conductivité σ électrique n’est pas bien représentée dans les

deux premières composantes; elle est à proximité du centre du cercle de corrélation. Ceci peut

s’expliquer par le fait que cette variable définit à peine les tendances des propriétés des

éléments. Elle est moins corrélée aux variables X, et donc semble être moins corrélée aux

facteurs PLS t1 et t2. En regardant le graphe PLS représentant la base de données du groupe de

carbone (Figure IV.2.8), il y’a de fortes corrélations observées entre m, Z d'un côté et entre

les constantes élastiques C11, C12, C44, et E, B d’un autre côté. Il semble également en

(Figure IV.2.8) qu’Etot est corrélée négativement à m et Z. Une tendance similaire est

observée entre V et EA. La conductivité électrique σ est à proximité du centre du cercle de

corrélation, donc elle apporte une contribution réduite à la discrimination.

Pour la base de données des halogènes, la régression PLS dont la variable Y est la

conductivité électrique σ est en fonction des variables X, qui sont les 9 propriétés physiques

(α, χ, m, Z, r, V, EA, I, Etot), avec t1 et t2, les résultats sont visualisés dans le cercle de

corrélation dans la Figure IV.2.9. Un premier aperçu indique que toutes les propriétés se

situent à la périphérie du cercle, ce qui signifie qu'elles sont toutes des variables

discriminantes et participantes.

Figure IV.2.7. Le cercle de corrélation entre les propriétés mécaniques, et les propriétés

physiques dans les deux composantes PLS (t1, t2) (la base de données des

métaux alcalins).

physiques dans les deux composantes PLS (t1, t2) (la base de données du

groupe de carbone).

physiques dans les deux composantes PLS (t1, t2) (la base de données des

halogènes).

IV.2.4. Conclusion

L'atome d'hydrogène a un seul électron, donc on pourrait penser que ses propriétés

chimiques sont limitées, mais il a diverses propriétés chimiques et peut être combiné avec

presque tous les éléments. L'hydrogène est différent des autres éléments de la classification

périodique, car il possède des propriétés exceptionnelles, il a été placé à la tête du groupe des

alcalins, car il a un seul électron de valence. Cependant, cette position ne révèle pas ses

propriétés chimiques et physiques [18].

Par conséquent, d'après les résultats représentés par les graphes des observations dans les

figures IV.2.1, IV.2.3., et IV.2.5, on peut en déduire que l'hydrogène partage certaines

propriétés avec certains éléments et groupes du tableau périodique, tels que le groupe du

carbone, mais pas totalement; à vrai dire l'hydrogène est un élément à part, et ne s’ajuste

harmonieusement à aucun groupe.

Dans cette étude, la méthode d'extraction des données a été utilisée comme une analyse

exploratoire des données. C’est une approche qui devient de plus en plus importante dans la

recherche, en utilisant les différentes méthodes statistiques multivariées telles que l’ACP et la

régression PLS pour visualiser les positions des éléments l’un par rapport à l'autre dans

chaque base de données, et pour étudier les relations entre leurs propriétés. Ce travail montre

que les outils statistiques tels que l’ACP combinée avec la PLS peuvent être très utiles pour

identifier les corrélations entre les groupes de variables dans un ensemble de données afin de

déterminer les variables (propriétés) qui devraient être utilisées pour classer les éléments.

Cette étude présente une nouvelle méthode pour étudier le comportement d'un élément dans le

tableau périodique, et les tendances de leurs propriétés à l'aide de l'exploration de données et

de ses techniques appropriées. Nous avons trouvé que l'hydrogène partage certaines

similitudes avec certains éléments et groupes dans le tableau périodique tels que le groupe de

carbone. En fait, l'hydrogène est toujours considéré comme un élément à part, distinct et

spécial.

[1] Marshall W. Cronyn, The Proper Place for Hydrogen in the Periodic Table, Journal of

Chemical Education. No 8. 80, 947-951 (2003).

[2] Albert Hérold, An arrangement of the chemical elements in several classes inside the

periodic table according to their common properties, C. R. Chimie. 9 (2006) 148–153.

[3] P. P. Edwards, M. T. J. Lodge, F. Hensel and R. Redmer, a metal conducts and a non-

metal doesn't'…', 941-965368 Phil. Trans. R. Soc. A. 368 (2010) 941-965.

[4] S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S. Ganeshan, Y. Wang, Z.K.

Liu, First-principles calculations of pure elements: Equations of state and elastic stiffness

constants, Computational Materials Science. 48 (2010) 813–826.

[5] NIST (National Institute of Standards and Technology), www.nist.gov (Accessed June

10, 2012).

[6] R.A. Dragoset, A. Musgrove, C.W. Clark, and W.C. Martin, (2003), Periodic Table:

Atomic Properties of the Elements (Version 4), NIST SP 966.

<http://physics.nist.gov/PT> . NIST (National Institute of Standards and Technology),

Gaithersburg, MD, (2012).

[7] J.C. Slater, J. Chem. Phys. 39 (1964) 3199, http://www.webelements.com/

[8] Charles Kittel, lntroduction to Solid State Physics, 8th edition. Hoboken, (NJ: John Wiley

& Sons), Inc, 2005.

[9] Y. Makino, S. Miyake, Estimation of bulk moduli of compounds by empirical relations

between bulk modulus and interatomic distance, Journal of Alloys and Compounds. 313

(2000) 235–241.

[10] The Massachusetts Institute of Technology. <http://www.chemicool.com>. (Accessed 20

July 2012).

[11] Martienssen Warlimont, Springer handbook of condensed matter and materials data

Volume 1- Hans Warlimont, Springer Berlin Heidelberg (2005).

[12] David R. Lide, ed., CRC Handbook of Chemistry and Physics, 90th Edition, (CRC

Press/Taylor and Francis, Boca Raton, FL), 2010.

[13] V. Ya. Ternovoi, A. A. Pyalling, D. N. Nikolaev, and S. V. Kvitov, Conductivity of

multiple shock compressed hydrogen along 135 and 180 GPa isobars, CP1195, shock

compression of condensed matter. (2009) 915-918.

[14] http://easycalculation.com/chemistry/periodic-table.php. (Accessed 29 June 2013).

[15] Peter Schmittinger, Chlorine, Principles and industrial practice, 1st Edition (2000),

(Wiley-VCH Verlag GmbH, D-69469 Weinheim) Germany.

[16] Shin, E. C., Craft, B. D., Pegg, R. B., R. Phillips, D., and Eitenmiller, R. R. (2010),

“Chemometric approach to fatty acid profiles in Runner-type peanut cultivars by

principal component analysis (PCA)”, Food Chemistry, 119, 1262–1270.

[17] Wiberg, E., Wiberg, N., and Holleman, A. F. (2001), « Inorganic chemistry », Academic

Press.

[18] Atkins, P.W., Overton, T.L., Rourke, J.P., Weller, M.T., and Armstrong, F.A. (2010).

Inorganic Chemistry, 5th ed, (Oxford University Press).

[19] Tenenhaus, M., Pagès, J., Ambroisine, L., and Guinot, C. (2005), « PLS methodology to

study relationships between hedonic judgements and product characteristics », Food

Quality and Preference, 16, 315–325.

[20] Sjöström, M., and Wold, S. (1986), “Partial Least Square Discriminant Plots”, Pattern

Recognition In Practice II. pp. 461-470.

[21] Laing, M. (2007), « Where to put hydrogen in a periodic table?, Foundations of

Chemistry », 9, 127–137.

[22] Cronyn, M. W. (2003), « The Proper Place for Hydrogen in the Periodic Table », Journal

of Chemical Education, No 8. 80, 947-951.

Troisième partie

IV.3. Investigation des propriétés structurales et mécaniques des hydrures

alcalins par les calculs ab initio et l'approche du datamining

IV.3.1. Introduction Les hydrures sont des matériaux prometteurs; qui peuvent être utilisés dans les

batteries rechargeables, les cellules, les réfrigérateurs, les capteurs, les commutateurs

optiques, ainsi que dans le stockage de chaleur, en industrie nucléaire et dans la purification

de l'hydrogène. Par conséquent, il est nécessaire d'étudier leurs propriétés, pour pouvoir

concevoir des hydrures appropriés pour les applications spéciales [1].

L'étude des hydrures métalliques est importante car elle peut aider à comprendre les

propriétés de l'hydrogène qui améliore les propriétés de stockage [2]. Les hydrures que

l'hydrogène forme par réaction avec les métaux alcalins (Li , Na, K, Rb, et Cs) sont

stoechiométriquement stable. Les hydrures alcalins MH (M = Li , Na, K, Rb, et Cs)

représentent un domaine intéressant de la recherche, parce qu'ils sont utiles dans la fusion ce

qui permet d'acquérir des carburants de haute énergie [3]. Depuis la première étude

expérimentale par rayonnement X, en 1931, il a été démontré [4] que les hydrures alcalins

cristallisent dans la structure NaCl (B1) à température ambiante et pression ambiante,

comme la structure de Li , Na, K, Rb, et Cs [5; 6].

Figure IV.3.1. Structure cristalline de la structure NaCl (B1) des hydrures alcalins MH dans

les conditions ambiantes. Les cercles bleus représentent M = Li , Na, K, Rb,

Cs, et les cercles violets représentent les atomes d'hydrogène.

L'objectif de ce travail est d'éxaminer les propriétés structurales et mécaniques des

hydrures alcalins obtenues par les calculs ab initio en utilisant l’approche datamining, et la

technique d’Analyse en Composantes Principales (ACP) pour explorer de nouvelles relations

afin de révèler les tendances dans la base de données et montrer les similitudes et les

corrélations existantes entre les variables (les propriétés) et les hydrures alcalins.

Pour réaliser cette étude, nous avons construit une base de données (Tableau IV.3.2)

à partir des propriétés mécaniques calculées, par les calculs ab initio implémentés dans le

code VASP [7; 8] dans le cadre de la Théorie de la Fonctionnelle de la Densité DFT [9; 10],

les énergies d’échange et de corrélation des structures ont été traitées par l’approximation du

gradient généralisé (GGA) [11] et le procédé de projection des ondes augmentées (PAW)

[12; 13; 14], ça confirme la précision des méthodes tout électrons, avec l'efficacité de la

méthode des pseudo-potentiels [15]. La fonctionnelle d'échange et de corrélation est adoptée

pour décrire l'interaction d'échange-corrélation. Le test de convergence a donné une énergie

de coupure de 312,50 eV lorsque la base d'onde plane est utilisée. Suivant le schéma

Monkhorst-Pack [16], pour l'intégration nous avons utilisé une maille de (13×13×13) points-

k dans la première zone de Brillouin, et qui a été utilisé pour tous les calculs. Dans tous les

cas, les optimisations de géométrie ont été effectuées et les convergences ont été assumées

lorsque les forces sur les atomes étaient inférieures à 1 MeV / Å.

IV.3.2. Base de données

LiH NaH KH RbH CsH

a0(Å) 4.02a 4.057[53] b

4.02 [54]c

4.833 a 4.870[55]b

4.834[56]c

5.699 a 5.70[57]b

5.699 [58]c

6.068 a 6.04[59]b

6.075 [60]c

6.437 a 6.388 [61]b

6.429 [62]c

B0(GPa) 34.614 a 34.7[55]b

34.30[58]c

22.507 a 19.40 [55]b

22.60[62]c

13.017 a 15.6 [66]b

13.30 [58]c

10.944 a 10.00[66]b

11.1 [62]c

8.686 a 8.00 [61]b 8.80 [58]c

B’0 3.141 a

3.40 [67]b

3.3[68]c

3.522 a 4.40 [55]b

3.62 [69]c

3.539 a 4.00 [66]b

3.70 [58]c

3.649 a 3.9 [66]b

3.47 [58]c

3.508 a 4.00 [70]b 3.0365 [71]c

a Le présent travail b Valeurs experimentales c Valeurs théoriques Tableau IV.3.1:Les valeurs calculées du paramètre de maille a0 (Ǻ), le module de

compressibilité (B0) (GPa) et la dérivé première de la pression (B’0) des hydrures alcalins dans la structure NaCl (B1), avec quelques autres ésultats.

LiH NaH KH RbH CsH

C11(GPa) 56.97 a 65.31 [72]b

49.90 a 47.3 [73]b

48.3 [74]c

23.49 a 23.0 [60]c

21.914 a 24.6 [58]c

15.817 a 16.4 [60]c

C12(GPa) 23.43 a 17.5 [75]b

22.3 [76]c

8.81a 8.0[60]c

7.78 a 8.35 [71]c

5.458 a 4.6 [58]c

5.12 a 6.761 [71]c

C44(GPa) 46.156 a 46.2 [73]b

46.0 [54]c

22.969 a 22.5 [73]b 22.7 [58]c

11.804 a 12.9 [58]c

9.299 a 8.2 [58]c

7.397 a 6.7 [60]c

G(GPa) 30.768 a

21.966 a

23 [71]c

10.025 a

13 [71]c 8.85 a

10.2 [71]c 6.49 a

9.15 [71]c

E(GPa) 71.20 a

49.72 a

53 [71]c

23.931 a

20.91a

15.587 a

ν 0.157 a

0.11 [71]c 0.13 a

0.13 [71]c 0.19 a

0.21 [71]c 0.18 a

0.23 [71]c 0.20 a

0.22 [71]c

A 2.75 a 1.11a

0.88 [71]c 1.50 a

1.27 [71]c 1.13 a

1.18 [71]c 1.38 a

1.18 [71]c

B/G 1.125 a

1.024 a

1.13 [71]c

1.29 a

1.2 [71]c

1.236 a

1.37 [71]c

1.33 a

1.31 [71]c

a Le présent travail b Valeurs experimentales c Valeurs théoriques

Tableau IV.3.2: Les Constantes mécaniques et élastiques des hydrures alcalins dans la

structure NaCl (B1), avec quelques autres résultants, le module de

compressibilité (B0), module de cisaillement (G), constantes élastiques (Cij),

le module d'Young (E) sont en (GPa). Le rapport B/G, le facteur

d'anisotropie (A) et le coefficient de Poisson (ν) sont des paramètres sans

dimension.

IV.3.3. L’analyse en composantes principales (ACP)

IV.3.3.1. Les propriétés structurales

Les paramètres structuraux des hydrures alcalins (LiH, NaH, KH, RbH et CsH) ont

été optimizes, et l'énergie totale a été étudiée en fonction du volume. Les paramètres de la

structure, module de compressibilité (B0), la dérivé première de la pression (B’0) ont été

déterminés en ajustant les énergies totales à l'équation d'état de Murnaghan [17]; les valeurs

sont données dans le (Tableau IV.3.1). A partir de ces valeurs, on peut noter que les valeurs

calculées sont en bon accord avec ceux obtenues dans les travaux expérimentaux et

théoriques précédents; cela prouve la validité de notre modèle théorique. L'approximation du

gradient généralisé (GGA) estime la fiabilité de l'énergie totale à la fois sur la densité

d'électrons et de son gradient. La GGA améliore généralement les paramètres structuraux du

matériau [18].

IV.3.3.2. Les propriétés mecaniques

Le cristal cubique possède trois constantes élastiques indépendantes, C11, C12 et C44

[19] qui ont été déterminées par ajustement des énergies totales d'un cristal contraint à une

equation de contraintes polynomiale du quatrième ordre, selon la loi de Hooke [20]. Trois

types de contraintes, à savoir la variation de volume, les contraintes de cisaillement

tétragonal et rhomboédrique et le volume conservé, ont été appliquées à la structure

optimisée. Les constantes élastiques sont calculées et rapportées dans le (Tableau IV.3.2),

avec quelques autres données disponibles, qui indiquent que les structures cubiques pour

chaque hydrure alcalin sont mécaniquement stables parce qu'elles satisfont les critères de

stabilité du cristal cubique [21].

C44> 0 (IV-1)

C11> | C12 | (IV- 2)

C11 + 2C12> 0 (IV-3)

Le module de cisaillement (Tableau IV.3.2) joue un rôle dominant dans la prédiction de la

dureté du matériau. Il a été trouvé que LiH a le module de cisaillement le plus élevé parmi

les hydrures alcalins, ce qui signifie que LiH a une grande dureté. Par conséquent, LiH est

plus résistant que les autres hydrures alcalins. Le rapport B/G est généralement utilisé pour

prédire le comportement ductile et fragile des matériaux. Le matériau est ductile lorsque

B/G > 1,75 [22], et il a un caractère fragile quand B/G ≤ 1,75 [23]. Un tel comportement est

indirectement lié au facteur d'anisotropie. D’après les valeurs de B/G calculées, présentées

dans le (Tableau IV.3.2), on constate qu'elles sont toutes inférieures à 1,75, ce qui indique

que les hydrures alcalins se comportent d'une manière fragile dans les conditions ambiantes,

et peuvent être donc considérés comme des matériaux fragiles. Le module d'Young E est

connue comme une quantité de mesure de la rigidité d'un matériau élastique [24]. En

analysant les valeurs de E présentées dans le (Tableau IV.3.2), on peut noter que le LiH est

le plus rigide parmi les hydrures alcalins. La rigidité des hydrures alcalins diminue de LiH à

CsH. Comme le montrent les tableaux IV.3.1 et IV.3.2, les valeurs calculées du module de

compressibilité, du module de cisaillement, et du module d'Young diminuent selon l'ordre

LiH < NaH < KH < RbH < CsH. Le rapport de Poisson ν, qui varie généralement de -1 à 0,5,

est utilisé pour estimer la stabilité du cristal contre le cisaillement [38], ν mesure la

résistance du matériau au cisaillement [36], il fournit plus d'informations sur les

caractéristiques des forces de liaison que tout autre constante élastique [48]; il est

généralement égale à 1/3 pour les matériaux ductiles et moins de 1/3 pour les matériaux

fragiles [49]. Les valeurs du rapport de Poisson ν, figurant dans le tableau IV.3.2, sont

inférieures à 1/3, ce qui indique que les hydrures alcalins sont des matériaux fragiles.

L'anisotropie A (également appelée le rapport d'anisotropie de Zener) est une mesure du

degré d'anisotropie dans les solides [25]. Elle est égale à 1 pour un matériau isotrope.

Lorsque A est inférieur ou supérieur à 1, A est utilisée pour mesurer le degré d'anisotropie

élastique [19]. Selon les valeurs d'anisotropie calculées et indiqués dans le tableau IV.3.2,

on peut noter que les hydrures alcalins sont caractérisés par une anisotropie élastique.

IV.3.4. Analyse par l’approche data mining

Les valeurs du module de compressibilité (B), le module de cisaillement (G), le module de

Young (E), le coefficient de Poisson (ν), le rapport d'anisotropie (A), le rapport B/G, et les

constantes élastiques (C11, C12 et C44) calculées par les calculs ab initio et affichées dans le

tableau IV.3.2, les hydrures alcalins (LiH, NaH, KH, RbH et CsH) constituent la base de

données analysées par l’approche data mining et la technique d’ACP. L'analyse en

composantes principales (ACP) effectuée sur la base de données, a donné deux importantes

composantes principales PC, où PC1 capture 83,07% de la variance totale dans la base de

données, alors que PC2 capture 16,84%, comme le montre (Figure IV.3.2). Le graphe des

observations des deux premières composantes principales pour les hydrures alcalins (Figure

IV.3.2), révèle deux groupes distincts d'hydrures. Groupe 1 comprend LiH et NaH ayant une

valeur positive de PC1, tandis que le groupe 2 contient KH, RbH et CsH qui ont une valeur

négative de PC1. Il est à noter que l'axe de PC2 sépare le groupe 1 du groupe 2. Le groupe 1

contient les hydrures alcalins avec des valeurs élevées du module de B, du module de

cisaillement, du module d’Young, et des constantes élastiques (C11, C12 et C44) et de

faibles valeurs du coefficient de Poisson et du ratio B/G; contrairement au groupe 2 qui

contient les hydrures ayant de faibles valeurs du module de compressibilité, du module de

cisaillement, du module d’Young, des constantes élastiques (C11, C12 et C44) et des valeurs

élevées du coefficient de Poisson et du rapport B/G. En outre, les hydrures alcalins du

groupe 2 ont des valeurs très proches de B, G, E, C11, C12, C44, ν, et B/G. En regardant le

graphe d’ACP des variables (Figure IV.3.3), on peut noter que les propriétés mécaniques, à

savoir B, G, E, C11, C12, C44, et A, ont les même valeurs de la composante principale

(PCs), ce qui signifie qu’elles sont fortement corrélées parce que leurs points sont proches

les uns des autres; cela révèle l'importance de ces propriétés. Celles-ci sont inversement

corrélées à ν et B/G, car elles ont des valeurs de PC opposées. L’axe PC2 sépare clairement

B, G, E, C11, C12, C44, A de ν et B/G; cela exprime la forte différence entre elles. G

représente la dureté contrairement à B/G et ν qui expriment la ductilité; donc une

augmentation de la dureté, conduira à une diminution de la ductilité (soit une augmentation

de la fragilité), ce qui prouve que les hydrures alcalins sont des matériaux fragiles. Aussi, si

B/G diminue et le module d’Young augmente, le matériau se transformerait en moins

ductile. Cela nécessite d'augmenter la rigidité et à diminuer la fragilité. Le biplot montré en

(Figure IV.3. 4) révèle que le premier groupe des hydrures (LiH, NaH) est lié à B, G et E,

indiquant leur grande dureté et rigidité, tandis que ceux du groupes 2 (KH, RbH, CsH) sont

corrélés à B/G et ν; ce qui indique la faible ductilité et la haute fragilité de ces hydrures. Les

résultats de l'analyse de données ACP sont en bon accord avec les résultats obtenus par les

calculs ab initio et avec ceux déterminés théoriquement et experimentalement.

Figure IV.3.2. Le graphe des observations des hydrures alcalins

Figure IV.3.3. Le graphe des variables des hydrures alcalins.

Figure IV.3.4. Le graphe de « Biplot » représentant les hydrures alcalins et les propriétés.

IV.3.5. Conclusion

En résumé, les propriétés structurales et mécaniques des hydrures alcalins (LiH, NaH,

KH, RbH et CsH) ont été étudiées par les calculs ab initio. Les calculs des énergies totales,

des géométries optimisées et des constantes élastiques ont été effectuées en utilisant le

logiciel VASP, ainsi que la méthode PAW GGA. Le data mining est une nouvelle approche

qui a été employée pour analyser les résultats obtenus, il est considéré comme l'une des

approches fiables pour les problèmes d'optimisation, l’ACP est une des techniques de data

mining largement utilisée pour l’analyse des données. Les propriétés calculées sont en bon

accord avec les données expérimentales et théoriques disponibles. Les constantes élastiques

calculées indiquent que les hydrures alcalins sont mécaniquement stables. L'analyse de G/B

révèle que les hydrures alcalins sont des matériaux fragiles dans les conditions ambiantes.

Compte tenu des valeurs du module de cisaillement (G), du module de compressibilité (B), et

du module d’Young (E), il a été constaté que LiH est le plus rigide et le plus fragile parmi les

hydrures étudiés. Les résultats obtenus montrent que les hydrures possèdent des propriétés

intéressantes qui peuvent être très utiles dans certaines applications industrielles, en

particulier LiH qui est un matériau prometteur.

Ce document présente l'aptitude des techniques d'exploration de données, telles que l’ACP, à

analyser et à obtenir des informations précieuses à partir d'un ensemble de données. En outre,

il peut être conclu que les résultats de l'analyse des données, sont en bon accord avec les

résultats obtenus par les calculs ab initio et ceux rapportés dans la littérature.

[1] L. George, R. Hrubiak, K. Rajan, S. K. Saxena, Principal component analysis on

properties of binary and ternary hydrides and a comparison of metal versus metal hydride

properties, Journal of Alloys and Compounds 478 (2009) 731–735.

[2] L. George, S. K. Saxena, Structural stability of metal hydrides, alanates and borohydrides

of alkali and alkali- earth elements: A review, International Journal of Hydrogen Energy 35

(2010) 5454-5470.

[3] X.W. Sun, Q.F. Chen, X.R. Chen, L.C. Cai, F.Q. Jing, Ab initio study of phase transition

and bulk modulus of NaH, Journal of Solid State Chemistry 184 (2011) 427–431.

[4] E. Zintl, A. Harder, Z. Phys. Chem. Abt. B 14 (1931) 265.

[5] X.W. Sun, L.C. Cai, Q.F. Chen, X.R. Chen, F.Q. Jing, Structural, thermodynamic,

electronic, and optical properties of NaH from first-principles calculations, Materials

Chemistry and Physics 133 (2012) 346– 355.

[6] D. Colognesi, M. Zoppi, Hydrogen vibrational dynamics in ionic metal hydrides revealed

through inelastic neutron scattering, Notiziari Neutroni E Luce Disincrotrone, 11 (2006) 4-

[7] G. Kresse, J. Furthmuller, Comput. Mater. Sci.6 (1996) 15.

[8] <http://cms.mpi.univie.ac.at/vasp>.

[9] P. Hohenberg, W. Kohn, Physical Review 136 (1964) B864–B871.

[10] W. Kohn, L.J. Sham, Physical Review 140 (1965) A1133–A1138.

[11] J. Perdew, J.A. Chevary, S.H. Vosko, K.A. Jackson, M.R. Pederson, D.J. Singh, C.

Fiolhais, Phys. Rev. B 46, 6671 (1992).

[12] G. Kresse, D. Joubert, Phys. Rev. B59 (1999) 1758.

[13] S. Shang, A.J. Bottger, M.P. Steenvoorden, M.W.J. Craje, Acta Mater. 54 (2006) 2407–

[14] P.E. Blöchl, O. Jepsen, O.K. Andersen, Physical Review B 49 (1994) 16223–16233.

[15] S.L. Shang, A. Saengdeejing, Z.G. Mei, D.E. Kim, H. Zhang, S. Ganeshan, Y. Wang,

Z.K. Liu, First-principles calculations of pure elements: Equations of state and elastic

stiffness constants, Computational Materials Science 48 (2010) 813–826.

[16] H.J. Monkhorst, J.D. Pack, Phys. Rev. B13 (1976) 5188–5192.

[17] F.D. Murnaghan, Proc. Natl. Acad. Sci. USA Vol. 30, (1944) 244.

[18] R. Miloua, Z. Kebbab, N. Benramdane, M. Khadraoui, F. Chiker, Ab initio prediction of

elastic and thermal properties of cubic TiO2, Computational Materials Science 50 (2011)

2142–2147.

[19] S. Boucetta, F. Zegrar, Density functional study of elastic, mechanical and

thermodynamic properties of MgCu with a CsCl-type structure, Journal of Magnesium

and Alloys 1 (2013) 128-133.

[20] J.F. Nye, Propriétés Physiques des Matériaux, Dunod, Paris, 1961.

[21] D.C. Wallace, Thermodynamics of Crystals, Wiley, New York, (1972).

[22] S.F. Pugh, Philos. Mag. 45 (1954) 823.

[23] P. Ravindran, L. Fast, P.A. Korzhavyi, B. Johansson, J. Wills, O. Eriksson, J. Appl.

Phys. 84 (1998) 4891.

[24] M.F. Yan, H.T. Chen, Structural, elastic and electronic properties of Cr2N: A first-

principles study, Computational Materials Science 88 (2014) 81–85.

[25] C. Zener, Elasticity and Anelasticity of Metals, University of Chicago Press, Chicago,

CONCLUSION GÉNÉRALE

Conclusion générale

Dans ce travail on déduit comment la combinaison de deux domaines importants : la

mécanique quantique et le data mining et ses méthodes (ACP et PLS), nous a permi d’étudier

un phénomène qui reste insoluble jusque-là pour les physiciens et les chimistes, qui est les

contradictions du tableau périodique avec la mécanique quantique. Le placement de certains

éléments dans le tableau périodique a été problématique depuis le premier tableau de Dimitri

Mendeleev en 1869.

Le tableau périodique des éléments, est la généralisation la plus importante en chimie,

il est souvent considéré comme un cas représentatif particulier dans l’étude de la relation entre

la chimie et la physique, et comme l'une des idées les plus unificatrices dans toute la science

moderne.

La tentative d'expliquer les détails du tableau périodique continue à défier l'ingéniosité

des physiciens quantiques et chimistes quantiques [2]. La mécanique quantique a la capacité

d’expliquer et reproduire la chimie, ce qui a permis aux physiciens d’aller au-delà du tableau

périodique des atomes neutres à l’état fondamental, et ce qui pourrait être interprété comme

une déclaration obtenue d'une réduction de la chimie à la physique [1]. La classification

périodique n'a pas encore sa forme définitive, et n'est pas entièrement cohérente avec la

mécanique quantique, à cause des anomalies qu'elle contient.

L’originalité de ce travail persiste dans l’usage de l’approche data mining et de ses

techniques, l’Analyse en composantes principales (ACP) et la régression (PLS), qui sont

appliquées pour la première fois dans l’étude de ce problème, et qui nous ont permi de

visualiser les corrélations existantes dans chaque base de données, et de voir de prés le

problème.

Par conséquent, les résultats obtenus montrent que le lutétium partage beaucoup de

similitudes avec les métaux de transition de la troisième période du tableau périodique, par

contre l'hydrogène partage certaines propriétés avec certains groupes du tableau périodique,

tel que le groupe du carbone, mais pas tout à fait; à vrai dire l'hydrogène est un élément à part,

et n’est conforme à aucun groupe.

Enfin on a calculé les propriétés structurales et mécaniques des hydrures alcalins par

les calculs ab initio implémentées dans le code VASP, dans le cadre de la Théorie de la

Fonctionnelle de la Densité DFT, les résultats obtenus ont été analysés en utilisant l’approche

datamining, et la technique d’Analyse en Composantes Principales (ACP) pour explorer les

similitudes et les corrélations existantes entre ce type d’hydrures. On a trouvé que les

hydrures alcalins sont des matériaux fragiles dans les conditions ambiantes, et que LiH est le

plus rigide et le plus fragile parmi ces hydrures, LiH est un matériau prometteur en industrie

des batteries rechargeables, et dans le stockage d’énergie.

Les résultats obtenus sont très intéressants, du point de vue scientifique, ils ont été

approuvés par de grands chercheurs travaillant sur ce problème. Cela prouve l’importance de

l’approche data mining et de ses techniques, l’Analyse en composantes principales (ACP) et

la régression (PLS) dans l’analyse et traitement de données.

Ce travail ouvre des horizons à l’usage de l’approche data mining et les techniques

d'analyse multivariée pour explorer et étudier des problèmes qui semblent sans issue.

Références

[1] V. N. Ostrovsky, « Physical Explanation of the Periodic Table », Ann. N. Y. Acad. Sci.

988 (2003) 182-192.

(2008). ISBN-13 978- 1-84816- 137-5.

Le résumé

La découverte de la structure de l’atome au début du vingtième siècle a

marqué une grande étape dans l’avancée des connaissances. De nombreux

phénomènes physiques et chimiques demeuraient sans interprétation tels que l’effet

Compton, l’effet Zeeman,…etc. Ce qui a conduit les physiciens et chimistes à

abandonner le modèle classique de la mécanique newtonienne et à introduire un

nouveau modèle qui est la mécanique quantique, ce qui a permis une interprétation

nouvelle de la classification périodique [1].

La mécanique quantique a été la théorie la plus spectaculaire réussi dans

l'histoire de la science. L'impact de la théorie a été ressenti dans des domaines tels que

la physique du solide, et la science des matériaux [2].

Bien qu'il soit évident que les tentatives pour expliquer la chimie en termes de

la théorie quantique ne peuvent apparaître suite au développement de la mécanique

quantique

au XXe siècle, ce type de réductionnisme ne date pas d'aujourd'hui. En général, le

réductionnisme est l'idée qu’une science, telle que la chimie, peut être réduite plus à

une science "fondamentale", dans ce cas, à la physique. la conception même du

réductionnisme supposant une hiérarchie dans les sciences entre les sciences plus

fondamentales, généralement la physique et les mathématiques, et ceux qui sont

considérées comme des dérivés ou des épiphénomènes, à commencer par la chimie, et

passant par la biologie aux sciences humaines comme la sociologie ou la psychologie

On objectera aisément à ce qui précède que même si la réduction n’existe pas

pour le moment elle peut jouer le rôle d’un idéal, d’un but à atteindre. N’a-t-elle pas

stimulé le développement de la chimie et de la physique au 19e siècle ? N’inspire-t-

elle pas aujourd’hui la biologie? Examinons cela. L’idée d’une réduction verticale

qui, de l’antiquité aux lumières, a été une thèse philosophique (l’atomisme) s’incarne

au 19e siècle dans l’hypothèse atomique des chimistes, puis dans la théorie cinétique

des gaz, dans la mécanique statistique, et finalement dans la “réalité moléculaire”

(selon l’expression de Jean Perrin). La théorie des quanta puis la mécanique quantique

donnent à l’atomisme des physiciens et des chimistes une justification plus profonde ;

elles expliquent que, comme le disait Bohr, il existe dans la nature une tendance à

produire des formes déterminées et à les faire réapparaître, encore et toujours, même

lorsqu’elles ont été perturbées ou détruites. Mais, en triomphant, l’atomisme a perdu

Le résumé

sa simplicité originelle. Les atomes ne sont plus insécables et inaltérables. L’existence

des molécules n’est plus un postulat de base de la chimie, mais un résultat de la

théorie quantique, valable sous certaines réserves. La postérité de l’atomisme s’est

scindée en deux branches bien distinctes : d’un côté la théorie savante, et les

techniques récentes de manipulation d’atomes ou de molécules presque isolées ; de

l’autre, l’idée de réduction verticale qui n’est plus une thèse philosophique ou une

hypothèse scientifique, mais est devenue une croyance.

Imaginons que la chimie, la physique du solide, la thermodynamique, la

mécanique classique enfin, soient toutes remplacées par la mécanique quantique,

devenue entièrement calculable après l’avènement d’ordinateurs d’un type nouveau.

L’industrie informatique réaliserait des chiffres d’affaires fabuleux. Mais l’idéal

d’intelligibilité qui a présidé à la naissance de la science serait mort et enterré, au

moins dans les sciences physiques ; car la mécanique quantique, qui calcule par ses

propres moyens et fournit des résultats d’une exactitude numérique étonnante, ne peut

guère se passer des béquilles de la physique classique quand on lui demande de nous

faire comprendre ce qui se passe. Par suite, les sciences physiques, débarrassées

désormais de toute incertitude et de toute nouveauté véritable, sombreraient dans un

océan d’ennui. En somme, même si la réduction devenait possible dans les sciences

physiques, elle ne les aiderait pas à remplir ce qui doit rester la tâche fondamentale de

toute science : nous aider à comprendre les phénomènes [10]. La mécanique

quantique a montré à quel point la séparation entre la physique et la chimie était

arbitraire [11].

Friedrich Paneth a clairement défini le statut épistémologique du concept

chimique de l'élément dans une conférence portant ce titre qu'il a donné en 1931. Ici,

il a soulevé deux questions. La première rappelle le problème d'Aristote avec « les

mixtes véritables », en quel sens peut-on supposer que les éléments persistent dans les

composés? " Sa réponse - basée sur une étude historique des notions d’éléments et

des atomes - est claire: puisque la chimie est concernée par les qualités secondaires

des substances, les chimistes devraient assumer la persistance des qualités dans les

composés. Il a proposé d'appeler ce qui persiste " substance de base " alors qu'il

réservait le terme " substance simple " pour la matière montrant des manifestations

phénoménologiques associées à cette substance de base abstraite, renouvelant de ce

fait la distinction conceptuelle de Mendeleev. La deuxième question de Paneth était: «

s’il est vrai ou non que la chimie doit et va se dissoudre dans la physique? " Ici, il a

Le résumé

traité la possibilité de reduire la chimie à la physique, un développement qui avait été

déjà prédit par certains physiciens.

La théorie quantique offre clairement des avantages considérables pour

l'enseignement de la chimie et, en particulier, pour la présentation du tableau

périodique, avec son explication du comment et du pourquoi les propriétés chimiques

des divers éléments obéissent à un modèle global. Néanmoins, ceci ne signifie pas que

les chimistes peuvent s'en sortir seuls avec la mécanique quantique. Le chimiste ne

peut pas s'isoler de ces développements et de se contenter d'exécuter et de décrire les

réactions. Il ne pourra pas tirer parti de ses succès précédents à moins qu'il assimile

les disciplines du physicien ou accepte de collaborer avec lui. Cette évolution de la

chimie vers la physico-chimie est est le trait le plus caractéristique de ces vingt

dernières années [9].

unificatrices dans toute la science moderne [12]. L'élément chimique est proche

d'une abstraction mathématique. Ainsi, il devient un instrument qui nous permet de

construire une série qui est supposée se cacher derrière. Cette abstraction permet au

chimiste de decrier l'ordre qui existe derrière la multiplicité apparente chaotique du

monde phénoménal. La plus grande valeur du concept de Mendeleev d'un élément

est sa puissance de construire la série apparentée. Les éléments chimiques sont

efficacement "désincarnés" les entités abstraites qui sont attachées au vrai monde par

le réseau des rapports décrits par le système périodique. Ce rapport abstrait-concret

est représenté par la position de l'élément dans le tableau périodique, qui forme

alternativement la base pour une multiplicité d'interprétation [13].

À mesure qu'augmentait le nombre d'éléments connus, les chimistes du XIXe

siècle éprouvaient le besoin de les ordonner. On connaissait les masses atomiques et

on avait déjà l'habitude de classer les éléments d'après l'augmentation de cette

caractéristique. La simple progression des masses atomiques ne pouvait toutefois

expliquer logiquement les différents comportements des éléments [14].

Il est en effet une sorte de miracle que la mécanique quantique explique le

tableau périodique. Mais nous ne devrions pas se laisser séduire en croyant que c’est

une explication déductive. Une chose qui est claire: est que la tentative d'expliquer les

détails de la classification périodique continue à défier l'ingéniosité des physiciens

quantiques et chimistes quantiques et que le tableau périodique continuera de

Le résumé

présenter un test concernant la pertinence des nouvelles méthodes développées en

chimie quantique. La réduction de la chimie à la mécanique quantique n'a ni

complètement échoué, comme certains philosophes de la science ont revendiqué, et

elle n'a pas été une réussite complète, comme certains historiens contemporains ont

revendiquée [12].

unificatrices dans toute la science moderne [9]. L'élément chimique est proche d'une

abstraction mathématique. Ainsi, il devient un instrument qui nous permet de

construire une série qui est supposée se cacher derrière. Cette abstraction permet au

chimiste de decrier l'ordre qui existe derrière la multiplicité apparente chaotique du

monde phénoménal. La plus grande valeur du concept de Mendeleev d'un élément

est sa puissance de construire la série apparentée. Les éléments chimiques sont

efficacement "désincarnés" les entités abstraites qui sont attachées au vrai monde par

le réseau des rapports décrits par le système périodique. Ce rapport abstrait-concret

est représenté par la position de l'élément dans le tableau périodique, qui forme

alternativement la base pour une multiplicité d'interprétation [10].

À mesure qu'augmentait le nombre d'éléments connus, les chimistes du XIXe

siècle éprouvaient le besoin de les ordonner. On connaissait les masses atomiques et

on avait déjà l'habitude de classer les éléments d'après l'augmentation de cette

caractéristique. La simple progression des masses atomiques ne pouvait toutefois

expliquer logiquement les différents comportements des éléments [12].