Applicazioni di meccanica quantistica: appunti per le lezioni
E. Bodo
21 novembre 2008
Indice
1 Istituzioni di meccanica quantistica 5
1.1 Stati, operatori e osservabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.3 Autovalori, autovettori, autostati . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.4 Basi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Postulati interpretativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Misure e valore medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.2 Riduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 Sovrapposizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 Evoluzione temporale e costanti del moto . . . . . . . . . . . . . . . . . . . . . . 10
1.2.5 Osservabili compatibili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 Rappresentazione matriciale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1 Il cambio di base di rappresentazione . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Sistemi a due stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5 Lo spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6 Momenti angolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.7 Sistemi a due particelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.8 Funzione dâonda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.9 Simmetria in meccanica quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.10 Lâequazione di SchrĂśdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.10.1 Autofunzioni ed energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.11 Principio e metodo variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.11.1 Principio variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.11.2 Metodo variazionale lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.12 Energie e strutture molecolari: problema elettronico (ab-initio) e problema nucleare (dina-mica) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.13 La dinamica delle molecole: lâapprossimazione di Born-Oppenheimer, la vibrazione erotazione delle molecole biatomiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1
INDICE 2
1.13.1 Lâapprossimazione di Born-Oppenheimer . . . . . . . . . . . . . . . . . . . . . . 35
1.13.2 Il moto delle molecole biatomiche: rotazione e vibrazione . . . . . . . . . . . . . 37
1.13.3 Lâapprossimazione armonica alle energie molecolari . . . . . . . . . . . . . . . . 39
1.13.4 LâHamiltoniano ro-vibrazionale âesattoâ: la rotazione molecolare e le barriere cen-trifughe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.14 Lâottimizzazione delle geometrie molecolari usando lâenergia elettronica (cenni). . . . . . 41
1.15 Teoria delle perturbazioni indipendente dal tempo . . . . . . . . . . . . . . . . . . . . . . 42
2 Energie elettroniche: Hartree Fock 45
2.1 Introduzione di una base atomica nel caso closed-shell: le equazioni di Roothaan. . . . . . 49
2.2 Un-restricted Harteee-Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.3 I Basis Set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3.1 Slater e Gaussian type functions (GTO) . . . . . . . . . . . . . . . . . . . . . . . 54
2.3.2 Classificazione dei set di base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3.3 Basis set contratti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.3.4 Basi comuni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Basi di Pople . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Basi correlation consistent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4 Orbitali molecolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3 Energie elettroniche: metodi post Hartee-Fock 64
3.1 Energia di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.2 Metodi Variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.2.1 Determinanti eccitati e autofunzioni di S2 (Configuration State Functions, CSF) . . 66
3.2.2 CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Cenni matematici della procedura Full-CI . . . . . . . . . . . . . . . . . . . . . . 69
3.2.3 Singole e doppie CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.4 Come Full-CI risolve il problema della correlazione e il problema della dissocia-zione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.2.5 MCSCF (CAS-SCF) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
CAS-SCF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.6 Il problema della size-consistency . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3 Metodi non variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3.1 Metodi perturbativi MP2 e MP4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3.2 I metodi Coupled Cluster (cenni) . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.4 Simboli di termine, configurazioni elettroniche (atomi e molecole lineari) . . . . . . . . . 78
3.4.1 Accoppiare gli spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.4.2 Accoppiamento dei momenti angolari orbitali . . . . . . . . . . . . . . . . . . . . 79
INDICE 3
4 Descrizione Born Oppenheimer delle molecole 81
4.1 Calcolo degli stati legati delle curve Born Oppenheimer . . . . . . . . . . . . . . . . . . . 81
4.1.1 Il metodo di integrazione di Numerov per le equazioni differenziali al secondo ordine 82
4.1.2 Condizioni al contorno e divergenza della funzione dâonda . . . . . . . . . . . . . 82
4.1.3 Il metodo dello âShootingâ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
A Gli spazi di Hilbert 86
A.1 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
A.2 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
A.3 Spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
A.3.1 Basi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
B Il programma LEVEL 90
INDICE 4
Lo scopo di questo corso (4 CFU, 40 ore) è quello di fornire agli studenti unâintroduzione di alcuni con-cetti di base della chimica quantistica computazionale utilizzando anche esercitazioni pratiche. Si intendepresentare agli studenti un quadro il piĂš generale possibile di alcune applicazioni che esistono nella ricer-ca moderna sulle proprietĂ nanoscopiche dei sistemi molecolari in fase gassosa. Lo scopo sarĂ quello didiscutere in dettaglio alcune tra le piĂš semplici metodologie di calcolo oggi impiegate per costruire deimodelli realistici descriventi il comportamento elementare dei processi chimici.
La prima parte del corso riguarda lo studio delle proprietĂ elettroniche delle molecole. VerrĂ esaminato ilmetodo di Hartree-Fock per il calcolo delle energie molecolari e la questione della scelta del set di base. Aqueste lezioni verrĂ affiancata unâesercitazione pratica in cui si utilizza il programma GAMESS. Verrannopoi accennati i metodi di calcolo piĂš avanzati con particolare attenzione alla loro applicazione nei variproblemi di calcolo. Una seconda esercitazione pratica verrĂ svolta utilizzando i metod âpost-Hartree-Fockâ per la costruzione di curve di energia potenziale molecolari.
La seconda parte del corso riguarda invece il moto dei nuclei nel loro caso piĂš semplice (una molecolabiatomica). VerrĂ descritto uno dei possibili metodi di integrazione comunemente utilizzato per calcolaregli stati legati vibrazionali di una molecola biatomica. Una terza esercitazione verrĂ utilizzata per il calcolopratico degli stati legati di due molecole.
Il materiale contenuto in questi appunti proviene in parte da diverse sorgenti: gli appunti di meccanicaquantistica di Elio Fabri (docente allâUniversitĂ di Pisa), il libro âAdvanced quantum chemistryâ di A.Szabo e âMeccanica quantistica modernaâ di J. J. Sakurai.
Capitolo 1
Istituzioni di meccanica quantistica
1.1 Stati, operatori e osservabili
1.1.1 Stati
La struttura matematica e concettuale della meccanica quantistica è abbastanza semplice: occorre introdur-re due concetti fondamentali, quello di stato di un sistema fisico e quello di osservabile. Lâinsieme deglistati possibili di un sistema fisico viene descritto in meccanica quantistica da uno spazio vettoriale suicomplessi dotato di prodotto scalare. Lo spazio vettoriale può essere a dimensione finita o infinita. Inmolti casi sarĂ sufficiente considerare uno spazio con numero finito di dimensioni ed in questo caso esso siriduce al familiare spazio Cn ( o anche Rn). Quando invece è necessario lavorare con unâinfinitĂ numerabiledi dimensioni, si richiede una struttura topologica e lo spazio diviene uno spazio di Hilbert. Indipenden-temente dalle dimensioni, lo spazio verrĂ sempre indicato con H . Ciò premesso, il concetto di stato hauna precisa traduzione matematica: quella di raggio unitario dello spazio H . Il termine "raggio" designaun sottospazio (s.s.) unidimensionale di H (lâequivalente di una retta passante per lâorigine in R3), ossialâinsieme dei vettori che differiscono tra loro solo per un moltiplicatore scalare (un numero complesso). Iltermine "unitario" restringe lâinsieme ai vettori di norma 1 (che non formano quindi piĂš un s.s. lineare).Due vettori di uno stesso raggio unitario possono differire solo per un moltiplicatore scalare di modulo 1,ossia per un fattore di fase eiĎ (Ď reale). Indicheremo uno stato per mezzo di uno dei vettori appartenenti alraggio unitario corrispondente. OccorrerĂ però non dimenticare mai lâarbitrarietĂ del fattore di fase.
Qui adotteremo il piĂš possibile, per vettori, operatori, e per altri enti che incontreremo, la notazione diDirac, che differisce da quella in uso in matematica. Eâ apparentemente piĂš pesante, ma presenta sostanzialivantaggi per lâapplicazione fisica. Il generico elemento di H (un vettore anche non unitario) sarĂ indicatocon un ket, ossia con la scrittura:
|. . .ă
ove al posto dei ". . ." scriveremo qualsiasi simbolo o insieme di simboli che risulti conveniente per indivi-duare il vettore. Per esempio, gli stati legati di un atomo dâidrogeno potranno essere descritti da |n, l,mă;uno stato di polarizzazione di un fotone potrĂ essere indicato con |+ă, etc.
Eâ noto che ad ogni spazio vettoriale si può associare il suo duale (vedi appendice A a pagina 86). Peruno spazio dotato di prodotto scalare, câè un anti-isomorfismo naturale fra lo spazio e il suo duale, chefa corrispondere a un vettore u il funzionale prodotto scalare (u, v) (qui siamo temporaneamente tornatiallâusuale notazione matematica). Eâ importante tener presente che il prodotto scalare (u, v) è lineare in v,ma è antilineare in u: se u = ax+by, vale (u, v) = aâ(x, v)+bâ(y, v)). Per ricordare questo, Dirac adottaper gli elementi del duale la notazione bra:
ău| è il vettore duale di |uă
5
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 6
Coerentemente, il prodotto scalare fra ău| e |vă è indicato con ău|vă. In particolare è importante il prodottoăv|vă che per un vettore unitario (o normalizzato ) è ăv|vă= |v|2 = 1.
1.1.2 Operatori
Il concetto di osservabile fisica si traduce in quello di operatore lineare autoaggiunto (a.a.) su H . Se Hè finito, invece di a.a. basta dire hermitiano. Gli operatori e le corrispondenti osservabili verranno di solitoindicati con lettere latine maiuscole: pertanto lâazione di un operatore su un vettore potrĂ essere scrittacome
M |m,n, lă
Se A è un operatore, si chiama elemento di matrice e fra i vettori u e v lâespressione ău|A|vă. Si dice che Aâ
è lâoperatore aggiunto di A se:ăv|Aâ |uăâ = ău|A|vă (1.1)
La definizione di operatore a.a. o hermitiano è ovvia ed è la seguente1: A è a.a. se Aâ = A, ossia seăv|A|uă = ău|A|văâ. Gli operatori che rappresentano osservabili fisiche sono operatori lineari ed a.a. Selo spazio vettoriale degli stati possibili è finito, lâoperatore può essere rappresentato come una matricedi numeri complessi e, in particolare, un operatore hermitiano verrĂ rappresentato da una matrice che hanumeri complessi nel triangolo superiore, i loro complessi coniugati nel triangolo inferiore e reali sulladiagonale. Se la matrice fosse reale sarebbe invece semplicemente simmetrica.
Il prodotto di due operatori AB rappresenta lâeffetto combinato di agire con B su un vettore e quindi agirecon A sul vettore risultante. Lâeffetto di BA su uno stato arbitrario non è sempre uguale a AB: in questo casosi dice che gli operatori A e B non commutano. La differenza ABâBA è detta commutatore e si scrive inmaniera compatta [A, B]. In pratica, la maggior parte delle informazioni che abbiamo sugli operatori vieneproprio dallo studio dei loro commutatori.
1.1.3 Autovalori, autovettori, autostati
Richiamiamo la definizione di autovettore e autovalore di un operatore A: si dice che |aă è autovettore di Acon autovalore a 6= 0 e a â C se
A |aă= a |aă (1.2)
Si dimostra che gli autovalori di un operatore a.a. sono reali e che gli autovettori appartenenti ad autovaloridiversi sono ortogonali.
Dimostrazione: Dato un operatore autoaggiunto A e due suoi autovalori a1 e a2abbiamo
A |1ă = a1 |1ăA |2ă = a2 |2ă (1.3)
1In notazione matematica le definizioni date sono piĂš semplici da ricordare e da capire: il prodotto scalare (vediappendice A a pagina 86) si scrive (u, v) e il prodotto nellâordine inverso ne è il complesso coniugato (u, v) = (v, u)â.Questo nella notazione di Dirac sarebbe ău|vă= ăv|uăâ. Lâaggiunto di un operatore A è detto Aâ e soddisfa la relazione
âu, v (u, Av) = (Aâ u, v)
che si può anche scrivere come(u, Av) = (v, Aâ u)â
che viene tradotta nella notazione di Dirac come
ău|A|vă= ăv|Aâ |uăâ
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 7
premoltiplicando la prima per ă2| e la seconda per ă1| otteniamo
ă2|A|1ă = a1 ă2|1ăă1|A|2ă = a2 ă1|2ă (1.4)
sottraendo la coniugata della seconda dalla prima si ottiene
ă2|A|1ăâă1|A|2ăâ = 0 = (a1âaâ2)ă2|1ă (1.5)
se i due autovettori sono uguali allora a1 = aâ2 che significa che i lâautovalore è reale. Se i due autovettori sono diversiallora risulta ncessariamente che ă2|1ă= 0 cioè che siano ortogonali.
Lâinsieme degli autovalori di un operatore in generale viene detto spettro. Va osservato che se |aă è auto-vettore di A per lâautovalore a, lo stesso è vero per qualsiasi suo multiplo scalare: quindi ad ogni autovaloreè associato lâintero sottospazio unidimensionale cosĂŹ generato. Eâ perciò naturale parlare di autostato.
Può però accadere che gli autovettori associati a un dato autovalore formino un sottospazio di H di dimen-sione n > 1. In questo caso si dice che lâautovalore è degenere, con degenerazione n (o n volte degenere).Quindi ad autovettori distinti corrisponde uno stesso autovalore. In generale non è detto che autovettori diquesto tipo siano ortogonali (in eq. (1.5) davamo per scontato che non ci fosse degenerazione). Eâ semprepossibile comunque derivare una serie di autovettori ortogonali da un insieme di autovettori degeneri.
1.1.4 Basi ortonormali
Si chiama base ortonormale di H un insieme (finito o numerabile) di vettori |kă unitari e tra loro ortogonali,tale che ogni vettore |vă di H sia esprimibile come combinazione lineare dei |kă:
v = âk
ck |kă (1.6)
Ancora una volta, la (1.6) è semplice solo se H è finito (è una somma finita). Altrimenti si tratta di unaserie, e lâuguaglianza va intesa nel senso di convergenza in norma (vedi lâappendice A). Si ricordi che dalla(1.6) segue
ăv|vă= âk|ck|2 = 1 (1.7)
se |vă è unitario. Se H è finito si dimostra che ogni op. hermitiano possiede una base ortonormalecostituita dai suoi autovettori. Non è detto che tale base sia unica, come è dimostrato dal caso limitedellâop. I (identitĂ ), per il quale ogni base va bene. Se e solo se gli autovalori sono tutti non degeneri, ossiase esistono tanti autovalori distinti quanta è la dimensione di H , allora la base è unica.
Concludiamo questo argomento enunciando un problema: abbiamo visto che alcune osservabili hannouna base di autovettori. Se abbiamo due diverse osservabili, ciascuna avrà la sua base di autovettori; mapossono essere la stessa? Sotto quali condizioni? La risposta sta nel seguente teorema: condizione nec. esuff. perchÊ due oss. A, B abbiano una base comune di autovettori è che esse commutino.
Dimostrazione: Se abbiamo due operatori che agiscono su s.s. di H differenti2, questi ovviamente commutano e iloro autostati in comune sono dati dal prodotto diretto dei loro autostati.
Se invece i due operatori agiscono sullo stesso spazio hanno una base di autovettori in comune solo se commutano:supponiamo di avere due operatori A e B che commutano e di conoscere gli autovettori |aă del primo
A |aă= a |aă
dato che i due operatori commutano potremo scrivere
AB |aă= BA |aă= Ba |aă= aB |aă2In termini di coordinate si direbbe che i due operatori agiscono su coordinate differenti.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 8
il che significa che il vettore B |aă è a sua volta unâautofunzione di A con autovalore a e quindi deve essere proporzionalea |aă. Questo implica che |aă è sia un autovettore di A che di B. Questo è vero nellâimplicita assunzione che a nonfosse degenere, nel qual caso tutto quello che si può dire è che B |aă è una qualche combinazione degli autovettori |kădel s.s. inviduato dallâautovalore a:
B |aă=s.s.(a)
âk
cak |kă
1.2 Postulati interpretativi
1.2.1 Misure e valore medio
Sul sistema è possibile eseguire misure del genere piÚ diverso. PoichÊ una misura fornisce sempre unrisultato (un numero reale), assumeremo che si tratti sempre della misura di una qualche osservabile e chetutte le osservabili possano essere sottoposte a misura. Un primo postulato interpretativo della meccanicaquantistica asserisce:
I possibili risultati della misura di unâosservabile sono i suoi autovalori.
Un secondo postulato è il seguente:
Se il sistema si trova nello stato |aă , autostato dellâosservabile A con autovalore a, la misuradi A fornirĂ con certezza il risultato a.
In questo genere di trattazione trascuriamo del tutto lâesistenza di errori di misura, ovvero assumiamoche possano essere ridotti piccoli a piacere. La questione non è affatto banale nel caso di osservabili conautovalori continui, che almeno per ora non vogliamo prendere in esame.
Che cosa accade se il sistema è in uno stato che non è autostato di A, ed eseguiamo una misura di A?Risponde un ulteriore postulato:
Se il sistema si trova nello stato |xă che non è autostato di A, una misura di A può fornire comerisultato uno qualsiasi degli autovalori di A.
Il risultato della misura è intrinsecamente indeterminato, nel senso che se si ripete la misura piĂš volte sulsistema preparato sempre nello stesso stato, si ottengono in generale risultati diversi. Eâ evidente che siamodi fronte al piĂš caratteristico postulato della meccanica quantistica: è quello che afferma lâindeterminismointrinseco della teoria. Si tratta di un indeterminismo non derivante solo da insufficiente informazione dellosperimentatore.
Lâasserzione dellâultimo postulato è precisata dal seguente (teorema del valor medio):
Sia |kă una base di autovettori di A, per gli autovalori ak . Sia poi
|xă= âk
ck |kă (1.8)
lo sviluppo di |xă nella base |kă. Allora la misura di A sullo stato |xă , ripetuta piu volte, fornirĂ il valore ak con probabilita |ck|2.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 9
Non è escluso che A abbia autovalori degeneri, ossia che alcuni degli ak coincidano. In tal caso laprobabilita del risultato è la somma dei corrispondenti |ck|2.
Si puo dare, come conseguenza di questi postulati, unâinteressante interpretazione dellâespressione ăx|A|xă. Calcoliamo infatti
ăx|A|xă= âk
ck ăx|A|kă= âk
ckak ăx|kă= âk|ck|2ak (1.9)
Otteniamo quindi che se si ripete la misura di A sullo stato |xă, la media dei risultati vale ăx|A|xă. Per questaragione useremo sempre il nome valore medio di A sullo stato |xă. Nota: Abbiamo scritto "sullo stato,"e non "sul vettore," perchĂŠ ăx|A|xă rimane invariato se si moltiplica |xă per un fattore di fase. Eâ quindideterminato dallo stato.
1.2.2 Riduzione
Per esaurire la lista dei postulati interpretativi ne manca ancora uno, che risponde alla domanda: che cosaaccade allo stato quando si esegue una misura? Nella fisica classica un problema del genere non si pone,perchĂŠ si da per scontato che unâoperazione di misura non alteri apprezzabilmente lo stato del sistema; omeglio, che si possa organizzare la misura in modo da rendere tale alterazione piccola quanto si vuole. Ilcomportamento dei sistemi quantistici mostra però che questo non è possibile: unâoperazione di misuraperturba necessariamente il sistema e ne altera lo stato. Ecco il postulato:
Se si esegue sullo stato |xă una misura dellâosservabile A, che porta al risultato ak, immedia-tamente dopo la misura il sistema si trova nellâautostato |kă di A.
Nota: Si deve dire "immediatamente dopo" perchĂŠ in genere lo stato cambierĂ nel tempo. In realtĂ ilpostulato di riduzione, nella formulazione appena scritta, non è sufficientemente generale, in quanto nondice che cosa accade quando un autovalore è degenere. Infatti in tal caso lâautostato di cui parla il postulatonon è unico. Occorre quindi precisarlo come segue:
Se lâautovalore ak è degenere, lo stato dopo la misura è la proiezione ortogonale normalizzatadi |xă nel s.s. appartenente ad ak.
Eâ importante un caso particolare: se |xă è autostato di A, non solo la misura fornisce con certezza ilcorrispondente autovalore, ma lo stato non viene influenzato dalla misura.
Esempio: Consideriamo una f.d.o. di un atomo dâidrogeno data dalla seguente espressione
Ď = a[2p0 +2pâ1â2p1]+b[3p0â3pâ1]
dove abbiamo indicato le funzioni degli orbitali idrogenoidi con la notazione nlm.
1. Se venisse misurato il valore del momento angolare L2, essendo tutte funzioni di tipo p con l = 1 si otterrebbesicuramente lâautovalore 2h2. La f.d.o è infatti unâautofunzione di L2 e quindi rimane inalterata dopo lâazionedellâoperatore e quindi dopo la misura.
2. Se si misura Lz si potrebbero ottenere invece i valori 0h, 1h e â1h con probabilitĂ rispettivamente date da|a|2 + |b|2, |a|2 e |a|2 + |b|2.
3. Dopo una misura di Lz, se fosse stato ottenuto il valore â1h, la f.d.o sarebbe data da (rinormalizzando)
Ď =1â
|a|2 + |b|2(a ¡2pâ1âb ¡3pâ1)
che risulta ancora una autofunzione di L2.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 10
1.2.3 Sovrapposizione
La connessione tra gli stati fisici di un sistema e i raggi unitari di uno spazio di Hilbert differenzia pro-fondamente la meccanica quantistica dalla fisica classica. Dati due stati |uă, |vă ha senso eseguire una lorocombinazione lineare, con coefficienti complessi qualsiasi:
|wă= Îą |uă+β |vă (1.10)
Il nuovo stato |wă è diverso da ciascuno dei due di partenza, e si dice che ne è sovrapposizione. Il concettodi sovrapposizione è la novitĂ della meccanica quantistica: non ha infatti alcun corrispettivo in fisica clas-sica. Per rendersene conto, consideriamo un caso particolare: quello in cui |uă, |vă sono autostati di unastessa oss. A, con autovalori diversi au e av. Eâ allora facile verificare che |wă non è autostato di A, e cheuna misura di A potrĂ fornire i due valori au, av con certe probabilitĂ . In questo senso |wă appare essereuna specie di "miscela" dei due autostati. Si noti però che solo i valori au, av sono possibili risultati di unamisura di A, e nessun altro: neppure un qualche valore intermedio fra i due. Lâesistenza di una sovrappo-sizione si manifesta solo col fatto che il risultato non è piu certo, ma si distribuisce fra due possibili, condate probabilitĂ . Ma può anche accadere lâopposto: che nĂŠ |uă nĂŠ |vă siano autostati di A, mentre |wă lo è.Può dunque capitare che la misura non dia risultato certo nĂŠ su |uă nĂŠ su |vă, mentre ciò accade se si fa lamisura sullo stato |wă. Quindi una sovrapposizione non agisce sempre nel senso di accrescere lâincertezzadel risultato di una misura, e questo di nuovo esce da qualsiasi schema classico.
1.2.4 Evoluzione temporale e costanti del moto
Per concludere questo veloce sommario sugli elementi di base della meccanica quantistica, dobbiamoparlare del modo in cui evolve nel tempo lo stato di un sistema. Finora il tempo non è intervenuto neldiscorso; ora dovremo tener presente e che in generale lo stato di un sistema cambia nel tempo, e converrĂ mostrare esplicitamente questo fatto, introducendo la variabile t fra i simboli che caratterizzano lo stato.CosĂŹ |tă indicherĂ un generico stato con la sua variazione nel tempo: potremo supporre, ad esempio, cheesso sia stato preparato al tempo t0 come |t0ă e poi lasciato evolvere indisturbato. La forma piu sempliceper la legge di evoluzione temporale di uno stato è lâequazione di SchrĂśdinger
ihâ
â t|tă= H |tă (1.11)
che è unâeq. differenziale di primo ordine; quindi la soluzione sarĂ determinata assegnando la condizioneiniziale |t0ă. A secondo membro compare lâoperatore a.a. H, lâhamiltoniana del sistema. Come si vede,la conoscenza di H è tutto ciò che occorre per determinare lâevoluzione temporale. Si noti che la (1.11) èomogenea nella funzione incognita |tă: ciò significa che una sovrapposizione si conserva nel tempo: se
|t0ă= Îą |a, t0ă+β |b, t0ă (1.12)
anche, per ogni t:|tă= Îą |a, tă+β |b, tă (1.13)
Una seconda proprietĂ si trova facendo lâipotesi che lo stato iniziale sia un autostato |Eă di H. Allora la(1.11) ha lâintegrale
|E, tă= eâiEth |E,0ă (1.14)
come si verifica direttamente. La (1.14) mostra che un autostato di H rimane inalterato nel tempo: infattiil corrispondente vettore viene moltiplicato solo per un fattore di fase. Per questa ragione gli autostati diH si chiamano stati stazionari. Invece, uno stato che sia sovrapposizione di due (o piÚ) autostati di H conautovalori diversi cambia nel tempo perchÊ il fattore di fase nella (1.14) è diverso per i vari autovettori.
Dato che H è a.a., ed ha quindi una base di autovettori, ogni vettore può essere sviluppato come combina-zione lineare di autovettori di H:
|x,0ă= âk
ck |Ekă (1.15)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 11
e perciò, usando la (1.14) per ciascun termine a secondo membro:
|x, tă= âk
ckeâiEkt
h |Ekă (1.16)
che mostra come si risolve in generale lâeq. di SchrĂśdinger se si conoscono gli stati stazionari. Conseguen-za ovvia, ma importante in sĂŠ, dellâesistenza degli stati stazionari è la seguente: il valor medio di qualsiasiosservabile su uno stato stazionario non cambia e nel tempo. Va da sĂŠ che se lo stato non è stazionario,le probabilitĂ e i valori medi per una generica osservabile cambiano nel tempo. Ci si può chiedere se nonesistano particolari osservabili per cui questo non accade; piĂš esattamente, se vi siano osservabili tali chele probabilitĂ (e quindi il valor medio) su qualunque stato non dipendono dal tempo. Tale osservabile sidice costante del moto. Si può dimostrare che le costanti del moto sono tutte e sole le osservabili checommutano con H.
Problema: dato un sistema in uno stato non-stazionario descritto in generale da
|xă= âj
C jeâiE jth | jă
mostrare che il valore medio dellâenergia non varia con il tempo, mentre quello di altre osservabili varia.
Soluzione: Il valore medio dellâenergia si scrive
ăx |H|xă= âi j
Câi ei Eit
h ăi|H| jăC jeâiE jth
dal momento che i | jă sono autostati di H e quindi ăi|H| jă= δi jE j abbiamo
ăx |H|xă= âi j
Câi ei Eit
h δi jE jC jeâiE jth = â
i jCâ
i C jδi jE jeâi(E jâEi) th = â
j|C j|2E j
che non dipende dal tempo. Per altre osservabili avremmo invece
ăx |A|xă= âi j
Câi eâi
E jth ăi|A| jăC jeâi
E jth
che non si può ridurre perchĂŠ, in generale, ăi|A| jă 6= A jδi j e quindi è dipendente dal tempo. Le uniche osservabili per lequali il valor medio è indipendente dal tempo su stati non stazionari, cioĂŠ le cosidette âcostanti del motoâ sono quelleper cui ăx|A|xă= A jδi j cioĂŠ quelle per le quali [A, H] = 0.
1.2.5 Osservabili compatibili
I postulati interpretativi ci dicono che cosa aspettarsi quando si esegue la misura di unâoss. In fisica classicaperò è possibile misurare insieme due o piĂš grandezze, ed è perciò naturale chiedersi come si presenta lasituazione secondo la meccanica quantistica. Cominciamo col rispondere a una domanda connessa: datouno stato |xă e due oss. A, B, in quali casi la probabilitĂ congiunta delle misure di A e di B non dipendedallâordine? Si dimostra che condizione nec. e suff. perchĂŠ la probabilitĂ congiunta dei risultati dellemisure di due oss. sia indipendente dal lâordine, è che le oss. commutino. Se questo accade, lâordine incui si eseguono le misure non conta; il che vuol dire che lâoperazione di misura dellâuna non influenzala misura dellâaltra (come accade sempre in fisica classica). Si dice allora che le oss. sono compatibili.Dunque:
due osservabili sono compatibili se e solo se commutano.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 12
1.3 Rappresentazione matriciale
Come abbiamo visto nella sezione precedente (e nellâappendice A), negli spazi di Hilbert a dimensionefinita H cioè nei familiari spazi vettoriali Rn o Cn, esistono basi complete di vettori ortonormali |iăn
i=1con cui si possono esprimere tutti gli altri vettori di stato
|aă=n
âi=1
ai |iă (1.17)
Possiamo quindi descrivere il vettore di stato |aă semplicemente facendo riferimento alle sue componenti ainella base |iăn
i=1. Le componenti ai sono numeri complessi (in generale) e sono dati dal prodotto scalare:ai = ăi|aă.
Le componenti sono in numero finito e possono essere arrangiate in un vettore colonna
a =
a1a2...
aN
(1.18)
Il vettore a è la rappresentazione dello stato astratto |aă nella base finita dei vettori |iă. Lâaggiunto di unvettore colonna è un vettore riga del tipo
aâ = (aâ1, aâ2, . . .aâN) (1.19)
che non è altro che la rappresentazione del vettore astratto ăa|. Il prodotto scalare nello spazio Cn diventaquindi un prodotto righe per colonne cioeâ una somma di prodotti di componenti:
ăa|bă= aâ b = (aâ1, aâ2, . . .aâN)
a1a2...
aN
= âi
aâi bi (1.20)
Come abbiamo fatto precedentemente, possiamo definire un operatore A come un oggetto che agisce su unket trasformandolo in un altro
A |aă= |bă (1.21)
Un operatore è completamente definito se conosciamo il suo effetto sui vettori di base
A |iă= âj| jăă j|A|iă= â
j| jăAi j (1.22)
dove Ai j sono gli elementi della matrice A che è detta rappresentazione matriciale dellâoperatore A nellabase |iă.
In questâultimo passaggio abbiamo fatto uso del cosidetto teorema di completezza cioè che
âi|iăăi|= 1 .
Questâultima relazione molto importante discende direttamente dal teorema di espansione:
|aă= âi
ai |iă (1.23)
doveai = ăi|aă
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 13
quindi possiamo riscrivere la relazione (1.23) come
|aă= âi|iăai = â
i|iăăi|aă=
(â
i|iăăi|
)|aă
da cui si vede che lâespressione in parentesi è lâoperatore identita I: La scrittura |iăăi| non è che il prodotto tensorialedi un vettore di H per uno del duale H â, quindi un operatore su H : lo indicheremo con Pi. Per capirne il significato,applichiamolo a un generico |uă:
Pi |uă= (|iăăi|) |uă= |iăăi|uăOtteniamo un vettore parallelo a |iă, ma moltiplicato per il coefficiente ăi|uă. Si tratta dunque della proiezione di |uă su|iă. Per questa ragione Pi prende il nome di proiettore associato al vettore |iă.
Eâ anche possibile ottenere la rappresentazione matriciale del prodotto di due operatori AB.
ăi|AB| jă= âkăi|A|kăăk|B| jă= â
kAikBk j (1.24)
che rappresenta lâespressione di un prodotto righe per colonne tra due matrici A ¡B.
1.3.1 Il cambio di base di rappresentazione
Abbiamo visto che in uno spazio di Hilbert la scelta della base di rappresentazione non è unica 3. Eâimportante conoscere il metodo per passare da una rappresentazione |iă ad unâaltra |Îąă. Entrambe le basisono complete quindi è possibile esprimere i ket di una nellâaltra
|Îąă= âi|iăăi|Îąă= â
iUiÎą |iă (1.25)
dove abbiamo definito la matrice di trasformazione U di elementi UiÎą . La trasformazione nella direzioneopposta ci fornisce
|iă= âÎą
|ÎąăăÎą|iă= âÎą
UâiÎą |Îąă= â
Îą
(Uâ )Îąi |Îąă (1.26)
perchĂŠ ăÎą|iă= ăi|Îąăâ e dove abbiamo usato gli elementi UâiÎą della matrice aggiunta (cioè trasposta coniu-
gata) Uâ . La matrice di trasformazione ha lâimportante proprietĂ di essere unitaria4
UUâ = 1 (1.27)
infatti i suoi elementi
(UUâ )i j = âÎą
ăi|ÎąăăÎą| jă= âÎą
(U)iÎą(Uâ )Îą j = ăi| jă= δi j (1.28)
sono non-nulli solo sulla diagonale dove valgono uno. Quindi due basi di rappresentazione diverse sonoconnesse da una matrice unitaria. In uno spazio a dimensione finita le due basi sono connesse da unarotazione dei loro vettori di base.
3Questo è banalmente vero se si pensa a due basi date dagli autovettori di operatori non commutanti, ma può succedere anchequando i due operatori commutano: quando uno degli operatori possiede autovettori degeneri. Esiste però un teorema importantedellâalgebra degli spazi vettoriali che ci assicura che ogni base in Rn, o in generale negli spazi a dimensione finita, ha lo stessonumero di elementi.
4Le matrici unitarie sono definite come quelle matrici la cui inversa è uguale allâaggiunta
Aâ1 = Aâ
in fisica sono importanti percheâ possono essere usate per rappresentare le operazioni di rotazione in quanto essendo âunitarieâ nonalterano la lunghezza dei vettori su cui operano, ma solo la loro direzione. Eâ altresĂŹ vero che non tutte le matrici unitarie rappresentinorotazioni.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 14
Dato un operatore O la cui rappresentazione sia O nella base |iă e Ί in quella |Îąă, la relazione tra O e Ί sitrova utilizzando il teorema di completezza
Ίιβ = ăÎą|O|β ă= âi jăÎą|iăăi|O| jăă j|β ă== â
i jUâ
iÎą Oi jU jβ = âi j
(Uâ )
ιi (O)i j (U) jβ (1.29)
che in forma matriciale può essere scritto come un prodotto righe per colonne delle tre matrici
= Uâ OU (1.30)
quindi anche le rappresentazioni di operatori sono legate da una trasformazione unitaria U.
Lâimportanza dellâesistenza di tale trasformazione sta nel fatto che, dato un operatore Hermitiano la cuirappresentazione nella base |iă O non è diagonale, è sempre possibile trovare una base |Îąă in cuilâoperatore ha rappresentazione diagonale Ίιβ = ĎÎą διβ , dove ĎÎą sono gli autovalori dellâoperatore O. Inaltre parole, cambiando base di rappresentazione, si vuole diagonalizzare la matrice O. Il problema delladiagonalizzazione è quindi equivalente a quello di trovare una matrice unitaria U che converte O nel modoseguente
Uâ
o11 o12 ¡ ¡ ¡ o1no21 o22 ¡ ¡ ¡ o2n
......
. . ....
on1 on2 ¡ ¡ ¡ onn
U = Ď =
Ď1 0
Ď2. . .
0 Ďn
(1.31)
Esistono molti differenti algoritmi che permettono di trovare U. In genere non è necessario conoscere tuttii dettagli dellâalgoritmo, ma basta saperlo usare come una specie di âscatola neraâ in cui entra O ed esconogli autovalori Ď e U (quindi gli autovettori). Il procedimento per trovare gli autovalori di una matrice (cioèdi diagonalizzarla) corrisponde grossomodo alla trattazione seguente. Data la matrice O vogliamo trovarei numeri ĎÎą e tutti i diversi vettori colonna cÎą per cui si ha
OcÎą = ĎÎą cÎą Îą = 1, . . . , n (1.32)
che può essere riscritta come(OâĎ1)c = 0 (1.33)
dove 1 è la matrice identitĂ . Lâultima equazione ammette soluzioni non banali solo se il determinantesecolare è nullo
|OâĎ1|= 0 (1.34)
Questa condizione ci permette di trovare gli N autovalori (che sono le N radici dellâequazione secolare chesi ottiene dal determinante) che sostituiti uno per uno dentro lâeq. (1.32) ci permettono di trovare i variautovettori cÎą a meno di un fattore moltiplicativo che si trova imponendo la condizione di normalizzazioneper uno degli autovettori.
âi
câÎąicÎąi = 1 (1.35)
In questo modo abbiamo risolto il problema trovando N soluzioni cÎą . Se costruiamo una matrice U usandogli N autovettori cÎą come colonne, possiamo scrivere
O
c11 c12 ¡ ¡ ¡ c1Nc21 c22 ¡ ¡ ¡ c2N...
.... . .
...cN1 cN2 ¡ ¡ ¡ cN
=
c11 c12 ¡ ¡ ¡ c1Nc21 c22 ¡ ¡ ¡ c2N...
.... . .
...cN1 cN2 ¡ ¡ ¡ cNN
Ď1 0Ď2
. . .0 Ďn
cioè
OU = UĎ (1.36)
Moltiplicando entrambi i membri di (1.36) per Uâ si ottiene proprio la relazione voluta
Uâ OU = Ď. (1.37)
cioĂŠ che è possibile trovare una trasformazione unitaria con cui costruire una nuova base in cui lâoperatoreè diagonale.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 15
1.4 Sistemi a due stati
I sistemi a due stati sono sistemi in cui lo spazio H ha solo due dimensioni. Ci sono numerose situazionifisiche in cui uno spazio a due sole dimensioni è significativo: o perchÊ si trascurano parte dei gradi diliberta del sistema (questo è il caso degli stati di spin di un elettrone, o degli stati di polarizzazione di unfotone) o perchÊ per ragioni energetiche altri stati sono esclusi dalle condizioni sperimentali.
In un sistema a due stati una base di H è formata da due soli vettori, che a seconda dei casi potremoindicare con |1ă e |2ă, oppure con |+ă e |âă. Il vettore generico potrĂ sempre essere scritto come |vă =v1 |1ă+ v2 |2ă con |v1|2 + |v2|2 = 1. Un fattore di fase è sempre arbitrario e possiamo disporne in variomodo: ad es. scegliendo v1 sempre reale e ⼠0. Si vede che restano liberi due soli parametri, e possiamoprendere
v1 = cosθ , v2 = eiĎ sinθ , θ â [0,Ď
2]
Non solo la rappresentazione degli stati è semplice, ma anche quella delle osservabili. Si vede infattifacilmente che esistono soltanto 4 operatori hermitiani (quindi autoaggiunti) linearmente indipendenti. Eâtradizionale prendere i seguenti:
1. lâidentitĂ I
2. lâoss. che ha autovalori 1 e -1 sulla base scelta: la chiameremo Ďz;
3. lâoss. Ďx definita da Ďx |1ă= |2ă e Ďx |2ă= |1ă;
4. lâoss. Ďy definita da Ďx |1ă= i |2ă e Ďx |2ă=âi |1ă;
Gli elementi di matrice delle osservabili Ďx, Ďy, Ďz sono risp.(0 11 0
),
(0 âii 0
),
(1 00 â1
)(1.38)
Si può verificare in piĂš modi che ciascuna delle (1.38) ha un autovalore 1 e un autovalore -15. Le osservabiliĎx, Ďy, Ďz si chiamano matrici di Pauli.
1.5 Lo spin
Consideriamo per cominciare un elettrone isolato. E noto che esso è dotato di un momento angolareintrinseco, per il quale si usa il termine inglese spin. Questo spin è un grado di libertà interno dellaparticella, che si aggiunge ai consueti gradi di libertà che ne descrivono il moto nello spazio.
Se ci disinteressiamo del moto dellâelettrone, possiamo limitarci a studiare questo grado di libertĂ interno,che è intrinsecamente quantistico: non ha analogo classico e non può essere descritto, neppure approssi-mativamente, con concetti classici (è perciò sbagliato e fonte di sicuri errori pensare allâelettrone come unaminuscola "trottola").
5 âŁâŁâŁâŁ 0âÎť 11 0âÎť
âŁâŁâŁâŁ = Îť2â1 = 0 ââ Îť =Âą1âŁâŁâŁâŁ 0âÎť âi
i 0âÎť
âŁâŁâŁâŁ = Îť2â (i)(âi) = Îť
2â1 = 0 ââ Îť =Âą1âŁâŁâŁâŁ 1âÎť 00 â1âÎť
âŁâŁâŁâŁ = (1âÎť )(â1âÎť ) =â1+Îť2 = 0 ââ Îť =Âą1
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 16
Il momento angolare di spin di un elettrone è un vettore e lo indicheremo con s. Se fissiamo una direzione,che prendiamo come asse z, e misuriamo la componente sz di s, troviamo due soli valori: ¹ 1
2 h. Per questaragione si dice che lâelettrone ha spin 1/2. PiĂš esattamente, il sistema dello spin dellâelettrone ha duesoli stati possibili: si applicano perciò tutte le considerazioni fatte nella sez. precedente. In particolarepossiamo usare le matrici di Pauli, ponendo
s =12
hĎ (1.39)
Si noti che la (1.39) è molto di piÚ che una semplice definizione, in quanto determina le relazioni algebrichefra la componenti del momento di spin; in particolare il commutatore
[sx,sy] = ihsz
La (1.39) mostra che due diverse componenti dello spin non sono mai compatibili e non potranno quindiessere misurate insieme.
Dato che un sistema di spin 1/2 è formalmente identico al sistema delle polarizzazioni di un fotone, ènaturale parlare di polarizzazione anche per lo spin. Possiamo e quindi parlare di fasci di elettroni (o diatomi) variamente polarizzati, oppure non polarizzati. Ci sono però alcune differenze, non nel formalismomatematico, ma nellâinterpretazione fisica. In primo luogo, mentre la polarizzazione dei fotoni è neces-sariamente trasversale (polarizzazione x e y per un fotone che viaggia lungo z) questa restrizione non câèper lo spin elettronico: qualunque stato di spin è autostato di una certa componente dello spin, il che puòessere espresso dicendo che lo spin è polarizzato nella corrispondente direzione. In secondo luogo due statiortogonali corrispondono ad autovalori opposti per es. della componente sz: sarĂ quindi naturale indicarlicon |+ă e |âă. Parlando alla buona si dice spesso "spin in su" e "spin in giĂš" ma questo modo di dire èscorretto: vediamo perchĂŠ. Lâespressione "spin su" fa pensare che il vettore di spin sia diretto ad es. nelverso positivo dellâasse z. Allora le componenti sx e sy di s dovrebbero essere nulle, mentre questo non èvero, per due ragioni:
1. Un autostato di sz non è autostato di sx nĂŠ di sy, come si vede ad esempio dalle matrici di Pauli: nellabase |+ă, |âă lâoss. sz è diagonale, come è giusto; ma sx e sy non sono affatto diagonali, anzi glielementi diagonali sono nulli (vedi le matrici di Pauli).
2. Lâultima osservazione mostra che espressioni come ă+|sx|+ă ecc. sono nulle, ossia è nullo il valormedio di sx e sy tanto sullo stato |+ă quanto su |âă6, ma se si esegue una misura di queste osservabilinon si trovera mai zero (che non è fra gli autovalori) ma solo Âą 1
2 h.
1.6 Momenti angolari
Il momento angolare totale di un sistema isolato è una costante del moto (vedi Sezione 1.9). Sia classi-camente che quantisticamente, la conservazione del momento angolare è una conseguenza dellâisotropiadello spazio. Le componenti del momento angolare J = (Jx, Jy, Jz) in meccanica quantistica obbedisconole seguenti regole di commutazione:
[Ji, J j] = Îľi jkihJk [J2, Ji] = 0
dove J2 = J2x + J2
y + J2z . Eâ quindi possibile individuare autofunzioni simultanee di J2 e di una sola com-
ponente Ji alla volta. Come nel caso dello spin infatti componenti diverse del momento angolare sonoincompatibili.
Si può dimostrare che gli autovalori di J2 sono dati da h2 j( j + 1) mentre quelli di una sua componente Jzsono nella forma mh. Valgono inoltre le seguenti condizioni:
6Ad esempio
ă+|sx|+ă=(
1 0)( 0 1
1 0
)(10
)=(
1 0)( 0
1
)= 0
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 17
1. i soli possibili valori del numero quantico j sono gli interi e i semi-interi non negativi 0, 12 , 1, 3
2 , . . .
2. dato un j fissato i possibili valori per m sono i (2 j +1) valori (â j,â j +1, . . . , jâ1, j).
Per poter utilizzare le regole di commutazione nel trovare gli autovalori e, piĂš in generale, per usare imomenti angolari è necessario indrodurre i due âoperatori scalaâ:
JÂą = JxÂą iJy
che hanno le seguenti regole di commutazione
[J+, Jâ] = 2hJz , [Jz, JÂą] =ÂąhJÂą e [J2,JÂą] = 0
Si può dimostrare che gli stati | j, mă non sono autostati di JÂą, ma che valgono le seguenti relazioni
J+ | j, mă =â
( jâm)( j +m+1) | j, m+1ăJâ | j, mă =
â( j +m)( jâm+1) | j, mâ1ă
I due operatori J2 e Jz in generale non formano un set completo di osservabili commutanti; sarĂ infattispesso necessario aggiungere a questi due operatori lâhamiltoniano del sistema H con cui commutano. Peresempio nella trattazione dellâatomo di idrogeno il momento angolare totale del sistema può essere descrittotramite i due operatori momento angolare orbitale L2e Lz (trascurando lo spin). Questi due operatori nondeterminano completamente lo stato dellâelettrone perchĂŠ i vari autostati |l, mă descrivono solo il motoangolare. Gli autostati di un sistema saranno quindi identificati da l, m e da un indice addizionale cherisulta determinante per stabilire, per esempio, lâenergia degli stati. Nel caso dellâatomo di idrogeno glistati possibili sono indicati dalla terna |n, l,mă.
In meccanica quantistica esiste lâanalogo del momento angolare orbitale L(Lx, Ly, Lz) e il momento di spindi cui abbiamo giĂ trattato. Si può quindi definire il momento angolare totale del sistema J(Jx, Jy, Jz) =L+S che è quello che effettivamente si conserva. Inoltre in sistemi a molte particelle i momenti angolaridelle singole particelle devono combinarsi tra loro a dare delle risultanti totali. Per esempio nel caso di unatomo il momento angolare orbitale di tutti gli elettroni è dato dalla somma vettoriale di tutti i momentirelativi ad ogni elettrone L = âi li. Lo stesso vale per il momento di spin S = âi si.
Vediamo brevemente come si fa a comporre due momenti angolari. Dato un sistema con due momentiangolari L e S con autovalori e autostati identificati da |l, lză e |s, sză, esistono due possibilitĂ per trattare ladinamica dei momenti angolari:
1. utilizzare autoket simultanei di L2, S2, Lz e Sz denotati da |ls; lzsză. I 4 operatori commutano e leequazioni agli autovalori sono
L2 |ls; lzsză = l(l +1)h2 |ls; lzszăS2 |ls; lzsză = s(s+1)h2 |ls; lzszăLz |ls; lzsză = lzh |ls; lzszăSz |ls; lzsză = szh |ls; lzsză
2. lâaltra possibilità è quella di usare autoket simultanei di J2, L2, S2 e Jz dove J2 è la somma vettorialedei momenti angolari. Anche questi operatori commutano, infatti
[J2, L2] = 0 e [J2, S2] = 0
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 18
Le equazioni agli autovalori per gli stati |ls; jmă sono
L2 |ls; jmă = l(l +1)h2 |ls; jmăS2 |ls; jmă = s(s+1)h2 |ls; jmăJ2 |ls; jmă = j( j +1)h2 |ls; jmăJz |ls; jmă = mh |ls; jmă
Eâ importante notare che se [J2, Jz] = 0 è pur vero che [J2, Lz] 6= 0 e [J2, Sz] 6= 0. Non è possibile aggiungereJ2 allâinsieme degli operatori della possibilitĂ 1, mentre non si possono aggiungere Lz e Sz alla possibilitĂ 2. Abbiamo due possibili insiemi di ket di base corrispondenti ai due insiemi massimali di osservabilicompatibili.
Eâ possibile trasformare una base nellâaltra utilizzando una trasformazione unitaria. Per esempio possiamoscrivere
|ls; jmă= âlz
âsz
|ls; lzszăăls; lzsz|ls; jmă
gli elementi della matrice di trasformazione ăls; lzsz|ls; jmă sono i coefficienti di Clebsh-Gordan. Questicoefficienti non sono nulli solo se
m = lz + sz e |lâ s| ⤠j ⤠l + s
che sono condizioni ovvie se si considera un modello vettoriale di addizione dei momenti angolari. Alcunevolte al posto dei coefficienti di C-G si usano quantitĂ ad essi proporzionali detti simboli 3â j.
1.7 Sistemi a due particelle
I sistemi di due particelle hanno un posto importante nella discussione sui fondamenti della meccanicaquantistica, almeno a partire dal famoso "paradosso di Einstein-Podolski-Rosen" di cui accenneremo inseguito. Dal punto di vista generale si tratta di definire stati e osservabili di un sistema fisico composto didue particelle, per ciascuna delle quali, prese separatamente, stati e osservabili siano giĂ ben identificati.Per semplificare il discorso ci limiteremo agli stati di spin (o di polarizzazione). Cominciamo perciò ariferirci, per concretezza, a un sistema formato da due elettroni. Per ciascuno dei due lo spazio deglistati è bidimensionale: li indicheremo con H1 e H2. Come si costruisce lo spazio degli stati del sistemacomplessivo? Prendiamo in ciascuno dei due spazi una base; per esempio quella degli autovettori di sz. Liindicheremo rispettivamente con |1+ă, |1âă e con, |2+ă |2âă. Eâ allora chiaro che lâinsieme delle coppieordinate
|1+ă |2+ă , |1+ă |2âă , |1âă|2+ă , |1âă|2âă (1.40)
forma una base per lo spazio H degli stati del sistema complessivo. Indicheremo questo scrivendo H =H1âH2. In parole, H è il prodotto tensoriale di H1 e H2.
Il prodotto tensoriale ha dimensione 4: però non si tratta di 2+2, ma di 2Ă2, come si vede ripetendo il ra-gionamento per spazi con un numero diverso di dimensioni. Conviene semplificare la notazione, indicandoi vettori scritti in (1.40) come segue:
|++ă , |+âă , |â+ă , |ââă (1.41)
sottintendendo che il primo simbolo si riferisce sempre allâelettrone 1, lâaltro allâelettrone 2. I 4 vettoridella (1.41) (appartenenti per definizione a H ) hanno unâinterpretazione fisica immediata: sono autovettorisimultanei delle due oss. s1z e s2z. Si noti che in partenza queste due oss. sono definite (come operatori)risp. in H1 e in H2 , ma si estendono in modo ovvio a H , proprio attraverso la loro azione sui vettori(1.41). Lâoperatore s1z, per esempio, è esprimibile nella base dei 4 stati (1.41) come prodotto tensoriale
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 19
s1z(1)â I(2) e la matrice corrispondente nella base (1.41) può essere generata come (usiamo il fatto chesz = 1
2 hĎz)
((s1z)11 ¡ I (s1z)12 ¡ I(s1z)21 ¡ I (s1z)22 ¡ I
)=
h2
1 ¡(
1 00 1
)0 ¡(
1 00 1
)0 ¡(
1 00 1
)â1 ¡
(1 00 1
)=
h2
1 0 0 00 1 0 00 0 â1 00 0 0 â1
Le osservabili del sistema composto non sono soltanto quelle dei due sistemi componenti, come s1z, s2z. Peresempio è unâosservabile in H la somma s1z +s2z e le altre analoghe; ma anche il prodotto s1z ¡s2z e simili.In particolare, è importante considerare lo spin totale S = s1 + s2 . Ci servirĂ conoscere il comportamentodi S sui 4 vettori della base (1.41); cominciamo con Sz = s1z + s2z. Dalla definizione di Sz è facile ricavareche i (1.41) sono tutti autovettori di Sz risp. con gli autovalori 1, 0, 0, -1 (qui e in seguito esprimeremo glispin in unitĂ di h). Per esempio prendiamo Sz |++ă dove |++ă= (1, 0, 0, 0):
Sz |++ă= h
1 0 0 00 0 0 00 0 0 00 0 0 â1
1000
= h
1000
Come si vede, gli autovalori 1 e -1 non sono degeneri, mentre lâautovalore 0 è due volte degenere. In realtĂ tutto il sottospazio
|wă= Îą |+âă+β |â+ă (1.42)
appartiene a questo autovalore. Per capire che cosa ciò significhi, proviamo ad applicare Sx = s1x + s2x a|wă: otteniamo
Sx |wă=12(Îą +β )(|++ă+ |ââă) (1.43)
Ci si arriva esprimendo Sx = s1x(1)â I(2)+ I(1)â s2x(2), ricordando che in generale sx = 12 hĎx e quindi
ottenendo((s1x)11 ¡ I (s1x)12 ¡ I(s1x)21 ¡ I (s1x)22 ¡ I
)+(
I11 ¡ s1x I12 ¡ s1xI21 ¡ s1x I22 ¡ s1x
)=
=h2
0 ¡(
1 00 1
)1 ¡(
1 00 1
)1 ¡(
1 00 1
)0 ¡(
1 00 1
)+
h2
1 ¡(
0 11 0
)0 ¡(
0 11 0
)0 ¡(
0 11 0
)1 ¡(
0 11 0
)
che risulta nella matrice
Sx = h
0 1 1 01 0 0 11 0 0 10 1 1 0
Il vettore |wă della (1.42) è dato nella base (1.41) dalla quadrupla (0, Îą, β , 0)e quindi lâazione di Sx su |wăè data da
h
0 1 1 01 0 0 11 0 0 10 1 1 0
0Îą
β
0
= h
ι +β
00
ι +β
Che è appunto il risultato riportato espresso in (1.43).
Adesso, data lâarbitrarietĂ di |wă, se in particolare scegliamo che Îą +β = 0, troviamo
Sx(|+âăâ|â+ă) = 0
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 20
e allo stesso modo ancheSy(|+âăâ|â+ă) = 0
Dunque il vettore
|0ă=1â2(|+âăâ|â+ă) (1.44)
è autovettore simultaneo di Sx, Sy, Sz, tutti con autovalore 0 (il fattore 1/â
2 serve per normalizzare). Eâquindi ragionevole dire che lo stato |0ă rappresenta uno stato di spin totale 0 del sistema di due elettroni.Procedendo in maniera analoga si dimostra che con i tre vettori
|1, 1ă= |++ă |1, 0ă=1â2(|+âă+ |â+ă) |1,â1ă= |ââă (1.45)
che sono per costruzione autovettori di Sz, con autovalori 1, 0, -1, si riesce a costruire, per sovrapposizione,autovettori di Sx e di Sy con gli stessi autovalori. Perciò diciamo che essi rappresentano tre stati di spintotale 1. PoichĂŠ lo stato di spin 0 è unico, lo si chiama spesso stato di singoletto, mentre quelli di spin1 si chiamano stati di tripletto. Un modo alternativo di procedere è quello di esprimere lâoperatore S2 =s2
1 + s22 +2s1 ¡ s2 nella base (1.41) e di trovarne direttamente gli autovalori e autovettori.
Stati intrecciati o âentangledâ
Degli stati di due particelle finora introdotti, sono particolarmente interessanti
|0ă=1â2(|+âăâ|â+ă) e |1, 0ă=
1â2(|+âă+ |â+ă)
Entrambi sono autostati di Sz per lâautovalore 0, e hanno anche in comune di essere costruiti con combinazioni linearidei due stati |+âă e |â+ă. Ma la cosa interessante è questa: mentre |+âă e |â+ă sono autostati e di s1z (e anchedi s2z), |0ăe |1, 0ă non lo sono: se si esegue una misura di s1z sul sistema preparato nello stato di singoletto, si potrĂ trovare tanto il risultato +1/2 quanto -1/2 (con la stessa probabilitĂ ). Per dimostrarlo, basta vedere che lâazione di s1ztrasforma |0ă in |1, 0ă e viceversa. Per esempio lâazione di s1z = s1z(1)â I(2) sul vettore |0ă= (0, 1,â1, 0) è data da
h2
1 0 0 00 1 0 00 0 â1 00 0 0 â1
01â10
=h2
0110
= |1, 0ă
Lo stesso è vero per s2z, e uguale discorso si può fare per il tripletto. Tra lâaltro, questo mostra che la misura di s1z o dis2z non basta a distinguere singoletto da tripletto.
Applicando il postulato della riduzione del pacchetto si vede che se si parte con |0ă e si misura s1z, quando il risultatoè per es. +1/2 si cade nello stato |+âă; perciò una successiva misura di s2z da con certezza il risultato -1/2. Viceversa:se si misura prima s2z tutto va in maniera simmetrica, e lo stato dopo la misura è autostato anche di s1z. Quindi se simisura s1z non câè bisogno di misurare s2z, perchĂŠ il risultato è prevedibile. Si vede dunque che le operazioni di misuradi s1z e s2z sono intrecciate, nel senso che il risultato dellâuna determina il risultato dellâaltra, sebbene in partenzanessuno dei due sia determinato. In un certo senso la cosa è ovvia: lo stato di singoletto è autostato di Sz, quindi ilvalore della somma di s1z e di s2z è perfettamente noto. Nessuna meraviglia che se si conosce il valore e di una delledue oss. ne segua il valore dellâaltra. Tuttavia questa situazione coesiste con lâiniziale indeterminazione di ciascunadelle due oss. Per questo motivo stati come |0ă o |1, 0ă vengono chiamati intrecciati (inglese entangled).
Consideriamo un sistema di due particelle a spin 12 in uno stato globale di singoletto che si muovono in direzioni
opposte come in Figura 1.1. Lâosservatore in A misura s1z della particella 1 mentre lâosservatore in B misura s2z. Se Atrova s1z positivo, allora può predire con certezza, prima che B faccia una qualche misura, il risultato della misura diB: s2z negativo. Se A non fa alcuna misura, B ha una probabilitĂ del 50% di trovare s2z positivo o negativo.
La situazione però può complicarsi considerando le altre componenti dello spin. Se consideriamo la direzione x comeasse di quantizzazione avremmo che il singoletto sarà descritto da una funzione analoga alla (1.44):
|0ă= |0ă=1â2(|x+,xâăâ|xâ,x+ă) (1.46)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 21
Figura 1.1: Misure di spin in uno stato di singoletto
Supponiamo che lâosservatore A possa adesso scegliere quale componente dello spin misurare, mentre B possa misura-re solo s2x della particella 2. Se A determina s1z > 0, B, chiaramente avrĂ il 50% di probabiliĂ di misurare s2x positivoo negativo. Anche se s2z è determinato, non lo è s2x. Se, invece, A misura s1x, allora la misura di B sarĂ determinata.Se A decide di non fare misure, B avrĂ il 50% di probabiliĂ di misurare s2x positivo o negativo. Queste considerazionimostrano che i risultati delle misure di B dipendono da cosa A ha deciso di fare. Questo succede anche se A e B sono adistanze macroscopiche e senza possibilitĂ di comunicare. Tutto va come se la particella 2 âsappiaâ quale componentedi spin della particella 1 è stata misurata. Al di lĂ dei problemi epistemiologici che questo tipo di fenomeni hannoportato, mi preme di assicurare una cosa: nonostante queste peculiaritĂ non si possono utilizzare queste misure pertrasmettere informazioni utili tra due punti separati dello spazio a velocitĂ superluminali. Supponiamo che A e B simettano dâaccordo di misurare la componente sz. Pur senza chiedere nulla ad A, B sa cosa A ha misurato, cionono-stante B osserva solamente una sequenza di valori positivi o negativi casuali e nessuna informazione utile. Anche se Acambiasse il suo apparato in modo da misurare sx, B otterrebbe risultati completamente scorrelati da quello che fa A.
1.8 Funzione dâonda
La definizione âformaleâ di funzione dâonda è la proiezione nello spazio delle coordinate dello stato a cuiessa si riferisce. Cioè la f.d.o è data dal prodotto scalare dello stato per un autobra dellâoperatore dellaposizione x. Lâoperatore della posizione è un operatore ad autovalori continui e quindi prima di procederealla definizione della funzione dâonda dobbiamo trattare brevemente gli autovalori a spettro continuo. Ab-biamo fino ad ora considerato operatori con uno spettro discreto di autovalori e quindi un numero discreto(finito per lo piĂš) di autovettori. Ora generalizzeremo le relazioni trovate al caso di operatori con uno spet-tro continuo. Questa generalizzazione dal punto di vista matematico non è semplice, nĂŠ priva di problemi.Non câè spazio qui per una trattazione dettagliata e ci limiteremo ad generalizzare senza andare troppo peril sottile le relazioni giĂ esaminate: sostituiremo il simbolo δi j con la funzione δ di Dirac e le somme congli integrali sulla variabile continua (che va a rappresentare lâautovalore)
ăi| jă= δi j â ăx|xâ˛ă= δ (xâ xâ˛)
âi|iăăi|= 1 â
âŤ|xăăx|dx = 1
âi| ăi|Îąă |2 = 1 â
âŤdx| ăx|Îąă |2 = 1
ăi|A| jă= aiδi j â ăx|A|xâ˛ă= δ (xâ xâ˛)a
Esempi di operatore a spettro continuo sono lâoperatore della posizione e dellâimpulso. Per la posizioneinfatti abbiamo
x |xă= x |xă
se gli autovettori |xă formano una base completa possiamo esprimere ogni ket come
|Îąă=âŤ
dx |xăăx|Îąă
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 22
il coefficiente dello sviluppo ăx|Îąă viene come al solito interpretato in modo tale che
| ăx|Îąă |2dx
sia la probabilitĂ di trovare la particella in un intorno dx di x. Nel formalismo di Dirac ăx|Îąă è quelloche nella meccanica ondulatoria di SchrĂśdinger si chiama Funzione dâonda ed è indicata con ĎÎą(x). Seprendiamo il prodotto scalare ăÎą|β ă infatti abbiamo
ăÎą|β ă=âŤ
dxăβ |xăăx|Îąă=âŤ
dxĎâβ(x)ĎÎą(x)
Possiamo reinterpretare anche lo sviluppo
âi|iăăi|Îąă= |Îąă
dove |iă sono gli autoket dellâoperatore A. Moltiplichiamo entrambi i membri per ăx| risulta
ăx|Îąă= âiăx|iăăi|Îąă
che sarebbe lâusuale espansione della f.d.o
ĎÎą(x) = âi
ciÎą ui(x)
dove le uÎą(x) sono le autofunzioni dellâoperatore A. Come si vede da questi esempi è facile passaredalla notazione di Dirac degli autostati a quella matriciale degli autovettori e a quella di SchrĂśdinger delleautofunzioni.
Problema: determinare lâespressione in termini della funzione dâonda dellâelemento di matrice ăÎą|A|β ă nel caso cheA sia una funzione dellâoperatore posizione.
Soluzione: Lâelemento di matrice può essere riscritto utilizzando le identitĂ dei ket
ăÎą|A|β ă=âŤ
dxdxⲠăÎą|xăăx|A|xâ˛ăăxâ˛|β ă=âŤ
dxdxâ˛ĎâÎą (x)ăx|A|xâ˛ăĎβ (xâ˛)
dove ăx|A|xâ˛ă è la rappresentazione nelle coordinate dellâoperatore A. Se A = f (x) abbiamo che [A, x] = 0e gli autovaloridi A sono uguali ad una funzione degli autovalori di x: a = f (x). Cioè in generale
ăx| f (x)|xâ˛ă= f (x)δ (xâ xâ˛)
e quindi
ăÎą| f (x)|β ă=âŤ
dxĎâÎą (x) f (x)Ďβ (x)
1.9 Simmetria in meccanica quantistica
Data una famiglia di operatori U(Îť ), lineari, unitari (Uâ U = 1) e differenziabili nel parametro Îť , per i qualivalga la condizione U(0) = I, allora lâoperatore
X = ihâUâÎť
âŁâŁâŁâŁÎť=0
è un operatore hermitiano. Se lâoperatore U(Îť ) descrive unâinvarianza di una osservabile Q, allora X èuna costante del moto. Lâoperatore U(Îť ) viene scelto in modo tale da soddisfare la seguente relazioni dicomposizione
U(Îť + Âľ) |xă= U(Îť )U(Âľ) |xă
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 23
e quindi se Âľ diventa infinitesimo
U(Îť +dÎť ) |xă= U(Îť )U(dÎť ) |xă
Per ipotesi la famiglia U(Îť ) è differenziabile e quindi possiamo scrivere (usiamo il fatto che U(dÎť ) =U(0+dÎť ) = U(0)+U â˛(0)dÎť )
U(Îť )(
I+âU(Îť )
âÎť
âŁâŁâŁâŁÎť=0
dÎť
)|xă= U(Îť )
(Iâ i
hXdÎť
)|xă
da cui si ha la seguente relazione operatoriale
U(Îť +dÎť )âU(Îť ) =â ih
XdÎťU(Îť )
che a sua volta diventaâU(Îť )
âÎť=â i
hXU(Îť )
che è unâequazione differenziale che ammette la soluzione formale:
U(Îť ) = eâih XÎť
dove X prende il nome di operatore generatore della famiglia U(Îť ).
Per esempio consideriamo la famiglia di operatori delle traslazioni U(Ta) che traslano un ket di stato delladistanza a:
U(Ta) |xă= |x+aă
per ipotesi U(Ta) è differenziabile rispetto ad a e quindi per spostamenti infinitesimi da otteniamo lâopera-tore di uno spostamento infinitesimo
U(Tda) = U(T0)+âU(Ta)
âa
âŁâŁâŁâŁa=0
da = I+Dda (1.47)
Adesso calcoliamo lâeffetto di U(Ta) su una funzione dâonda ĎÎą(x) = ăx|Îąă. La funzione dâonda relativaallo stato traslato U(Ta) |Îąă è data da
Ďâ˛Îą(x) = ăx|U(Ta)Îąă= ăUâ (Ta)x|Îąă
essendo ovviamente Uâ (Ta) |xă= |xâaă, avremo
Ďâ˛Îą(x) = ăxâa|Îąă= ĎÎą(xâa)
e quindi lâeffetto di operare con lâoperatore delle traslazioni su una funzione dâonda è quello di produrneuna copia il cui valore in x+a è uguale a quello di ĎÎą(x), o in termini matematici U(Ta)ĎÎą(x) = ĎÎą(xâa).Per uno spostamento infinitesimo, usando la (1.47) avremo che
U(Tdx)ĎÎą(x) = ĎÎą(xâdx) = ĎÎą(x)+DĎÎą(x)dx (1.48)
inoltre la funzione dâonda traslata di dx sarĂ anche data da
ĎÎą(xâdx) = ĎÎą(x)â âĎÎą(x)âx
dx (1.49)
e quindi confrontando la (1.48) e la (1.49) otteniamo
D =ââĎÎą(x)âx
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 24
Si può quindi vedere che lâoperatore impulso dato da
p =âihD =âihâ
âx
è il generatore della famiglia degli operatori di traslazione (x â x+a)
U(Ta) = eâih p¡a
quindi la conservazione dellâimpulso lineare è una conseguenza della simmetria traslazionale o omogeneitĂ dello spazio.
Allo stesso modo si può far vedere che lâoperatore hamiltoniano di un sistema è il generatore dellâ operatoreevoluzione temporale
U(t) = eâih Ht
Infine il momento angolare totale di un sistema è il generatore degli operatori rotazione attorno allâasse ndi un angolo Ď
R(n,Ď) = eâih J¡nĎ
il che ci dice che la conservazione del momento angolare è la conseguenza dellâisotropia dello spazio.
Abbiamo visto che tre proprietĂ del nostro sistema fisico (invarianza per traslazione, rotazione o sposta-mento temporale) si riflettono nel fatto che impulso lineare totale, momento angolare totale e energia siano3 costanti del moto in ogni sistema isolato. Matematicamente la struttura della meccanica quantistica ri-flette questa situazione associando alle tre operazioni traslazione, rotazione ed evoluzione gli operatorihermitiani p, J e H.
Esiste però in meccanica quantistica unâaltra importante simmetria di cui tenere conto che è una simmetriadiscreta (contrariamente a quanto visto prima); essa è la paritĂ o simmetria di inversione spaziale. Lâope-ratore Ď che inverte tutte le coordinate di un sistema è unitario Ďâ Ď = 1 e opera sui ket in questo modoĎ |xă = |âxă. Essendo unitario si può provare che Ď anticommuta con x lâoperatore posizione. Questodovrebbe essere ovvio nel momento in cui pensiamo che il valore di aspettazione di x (il valor medio dellaposizione della particella) dovrĂ cambiare di segno quando lo stato viene invertito spazialmente
ăÎą|Ďâ xĎ|Îąă=âăÎą|x|Îąă
questo si verifica solo se Ďâ xĎ =âxe cioè quando xĎ =âĎ x. Altre proprietĂ interessanti dellâoperatore Ď
sono che è hermitiano con autovalori Âą1 e che Ď2 = I. Che succede quando applichiamo Ď ad una funzionedâonda?
ĎĎÎą(x) = ăx|Ď|Îąă= ăâx|Îąă= ĎÎą(âx).
il che è piuttosto banale. Una cosa piĂš interessante succede alle funzioni dâonda che sono autofunzioni diĎ cioè che provengono da un autostato |Îąă autostato di Ď:
ăx|Ď|Îąă=Âąăx|Îąă
cioèĎÎą(âx) =ÂąĎÎą(x) (1.50)
esistono quindi funzioni dâonda pari e dispari rispetto alla simmetria di inversione di tutte le coordinate.Eâ ovvio che non tutte le funzioni dâonda soddifano la relazione (1.50). Per esempio unâautofunzionedellâoperatore impulso (unâonda piana) non è autofunzione di Ď (anche perchĂŠ Ď e p anticommutano),mentre lo sono le autofunzioni del momento angolare (si può dimostrare che J2e Jz commutano con Ď eche le loro autofunzioni sono autofunzioni di Ď con autovalore (â1) j). Cosa succede alle autofunzionidellâhamiltoniano? Supponiamo di avere un hamiltoniano tale che [H, Ď] = 0 e che |nă sia un autoket di Hnon degenere e con autovalore En. Si può vedere che |nă è anche un autoket della paritĂ . Quindi quandotroviamo un autostato dellâhamiltoniana non degenere abbiamo anche un autostato della paritĂ . Il problemanei sistemi fisici reali è che la degenerazione è la regola piĂš che lâeccezione. Per esempio una particellalibera ha come autostati dellâenergia gli autostati dellâimpulso, ma i due autostati |pă e |âpă sono degeneriin energia e quindi gli autostati dellâimpuslo non sono autostati della paritĂ .
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 25
1.10 Lâequazione di SchrĂśdinger
In meccanica quantistica la struttura dellâequazione di SchrĂśdinger è postulata, anche se esistono giustifica-zioni piĂš o meno complesse alla sua forma. Uno dei postulati della meccanica quantistica (anche se primane abbiamo dato una giustificazione in termini di simmetria) è quello di assumere per lâoperatore associatoal momento lineare la forma âihâ. Lâequazione di SchrĂśdinger per una particella soggetta allâazione di unpotenziale è
ihâΨ(x, t)
â t=(â h2
2mâ
2 +V (x))
Ψ(x, t)
Come abbiamo giĂ visto, se il potenziale non dipende esplicitamente da t si può risolvere lâeq. di SchrĂśdin-ger indipendente dal tempo in modo da ottenere quelli che si chiamano stati stazionari (la cui variazione neltempo si riduce ad un fattore oscillante exp(âiEt/h)). Uno stato stazionario è quindi dato dallâequazioneagli autovalori (
â h2
2mâ
2 +V (x))
Ď(x) = EĎ(x) (1.51)
Questa equazione può essere risolta in diversi modi: una soluzione analitica è possibile solo in pochissimicasi tra i quali il piĂš importante è certamente lâatomo di idrogeno che risulta il âmodello baseâ con cuicostruiamo anche le molecole. Molto piĂš comune è risolvere (1.51) numericamente. Questi metodi nu-merici diventano sempre piĂš complicati allâaumentare del numero di gradi di libertĂ interni del sistema edinoltre per sistemi molto complessi è di solito possibile trovare solo lo stato fondamentale e solo con sforzicomputationali notevoli. In questo corso noi ci occuperemo di un metodo numerico per risolvere (1.51) nelcaso mono-dimensionale cioeâ in cui il vettore x si riduce ad una sola coordinata. BenchĂŠ possano sembraresemplici, in realtĂ i problemi monodimensionali con potenziali arbitrari sono molto importanti sia come ba-se per capire le applicazioni di metodi analoghi a problemi multidimensionali, sia perchĂŠ, non di rado, sonogiĂ descrizioni accurate di alcuni sistemi fisici reali: per esempio la dinamica dei nuclei di una molecolabiatomica se trattata in approssimazione di Born-Oppenheimer è un problema monodimensionale.
Lâequazione di SchrĂśdinger monodimensionale per una funzione dâonda u(x) è
d2u(x)dx2 +
2mh2 [EâV (x)]u(x) = 0
dove V (x) è un potenziale qualunque.
Figura 1.2:
La quantitĂ [EâV (x)] divide lâasse delle x in diversi segmenti separati dai punti in cui vale zero (che ven-gono detti Turning Point). Supponiamo che quella quantitĂ si annulli due volte in un intorno di un minimo
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 26
del potenziale: otterremo tre regioni come indicato in Figura 1.2. La prima e la terza regione cioè quelleper valori x < T Pâ1 e x > T Pâ2 sono regioni in cui [EâV (x)] < 0 cioè in cui il potenziale è maggioredellâenergia totale ovvero lâenergia cinetica è negativa. Queste sono regioni a cui una particella classica nonpuò accedere. In meccanica quantistica invece la funzione dâonda penetra leggermente allâinterno di questeregioni a seconda di quanto è rapido lâincremento dellâenergia potenziale7. In generale la funzione dâondaha un andamento esponenziale decrescente al loro interno. Inoltre allâinterno delle regioni classicamenteproibite, la funzione dâonda ha sempre concavitĂ rivolta verso lâalto e non può avere nodi.
1.10.1 Autofunzioni ed energie
Lâinsieme degli autovalori di un operatore è detto âspettroâ. La quasi totalitĂ degli operatori Hamiltonia-ni che si incontrano in meccanica quantistica ha una parte dello spettro composta da autovalori discreti adenergia negativa ed una parte da autovalori continui di energia positiva. Per esempio se prendiamo lâHamil-toniano dellâatomo di idrogeno (che giĂ conoscete) sappiamo che esso ha un numero infinito di autovaloridiscreti ad energia negativa (negativa rispetto alla frammentazione protone+elettrone) le cui energie corri-spondenti sono quantizzate e date dalla formula En = â1/2n2 (in unitĂ atomiche e nel caso di un sistemadi riferimento centrato nel protone). Queste ultime corrispondono ai livelli energetici degli stati legati del-lâatomo dâidrogeno e sono quantizzati cioè anche se in numero infinito sono autovalori discreti. Lo stessoHamiltoniano però ammette un numero infinito di autovalori ad energia positiva, energie che corrispondonoai possibili stati non legati di un elettrone e di un protone. Questi ultimi non sono discreti e rappresentanoun continuo di valori.
Come vedremo nellâapprossimazione di Born-Oppenheimer è possibile ridurre il moto vibrazionale di unamolecola biatomica ad un problema monodimensionale. Una curva di energia potenziale e la strutturagenerale dello spettro per una molecola biatomica ha la forma riportata in Figura 1.3. Lâequazione di
Figura 1.3: Potenziale intermolecolare tipico e autovalori dellâHamiltoniano
SchrĂśdinger ha due tipi di soluzione a seconda del segno dellâautovalore corrispondente:
⢠autofunzioni corrispondenti ad autovalori negativi (negativi rispetto allâenergia della dissociazioneA+B dove abbiamo posto lo zero dellâenergia) che rappresentano gli stati legati del sistema moleco-lare quindi le vibrazioni e le rotazioni della molecola legata. Il numero di queste soluzioni è di solito
7Se lâenergia potenziale diventa infinita nei turning point, come nel caso della particella nella scatola, allora la funzione nonpenetra nelle regioni classicamente proibite, ma si annullerĂ identicamente nei due turning point.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 27
finito (solo nel caso di potenziali di tipo Coulombiano come nellâatomo di idrogeno si hanno infinitistati legati) e gli autovalori sono discreti.
⢠autofunzioni corrispondenti ad autovalori ad energia positiva che rappresentano il moto dei due atominon legati cioè i processi di urto tra i due atomi (scattering states). Il numero di queste autofunzioniè infinito e non numerabile nel senso che gli autovalori rappresentano un insieme continuo di valori.
In Figura 1.4 nel pannello di sinistra sono riportate alcune funzioni dâonda tipiche per stati legati legati diuna molecola biatomica sovrapposti al potenziale. Allâaumentare dellâenergia (identificata approssimati-vamente dalla posizione della funzione sul potenziale) aumenta il numero di nodi perchĂŠ le autofunzioni diun operatore Hermitiano sono ortogonali.
Figura 1.4: Stati legati e di scattering di una molecola biatomica
Nella stessa figura, ma nel pannello di destra, sono invece disegnate tre autofunzioni del continuo o trestati di âscatteringâ. Questi stati rappresentano i processi di urto tra gli atomi costituenti la molecola.Allâaumentare dellâenergia anchâessi mostrano un piĂš elevato numero di oscillazioni. A lungo raggio peròquesti stati non sono nulli, ma diventano delle semplici onde di particella libera (combinazioni di funzioniseno e coseno). Quello che succede è che la seconda condizione al contorno per r â â non è la stessadegli stati legati e quindi gli stati non sono discreti. Un altra peculiarità è che gli stati del continuo nonsono evidentemente normalizzabili (lâintegrale su tutto lâasse x di sinx o cosx è indefinito). Gli autostatidel continuo (cioè ad energia positiva) non appartengono a L2 cioè allo spazio delle funzioni che sono alquadrato integrabili. Trattare gli stati del continuo è in generale piĂš complesso rispetto al caso degli statilegati. Lâanalisi della struttura e delle proprietĂ degli stati del continuo va sotto il nome di âscatteringtheoryâ e ricopre un ruolo di fondamentale importanza in chimica (anche se non viene mai affrontata nelpiano di studi): basti pensare che una qualunque reazione chimica in fase gassosa benchĂŠ avvenga tra dueo piĂš stati legati (i due o piĂš reagenti) ha a che fare con il loro moto relativo che produce i prodotti che aloro volta si allontanano gli uni dagli altri. Nel caso piĂš semplice avremmo
AB+B ââ B2 +A
dove siamo ovviamente interessati alla funzione dâonda del sistema ad energia positiva (cioè allo stato discattering tra AB e B), energia che è semplicemente lâenergia cinetica relativa tra AB e B.
1.11 Principio e metodo variazionale
Lâequazione di SchrĂśdinger time-independent è unâequazione agli autovalori
H |ÎŚă= E |ÎŚă . (1.52)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 28
Il metodo variazionale, basandosi sul principio variazionale, permette di trovare una soluzione approssi-mata a questa equazione. Questo metodo è estremamente importante perchĂŠ, a parte pochi e semplici casi,lâeq. di SchrĂśdinger non può essere risolta esattamente. Dalla teoria degli operatori nello spazio di Hilbertsappiamo che, essendo H un operatore Hermitiano, ammette uno spettro composto da infiniti autovalorireali EÎą a cui corrispondono infinite autofunzioni ortonormali (che in genere non sappiamo trovare) e cheindichiamo con |ÎŚÎąă
H |ÎŚÎąă= EÎą |ÎŚÎąă Îą = 0, 1, 2, . . . (1.53)
Si può assumere per semplicitĂ che il set di autovalori EÎą sia discreto. Il set di autofunzioni |ÎŚÎąă eâuna base di rappresentazione completa dello spazio di Hilbert e quindi qualunque funzione di questo spaziosi può esprimere come combinazione lineare delle autofunzioni:
|ÎŚă= âÎą
cÎą |ÎŚÎąă= âÎą
ăÎŚÎą |ÎŚă |ÎŚÎąă (1.54)
1.11.1 Principio variazionale
Il teorema variazionale recita:
data una funzione dâonda normalizzata |ÎŚă con cui si cerca di approssimare lo stato fonda-mentale di un sistema, il valore medio dellâenergia calcolato su questa funzione è un limitesuperiore allâenergia dello stato fondamentale vero
ăÎŚ|H|ÎŚă ⼠E0
La dimostrazione è molto semplice: usando lâeq. (1.54), possiamo scrivere:
1 = ăÎŚ|ÎŚă= âιβ
ăÎŚ|ÎŚÎąăăÎŚÎą |Όβ ăăΌβ |ÎŚă=
= âιβ
ăÎŚ|ÎŚÎąăδιβ ăΌβ |ÎŚă= âÎą
ăÎŚ|ÎŚÎąăăÎŚÎą |ÎŚă= âÎą
âŁâŁăÎŚÎą |ÎŚăâŁâŁ2 (1.55)
dove abbiamo fatto uso del fatto che le autofunzioni di H sono ortonormali. Il valore medio dellâenergiapuò essere scritto usando lo stesso procedimento come
ăÎŚ|H|ÎŚă= âιβ
ăÎŚ|ÎŚÎąăăÎŚÎą |H|Όβ ăăΌβ |ÎŚă= âÎą
EÎą
âŁâŁăÎŚÎą |ÎŚăâŁâŁ2 (1.56)
Ora, essendo Eι ⼠E0 per definizione, otteniamo:
ăÎŚ|H|ÎŚă= âÎą
EÎą
âŁâŁăÎŚÎą |ÎŚăâŁâŁ2 ⼠E0 â
Îą
âŁâŁăÎŚÎą |ÎŚăâŁâŁ2 = E0 (1.57)
dove abbiamo usato (1.55) per lâultima uguaglianza che dimostra il teorema.
Il teorema ci dice una cosa molto importante: il valore medio dellâenergia di una funzione dâonda approssi-mata eâ sempre troppo alta ed è quindi possibile misurare la qualitĂ di una funzione usando la sua energia:piĂš bassa lâenergia, migliore sarĂ la funzione approssimata. Questo è alla base del metodo variazionalein cui una funzione approssimata (funzione di prova) che dipende da alcuni parametri viene ottimizzatavariando tali parametri in modo che il valore medio di H sia il minimo possibile.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 29
1.11.2 Metodo variazionale lineare
Data una funzione di prova dipendente da alcuni parametri il valore medio dellâenergia di tale funzioneăÎŚ|H|ÎŚă dipende anchâesso dagli stessi parametri. Se la funzione di prova contiene solo parametri lineariil problema di ottimizzare questi parametri si riduce ad una diagonalizzazione di una opportuna matrice.Se prendiamo, infatti, un set composto da un numero finito (N) di funzioni di base fissate |Ψιă, si puoâesprimere la funzione di prova come combinazione lineare di queste funzioni
|ÎŚă=N
âi=1
ci |Ψiă (1.58)
e si puoâ ridurre il problema di trovare un set di coefficienti ci ottimali ad una diagonalizzazione di matrice.
A questo punto bisogna precisare qualcosa sulle funzioni di base utilizzate: abbiamo due diversi casi aseconda se le funzioni |Ψιă siano o meno ortonormali (assumiamo siano reali per comoditĂ ). Il caso confunzioni ortonormali è ovviamente matematicamente piĂš semplice.
La rappresentazione matriciale di H sulla base scelta è una matrice H reale simmetrica (H è hermitiano)NĂN con elementi
H ji = Hi j = ăΨi|H|Ψ jă (1.59)
Il valore medio di H è dato da
ăÎŚ|H|ÎŚă= âi j
ci ¡ c j ¡â¨Î¨iâŁâŁH|Ψ j
âŠ= â
i jcic jHi j (1.60)
ed è una funzione dei coefficienti dellâespansione. Il nostro problema consiste nel trovare i migliori cicioè quelli che rendono minima lâenergia (1.60) (rendono minima sta per ârendono piĂš vicina possibileallâenergia veraâ). Il problema si riduce quindi a quella che si chiama una minimizzazione vincolata (oproblema di Lagrange) perchĂŠ la minimizzazione dellâenergia deve comunque avvenire mantenendo inal-terata la condizione (il vincolo) che la funzione di prova sia normalizzata. Il vincolo in termini matematiciè
ăÎŚ|ÎŚă= âi j
ci ¡ c j ¡ ăΨi|Ψ jă= âi|ci|2 = 1 (1.61)
Per poter minimizzare una funzione vincolata si ricorre al metodo dei Moltiplicatori di Lagrange, cioè sicostruisce una funzione Langragiana (che contiene il moltiplicatore di Lagrange E che moltiplica il vincoloin forma implicita):
L (c1, . . . , cn,E) = ăÎŚ|H|ÎŚăâE(ăÎŚ|ÎŚăâ1
)= (1.62)
= âi j
cic jHi j âE
(â
i|ci|2â1
)(1.63)
Il minimo della funzione Langragiana e quello di ăÎŚ|H|ÎŚă coincidono. Per trovare tale minimo imponiamoche la variazione L sia nulla per variazioni degli N coefficienti:
âL
âck= â
jc jHk j +â
iciHik â2Eck = 0 (1.64)
essendo H una matrice simmetrica possiamo scrivere:
âj
Hi jc j âEci = 0 i = 1, . . . , N (1.65)
In notazione matriciale il primo è il prodotto di una matrice con un vettore colonna e quindi si può scrivere
Hc =Ec (1.66)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 30
che è un comune problema agli autovalori della matrice H. Essendo una matrice simmetrica H ammette Nautovalori reali e N autovettori ortogonali. Quindi esplicitamentre si ha:
HcÎą =EÎą cιι = 0,1, . . .Nâ1
dove(cÎą)â cβ = â
icÎą
i cβ
i = 1
Se si usano questi autovettori come colonne di una matrice C si può generalizzare le relazione (1.65) a
HC = CE
dove si è costruita la matrice diagonale E con elementi Ei j = δi jEi. Quindi abbiamo trovato N soluzioni(N serie differenti di coefficienti ci) diverse che rappresentano altrettanti stati del sistema e che risultanoortonormali:
ăÎŚÎą |Όβ ă = âi j
C jÎąC jβ ăΨi|Ψ jă= âi j
CiÎąC jβ δi j = âi
cιi cβ
i = διβ
I vari Ei che appaiono sono approssimazioni alle energie dei vari stati del sistema. Il valore piĂš basso diEi cioè E0 è la migliore approssimazione possibile allâenergia dello stato fondamentale vero del sistemaallâinterno della base prescelta. Si può dimostrare che i valori E1, E2 ecc. sono una buona approssimazionedegli stati eccitati del sistema. La condizione per gli stati eccitati è tuttavia un poâ piĂš complessa, infatti sela funzione âveraâ dello stato fondamentale è Ψ0 di energia Ev
0 e lâenergia âveraâ del primo stato eccitatoè Ev
1 , le due energie approssimate E0 ed E1 che corrispondono alle due funzioni variazionali ÎŚ0 e ÎŚ1obbediscono alle seguenti condizioni
E0 ⼠Ev0
E1 ⼠Ev1 â Îľ0(Ev
1 âEv0)
dove la prima condizione è il teorema variazionale, e la seconda rappresenta la condizione piĂš debole validaper stati eccitati dove Îľ0 = 1â|ăΨ0|ÎŚ0ă |2. PerchĂŠ anche la seconda sia valida è necessario che la funzionedi prova per lo stato fondamentale sia il piĂš simile possibile a quella vera.
BenchÊ il metodo possa apparire molto semplice, è di fondamentale importanza perchÊ su di esso si basanoper esempio i calcoli CI (configuration interaction) che vedremo piÚ avanti e che possono essere consideratii metodi con cui si ottengono le migliori energie energie elettroniche molecolari.
Lo stesso risultato si ottiene in maniera molto semplice (quando si usa una base ortonormale) approssimando diret-tamente la funzione dâonda vera su una base finita di funzioni ottenuta dal troncamento di qualche set completo (peresempio):
|ÎŚă=N
âi=1
ci |Ψiă (1.67)
Sostituendo questa espressione nellâeq. (1.52) si ottiene
âi
ciH |Ψiă= E âi|Ψiă
premoltiplicando a sinistra per ăΨ j|
âi
â¨Î¨ jâŁâŁH|Ψi
âŠ= E â
iciâ¨Î¨ jâŁâŁÎ¨iâŠ
= Ec j
cioèâ
iH jici = Ec j
che è esattamente uguale allâeq. (1.65).
Naturalmente, lâequivalenza fra lâequazione di autovalore per lâoperatore e quella per la sua matrice di rappresen-tazione in una base ortonormale di funzioni vale rigorosamente se e solo se queste funzioni costituiscono un insieme
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 31
completo, cioè se la base descrive lâintero spazio di Hilbert. Altrimenti è chiaro che in generale non sarĂ possibileesprimere qualsiasi funzione, ed in particolare le autofunzioni, come combinazione lineare delle funzioni di base. Lacompletezza dellâinsieme di base non è però sempre realizzabile in pratica in quanto lo spazio ha spesso dimensioneinfinita. Tuttavia, costruire e diagonalizzare la matrice appare una procedura ragionevole anche in un sottospazio finitoper trovare delle autofunzioni approssimate, e viene usata comunemente.
Nel caso che si scelgano invece funzioni di base non ortonormali le cose si fanno piĂš complesse, ma ilprocedimento resta lo stesso. Definiamo la Langragiana come prima, ma teniamo conto delle funzioni nonortonormali
L (c1, . . . , cn,E) = ăÎŚ|H|ÎŚăâE(ăÎŚ|ÎŚăâ1
)=
= âi j
cic jHi j âE
(âi j
cic j ăΨi|Ψ jăâ1
)(1.68)
doveâ¨Î¨iâŁâŁÎ¨ j
âŠ= Si j sono gli elementi della matrice di sovrapposizione. La differenziazione dellâespres-
sione qui sopra è ora leggermente piÚ complicata
âL
âck= â
jc jHk j +â
iciHik âE
(â
jc jSk j +â
iciSik
)(1.69)
che può essere riscritta come
âL
âck= â
j
(c jHk j âEc jSk j
)+â
i(ciHik âEciSik) = (1.70)
Lâunica è che si annullino le quantitĂ tra parentesi cioè sia verificata la condizione seguente:
âj
Hi jc j = E âj
Si jc j (1.71)
o in notazione matricialeHc =ESc (1.72)
dove S è la matrice di sovrapposizione. Questa è essenzialmente una generalizzazione della relazione (1.66)dove avevamo S = I. Questa volta però il problema lineare è decisamente piÚ complesso da risolvere e sidice problema agli autovalori generalizzato. Come vedremo il metodo di Hartree-Fock si basa proprio sullasoluzione di questo tipo di problema (la formulazione di Roothan usa infatti una base non ortogonale).La soluzione si ottiene in genere ortogonalizzando la base e riducendo il problema generalizzato ad unproblema lineare tradizionale.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 32
1.12 Energie e strutture molecolari: problema elettronico (ab-initio)e problema nucleare (dinamica)
Il problema terribilmente complesso del moto di M + N particlelle quantistiche, M nuclei e N elettroni,può essere âscompostoâ in due fasi grazie allâapprossimazione di Born-Oppenheimer (BO). Il problemaelettronico viene in genere risolto prima e fornisce quella che si chiama la PES (superficie di energiapotenziale) che, secondo BO rappresenta il potenziale in cui si muovono i nuclei.
Figura 1.5:
Come indicato schematicamente in Figura 1.5 tramite lâapprossimazione di Bon Oppenheimer uno puòrisolvere il problema elettronico senza prendere in considerazione i moti nucleari. In pratica si risolve ilproblema elettronico considerando i nuclei fissi e infinitamente massivi. Si ottengono le energie degli statielettronici (a volte solo lo stato fondamentale) e si spostano i nuclei. Continuando in questo modo si cal-colano le energie degli stati elettronici come una funzione delle coordinate nucleari (le energie elettronichenon sono ovviamente funzioni analitiche, ma semplici insiemi di punti discreti). Queste funzioni punto-a-punto forniscono, a meno di una costante arbitraria e previa una qualche forma di interpolazione/fitting, lesuperfici di energia potenziale (PES). La PES può (nellâambito di validitĂ della Born-Oppenheimer) essereinterpretata come il potenziale agente tra i nuclei. Una volta ottenuto questo potenziale è possibile farmuovere i nuclei sia classicamente sia quantomeccanicamente. Nel secondo caso non si va oltre i pochiatomi e sono veramente rari i casi in cui si raggiungano i 4 atomi. Nel caso si voglia calcolare solo lostato fondamentale si possono usare metodi sofisticati e raggiungere le poche decine di atomi. Se invece inuclei vengono trattati classicamente come particelle puntiformi si può arrivare a trattarne anche migliaia.In questâultimo caso esistono due possibili approcci al sistema:
1. Calcolare lâenergia elettronica con un metodo ab-initio e poi usare il potenziale risultante per muo-vere i nuclei: che è il modo in cui funzionano i metodi di dinamica molecolare di tipo Car-Parrinelloe similari (numero di atomi inferiore a cento).
2. Bypassare completamente il calcolo delle energie elettroniche assumendo un campo di forze piĂš omeno armonico tra i vari nuclei dato da costanti empiriche e ottimizzate su molecole piĂš semplici(MM2 per esempio): che sarebbero i metodi di meccanica molecolare classica dove il numero diatomi arriva anche ad alcune migliaia.
Il metodo Hartree-Fock fornisce la piĂš semplice approssimazione variazionale alla funzione dâonda dellostato stazionario fondamentale che si possa costruire rigorosamente (ab-initio) dai principi teorici (cioè
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 33
dallâhamiltoniano elettronico non-relativistico esatto) senza intervento di parametri aggiustabili empirica-mente. Esso corrisponde al minimo sviluppo della funzione dâonda dotato di senso fisico: un singolodeterminante o una combinazione lineare di pochi determinanti dettata dai requisiti di simmetria spaziale edi spin. Nonostante ciò, oltre a costituire un modello fisico di particolarmente facile interpretazione, essofornisce risultati per alcuni aspetti soddisfacenti e perfino di validitĂ semiquantitativa. Ad esempio, lâener-gia totale HF rappresenta tipicamente oltre il 90% dellâenergia totale vera (non-relativistica) di un sistemaelettronico. Questo naturalmente riflette il fatto che i termini di accoppiamento coulombiano nellâhamil-toniano sono termini âpiccoliâ rispetto allâenergia cinetica e a quella di attrazione verso i nuclei. Questoè vero in particolare per gli elettroni di core, per i quali questi ultimi termini sono molto grandi visto cheessi orbitano ad altissima velocitĂ vicino ai nuclei, ed il cui moto è in pratica trascurabilmente correlato aquello degli elettroni di valenza.
Tuttavia, per la gran parte degli scopi di interesse chimico e spettroscopico, il modello HF è insufficientee, al piĂš, solo qualitativo. Le osservabili di interesse piĂš comune sono infatti in generale differenze dienergia fra stati elettronici diversi (spettroscopia) o fra diverse configurazioni nucleari di uno stesso stato(energetica delle reazioni chimiche). Queste differenze di energia, che originano essenzialmente da diffe-renze nelle distribuzioni elettroniche degli elettroni di valenza, sono tipicamente proprio dello stesso ordinedi grandezza degli errori nelle energie totali HF e spesso inferiori. Per alcune osservabili che coinvolga-no significativamente rotture o formazioni di legami chimici (un esempio evidente è quello dei processidi dissociazione) il modello HF è in generale giĂ a priori qualitativamente sbagliato. CosĂŹ pure, si verificaspesso una fondamentale inadeguatezza della funzione dâonda HF per la riproduzione di osservabili diversedallâenergia. La differenza (teorica) fra lâenergia esatta non-relativistica di un sistema elettronico e quella(esatta) HF viene definita energia di correlazione elettronica, e tutti i fenomeni e le alterazioni del valore diosservabili che possono essere riprodotti solo da funzioni dâonda piĂš accurate di quella HF vengono dettieffetti di correlazione.
Ecco qui di seguito una breve rassegna di metodologie che vengono comunemente utilizzate per calcolarele energie elettroniche
1. Hartree-Fock (HF): è il metodo concettualmente piĂš semplice. In pratica è la metodologia principaleche abbiamo per costrire gli orbitali molecolari. Il metodo inoltre permette di calcolare rapidamenteuna buona apprissimazione allâenergia di molecole fortemente legate la cui geometria non sia troppodiversa da quella di equilibrio. Il suo limite è che non tiene conto della correlazione elettronica equindi commette un errore sistematico sullâenergia. Anticipiamo qui la definizione di un concettomolto importante nellâambito dei calcoli ab-initio: lâenergia di correlazione. Tale energia è moltosemplicemente definita come âquello che manca ad un calcolo Hartree-Fockâ. Se confrontiamo irisultati ottenuti da HF con quelli âesattiâ ottenuti da metodi migliori vediamo che manca semprequalcosa di simile ad un 10% dellâenergia. Questo ammontare è detto energia di correlazione chederiva fisicamente dallâinterazione âistantaneaâ tra elettroni che il metodo di HF necessariamentenon include perchĂŠ è un metodo basato sullâapprossimazione di campo medio (cioè non considera leposizioni istantanee relative degli elettroni).
Esistono 3 tipi di HF: Restricted HF, Restricted Open-Shell HF, Unrestricted HF. La differenza stanel modo in cui vengono accoppiati gli spin degli elettroni negli orbitali molecolari. Il primo tra i trenon può trattare problemi di rottura omolitica di legami.
Il costo computazionale di HF è relativamente modesto e viene ormai prevalentemente usato quasiesclusivamente per generare orbitali molecolari che possono servire come partenza per metodologiepiÚ complesse e accurate. Se necessario, è comunque possibile usare HF per ottimizzare le geometriedelle molecole, ma sarebbe meglio usare metodi computazionalmente equivalenti, ma piÚ accuraticome MP2 o DFT.
2. Density Functional Theory (DFT): è una metodologia che si basa sul calcolo della densitĂ elettro-nica della molecola. Il suo costo computazionale è di poco superiore ad HF, ma può raggiungereaccuratezze molto maggiori grazie ad un approccio âquasi semiempiricoâ. Viene comunemente im-piegata per il calcolo dellâenergia in sistemi con molti elettroni come i solidi per esempio. Il suo
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 34
problema principale è che il calcolo dellâenergia di correlazione (cioè la parte mancante ad un calco-lo HF) è âempiricaâ e si basa su formule piĂš o meno complicate che possono o meno funzionare suun dato sistema. Semplificando molto, tali formule vengono detti funzionali. Ne esistono diversi aseconda delle esigenze e, purtroppo, i risultati sono fortemente dipendenti dalla loro scelta.
Alcuni tra i chimici teorici piĂš intransigenti considerano la DFT alla stregua di un metodo âse-miempiricoâ. Parte del suo successo è anche dovuto al fatto che viene usata per calcolare lâenergiaelettronica nei metodi di tipo Car-Parrinello dove il calcolo del moto classico dei nuclei è accoppiatocon un calcolo ab-initio di tipo DFT dellâenergia elettronica.
3. Many Body Perturbation Theory (MBPT) o Møller Plesset Theory (MP2-MP4): questi due me-todi non sono variazionali e potrebbero produrre energie piÚ basse di quelle esatte. Questi metodi,infatti, calcolano le energie elettroniche utilizzando la teoria delle perturbazioni al secondo e quartoordine. Il costo di MP2, come vedremo, non è di molto superiore ad un calcolo HF che viene co-munque eseguito in quanto entrambi i metodi perturbativi necessitano di orbitali molecolari. MP2include però gran parte della correlazione elettronica e si può utilizzare per ottimizzare geometriemolecolari. MP4 invece risulta computazionalmente molto pesante, ma rappresenta uno dei metodipiÚ accurati in circolazione per il calcolo delle energie elettroniche degli stati fondamentali.
4. CI, Full-CI (Configuration Interaction): ĂŠ un metodo che in linea di principio permetterebbe diottenere le energie elettroniche âesatteâ dello stato fondamentale e di tutti gli stati eccitati. Purtroppoè anche pressochĂŠ inutilizzabile dato lo sforzo computazionale richiesto. Eâ stato usato solo in sistemicon pochissimi elettroni. Anche se concettualmente importante, nella pratica gli si preferisconometodi come i seguenti.
5. DCI, SDCI, QCI e MRCI (Doubles-Configuration Interaction, Singles and Doubles CI, Quadratic-CI e Multi Reference CI): sono diversi modi di semplificare un calcolo Full-CI. Possono esseremolto accurati, ma è sempre difficile giudicare la loro accuratezza. Vengono utilizzati per calcolarele energie elettroniche degli stati eccitati.
6. MCSCF e CASSCF (Multi Configurational Self Consisten Field, Complete Active Space Self Con-sisten Field): sono lâequivalente di HF per situazioni in cui HF non può funzionare. Sono metodiche servono a costruire orbitali molecolari (ma queata volta adatti anche a descrivere stati elettronicieccitati). Anche loro non includono la correlazione dinamica che deve essere âaggiuntaâ utilizzandocalcoli di tipo perturbativo o SDCI. Per quello si sente spesso parlate di metodologie CAS-PT2 oCAS-MRCI. Questo ultimo tipo di calcoli è molto complesso dal punto di vista teorico, difficile dafare e pesante computazionalmente, ma fornisce energie molto accurate.
7. CC (Coupled Cluster): una serie di metodologie la cui teoria è molto complessa. Permette di rag-giungere unâaccuratezza molto alta, ma solo per lo stato fondamentale a scapito di una notevolepesantezza computazionale. Metodo dâelezione per lo studio dei legami deboli (dimeri molecolari,sistemi di Van der Waals).
8. Metodi semiempirici (Huckel): vengono utilizzati hamiltoniani modello con cui si costruisconodeterminanti secolari in grado di fornire energie molecolari approssimate: sono metodi utili per latrattazione di molecole organiche con molti atomi.
I vari metodi hanno accuratezze e campi di applicazione molto diversi che sono riportati qualitativamentein Figura 1.6.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 35
Figura 1.6:
1.13 La dinamica delle molecole: lâapprossimazione di Born-Oppenheimer,la vibrazione e rotazione delle molecole biatomiche
1.13.1 Lâapprossimazione di Born-Oppenheimer
La massa degli elettroni è molto piĂš piccola di quella dei nuclei. Le forze a cui sono sottoposti elettroni enuclei sono invece dello stesso ordine di grandezza. Il moto dei nuclei, quindi, è molto âlentoâ rispetto aquello elettronico. In chimica è importante che sia possibile descrivere i moti nucleari disaccoppiandoli daquelli elettronici. Questo è quello che fa lâapprossimazione di Born-Oppenheimer. Qui ci limiteremo aduna molecola biatomica per evitare una notazione inutilmente complessa.
Figura 1.7: Coordinate utilizzate per descrivere lâapprossimazione di Born-Oppenheimer
Lâequazione di SchrĂśdinger indipendente dal tempo per una molecola biatomica composta da due nuclei di
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 36
massa MAe MB e da N elettroni è:
[TN +Te +V +Hmp]Ď(R,r) = EtotĎ(R,r) (1.73)
dove con R abbiamo indicato il vettore tra i due nuclei e con r le varie coordinate elettroniche rispetto ad unopportuno sistema di riferimento il cui centro è nel centro di massa della molecola (vedi Figura 1.7). I varitermini dellâHamiltoniano sono lâenergia cinetica relativa dei nuclei e quella elettronica (in unitĂ atomiche)
TN =â 12Âľ
â2R e Te =
N
âi=1
(â1
2â
2ri
)(1.74)
dove Âľ = MAMB/(MA + MB) è la massa ridotta tra i due nuclei. Il termine Hmp è detto termine di pola-rizzazione di massa ed è dovuto al fatto che in un sistema descritto dalle coordinate di figura Figura 1.7lâoperatore di energia cinetica non è una somma di laplaciani. Tale termine è dato da
Hmp =â 12(MA +MB)
(N
âi=1
âri
)2
(1.75)
Il potenziale consiste nellâenergia elettrostatica tra le particelle
V =âN
âi=1
ZA
|riâRA|â
N
âi=1
ZB
|riâRB|+ â
i< j
1ri j
+ZAZB
R(1.76)
Adesso fissiamo i nuclei, otteniamo unâequazione per gli elettroni che possiamo in linea di principiorisolvere con uno dei metodi studiati predentemente e quindi trovarne autovalori e autofunzioni:
(Te +V )ÎŚq(R;r) = Eq(R)ÎŚq(R;r) (1.77)
Lâautovalore Eq(R) e la funzione dâonda elettronica ÎŚq(R;r) dipendono parametricamente, per ogni statoelettronico q, dalla coordinata internucleare R. Se il set di funzioni elettroniche è un set completo ÎŚq eortonormale, possiamo espandere (tale espansione è detta adiabatica) la funzione dâonda totale come
Ď(R;r) = âq
Fq(R)ÎŚq(R;r) (1.78)
dove i coefficienti di espansione Fq(R) sono coefficienti dipendenti da R. Li possiamo interpretare comefunzioni dâonda che rappresentano il moto nucleare quando lo stato elettronico è q. Sostituendo (1.78)nellâeq. di SchrĂśdinger (1.73) e moltiplicando a sinistra per ÎŚâ
s e integrando si ottiene
âq
âŤdrÎŚ
âs (R;r)[TN +Te +V âEtot]Fq(R)ÎŚq(R;r) = 0 (1.79)
che è un set di equazioni integro-differenziali per i valori possibili di s = 1, 2, . . .. Queste equazioni sonoaccoppiate perchè ÎŚq non è un autofunzione di TN . Lâazione degli altri operatori invece è quella dellâeq.(1.77). Quindi si ottiene
âq
[âŤdrÎŚ
âs (R;r)TNFq(R)ÎŚq(R;r)
]+[Es(R)âEtot]Fs(R) = 0 (1.80)
dove abbiamo usato la condizione ăÎŚs|ÎŚqă = δqs e dove il secondo termine contenente energie è disac-coppiato (compare solo lâindice s), mentre il primo termine è accoppiato. Eâ importante notare che finoad ora non abbiamo utilizzato alcuna approssimazione. Fino ad ora il calcolo è esatto. Vediamo qual è lastruttura del primo termine andando a calcolare lâazione dellâoperatore TN sul prodotto di funzione (ÎŚqFq).Entrambe le funzioni dipendono da R e quindi TN che è una derivata seconda rispetto alle stesse coordinatedarĂ
TN(ÎŚqFq) =â 12Âľ
[Fq ¡ (â2
RÎŚq)+2(âRFq ¡âRÎŚq)+ÎŚq ¡ (â2RFq)
](1.81)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 37
da cui si vede come compaiano due termini dâaccoppiamento che coinvolgono il gradiente rispetto allecoordinate nucleari delle funzioni dâonda elettroniche.
Lâapprossimazione di Born-Oppenheimer consiste nel trascurare |âRÎŚq| rispetto a |âRFq|. Questo fa sĂŹ chele equazioni in (1.80) disaccoppino e diventino une serie di equazioni agli autovalori per il moto nucleare[
â 12Âľ
â2R +Es(R)âEtot
]Fs(R) = 0 (1.82)
dove se interpretiamo lâautovalore dellâeq. dâonda elettronica (1.77) come un potenziale abbiamo unâe-quazione del tutto analoga ad unâequazione di SchrĂśdinger8. Il senso dellâapprossimazione di Born-Oppenheimer è quello di interpretare lâenergia totale elettronica della molecola come il potenziale in cui simuovono i nuclei.
1.13.2 Il moto delle molecole biatomiche: rotazione e vibrazione
Lâapprossimazione di Born Oppenhemier permette la separazione del moto elettronico da quello nucleare.In pratica abbiamo visto che è possibile risolvere il problema elettronico a diverse geometrie nucleari eottenere lâenergia elettronica totale come funzione delle coordinate nucleari. Nel caso di una molecolabiatomica si ottiene quindi una curva di energia che è funzione della distanza tra i nuclei, mentre nel casodi molecole poliatomiche si ottiene una funzione a piĂš dimensioni. Lâapprossimazione di Born Oppen-heimer permette di considerare questa energia totale elettronica come il potenziale in cui si muovono inuclei. Per questo motivo si parla di Curve di Energia Potenziale (PEC) o Superfici di Energia Potenzia-le (PES). Per semplicitĂ da ora in poi considereremo solemente il caso monodimensionale della curva dienergia potenziale in quanto il caso multidimensionale rappresenta una notevole (e a volte insormontabile)complicazione formale e di calcolo.
Il moto dei nuclei allâinterno del potenziale generato dagli elettroni può essere trattato in modo quantisticoo classico. In questo corso ci limiteremo a sistemi molto semplici e quindi alla soluzione quantisticaâesattaâ, ma in problemi piĂš complessi la scelta della meccanica classica è lâunica ragionevole. Con buonaapprossimazione, a parte sistemi particolari, non si procede alla dinamica quantistica in sistemi con piuâ di6-8 gradi di libertĂ .
Il nostro sistema è costituito da due particelle A e B che interagiscono tramite un potenziale che dipendesolamente dalla distanza tra le particelle e non dallâorientazione della molecola nello spazio V (R)âĄV (R).Lâequazione di SchrĂśdinger per il moto di due particelle rispetto al centro di massa è data, in termini di unaparticella di massa ridotta Âľ , da: (
â 12Âľ
â2 +V (R)
)Ď(R) = EĎ(R)
8Un altro modo di vedere lâapprossimazione di BO è questo: consideriamo lâeq. (1.80) e riscriviamola in notazione compatta
âqăs|TNFq|qă+[Es(R)âEtot ]Fs = 0
esplicitando TNsi ha
â 12Âľ
âq
(ăs|â2
R|qăFq +2ăs|âR|qăâRFq)â 1
2Âľâ
2RFs +[Es(R)âEtot]Fs = 0
I termini nella sommatoria sono detti termini non-adiabatici di primo e secondo ordine. Lâapprossimazione adiabatica si ottienetroncando la sommatoria e tenendo solo il primo termine non-adiabatico al secondo ordine (quello al primo ordine va a zero per s = q)
â 12Âľ
(ăs|â2
R|să+â2R)
Fs +[Es(R)âEtot]Fs = 0
Questâultima equazione si può scrivere in forma piĂš esplicita come[â 1
2Âľâ
2R +Es(R)+Us(R)âEtot
]Fs(R) = 0
dove il termine Us(R) è detto correzione diagonale ed è molto piccolo quando confrontato con Es(R). Lâapprossimazione di Born-Oppenhemier si ottiene trascurando anche Us(R).
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 38
Nel caso di potenziali centrali la risoluzione dellâequazione di SchrĂśdinger è semplificata e procede comeper lâatomo di idrogeno separando la parte radiale della funzione dâonda da quella angolare. LâHamiltonia-no espresso in coordinate polari infatti diventa
H =â 12Âľ
â2R +V (R) =â 1
2Âľ
(1
R2â
âR
(R2 â
âR
)â L2
R2
)+V (R) (1.83)
dove L2 è il solito operatore di momento angolare con autovalori l(l + 1) in unitĂ atomiche. Come nellatrattazione dellâatomo di idrogeno possiamo fattorizzare la funzione dâonda (nel caso di potentiali centralifattorizzare la funzione dâonda non è unâapprossimazione!) e scrivere
Ď(R) = Rl(R) ¡Yl,m(θ ,Ď) (1.84)
dove con Yl,m(θ ,Ď) abbiamo indicato le armoniche sferiche che sappiamo essere soluzioni della parteangolare dellâequazione. Sostituendo lâeq.(1.84) in (1.83) si ottiene lâequazione per il moto radiale (latrattazione è del tutto analoga a quella dellâatomo di idrogeno)
â 12Âľ
[1
R2â
âR
(R2 â
âR
)â l(l +1)
R2
]+V (R)
Rl(R) = E â˛Rl(R). (1.85)
Questa equazione descrive il moto radiale di qualunque sistema a due particelle che interagiscono tramiteun potenziale centrale. Nel caso dellâatomo di idrogeno il potenziale è dato dallâespressione V (R) = 1/Re la soluzione dellâeq. (1.85) è analitica ed è data, per gli stati legati, dai polinomi associati di LaguerreL2l+1
n+l (2r/n) moltiplicati per degli esponenziali decrescenti. Purtroppo nel caso di una molecola biatomicail potenziale non è noto analiticamente e come vedremo lâequazione radiale va risolta numericamente. Unaforma âcomodaâ dellâeq. (1.85) si ottiene scrivendo
ul(R) = r ¡Rl(R)
e quindi ottenendo [â 1
2Âľ
d2
dR2 +l(l +1)2ÂľR2 +V (R)
]ul(R) = E â˛ul(R).
Abbiamo trasformato il problema del moto di due atomi nella risoluzione di unâequazione mono-dimensionalecon potenziale dato da
Ve f f (R) =l(l +1)2ÂľR2 +V (R)
dove il termine l(l+1)/2ÂľR2 è detto barriera centrifuga e rappresenta il contributo allâenergia del momentoangolare della molecola.
In genere nelle molecole biatomiche il momento angolare l viene indicato con j e il potenziale è quellofornito dalla soluzione dellâequazione dâonda elettronica Es(R); quindi lâequazione che ci permette dianalizzare il moto degli atomi in una molecola biatomica è semplicemente:[
â 12Âľ
d2
dR2 +j( j +1)2ÂľR2 +(Es(R)âErif)âEs jν
]us
ν , j(R) = 0 (1.86)
dove abbiamo indicato con Es jν lâautovalore dellâenergia dellâequazione nucleare, con j il momento ango-lare della molecola e con ν il numero quantico che identifica lo stato energetico allâinterno della buca dipotenziale (lâequivalente di n per lâatomo di idrogeno) e che vedremo sarĂ il numero quantico vibrazionale.Abbiamo inoltre specificato esplicitamente che il potentiale V (r) = Es(R)âErif è dato dallâenergia di unparticolare stato elettronico s calcolato a diverse geometrie usando un metodo ab-initio a meno di una co-stante che di solito è il limite di dissociazione molecolare piĂš basso cioĂŠ lâenergia elettronica dei due atomisparati Erif = Es(R â â) = Es(A) + Es(B). Lâenergia totale Es jν della molecola dipenderĂ quindi dallostato elettronico scelto s, dal numero quantico principale ν e dal momento angolare presente nel sistemaj. In Figura 1.8 è riportato uno schema per i primi due stati elettronici in una generica molecola biatomicasenza eccitazione rotazionale cioè con j = 0. Se i due o piĂš stati elettronici sono molto lontani in energiaallora i singoli stati legati al loro interno possono considerarsi indipendenti e quindi possono essere trattatiseparatamente9.
9Nota bene: gli stati legati che si trovano allâinterno dello stato elettronico eccitato nella figura 4 (identificati da E(s = 2)) non
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 39
Figura 1.8: Schema dei livelli vibro-elettronici di una molecola biatomica
1.13.3 Lâapprossimazione armonica alle energie molecolari
Eâ possibile ottenere una stima dei valori di Es jν usando lâapprossimazione armonica. Eâ infatti possibileespandere il potenziale di un determinato stato elettronico in serie di Taylor per distanze vicine alla geo-metria di equilibrio. Vicino al minimo la derivata prima è nulla e il potenziale al secondo ordine è datodallâapprossimazione armonica
Es(R)âź Es(Req)+12
d2Es
dR2 (RâReq)2 = Es(Req)+12
k(RâReq)2.
Allo stesso tempo si approssima lâenergia rotazionale utilizzando il valore di equilibrio di R (esplicitandole unitĂ atomiche):
E j âźh2
2ÂľR2eq
j( j +1) =h2
2Ij( j +1) = B j( j +1)
in modo che lâenergia totale risulti una semplice somma (dove le costanti dipendono dallo stato elettronicos: Ď perchĂŠ dipende dalla forma della curva, B percheâ dipende da Req che è diverso per stati elettronicidiversi)
Esν j = hĎs(ν +12)+Bs j( j +1).
In realtĂ questa è una descrizione piuttosto cruda delle energie molecolari e di solito si aggiungono deitermini correttivi per poter âfittareâ i risultati spettroscopici delle transizioni tra i livelli ro-vibrazionali.Lâespressione generale a cui si giunge con varie aggiunte è la seguente
Es, j,ν = hĎs
[(ν +
12
)âβs
(ν +
12
)2]
+Bs j( j +1)âDs j2( j +1)2 (1.87)
dove βs è la costante di anarmonicità e D è una costante che introduce la distorsione centrifuga.
sono veri stati legati, ma stati quasi-legati o metastabili in quanto è sempre possibile che decadano nello stato fondamentale peremissione spontanea (rilassamento radiativo). Tutti quegli stati hanno un tempo di vita finito e per il principio di indeterminazionela loro energia è afflitta da unâincertezza data dallâinverso del loro tempo di vita âE âź h/Ď . Questa incertezza affligge tutti gli statieccitati e come è noto le probabilitĂ di emissione spontanea sono proporzionali al cubo della frequenza della transizione e quindi itempi di vita degli stati elettronici eccitati sono particolarmente brevi e le loro energie molto incerte (spettroscopicamente si parla dirighe molto allargate percheâ non esiste una âprecisaâ condizione di risonanza non essendoci una precisa energia dello stato). Peresempio è pressochĂŠ impossibile accorgersi dellâincertezza dellâenergia uno stato vibrazionale eccitato come E(s=1, v=1, j=0), mentreè facile misurarla per uno stato come E(s=2, v=0, j=0).
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 40
1.13.4 LâHamiltoniano ro-vibrazionale âesattoâ: la rotazione molecolare e le bar-riere centrifughe
Lâespressione (1.87) benchĂŠ spieghi qualitativamente lâorigine dei vari contributi allâenergia molecola, nonè quantitativamente corretta sopratutto nel considerare le rotazioni. La cosa migliore è trovare tutte lesoluzioni del problema (??) integrando numericamente. Per prima cosa uno determina le auto-funzioni e leenergie ponendo j = 0, quindi passa a j = 1, j = 2 e coĂŹ via. I vari problemi a diverso valore di j vengonotrattati indipendentemente perchĂŠ j è lâunico momento angolare e quindi una costante del moto e quindi siconserva10. Quello che succede al cambiare di j è semplice da interpretare se si guarda la dipendenza delpotentiale
Ve f f (R) =j( j +1)2ÂľR2 +Es(R)
da j cioè si analizza il problema delle barriere centrifughe. In Figura 1.9 ho riportato il comportamentodi Ve f f per diversi valori di j per un potenziale generico. Quello che succede è che allâaumentare di j il
Figura 1.9: Comportamento di Ve f f per diversi valori di j.
potenziale diventa sempre piĂš repulsivo e la buca viene sempre piĂš ridotta perchĂŠ appaiono delle contributidetti barriere centrifughe generate dal termine positivo j( j + 1)/2ÂľR2. Come si vede chiaramente dallaFigura 1.9 il potenziale non avrebbe piĂš la possibilitĂ di sistemare stati legati giĂ con j = 15 percheâ ilminimo del potenziale si trova ad energie positive. Una trattazione esatta della rotazione e dei momentiangolari deve tenere conto del fatto che non è piuâ possibile avere una molecola legata per certi valori dij. Le barriere sono dette centrifughe perchĂŠ in una visione classica di un processo dâurto le traiettorie conenergia positiva minore della barriera non possono âavvicinarsiâ alla buca di potenziale perchĂŠ in mecca-nica classica la penetrazione delle barriere è proibita. Lâaumentare di j in genere provoca una diminuzionedel numero di stati legati che la molecola supporta: in figura 6 infatti vediamo lo stesso potenziale di pri-ma per due diversi valori di j, 0 e 10. Ho calcolato gli stati legati del sistema e mentre il potenziale perj = 0 supporta 3 stati legati ne ha solo uno per j = 10. Come detto prima per j = 15 la molecola dissocia.Ovviamente i valori di j che riescono a dissociare la molecola dipendono dalla forza del legame chimico edalle masse in gioco: molecole fortemente legate hanno moltissimi stati legati e ci vogliono valori altissimidi j per dissociarle.
10Ogni sistema invariante per rotazioni nello spazio cioè ogni sistema isolato ha come costante del moto il momento angolare totaleJ. In una molecola biatomica isolata di tipo ÎŁ, j è lâunico momento angolare e quindi si conserva.
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 41
Figura 1.10: Diminuzione degli stati legati vibrazionali allâaumentare di j
1.14 Lâottimizzazione delle geometrie molecolari usando lâenergiaelettronica (cenni).
Come si è visto è possibile calcolare una curva di energia potenziale per una determinata molecola. Inquesto modo risulta possibile per esempio determinare il minimo della curva di energia potenziale. Questominimo identifica anche una determinata geometria molecolare che è detta geometria di minima energiao di equilibrio. Questa geometria è quanto di piĂš vicino a quella che si potrebbe chiamare la geometriadella molecola. In realtĂ le molecole sono oggetti quantistici cioĂŠ oggetti in cui i nuclei componenti sonodelocalizzati e quindi descritti da funzioni dâonda. Ne consegue che non è possibile sapere con precisione laposizione di un nucleo allâinterno della molecola. Tuttavia, è vero che nel caso in cui si stiano analizzandosistemi fortemente interagenti la posizione media dei nuclei, quando la molecola si trova nel suo statofondamentale, identificherĂ una geometria molto simile a quella minima. Bisogna però tenere conto chenel caso di legami piĂš deboli che la delocalizzazione nucleare è molto pronunciata e non si riesce a stabilireuna reale geometria molecolare (questo è tanto piĂš vero quanto piĂš sono leggeri i nuclei come per esempionel caso del legame idrogeno).
Per sistemi fortemente legati la determinazione della geometria minima è molto importante perchĂŠ permettedi fare confronti con dati di tipo cristallografico o spettroscopico (NMR) e quindi di determinare la bontĂ omeno di un calcolo. Spesso non è possibile ottenere dati sperimentali sulla posizione dei nuclei e il calcoloquantomeccanico della geometria di equilibrio è lâunico modo per ipotizzare una struttura.
Se nel caso di una molecola biatomica è possibile calcolare tutta la curva per poi localizzare il minimo,in sistemi con piĂš di due o tre atomi non è certo possibile esplorare tutta la PES. Per trovare un minimoquindi si usa il gradiente dellâenergia elettronica calcolata con un metodo ab-initio HF o Post-HF per farsiquidare verso il minimo. In un sistema a molti gradi di libertĂ il numero dei minimi relativi aumenta inmodo vertiginoso: con N atomi si possono avere âź 2N!eN minimi relativi! Uno dei problemi dei metodidi ottimizzazione è che non si possono distinguere i minimi relativi da quello assoluto. Lâunica stradapossibile è quella di calcolare tantissimi minimi e confrontarne le energie.
Possiamo dire che lâottimizzazione delle geometrie molecolari è un problema complicatissimo e esistonomoltissimi modi diversi di affrontarlo. Nellâapprossimazione di B.O. lâenergia di una molecola è unafunzione continua delle 3N coordinate nucleari E(X) con X = (X1, X2, . . . , X3N). Nellâintorno del puntoX0 è possibile espandere lâenergia in serie di Taylor
E(X) = E(X0)+qâ f(X0)+12
qâ H(X0)q+ . . . (1.88)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 42
dove q = (XâX0)
fi =âE(X)
âXie Hi j =
â 2E(X)âXiâX j
(1.89)
sono rispettivamente il gradiente e lâHessiano dellâenergia. Allo stesso modo anche il gradiente può essereespanso in serie di Taylor
f(X) = f(X0)+H(X0)q (1.90)
Se X0 è un punto stazionario, una forma quadratica ottenuta dal troncamento di (1.88) dovrebbe esseresufficiente a descrivere lâenergia, infatti f (X0) = 0 e quindi abbiamo
E(X) = E(X0)+12
qâ H(X0)q+ . . . (1.91)
Se vogliamo trovare lo spostamento q che da un punto qualsiasi ci porta verso un punto stazionario (nel-lâapprossimazione che questo spostamento sia piccolo abbastanza da poter considerare la funzione energiadata da una forma quadratica) imponiamo che tale spostamento debba portarci dal punto X verso il puntoXe in cui il gradiente è nullo e quindi (usando unâequazione analoga alla (1.90)) otteniamo lâequazione cheè il punto di partenza dei metodi di minimizzazione:
f(X) =âH(X)q (1.92)
Se H non è singolare questo spostamento è dato da
q =âHâ1(X)f(X) (1.93)
Dalla (1.91) si ottiene una stima dellâenergia del punto Xe in cui ci porta lo spostamento q:
E(Xe) = E(X)â 12
f(X)Hâ1(X)f(X) = E(X)â 12
qâ Hâ1(X)q
La valutazione delle derivate dellâenergia è piuttosto complessa e quindi non la trattiamo qui: esistonosostanzialmente due possibilitĂ a seconda che si abbia o meno la possibilitĂ di valutare analiticamente lederivate dellâenergia rispetto alle coordinate nucleari. Per alcuni metodi ab-initio questo è possibile conrelativamente poco sforzo (per esempio HF o MP2), mentre per altri è praticamente impossibile (metodiCI).
1.15 Teoria delle perturbazioni indipendente dal tempo
Data unâequazione di SchrĂśdingerHÎŚk = EkÎŚk (1.94)
non risolubile esattamente, la teoria delle perturbazioni permette di trovare delle soluzioni approssimate siaper suoi autovalori Ek che per le sue autofunzioni Όk. La condizione necessaria per applicarla è che esistaun hamiltoniano piÚ semplice H(0) di cui si conoscano le autofunzioni e gli autovalori:
H(0)ÎŚ
(0)k = E(0)
k ÎŚ(0)k (1.95)
Si definisce perturbatore la differenza H âH(0) = H(1) anche se si preferisce introdurre un parametroarbitrario 0 ⤠Ν ⤠1 detto parametero di âswitchâ che misura lâentitĂ della perturbazione e quindi scriverelâhamiltoniano totale come
H = H(0) +ÎťH(1) . (1.96)
Per trovare le correzioni allâenergia si espandono le funzioni ÎŚk e gli autovalori Ek in serie di potenze di Îť
Ek(Îť ) = E(0)k +ÎťE(1)
k +Îť2E(2)
k + . . .
Όk(Ν ) = Ό(0)k +ΝΌ
(1)k +Îť
2ÎŚ
(2)k + . . . (1.97)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 43
Sostituendo queste equazioni in (1.94) si ottiene
(H(0) +H(1))(Ό(0)k +ΝΌ
(1)k +Îť
2ÎŚ
(2)k ) = (E(0)
k +ÎťE(1)k +Îť
2E(2)k )(ÎŚ(0)
k +ΝΌ(1)k +Ν
2ÎŚ
(2)k )(1.98)
che da vita ad unâequazione piuttosto complicata.
H(0)ÎŚ
(0)k +ÎťH(0)
ÎŚ(1)k +Îť
2H(0)ÎŚ
(2)k +ÎťH(1)
ÎŚ(0)k +Îť
2H(1)ÎŚ
(1)k =
= E(0)k ÎŚ
(0)k +ÎťE(0)
k ÎŚ(1)k +Îť
2E(0)k ÎŚ
(2)k +ÎťE(1)
k ÎŚ(0)k +Îť
2E(1)k ÎŚ
(1)k +Îť
2E(2)k ÎŚ
(0)k (1.99)
Questâultima si può ridurre ad un set di equazioni equivalenti notando che i coefficienti delle stesse po-tenze di Îť devono essere uguali. Uguagliando quindi i fattori di Îť 0 = 1 abbiamo lâequazione di partenzaH(0)ÎŚ
(0)k = E(0)
k ÎŚ(0)k ; eguagliando, invece quelli di Îť otteniamo:
H(0)ÎŚ
(1)k +H(1)
ÎŚ(0)k = E(0)
k ÎŚ(1)k +E(1)
k ÎŚ(0)k (1.100)
che può essere riscritta e premoltiplicata per ăÎŚ(0)k |
ăÎŚ(0)k |(H(0)âE(0)
k )|ÎŚ(1)k ă= ăÎŚ(0)
k |(âH(1) +E(1)k )|ÎŚ(0)
k ă . (1.101)
Lâhamiltoniano H(0)è ovviamente Hermitiano e quindi ăÎŚ(0)k |H(0) = ăÎŚ(0)
k |E(0)k e quindi (1.101) risulta
ăÎŚ(0)k |(âH(1) +E(1)
k )|ÎŚ(0)k ă= 0
che ci fornisce la regola per calcolare la correzione al primo ordine per lâenergia
E(1)k = ăÎŚ(0)
k |H(1)|ÎŚ(0)k ă . (1.102)
Con la stessa procedura si identificano i termini corrispondenti ad Îť 2, si premoltiplica per ăÎŚ(0)k | e si ottiene
E(2)k = ăÎŚ(0)
k |H(1)âE(1)k |ÎŚ(1)
k ă . (1.103)
Per poter trovare la funzione dâonda al primo ordine ÎŚ(1)k la si espande negli autostati di H(0)
ÎŚ(1)k = â
ia(1)
i ÎŚ(0)i (1.104)
e la si sostituisce nellâeq. al primo ordine (1.100) ottenendo
H(0)â
ia(1)
i ÎŚ(0)i +H(1)
ÎŚ(0)k = E(0)
k âi
a(1)i ÎŚ
(0)i +E(1)
k ÎŚ(0)k
(H(0)âE(0)k )â
ia(1)
i ÎŚ(0)i = (E(1)
k âH(1))ÎŚ(0)k . (1.105)
Premoltiplichiamo per una qualunque delle ÎŚ(0)j e integriamo per ottenere
a(1)j (E(0)
j âE(0)k )+ ăÎŚ(0)
j |H(1)|ÎŚ(0)k ăâE(1)
k δ jk = 0 (1.106)
Per j = k questa equazione si riduce al risultato (1.102), ma per j 6= k si ha
a j =ăÎŚ(0)
j |H(1)|ÎŚ(0)k ă
E(0)k âE(0)
j
, k 6= j
Possiamo riscrivere (1.104)
ÎŚ(1)k = â
i6=ka(1)
i ÎŚ(0)i = â
i6=k
ăÎŚ(0)i |H(1)|ÎŚ(0)
k ăE(0)
k âE(0)i
ÎŚ(0)i (1.107)
CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 44
e infine trovare la correzione la secondo ordine sostituendo questâultimo risultato in (1.103)
E(2)k =
â¨ÎŚ
(0)k
âŁâŁâŁâŁâŁH(1)âE(1)k |â
i6=k
ăÎŚ(0)i |H(1)|ÎŚ(0)
k ăE(0)
k âE(0)i
ÎŚ(0)i
âŠ=
= âi6=k
ăÎŚ(0)i |H(1)|ÎŚ(0)
k ăE(0)
k âE(0)i
ăÎŚ(0)k |H(1)âE(1)
k |ÎŚ(0)i ă=
= âi6=k
ăÎŚ(0)i |H(1)|ÎŚ(0)
k ăE(0)
k âE(0)i
(ăÎŚ(0)
k |H(1)|ÎŚ(0)i ăâăÎŚ(0)
k |E(1)k |ÎŚ(0)
i ă)
=
= âi6=k
ăÎŚ(0)i |H(1)|ÎŚ(0)
k ăăÎŚ(0)k |H(1)|ÎŚ(0)
i ăE(0)
k âE(0)i
= âi6=k
âŁâŁâŁăÎŚ(0)i |H(1)|ÎŚ(0)
k ăâŁâŁâŁ2
E(0)k âE(0)
i
(1.108)
Capitolo 2
Energie elettroniche: Hartree Fock
In questa sezione vedremo come funziona il metodo di HF. Questo metodo permette di calcolare in buonaapprossimazione lâenergia elettronica Born-Oppenheimer (a nuclei fissi) di una molecola qualsiasi utiliz-zando lâapprossimazione degli orbitali molecolari. Lâapprossimazione di HF non solo è importante in sĂŠ,ma anche percheâ gli orbitali molecolari che si ottengono possono essere utilizzati come punto di partenzaper calcoli molto piĂš complessi che includono gli effetti della correlazione elettronica. Questi ultimi sonospesso chiamati metodi post-HF.
Il metodo di HF si basa sul metodo variazionale. In pratica si cerca di determinare i migliori spin-orbitaliche generano un determinante di Slater capace di descrivere lo stato fondamentale elettronico di una mole-cola ad una fissata geometria nucleare. Il problema è che come vedremo il metodo di HF è piÚ complessodel semplice metodo variazionale lineare.
LâHamiltoniano elettronico privo delle energie cinetiche nucleari per una molecola con N nuclei e nelettroni eâ dato da:
Hel = Te +V =â12
n
âi=1
â2i â
n
âi=1
(N
âJ=1
ZJ
RJi
)+
12 â
i, j
1ri j
+âJ,I
ZJZI
RJI. (2.1)
La funzione dâonda di prova eâ data da un determinante di Slater costruito con spin-orbitali molecolari
|Ψ0ă=1ân!
âŁâŁâŁâŁâŁâŁâŁâŁĎ1(1) Ď2(1) ¡ ¡ ¡ Ďn(1)Ď1(2) Ď2(2) ¡ ¡ ¡ Ďn(2)¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡
Ď1(n) Ď2(n) ¡ ¡ ¡ Ďn(n)
âŁâŁâŁâŁâŁâŁâŁâŁ= A [Ď1(1)Ď2(2) ¡ ¡ ¡Ďn(n)] = A Î (2.2)
dove con la notazione Ďi(i) intendiamo Ďi(ri,Ďi) lâi-esimo spin-orbitale molecolare popolato dallâi-esimoelettrone e con A abbiamo indicato lâoperatore di antisimmetrizzazione dato dalla seguente somma dipermutatori
A =1ân!
nâ1
âp=0
(â1)pP =1ân!
(1ââ
i jPi j +â
i jkPi jk â . . .
)Lâenergia che vogliamo minimizzare rispetto agli spin-orbitali è data da:
E = ăΨ0 |Hel |Ψ0ă (2.3)
LâHamiltoniano elettronico può essere scritto in forma semplificata:
Hel =n
âi=1
â1
2â
2i â
(N
âJ=1
ZJ
RJi
)+
12 â
i, j
1ri j
+ cost =n
âi=1
hi +12 â
i, jgi j + cost (2.4)
45
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 46
dove cost è il termine o i termini di repulsione nucleare (è una costante e non ha importanza), i vari hi sonoHamiltoniani mono-elettronici e rappresentano lâenergia di un singolo elettrone nel campo generato dai varinuclei presenti nella molecola e gi j sono gli operatori bielettronici. Lâenergia che vogliamo minimizzare èquindi data data da:
E[Ψ0] =
â¨Î¨0
âŁâŁâŁâŁâŁ n
âi=1
hi +12 â
i, jgi j|Ψ0
âŠ. (2.5)
In pratica vogliamo determinare il migliore set di spin-orbitali molecolari secondo la prescrizione delteorema variazionale. 1
Lâenergia (2.5) può essere riscritta in modo piĂš comodo tenendo conto dellâespressione del determinantedi Slater che si ottiene utilizzando lâoperatore di antisimmetrizzazione e le proprietĂ :
A A =â
n!A A H = HA (2.6)
E = ăΨ0 |Hel |Ψ0ă= ăA Î |Hel |A Î ă= (2.7)â
n!ăÎ |Hel |A Î ă= âp
(â1)p â¨Î âŁâŁHel |PÎ
âŠ(2.8)
Per il termine monoelettronico hi sopravvive solamente la permutazione nulla
âp
(â1)p â¨Î âŁâŁhi|PÎ
âŠ= ăÎ |hi|Î ă=
= ăĎ1(1)Ď2(2) . . .Ďn(n)|hi|Ď1(1)Ď2(2) . . .Ďn(n)ă= ăĎ1(1)|Ď1(1)ă . . .ăĎi(i)|hi|Ďi(i)ă . . .ăĎn(n)|Ďn(n)ă= ăĎi(i)|hi|Ďi(i)ă
Per il termine bielettronico solo lâidentitĂ e il termine Pi j danno un contributo non nullo:
âp
(â1)p â¨Î âŁâŁgi j|PÎ
âŠ=â¨Î âŁâŁgi j|Î
âŠââ¨Î âŁâŁgi jPi j|Î
âŠil primo contributo è dato daâ¨
Î âŁâŁgi j|Î
âŠ= ăĎ1(1)Ď2(2) . . .Ďn(n)|gi j|Ď1(1)Ď2(2) . . .Ďn(n)ă= ăĎ1(1)|Ď1(1)ă . . .ăĎi(i)Ď j( j)|gi j|Ďi(i)Ď j( j)ă . . .ăĎn(n)|Ďn(n)ă= ăĎi(i)Ď j( j)|gi j|Ďi(i)Ď j( j)ă= Ji j
mentre il secondo è uguale, ma con lo scambio delle particelle:â¨Î âŁâŁgi jPi j|Î
âŠ= ăĎ1(1)Ď2(2) . . .Ďn(n)|gi j|Ď1(1)Ď2(2) . . .Ďn(n)ă= ăĎ1(1)|Ď1(1)ă . . .ăĎi(i)Ď j( j)|gi j|Pi jĎi(i)Ď j( j)ă . . .ăĎn(n)|Ďn(n)ă= ăĎi(i)Ď j( j)|gi j|Ďi( j)Ď j(i)ă= Ki j
Lâenergia da minimizzare è quindi data dalle espressioni seguenti:
1Eâ importante notare che oltre a Born-Openheimer abbiamo introdotto una nuova approssimazione: lâapprossimazione a singolaparticella cioè abbiamo implicitamente assunto che la funzione dâonda totale elettronica Ψ0 sia data da un prodotto di funzioni disingola particella (gli spin-orbitali molecolari) anche se opportunamente antisimmetrizzato (determinante di Slater).
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 47
E0[Ďi] =n
âi=1
ăĎi|h|Ďiă+12 â
i, j(ăi j|i jăâăi j| jiă) (2.9)
=n
âi=1
ăĎi|h|Ďiă+12 â
i jăi j||i jă (2.10)
=n
âi=1
ăĎi|h|Ďiă+12 â
i j(Ji j âKi j) (2.11)
=n
âi=1
ăĎi|h|Ďiă+12 â
i j(ăĎ j|Ji|Ď jăâăĎ j|Ki|Ď jă) (2.12)
dove gli operatori di Coulomb e di scambio sono definiti dalle loro operazioni sullâorbitale Ď j
JiĎ j(2) =[âŤ
dx1Ďi(1)1
r12Ďi(1)
]Ď j(2)
KiĎ j(2) =[âŤ
dx1Ďi(1)1
r12Ď j(1)
]Ďi(2) (2.13)
Mentre il primo operatore non è altro che una moltiplicazione dellâorbitale con unâelemento di matrice,il secondo è un operatore molto piĂš complesso che integra lâorbitale su cui opera (operatore non loca-le). Ripetiamo ancora una volta per chiarezza gli integrali bielettronici e la notazione âfisicaâ compattacorrispondente:
ăĎi(1)Ď j(2)| 1r12
|Ďi(1)Ď j(2)ă =âŤ
Ďâi (1)Ď âj (2)
1r12
Ďi(1)Ď j(2)dx1dx2
=⍠|Ďi(1)Ď j(2)|2
r12dx1dx2 = ăi j|i jă
ăĎi(1)Ď j(2)| 1r12
|Ď j(1)Ďi(2)ă =âŤ
Ďâi (1)Ď âj (2)
1r12
Ď j(1)Ďi(2)dx1dx2 = ăi j| jiă (2.14)
Il primo è detto integrale di Coulomb, il secondo integrale di scambio.
Adesso dobbiamo trovare il minimo di questa espressione seguendo la variazione degli spinorbitali e quindidella funzione dâonda Ψ0 = Ψ0 +δΨ0. La Lagrangiana risultante è (eq. (1.62)):
L [Ďi] = E0[Ďi]ân
âi
n
âj
Îťi j (ăĎi|Ď jăâδi j) (2.15)
dove Îťi j sono moltiplicatori di Lagrange. Variamo gli spin-orbitali di una quantitĂ infinitesema Ďi âĎi +δĎi e imponiamo la condizione di stazionarietĂ della Lagrangiana:
δE0ââi j
Îťi jδ ăĎi|Ď jă= 0 (2.16)
il primo termine risulta:
δE0 =n
âi=1
(ăδĎi|hi|Ďiă+ ăĎi|hi|δĎiă)
+12 â
i, j(ăÎ´Ď j|JiâKi|Ď jă+ ăĎ j|JiâKi|Î´Ď jă+
+ăδĎi|J j âK j|Ďiă+ ăĎi|J j âK j|δĎiă) (2.17)
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 48
Il terzo e quinto termine sono uguali perchĂŠ la somma è estesa su tutti gli indici i, j e cosĂŹ è anche per ilquarto e sesto. Riscriviamo lâespressione semplificando il fattore 1/2:
δE0 =n
âi=1
(ăδĎi|hi|Ďiă+ ăĎi|hi|δĎiă)+âi, j
(ăδĎi|J j âK j|Ďiă+ ăĎi|J j âK j|δĎiă) (2.18)
=n
âi=1
(ăδĎi|Fi|Ďiă+ ăĎi|Fi|δĎiă) (2.19)
dove abbiamo definito lâoperatore di Fock
Fi = hi +âj(J j âK j)
che è un operatore mono-elettronico (apparentemente! bisogna sempre ricordarsi della non localitĂ di K)che descrive lâenergia cinectica dellâelettrone, lâattrazione di tutti i nuclei su esso, e la repulsione versotutti gli altri elettroni. Da notare che lâoperatore di Fock è associato ad una variazione dellâenergia, manon allâenergia stessa, infatti H non è la somma di operatori di Fock. La variazione della Lagrangiana èdiventata
δL =n
âi=1
(ăδĎi|Fi|Ďiă+ ăĎi|Fi|δĎiă)ââi j
Îťi j(ăδĎi|Ď jă+ ăĎi|Î´Ď jă= 0
che, tenendo conto del fatto che ăĎ |δĎă= ăĎ |δĎăâe che ăĎi|Fi|δĎiă= ăδĎi|Fi|Ďiăâ, diventa
δL =n
âi=1
ăδĎi|Fi|Ďiăââi j
Îťi j ăδĎi|Ď jă+n
âi=1
ăĎi|Fi|δĎiăââi j
Îťi j ăĎi|Î´Ď jă=
n
âi=1
ăδĎi|Fi|Ďiăââi j
Îťi j ăδĎi|Ď jă+n
âi=1
ăδĎi|Fi|Ďiăâââi j
Îťi j ăδĎi|Ď jăâ
La variazione sia di ăÎ´Ď | che di ăÎ´Ď |â deve rendere δL = 0 e quindi sia i primi due termini che i secondidevono essere zero: prendendo la complessa coniugata dei due ultimi termini e sottraendoli ai primi due siottiene
âi j
(Îťi j âÎťâji)ăδĎi|Ď jă= 0
il che significa che i moltiplicatori di Lagrange sono elementi di una matrice Hermitiana. Siamo arrivatiad una espressione matematica semplice della condizione che deve essere soddisfatta dagli spin-orbitalipercheâ diano una energia minima. Questa condizione eâ unâinsieme di equazioni accoppiate integro-differenziali di Hartree-Fock:
FĎi(1) =n
âj=1
Îťi jĎ j(1) i = 1,2,3, ...n (2.20)
Malgrado nel membro di destra di (2.20) compaia una somma dei moltiplicatori di Lagrange è semprepossibile fare in modo che compaia un singolo autovalore (spin-orbitali in forma canonica) e le equazionidi HF prendono la forma:
FĎi(1) = ÎľiĎi(1) (2.21)
dove le energie Îľi possono essere considerate le energie dei vari spin-orbitali molecolari. Per esempio bastamodificare gli spin-orbitali ottenuti dalle eq. (2.20) attraverso una trasformazione unitaria: i moltiplicatoridi Lagrange che appaiono in (2.20) infatti sono elementi della matrice di Fock
ăĎi|F |Ď jă= âk
Îťki ăĎi|Ďkă= Îťi j
che, essendo una matrice hermitiana, è sempre possibile diagonalizzare con una trasformazione unitaria U:
Îľ = Uâ ÎťU.
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 49
Esiste quindi un diverso set di spin-orbitali detti canonici che soddisfa le equazioni (2.21).
In generale ogni arbitraria trasformazione unitaria degli N orbitali ottenuti come soluzione delle equazionidi HF è perfettamente equivalente nel senso che non altera il determinante e quindi la sua energia. Tuttaviain generale gli orbitali trasformati pur soddisfacendo le (2.20) non diagonalizzano lâoperatore di Fock. Leautofunzioni dellâoperatore di Fock (orbitali canonici) sono speciali e vengono distinte da qualunque altroinsieme equivalente di orbitali.
Occorre inoltre notare che un operatore di Fock, come ogni altro hamiltoniano, ha uno spettro di soluzionicompleto (discreto se abbiamo elettroni legati ai nuclei). Le prime n soluzioni dellâeq. (2.21) sono gli spin-orbitali occupati, mentre i rimanenti vengono comunemente detti orbitali virtuali. Questo significa che nelcostruire F bisogna prendere quegli orbitali che compaiono nel determinante cioè gli orbitali occupati. Inrelazione allâosservazione fatta piĂš sopra dovrebbe essere chiaro che, durante la soluzione delle equazionidi HF, le uniche variazioni orbitaliche significative (al fine di rendere stazionaria lâenergia) sono quelle chemodificano gli orbitali occupati attraverso lâintroduzione di componenti dello spazio degli orbitali virtuali.Infatti una combinazione lineare di orbitali occupati non altera lâenergia ed questâultima non dipende dagliorbitali virtuali.
Le energie degli orbitali possono essere espresse in termini degli integrali di Coulomb e di scambio
Îľi = ăĎi| f |Ďiă=
â¨Ďi
âŁâŁâŁâŁâŁh+âj(J j âK j)|Ďi
âŠ= ăĎi|h|Ďiă+â
j(ăĎi|J j|ĎiăâăĎi|K j|Ďiă)
= ăi|h|iă+âjăi j | |i jă
questa espressione è leggermente diversa a seconda se lâorbitale i sia o meno occupato. Se Ďi è occupatoabbiamo
Îľi = ăi|h|iă+n
âj 6=iăi j | |i jă (2.22)
perchĂŠ ăii||iiă= 0. Un fatto molto importante è che la somma degli autovalori di Fock degli orbitali occupati(2.22) non è lâenergia elettronica della molecola:
n
âi
Îľi =n
âiăi|h|iă+
n
âi j, j 6=i
ăi j | |i jă
dove invece lâenergia ottenuta minimizzando la Langragiana è data dallâeq. (2.9), cioè da
Eo =n
âiăi|h|iă+ 1
2 âi jăi j | |i jă .
La ragione è che la somma degli autovalori conta lâinterazione dellâelettrone i con lâelettrone j, ma anchequella dellâelettrone j con i. CioĂŠ conta due volte lâenergia di interazione tra gli elettroni. Lâenergia totalecorrettamente, invece, divide per due questi contributi. In realtĂ gli autovalori di Fock sono importantilo stesso perchĂŠ, anche se non lo dimostriamo, quelli relativi ad orbitali occupati rappresentano anche seapprossimativamente il potenziale di ionizzazione dellâi-esimo elettrone, mentre quelli relativi ad orbitalivirtuali lâaffinitĂ elettronica.
2.1 Introduzione di una base atomica nel caso closed-shell: le equa-zioni di Roothaan.
Non è possibile risolvere direttamente le equazioni di HF nel caso di molecole. Un metodo numeri-co è stato proposto da Roothaan ed è ancora oggi quasi esclusivamente utilizzato. Il metodo prevede di
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 50
espandere ogni spin-orbitale molecolare su una base di funzioni atomiche centrate sui nuclei della mole-cola (LCAO). La trattazione non può piÚ essere generale e cominceremo con vedere cosa succede in unamolecola con tutti gli spin appaiati cioè closed-shell (N elettroni). In una molecola closed-shell il numerodi spin ι è uguale a quelli con spin β ed quindi è possibile considerare che ogni coppia di elettroni siadescritta dallo stesso orbitale spaziale e da diverse parti di spin. In pratica adesso possiamo occuparci solodella parte spaziale degli spin-orbitali. Un set ristretto di orbitali ha la forma
Ďi(x) =
Ďi(r)Îą(Ď)Ďi(r)β (Ď)
dove la parte spaziale Ď dello spin-orbitale è la stessa. Lâequazione i-esima di HF è quindi data da
f (x1)Ďi(r)Îą(Ď1) = ÎľiĎi(r)Îą(Ď1),
si assume che lâequivalente per spin β dia lo stesso autovalore. Se premoltiplichiamo per Îąâ(Ď) e integria-mo sullo spin: âŤ
Îąâ(Ď1) f (x1)Ďi(r)Îą(Ď1)dĎ1 = ÎľiĎi(r)
âŤÎą(Ď1)Îą(Ď1)dĎ1 = ÎľiĎi(r)
dove lâoperatore di Fock adesso è solo un operatore nelle variabili spaziali e può essere espresso comesegue
f (r1)Ďi(r1) =âŤ
Îąâ(Ď1) f (x1)Ďi(r1)Îą(Ď1)dĎ1 =âŤ
Îąâ(Ď1)
[h1 +
N
âl(Jl âKl)
]Ďi(r1)Îą(Ď1)dĎ1 =
âŤÎąâ(Ď1)h(1)Ďi(r1)Îą(Ď1)dĎ1+
N
âl
(âŤdĎ1Îą
â(Ď1)Ď âl (x2)râ112 Ďl(x2)dx2Ďi(r1)Îą(Ď1)â
âŤdĎ1Îą
â(Ď1)Ď âl (x2)râ112 Ďl(x1)dx2Ďi(r2)Îą(Ď2)
)Lâultima espressione va valutata separatamente a seconda dello spin di Ďl(x2). La prima somma vale perspin Îą , la seconda per spin β :
f (r1)Ďi(r1) = h(r1)+N/2
âl spinÎą
[âŤdĎ1dĎ2dr2Îą
â(Ď1)Ďâl (r2)Îąâ(Ď2)râ1
12 Ďl(r2)Îą(Ď2)Ďi(r1)Îą(Ď1)â
âŤdĎ1dĎ2dr2Îą
â(Ď1)Ďâl (r2)Îąâ(Ď2)râ1
12 Ďl(r1)Îą(Ď1)Ďi(r2)Îą(Ď2)]+
N/2
âl spinβ
[âŤdĎ1dĎ2dr2Îą
â(Ď1)Ďâl (r2)β â(Ď2)râ1
12 Ďl(r2)β (Ď2)Ďi(r1)Îą(Ď1)â
âŤdĎ1dĎ2dr2Îą
â(Ď1)Ďâl (r2)β â(Ď2)râ1
12 Ďl(r1)β (Ď1)Ďi(r2)Îą(Ď2)]
della seconda somma lâultimo termine scompare durante lâintegrazione in dĎ2 per lâortonormalitĂ dellefunzioni di spin. Quindi per ogni equazione di HF nel caso restricted abbiamo due contributi identici diCoulomb e uno solo di scambio per ogni coppia di elettroni. Per una molecola closed-shell lâespressionedellâoperatore di Fock e dellâenergia sono quindi:
f (r1) = h(r1)+n/2
âa
(2Ja(1)âKa(1)) (2.23)
E = 2n/2
âaăa|h|aă+
n/2
âa,b
[2ăab|abăâăab|baă] = 2n/2
âa
haa +n/2
âa,b
[2JabâKab] (2.24)
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 51
dove Jab e Kab sono gli integrali di Coulomb e di scambio.
Nel metodo di Roothaan gli spin-orbitali molecolari sono espansi in un set di base atomico di M funzioniatomiche non ortonormali (LCAO):
Ďi(r1) =M
âÂľ=1
CÂľiĎÂľ (2.25)
Lo sviluppo qui sopra ha senso solo se il numero di funzioni di base impiegate è molto piĂš grande del nu-mero di orbitali che dobbiamo determinare (orbitali occupati). Se cosĂŹ non fosse quellâespansione sarebbeuna combinazione linerare che lascia invariante lâenergia del sistema. Sostituendo questa espressione nelleequazioni di HF si ottiene:
fM
âν=1
Cν iĎν = Îľi
M
âν=1
Cν iĎν (2.26)
premoltiplicando per ĎâÂľ e integrando si ottiene
M
âν=1
ăÂľ| f |νăCν i = Îľi ăÂľ|νăCν i
cioè in forma matricialeFC = ξSC (2.27)
dove S è la matrice di sovrapposizione e F quella di Fock. Le incognite sono i coefficienti cioè C.Lâespressione degli elementi della matrice F in termini del set di base ĎÂľ è piuttosto complessa:
F¾ν = Hcore¾ν +
n/2
âa
M
âÎťĎ
CÎťaCâĎa [2ă¾ν |ĎÎť ăâă¾ν |ÎťĎă] (2.28)
dove
Hcore¾ν = T¾ν +V nucl
¾ν =âŤ
dr1ĎâÂľ(1)
(â1
2â
21
)Ďν(1)+
âŤdr1ĎÂľ(1)
[â
N
âJ=1
ZJ
RJ1
]Ďν(1) (2.29)
è il termine monoelettronico. Lâespressione
PĎÎť = 2n/2
âa
CâĎaCÎťa (2.30)
è detta âdensity matrixâ. In termini di matrice densitĂ lâoperatore di Fock risulta:
F¾ν = Hcore¾ν +
M
âÎťĎ
PÎťĎ
[ă¾ν |ĎÎť ăâ 1
2ă¾ν |ÎťĎă
]= Hcore
¾ν +G¾ν (2.31)
Problema: trovare lâespressione degli elementi della matrice di Fock.
Soluzione: lâoperatore di Fock nella base orbitalica è dato da
ăĎ j|F |Ďiă =
â¨Ď j
âŁâŁâŁâŁâŁh+n/2
âa
(2Ja(1)âKa(1)) |Ďi
âŠ
=â¨Ď jâŁâŁh|Ďi
âŠ+
n/2
âa
[2ăia| jaăâăia|a jă] = hi j +Vi j
e soddisfa lâequazione seguente(hi j +Vi j) = δi jÎľi (2.32)
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 52
gli orbitali sono espansi nella base atomica
Ďi =M
âÂľ
CÂľiĎÂľ , Ď j =M
âν
Cν jĎν Ďa =M
âĎ
CĎaĎĎ =M
âÎť
CÎťaĎÎť
Lâhamiltoniano bielettronico Vi j diventa
n/2
âa
[2
â¨M
âÂľ
CÂľiĎÂľ ¡M
âĎ
CĎaĎĎ
âŁâŁâŁâŁâŁ M
âν
Cν jĎν ¡M
âÎť
CÎťaĎÎť
âŠâ
â¨M
âÂľ
CÂľiĎÂľ ¡M
âĎ
CĎaĎĎ
âŁâŁâŁâŁâŁ M
âÎť
CÎťaĎÎť ¡M
âν
Cν jĎν
âŠ]=
n/2
âa
â¾νγΝ
CâÂľiC
âÎłaCν jCÎťa [2ăÂľĎ |νΝ ăâăÂľĎ |Ννă] = â
¾ν
CâÂľiCν jV¾ν
dove
V¾ν = âĎÎť
PÎťĎ
[ăÂľĎ |νΝ ăâ 1
2ăÂľĎ |Ννă
], con PÎťĎ = 2
n/2
âa
CâĎaCÎťa
abbiamo poi per lâhamiltoniano monoelettronico
hi j = â¾ν
CâÂľiCν jh¾ν
infine dobbiamo anche esprimere il termine di destra di (2.32) in termini della base atomica
δi j = ăi| jă=
â¨M
âÂľ
CÂľiĎÂľ
âŁâŁâŁâŁâŁ M
âν
Cν jĎν
âŠ= â
¾ν
CâÂľiS¾νCν j
Lâequazione (2.32) diventa quindi
â¾ν
CâÂľiCν jh¾ν +â
¾ν
CâÂľiCν jV¾ν = â
¾ν
(CâÂľiS¾νCν j)Îľi
â¾ν
(CâÂľiS¾νCν j)Îľiââ
¾ν
CâÂľiCν jh¾ν â â
¾ν
CâÂľiCν jV¾ν = 0
â¾ν
CÂľi[ÎľiS¾ν âh¾ν âV¾ν ]Cν j = 0
e quindi alla fine avremoâν
[h¾ν âV¾ν â ÎľiS¾ν ]Cν j = 0
che altro non è che F ¡C =E ¡S ¡C.
Il problema contenuto nelle equazioni di HF-Roothan non è di banale soluzione perchĂŠ lâoperatore F (se-condo lâeq. (2.28)) dipende dagli stessi coefficienti che vogliamo trovare. Questo è la conseguenza delfatto che nelle equazioni di HF si volevano trovare gli spin-orbitali utilizzando un operatore che ne di-pende. Quindi il problema FC = ÎľSC non eâ un âsempliceâ problema lineare, ma richiede una soluzioneiterativa tipica dei problemi non lineari. Inoltre anche assumendo di conoscere lâoperatore di Fock (almenoallâinizio) e quindi di ridursi ad un problema lineare non eâ comunque semplice risolvere il problema ma-triciale FC = SCÎľ; sarebbe molto piĂš semplice risolvere un problema come quello che si ottiene nel casodi basi ortonormali:
FC = ÎľC ,
ma questo vorrebbe dire ortogonalizzare la base di orbitali atomici ĎÂľ . Effettivamente questo è quello chesi fa in pratica. Si cerca cioè una matrice unitaria X tale che Xâ SX non solo sia diagonale, ma sia anchela matrice identitĂ . Cioè si diagonalizza e si rinormalizza la matrice di sovraposizione S. Esistono diversimodi per farlo, uno molto comune è quello dellâortogonalizzazione canonica: si cerca la matrice Xnellaforma
X = U ¡ sâ12
dove U è una matrice che diagonalizza S:Uâ SU = s
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 53
con s diagonale. Diagonalizzare (e rinormalizzare) S significa modificare gli spin-orbitali e quindi lamatrice C. La nuova matrice sarĂ data da CⲠ= Xâ1C. Sostituendo nelle equazioni (2.27) C = XCâ˛
otteniamo:
FXCⲠ= SXCâ˛Îľ
Xâ FXCⲠ= Xâ SXCâ˛Îľ
cioeâ infineFâ˛CⲠ= Câ˛
Îľ.
Che è quello che volevamo. Lo schema di un calcolo HF-Roothan per una molecola closed-shell eârelativamente semplice:
1. Specificare la geometria molecolare e le cariche dei nuclei.
2. Calcolare S¾ν , Hcore¾ν e gli integrali (¾ν |ÎťĎ).
3. Diagonalizzare la matrice S ottenuta dai S¾ν , ottenere s e U, e quindi X.
4. Effettuare una guess ragionevole per la matrice densità P¾ν .
5. Calcolare il pezzo bielettronico di F cioè gli elementi G¾ν a partire dalla matrice densità e dagliintegrali bielettronici.
6. Aggiungere ad Hcore la matrice G ottenendo quindi F.
7. Calcolare F nella base ortogonale FⲠ= Xâ FX.
8. Diagonalizzare FⲠe quindi ottenere Câ˛e gli autovalori Îľ .
9. Calcolare C = XCâ˛.
10. Formare una nuova P con i coefficienti ottenuti.
11. Controllare se gli autovalori Îľ appena calcolati sono molto diversi da quelli precedenti. Se sĂŹ tornareal punto 5, se no terminare il programma.
Avendo definito un basis set Ď j câè bisogno di calcolare e conservare gli integrali mono e bielettronici chevengono calcolati allâinizio del calcolo HF. Gli integrali di sovrapposizione e quelli monoelettronici sonopochi e di facile gestione. Il problema leggermente piĂš complicato è rappresentato da quelli bielettroniciinfatti se abbiamo K funzioni di base allora il numero di integrali sarĂ dellâordine di K4/8. Alcuni peròsi annullano se le funzioni sono centrate su nuclei molto lontani. La âguessâ piĂš semplice che possiamoimmaginare per P è zero che corrisponde ad approssimare F con Hcore, ma di solito si preferisce unaâguessâ semiempirica di tipo Huckel.
2.2 Un-restricted Harteee-Fock
In maniera analoga a quanto visto per caso restricted , gli spin-orbitali vengono espressi come prodotti difunzioni di spin per orbitali spaziali: questa volta però le parti spaziali non sono le stesse, ma lasciamo chegli elettroni ι e β siano descritti da orbitali diversi:
Ďi(x)
ĎÎą
i (r)Îą(Ď)Ď
β
i (r)β (Ď)
da cui è possibile ricavare le espressioni delle equazioni di Fock esattamente nella stessa maniera che è stataseguita per il caso restricted. Eâ comunque possibile costruire gli operatori di Fock in modo meno rigoroso
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 54
considerando la situazione delle occupazioni degli spin-orbitali. Lâoperatore di Fock f Îą(1) non è altro cheil campo medio subito da un elettrone di spin Îą: questo include lâhamiltoniano di singola particella h1, gliintegrali di Coulomb e di scambio con tutti gli altri NÎą elettroni a spin Îą e gli integrali di Coulomb contutti gli altri Nβ elettroni a spin β (lo scambio si annulla con elettroni a spin opposto):
f Îą(1) = h1 +NÎą
âa
[JÎąa (1)âKÎą
a (1)]+Nβ
âa
[Jβ
a (1)]
analogamente per simmetria si deve avere
f β (1) = h1 +Nβ
âa
[Jβ
a (1)âKβa (1)
]+
NÎą
âa
[JÎąa (1)]
Le due equazioni non possono essere risolte indipendentemente percheâ sono accoppiate: per esempiof Îą dipende dagli orbitali occupati Ď
βa attraverso Jι
a .
In termini di integrali mono e bielettronici lâenergia di un UHF è data dallâespressione seguente
E0 =NÎą
âa
hÎąaa +
Nβ
âa
hβaa +
12
NÎą
âab
(Jιιab âKιι
ab )+12
Nβ
âab
(Jββ
ab âKββ
ab )+NÎą
âa
Nβ
âb
Jιβ
ab
Lâintroduzione di una base atomica per ottenere la trasformazione da equazioni integro-differenziali inequazioni matriciali da risolvere iterativamente si ottiene analogamente al caso restricted e le equazioniche si ottengono vengono dette di Pople-Nesbet:
Fι Cι = SCιξ
Îą
Fβ Cβ = SCβξ
β
dove i coefficienti della base sono adesso distinti per spin. Le matrici di Fock hanno espressioni analoghea quelle del caso restricted, ma la parte di scambio è diversa.
BenchÊ il caso UHF sia utilizzato in pratica ha un grave difetto: i suoi determinanti non sono autofunzioni diS2 e questo può rappresentare un problema piuttosto serio quando si utilizzano le soluzioni (MO) Hartree-Fock per calcoli piÚ sofisticati.
2.3 I Basis Set
2.3.1 Slater e Gaussian type functions (GTO)
Storicamente, il calcolo quanto-meccanico dellâenergia elettronica delle molecole è stato quasi semprefatto usando lâapprossimazione LCAO-MO (Linear Combination of Atomic Orbitals - Molecular Orbi-tals). Come abbiamo visto gli orbitali molecolari vengono costruiti come combinazione lineare di orbitaliatomici:
Ďi =M
âÂľ=1
CÂľiĎÂľ
dove Ďi è lâi-esimo orbitale molecolare, CÂľi sono i coefficienti della combinazione lineare, ĎÂľ è il Âľ-esimoorbitale atomico e M è il numero totale di orbitali atomici di base utilizzati.
Rigorosamente parlando, gli orbitali atomici sarebbero la soluzione dellâequazione di Hartree-Fock per unatomo, cioè una funzione dâonda monoelettronica atomica. Qualunque altra funzione non è un orbitale ato-mico propriamente detto. Alcune funzioni sono tuttavia molto simili e la terminologia è piuttosto confusa ariguardo. Ora come ora il termine orbitale atomico è stato quasi interamente sostituito da funzione di baseo contrazione.
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 55
Fino a non molto tempo fa, i cosidetti Orbitali di Slater (STO - Slater Type Orbital) venivano utilizzatiperchĂŠ erano molto simili alle soluzioni degli atomi idrogenoidi. Questo tipo di orbitali sono descritti dauna funzione che dipende da coordinate sferiche e da 3 ânumeri quanticiâ:
Ďi(Ξ ,n, l,m|r,θ ,Ď) = Nrnâ1eâΞ rYlm(θ ,Ď)
dove N è un fattore di normalizzazione e Ξ viene detto esponente. Le r, θ , e Ď sono coordinate sferiche, eYl,m è unâarmonica sferica. I numeri n, l, e m sono numeri quantici analoghi a quelli idrogenoidi.
Sfortunatamente, funzioni come queste non sono facilmente utilizzabili nei calcoli degli integrali bielettro-nici che devono essere necessariamente veloci. Questo è il motivo per cui, storicamente, vennero introdottele funzioni gaussiane o GTO (Gaussian Type Orbitals). Eâ infatti possibile approssimare una funzionedi tipo STO combinando linearmente alcune gaussiane. Anche se la procedura richiede 5 o 6 gaussiane ilcalcolo di un integrale bielettronico risulta piĂš rapido con le funzioni GTO. I GTO possono essere espressidalla seguente formula generale:
g(Îś , lx, ly, lz|x,y,z) = NeâÎś r2xlx ylyzlz
o ancheg(Îś , l,m,n|r,θ ,Ď) = Nr(2nâ2âl)eâÎś r2
Ylm(θ ,Ď)
dove N è una costante di normalizzazione, Îś è lâesponente, x, y, e z sono coordinate cartesiane centrate sulnucleo. I numeri interi lx, ly, e lz non sono numeri quantici, ma semplici potenze delle coordinate carte-siane dal momento che queste funzioni non sono orbitali atomici. Questi sono alcuni esempi di funzionigaussiane:
1s = NeâÎąr2
2px = NeâÎąr2x
2py = NeâÎąr2y
2pz = NeâÎąr2z
3dxx = NeâÎąr2x2
3dxz = NeâÎąr2xz
...
4 fxxx = NeâÎąr2x3
4 fxyz = NeâÎąr2xyz
...
La somma delle potenze delle coordinate cartesiane L = lx + ly + lz viene usata analogamente al numeroquantico di momento angolare per gli atomi in modo da contraddistinguere le funzioni per shell: funzionis (L = 0), p (L = 1), d (L = 2), f (L = 3), ecc.
Câè un problema per quanto riguarda le funzioni di tipo d e quelle corrispondenti a valori di L piĂš alti:esistono 5 orbitali linearmente indipendenti e ortogonali, ma ci sono 6 gaussiane possibili (le terne dinumeri lx, ly, lz sarebbero: 2,0,0 o 0,2,0 o 0,0,2 e 1,1,0 o 0,1,1 o 1,0,1). Se le usiamo tutte e 6 in realtĂ stiamo utilizzando anche un orbitale STO di tipo 3s, infatti:
3dxx(2,0,0)+3dyy(0,2,0)+3dzz(0,0,2) = N(x2 + y2 + z2)eâÎąr2= Nr2eÎąr2
Per quanto riguarda le funzioni di tipo f , abbiamo 10 possibili gaussiane, ma solo 7 orbitali. Le gaussianeintroducono gli orbitali 4px, 4pye 4pz. Questo effetto si chiama contaminazione. Quasi tutti i metodiab-initio sono variazioni piÚ o meno complesse del metodo variazionale lineare. La contaminazione non èquindi un problema visto che la base in questi metodi è arbitraria. In generale sarebbe meglio eliminare icontaminanti da un set di base per diminuire la dipendenza lineare delle funzioni di base.
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 56
La funzioni gaussiane non sono delle buone funzioni di base per gli orbitali atomici e molecolari. Ladipendenza da r2 allâesponente infatti rende le GTO inferiori allo STO sotto due punti di vista: sul nucleouna GTO ha derivata prima uguale a zero, mentre uno STO ha la tipica âcuspideâ; inoltre una o in generaledecresce troppo velocemente con la distanza dal nucleo rispetto alla vera densitĂ elettronica. Sia gli STOche i GTO possono essere utilizzati come base per calcoli variazionali, ma ovviamente ci vorranno moltipiĂš GTO per ottenere una data accuratezza rispetto al numero di STO. Tuttavia la facilitĂ e velocitĂ con cuisi possono valutare gli integrali utilizzando GTO rende questi ultimi piĂš convenienti computazionalmente.
2.3.2 Classificazione dei set di base
I set di base che contengono il piĂš piccolo numero di GTO sono detti basi minimali. Per lâidrogeno elâelio questo significa utilizzare solo una funzione 1s, per gli elementi del primo periodo due funzioni s(1s e 2s) e un set di funzioni di p. Anche se litio e berillio formalmente richiedono solo due funzioni ssi è soliti utilizzare anche il set p(ibridizzazione). Il miglioramento successivo è quello di raddoppiare ilnumero di funzioni producendo un basis set double zeta (DZ). Una base DZ quindi impiega due funzionis per idrogeno ed elio, 4 funzioni s(1s, 1sâ˛, 2s, 2sâ˛) e due set di funzioni p per gli elementi del primoperiodo. Lâimportanza della presenza delle funzioni aggiuntive in un set DZ rispetto al basis set minimalepuò essere illustrata considerando la molecola HCN. Il legame C-H consiste prevalentemente dellâorbitales dellâidrogeno e dellâorbitale pz del carbonio. Il legame Ď tra carbonio e azoto dâaltro canto consiste nelmescolamento degli orbitali px (o py) dei due atomi pesanti ed ha una distribuzione di carica molto piĂšdiffusa. Lâesponente ottimale per lâorbitale p del carbonio sarebbe quindi piĂš piccolo nella direzione x chein quella z. Un set di base minimale ha una sola funzione p e quindi un solo esponente e sarebbe possibilesolo un compromesso, mentre un set di base DZ ha due orbitali p e quindi due esponenti: la funzione piĂšcontratta andrĂ principalmente nella combinazione del legame Ď C-H, mentre la funzione piĂš diffusa andrĂ a contribuire al legame Ď C-N. Raddoppiare il numero di funzioni di base quindi permette una descrizionemigliore del fatto che in una molecola la densitĂ di carica è differente in direzioni diverse. I legami chimicicoinvolgono prevalentemente orbitali atomici di valenza. Raddoppiare le funzioni 1s su un atomo del primoo secondo periodo come il carbonio permette una descrizione piĂš accurata degli elettroni di core che peròsono piuttosto insensibili allâintorno chimico dellâatomo. Una variazione del set minimale che raddoppiail numero di funzioni di valenza è detto split valence double zeta. In realtĂ i set di base split valencesono diffusissimi in quanto si rivela del tutto inutile raddoppiare le funzioni degli orbitali di core. Lâovviostep successivo è quello di creare un set di base triple zeta (TZ) triplicando le funzioni di base di un setminimale. Anche in questo caso è piĂš comune triplicare solo le funzioni di valenza.
Eâ ovviamente possibile creare dei set di base che includano delle funzioni di base dette polarizzazioniche vanno oltre la shell di valenza. Queste funzioni servono a fornire al set di base una certa flessibilitĂ angolare per formare orbitali molecolari migliori. Le funzioni di polarizzazione hanno il valore del mo-mento angolare piĂš alto di una unitĂ rispetto alla shell di valenza: includono per esempio funzioni di tipop per idrogeno ed elio e di tipo d per gli elementi del secondo periodo. In generale le funzioni di pola-rizzazione vengono aggiunte non contratte. Le funzioni di polarizzazione hanno esponenti tali da averecome estensione radiale quella della shell di valenza. Le funzioni di polarizzazione non sono quindi unadescrizione degli orbitali con momento angolare piĂš alto perchĂŠ questi ultimi sarebbero molto piĂš diffusi diquanto siano le funzioni di polarizzazione. La polarizzazione è assolutamente necessaria quando vengonoutilizzati metodi di calcolo altamente correlati (post-HF). Le polarizzazioni vengono aggiunte ai set di basecome il DZ creando i set di base polarizzato come il DZP (double zeta plus polarization).
Esiste un ulteriore modo di migliorare i set di base (per esempio se si vogliono descrivere anioni) checonsiste nellâaggiungere funzioni molto diffuse ad un set giĂ polarizzato. Questi set di base sono dettiaumentati. Gli esponenti di tali funzioni vengono di solito determinati ricostruendo le affinitĂ elettronichesperimentali degli atomi (infatti non esistono basi aumentate per gli alcalini).
Una domanda spontanea a questo punto è: come vengono determinati gli esponenti delle funzioni gaus-siane? Gli esponenti delle funzioni s e p vengono di solito determinati con calcoli variazionali tipo HF(piÚ complessi di un calcolo HF come quello illustrato precedentemente dove venivano ottimizzati solo
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 57
i coefficienti). Questa procedura non può essere utilizzata per determinare gli esponenti delle funzionidi polarizzazione. Tali esponenti possono venire infatti determinati con calcoli variazionali su piccolemolecole.
2.3.3 Basis set contratti
Uno degli svantaggi di tutti i basis set ottimizzati energeticamente è il fatto che dipendono fortemente dallaregione interna della funzione dâonda: gli elettroni 1s infatti hanno energie molto grandi e minimizzarelâenergia tenderĂ a rendere ottimale il basis set per gli elettroni di core e meno ottimale per quelli divalenza. Il problema è che le proprietĂ chimiche dipendono dagli elettroni di valenza e non da quelli dicore. Inoltre alcune proprietĂ chimicamente rilevanti come la polarizzabilitĂ dipendono dalla parte diffusadella densitĂ di carica che è energeticamente irrilevante. Un set di base con una buona descrizione dellaporzione esterna della funzione dâonda deve essere molto grande e questo non è certamente un criterioefficiente per la costruzione di set di base.
Il fatto che molte funzioni di base finiscano per descrivere gli elettroni di core che risultano energeticamen-te dominanti, ma chimicamente irrilevanti, è il motivo dellâesistenza dei set di base contratti. Prendiamoad esempio un set di base di 10 funzioni s e qualche funzione p per il carbonio. Ottimizzando tale setdi base energeticamente si otterrebbe che almeno 6 delle funzioni s vanno a descrivere gli elettroni 1s ealtre due descrivono la parte interna dellâorbitale 2s. Solo due funzioni s rimangono a descrivere la partechimicamente rilevante della funzione dâonda. Dato che gli orbitali di core cambiano molto poco al cam-biare dellâintorno chimico dellâatomo anche i coefficienti della loro combinazioni lineari sono pressochĂŠinsensibili al resto della molecola (i MO risultanti sarebbero localizzati solo un atomo della molecola e laloro forma ricorderebbe molto quella di un piccolo guscio sferico). Quello che si ottiene in questo modo èche lo sforzo computazionale di ottimizzazione viene speso per ottimizzare una parte della funzione dâondachimicamente inutile e che risulta praticamente costante.
Dato che gli orbitali interni di un atomo richiedo piĂš o meno sempre le stesse combinazioni di GTO erisultano sostanzialmente indipendenti dallâintorno molecolare è possibile fissare i coefficienti della com-binazione una volta per tutte ed usare tale combinazione come funzione di base. Questo meccanismoè alla base della creazione dei set di base contratti: nel nostro esempio sarebbe infatti possibile fissare icoefficienti di mescolamento dei primi 6 GTO e delle due coppie seguenti ottenendo 3 funzioni di base da10 (ecco perchĂŠ si parla di contrazione) a scapito della flessibilitĂ , ma come si è poi visto senza perderetroppo in accuratezza e sicuramente guadagnando in efficienza. La combinazione di piĂš GTO, dette in que-sto caso primitive gaussiane (PGTO), in piccole combinazioni è detta contrazione e le funzioni risultatosono dette contracted GTO (CGTO). Nel caso di set di base contratti la notazione precedente (DZ, TZ,ecc.) si riferisce al numero di CGTO. La contrazione serve sopratutto a descrivere gli elettroni di core peri quali sono necessarie molte PGTO che servono a riprodurre la condizione di âcuspideâ sul nucleo. Perspecificare la contrazione si usa la seguente (ovvia) notazione
(10s4p1d)â [3s2p1d]
Esistono due modi per contrarre un determinato set di base, e si parla quindi di segmented o generalcontraction. La contrazione del primo tipo è quella utilizzata nellâesempio precedente: un dato set diPGTO viene partizionato in set piĂš piccoli di funzioni che sono poi combinate in CGTO attraverso deicoefficienti opportuni. Un set di base 10s viene contratto 3s prendendo 6 funzioni interne per una CGTO,le seguenti 3 per la seconda CGTO e lâultima rimanente come lâultima CGTO
ĎCGTO1 =
6
âi=1
aiĎPGTOi
ĎCGTO2 =
9
âi=7
aiĎPGTOi
ĎCGTO3 = Ď
PGTO10
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 58
In una contrazione di tipo generale invece tutte le PGTO di un determinato momento angolare sonoutilizzate a formare la CGTO con coefficienti diversi
ĎCGTO1 =
10
âi=1
aiĎPGTOi
ĎCGTO2 =
10
âi=1
biĎPGTOi
ĎCGTO3 =
10
âi=1
ciĎPGTOi
2.3.4 Basi comuni
Basi di Pople
⢠STO-nG
Sono costruite con Slater Type Orbitals a loro volta costituiti da n PGTO combinate insieme. Sonobasi minimali dove gli esponenti delle PGTO sono determinate fittando la loro combinazione alrelativo STO piuttosto che ottimizzando lâenergia dellâatomo. Vengo utilizzate le basi con n = 2 o 3anche se esistono basi con n fino a 6. La base STO-3G è la base minimale piĂš utilizzata.
⢠kânlmG
Questo tipo di base sono di tipo split-valence dove il k iniziale indica il numero di PGTO utilizzate pergli orbitali di core. Il gruppo nlm dopo il trattino indica sia in quante funzioni sono divisi gli orbitalidi valenza sia quante PGTO sono utilizzate per la loro rappresentazione. Eventuali polarizzazionisono indicate dopo la G. In questo tipo di basi gli esponenti delle funzioni s sono uguali a quelli dellefunzioni p e sono determinati variazionalmente.
â 3â 21G: questo è un set di base in cui gli orbitali di core sono una contrazione di 3 PGTO ela parte interna di valenza è costituita da due PGTO e quella esterna da una sola PGTO. Peril carbonio la contrazione sarebbe (6s3p)â [3s2p]. Questa base contiene lo stesso numero diPGTO della STO-3G, ma ha il doppio di funzioni di valenza.
â 6â 31G: anche questo è uno split valence dove gli elettroni di core sono una contrazione di6 PGTO, la valenza è rappresentata da una contrazione di 3 e di 1 PGTO. Per il carbonio lacontrazione sarebbe (10s4p)â [3s2p].
Ad ognuno di questi possono essere aggiunte funzioni di polarizzazione o diffuse. Le funzioni diffusesono di tipo s o p e vengono indicate da un + o un ++. Il primo sta ad indicare delle funzionidiffuse sugli atomi pesanti, il secondo lâaggiunta di una diffusa anche per lâidrogeno. Le funzioni dipolarizzazione sono invece indicate dopo la G con designazioni diverse a seconda se siano aggiunteagli atomi pesanti o allâidrogeno. Il set di base 6â 31 + G(d) è uno split valence con un set didiffuse sp sugli atomi pesanti una singola polarizzazione d sugli stessi. Un set di base 6â 311 ++G(2d f ,2pd) è un set split valence con funzioni diffuse addizionali sugli atomi pesanti e sugliidrogeni e con funzioni polarizzanti di tipo d e f sugli atomi pesanti e p e d sullâidrogeno. DAnotare che esiste una seconda notazione che usa il simbolo â: per cui la notazione 6â31Gâ indica ilset 6â31G(d).
Basi correlation consistent
Unâintera serie di set di base tra le piĂš utilizzate per calcoli molto accurati riassume tutte queste caratteristi-che ed è la cosidetta correlation consistent (cc) inventati da Dunning. Sono ottenuti tentando di recuperarelâenergia di correlazione degli elettroni di valenza e sono molto utilizzati per calcoli su molecole piccole. Il
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 59
nome deriva dal fatto che le basi sono disegnate in modo che le funzioni che contribuiscono similmente allacorrelazione sono introdotte allo stesso stadio indipendentemente dal tipo di funzione. Lâintroduzione delleprime funzioni d provoca un notevole abbassamento dellâenergia, ma il contributo delle seconde funzionid è simile a quello delle prime f . Lâaggiunta delle polarizzazioni viene quindi fatta nel seguente modo: 1d,2d1 f , 3d2 f 1g ecc.
Esistono diverse basi cc che usano la notazione tradizionale: ccâ pV DZ, ccâ pV T Z, ccâ pV QZ, ccâpV 5Z. La loro composizione è data nella tabella seguente.
Base PGTO(atom/H) CGTO(atom/H)cc-pVDZ 9s,4p,1d/4s,1p 3s,2p,1d/2s,1pcc-pVTZ 10s,5p,2d,1f/5s,2p,1d 4s,3p,2d,1f/3s,2p,1dcc-pVQZ 12s,6p,3d,2f,1g/6s,3p,2d,1f 5s,4p,3d,2f,1g/4s,3p,2d,1fcc-pV5Z 14s,9p,4d,3f,2g,1h/8s,4p,3d,2f,1g 6s,5p,4d,3f,2g,1h/5s,4p,3d,2f,1gcc-pV6Z 16s,10p,5d,4f,3g,2h,1i/10s,5p,4d,3f,2g,1h 7s,6p,5d,4f,3g,2h,1i/6s,5p,4d,3f,2g,1h
Tabella 2.1: Basi correlation consistent
Questi set di base possono essere aumentati da funzioni diffuse e in questo caso prendono il suffisso aug. Ilvantaggio principale di questi set di base è quello di poter generare una serie di calcoli sempre piÚ accuratiche convergono verso il cosidetto limite della base (basis set limit).
BASIS="cc-pVTZ"
H 0
S 3 1.00
33.8700000 0.606800000E-02
5.09500000 0.453080000E-01
1.15900000 0.202822000
S 1 1.00
0.325800000 1.00000000
S 1 1.00
0.102700000 1.00000000
P 1 1.00
1.40700000 1.00000000
P 1 1.00
0.388000000 1.00000000
D 1 1.00
1.05700000 1.00000000
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 60
BASIS="aug-cc-pVTZ"
H 0
S 3 1.00
33.8700000 0.606800000E-02
5.09500000 0.453080000E-01
1.15900000 0.202822000
S 1 1.00
0.325800000 1.00000000
S 1 1.00
0.102700000 1.00000000
P 1 1.00
1.40700000 1.00000000
P 1 1.00
0.388000000 1.00000000
D 1 1.00
1.05700000 1.00000000
S 1 1.00
0.252600000E-01 1.00000000
P 1 1.00
0.102000000 1.00000000
D 1 1.00
0.247000000 1.00000000
2.4 Orbitali molecolari
Gli orbitali molecolari vengono creati combinando orbitali atomici (nella forma di CGTO come abbiamovisto). Tradizionalmente gli orbitali vengono distinti in orbitali di core e di valenza. Gli orbitali di corenon hanno molta importanza per la formazione dei legami chimici perchÊ derivano sostanzialmente dallacombinazione degli orbitali atomici piÚ interni che, a distanze nucleari non troppo piccole non hannopraticamente sovrapposizione. Gli orbitali di valenza sono invece i principali responsabili del legamechimico e delle sue proprietà . La loro struttura è determinata dalle forze elettrostatiche interagenti tra gliatomi e quindi dipende dalle distanze interatomiche. A grandi distanze la loro struttura è sostanzialmentequella degli orbitali atomici di partenza.
In una molecola biatomica o lineare esistono diversi tipi di orbitali. La caratteristica importante delle mo-lecole biatomiche è la presenza di una chiara simmetria assiale cioĂŠ la molecola appartiene al gruppo disimmetria Câv o Dâh (nel caso sia simmetrica rispetto al piano ortogonale allâasse di legame: per esempioCO2). Questo è semplicemente dovuto al fatto che il potenziale elettrostatico che compare nellâHamilto-niana di una molecola lineare è invariante per rotazioni attorno allâasse di legame. Una regola della m.q.ci assicura che le operazioni di rotazione sono âgenerateâ dai momenti angolari nella forma di operatoriesponenziali. Nel caso specifico, la rotazione di un angolo Î´Ď attorno allâasse di legame CzÎ´Ď Ă¨ data dalmomento angolare Lz dove z è lâasse di legame
CzÎ´Ď = eiδĎ
h Lz
Abbiamo detto che lâHamiltoniano è invariante per rotazioni attorno allâasse z, quindi comuta con CzÎ´Ď , diconseguenza commuta anche con Lz. Un orbitale molecolare sarĂ quindi descritto, oltre che da unâenergia,anche dal n.q. m autovalore di Lz
LzΨMO =âihâ
âĎΨMO = hmΨMO
Inoltre dato che lâenergia dellâorbitale dipende dal quadrato del momento angolare le coppie di orbitali conm =Âą1 o Âą2 ecc. sono doppiamente degeneri. Il valore assoluto di m in genere è detto Îť : gli orbitali conÎť = 0 sono gli orbitali Ď , quelli con Îť = 1 gli orbitali Ď , con Îť = 2 δ .
In molecole di tipo Dâh si ha un centro di simmetria aggiuntivo e ogni orbitale molecolare viene anchedistinto per la sua simmetria rispetto al piano perpendicolare allâasse molecolare. Si usano i simboli g(gerade) per gli orbitali pari rispetto alla riflessione e u (ungerade) per quelli dispari.
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 61
Prendiamo la molecola piĂš semplice di tutte, H2 e vediamone gli orbitali molecolari che otteniamo da unaminimale fatta di due funzioni 1s. In Figura 2.1 i due orbitali legante (Ďg o Ďâ) sono riportati in terminidegli orbitali di partenza e di densitĂ . Come è noto si hanno due orbitali molecolari di diversa energia cheschemticamente possono essere visti come in
Figura 2.1: In alto a sinistra: Combinazione legante di due orbitali 1s; in alto a destra: combinazioneantilegante. In basso a sinistra: densitĂ risultante per lâorbitale molecolare Ďg; in basso a destra: densitĂ risultante per lâorbitale Ďu
Come è noto si ottengono due orbitali molecolari di diversa energia che schematicamente possono esserevisti come in 2.2.
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 62
Figura 2.2: In alto a sinistra: Schema degli orbitali molecolari in H2; in alto a destra: andamento energe-tico dei due autovalori degli orbitali al variare della distanza internucleare. In basso a sinistra: superficieisodensitĂ per lâorbitale molecolare Ďg; in basso a destra: superficie isodensitĂ risultante per lâorbitale Ďu
In altre molecole omonucleari o utilizzando basi piĂš grandi che includano anche orbitali p si avrebbe lapossibilitĂ di avere orbitali Ď o Ď dovuti a questi orbitali. I superfici di isodensitĂ sono riportate in 2.3.
CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 63
Figura 2.3: In alto: superficie isodensitĂ della combinazione legante(sinistra) e antilegante (destra) di dueorbitali pz. In basso: superficie isodensitĂ della combinazione legante(sinistra) e antilegante (destra) di dueorbitali px.
Capitolo 3
Energie elettroniche: metodi postHartee-Fock
Il metodo Hartree-Fock fornisce la piĂš semplice approssimazione variazionale alla funzione dâonda di unostato stazionario e corrisponde al minimo sviluppo della funzione dâonda dotato di senso fisico: un singolodeterminante di Slater. Sfortunatamente, come visto in precedenza, nella maggior parte delle situazionidi interesse chimico (rottura e formazione di legami) il modello di HF è completamente inadeguato.
Una prima macroscopica manifestazione dellâerrore insito nel modello RHF emerge nella descrizione delladissociazione della piĂš semplice molecola biatomica: H2. Nellâintorno della distanza internucleare di equi-librio, la funzione dâonda elettronica dello stato fondamentale è ben descritta dalla configurazione restrictedHF 1Ď2
g . Ă evidente a priori, tuttavia, che questo modello non può essere corretto per qualsiasi valore delladistanza R fra i due nuclei: man mano che questâultima aumenta, la funzione dâonda deve, con continuitĂ ,gradualmente trasformarsi in quella asintotica che, rimanendo in un modello mono-configurazionale, deveessere del tipo 1s1
A ¡ 1s1B con spin opposti a dare S = s1 + s2 = 0. Una configurazione con un solo orbi-
tale doppiamente occupato non può mai evidentemente trasformarsi in questa, divenendo, al piÚ, del tipo1s2
A ¡1s0B e cioè corrispondente ad una dissociazione ionica H+ e Hâ. Questo succede perchĂŠ nella rappre-
sentazione RHF i due elettroni devono avere la stessa parte spaziale. Il risultato di questo errore qualitativoè una energia di dissociazione piĂš che doppia di quella reale (oltre 10 eV contro 4.75 eV). Vale la pena diosservare che nellâesempio precedente la deficienza qualitativa del modello a particelle indipendenti nonè assoluta ma va in pratica interamente attribuita al modo in cui nel metodo RHF si separa il problema dispin da quello spaziale, imponendo lâuso di orbitali doppiamente occupati. Un modello a spin non ristretti(UHF) descrive almeno al livello qualitativo correttamente la dissociazione di H2. Questa osservazionemette in evidenza, in generale, una certa ambiguitĂ nella definizione di errore di correlazione, la cui entitĂ e natura fisica viene a dipendere dal particolare modello Hartree-Fock cui ci si riferisce. La differenza(teorica) fra lâenergia esatta non-relativistica di un sistema elettronico e quella HF viene definita energiadi correlazione elettronica, e tutti i fenomeni e le alterazioni del valore di osservabili che possono essereriprodotti solo da funzioni dâonda piĂš accurate di quella HF vengono detti effetti di correlazione.
Il metodo di gran lunga piĂš usato per trattare effetti di correlazione elettronica è anche quello teoricamentepiĂš semplice ed intuitivo, e cioè lâinterazione di configurazione (CI, configuration interaction). Dal puntodi vista strettamente teorico formale ben poco câè da aggiungere, e lo faremo fra poco, allâanalisi di questometodo che giĂ abbiamo sostanzialmente discusso: dato un insieme di orbitali (quale, ad esempio e cometipicamente accade, quello generato da un calcolo HF) si tratta di costruire la matrice dellâhamiltonianoin uno spazio piĂš grande possibile di determinanti e di calcolarne uno o piĂš autovalori ed autovettori. Etuttavia lâinterazione di configurazione è il metodo che è stato oggetto, nel corso degli anni, di forse ilmaggior numero di studi pubblicati in chimica teorica, rivolti allo sviluppo di sempre nuove e piĂš efficientitecniche computazionali.
Come vedremo piÚ sotto per mezzo di alcuni esempi, fare un calcolo CI è semplicemente fuori discussione
64
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 65
per la maggior parte dei sistemi a molti elettroni a prescindere da qualsiasi prevedibile sviluppo nelletecniche computazionali e nella potenza dei calcolatori. Sono stati quindi inventati altri metodi oltre CI percercare di âaggiungereâ la correlazione elettronica ad HF:
⢠metodi variazionali basati su approssimazioni a CI come MCSCF (multi configurational self consi-sten field) e MRCI (multi reference CI);
⢠metodi basati sulla teoria delle perturbazioni a molti corpi (MBPT o MP2/4)
⢠metodi basati sul funzionale della densità (DFT)
In questa sede ci limiteremo ad accennare le tecniche basate sui metodi Full-CI, MCSCF e MBPT.
3.1 Energia di correlazione
La correlazione dinamica è quel contributo energetico strettamente attribuibile allâeffettiva interazioneistantanea fra coppie di elettroni, cioè quella parte intrinsecamente trascurata in qualsiasi modello a parti-celle indipendenti. La correlazione dinamica rappresenta un vero problema: essa può essere rappresentatasolo considerando lâeffetto combinato di un numero generalmente grandissimo di determinanti, non indi-viduabili a priori e i cui pesi sono tutti confrontabilmente importanti. Lâesperienza indica indubbiamenteche la correlazione converge molto lentamente con il numero di configurazioni incluse.
Riprendiamo in esame il semplice esempio della dissociazione di H2. Sebbene il processo di dissociazione(cioè la curva di energia elettronica) sia disastrosamente descritto a livello RHF, lâenergia di dissociazionepuò nondimeno essere ragionevolmente calcolata con questo metodo: basta sottrarre al doppio dellâenergiadi un atomo di idrogeno (nota esattamente) lâenergia RHF dello stato fondamentale di H2 alla distanza diequilibrio, dove la descrizione RHF è almeno qualitativamente corretta. Si ottiene in questo modo un valorecon un errore di circa il 10%. Questo errore è dunque dovuto alla correlazione dinamica. Ă ragionevole sup-porre che il contributo di energia di correlazione dinamica sia (molto approssimativamente) proporzionaleal numero di coppie di elettroni nel sistema. Ă comunque chiaro che, in sistemi piĂš grandi, con piĂš elettronidi valenza, lâerrore assoluto nelle energie di dissociazione dovuto alla correlazione dinamica è destinato adaumentare. Naturalmente, non solo le energie ma anche tutte le altre osservabili calcolate teoricamente so-no affette dallâerrore di correlazione. Ă facile immaginare quanto sia importante essere in grado di stimarea priori, se non lâentitĂ , se non altro il segno delle correzioni di correlazione. Questo è tuttâaltro che facilein generale. Parlando ad esempio di differenze di energia, occorre poter stimare la variazione di energiadi correlazione fra gli estremi della transizione considerata (sia essa fra due stati elettronici distinti o frapunti diversi della stessa superficie di energia elettronica). Ancora piĂš complessa è lâanalisi di proprietĂ elettriche o magnetiche che dipendano dalla effettiva distribuzione di densitĂ elettronica (ad esempio, ilmomento di dipolo).
In termini piĂš formali lâenergia di correlazione è definita come
Ecorr = E0âEHF (3.1)
cioĂŠ come la differenza tra lâenergia âesattaâ di un sistema polielettronico e lâenergia HF ottenuta nel limitedi una base monoelettronica completa. Quando, come in pratica, il calcolo HF viene fatto in una baseincompleta si determina lâenergia di correlazione per quella base monoelettronica (basis set correlationenergy). Lâenergia di correlazione come abbiamo detto è dovuta alle interazioni tra gli elettroni e quindici si potrebbe aspettare che questa energia diminuisca allâaumentare della distanza tra i nuclei visto che ilnumero di âcoppieâ elettroniche interagenti diminuisce quando le molecole si frammentano. Quello chesuccede è esattamente lâopposto come testimoniato dalla seguente tabella calcolata per la molecola di H2Onella base DZ.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 66
Geometry Ecorr(u.a.)Req -0.14
1.5 ¡Req -0.212.5 ¡Req -0.31
Questo succede perchÊ la definizione (3.1) non include il contributo dovuto alla cosidetta correlazione didegenerazione o correlazione non-dinamica. Questo tipo di errore di correlazione si manifesta quandouna sola configurazione elettronica (determinante) non è piÚ dominante, ma lo stato elettronico realisticosarebbe dato da una somma di determinanti di Slater con una differente occupazioni degli orbitali (nediscutiamo piÚ lungamente in Sezione 3.2.5).
Cercando di fare un poâ di chiarezza potremmo dire che quando sono coinvolte rotture di legame e sta-ti eccitati, la correlazione non-dinamica può essere ottenuta aggiungendo alla configurazione dominantequalche configurazione aggiuntiva (come vedremo questo è quello che fa MCSCF). Questa correlazione èdovuta ad artefatti del modello monodeterminatale di HF. Lâaltro tipo di correlazione (quella dinamica) èdovuta alle interazioni elettroniche e si può calcolare includendo un numero molto grande di configurazionielettroniche aggiuntive.
3.2 Metodi Variazionali
Lâidea dei metodi variazionali post-HF o di tipo CI è molto semplice: diagonalizzare lâHamiltoniano N-elettronico in una base di funzioni N-elettroniche (determinanti di Slater). In altre parole, non limitarsia trovare un solo determinante, ma rappresentare la funzione dâonda come combinazione lineare di moltideterminanti. Eâ importante notare che questi metodi hanno bisogno di un determinante di base dettoriferimento con cui generare tutti gli altri. Questo determinante di solito è dato da un calcolo HF.
3.2.1 Determinanti eccitati e autofunzioni di S2 (Configuration State Functions,CSF)
Cercheremo di vedere con un esempio molto semplice in che modo vengono ottenuti gli altri determinantidi Slater oltre quello HF e che proprietĂ debbano avere per essere utilizzabili. I determinanti di Slater ingenerale sono autofunzioni dellâoperatore Sz, ma non sono sempre autofunzioni dellâoperatore di spin totaleS2. Eâ possibile formare tali autofunzioni usando delle combinazioni lineari di determinanti di Slater. Molticalcoli in effetti sono piĂš semplici quando vengono effettuati utilizzando autofunzioni dello spint totale (elâinterpretazione dei risultati risulta piĂš semplice).
Al posto di fare una trattazione generale ci limitamo ad un esempio semplice: la molecola H2 descritta conun LCAO ed un basis set minimale STO-3G. Nel basis set STO-3G ogni atomo di idrogeno è descritto dauna contrazione di tipo 1s ottenuto dalla contrazione di 3 GTO di tipo s. Durante un procedimento HFvengono âottimizzatiâ (in realtĂ per una base minimale câè poco da ottimizzare) i due orbitali molecolari
Ď1 = ĎA + ĎB
Ď2 = ĎAâĎB
il determinante dello stato fondamentale (due elettroni nellâorbitale legante Ď1) di HF è:
|Ψ0ă= |Ď1Ď1ă= Ď1(1)Îą(1)Ď1(2)β (2)âĎ1(2)Îą(2)Ď1(1)β (1) = Ď1(1)Ď1(2)[Îą(1)β (2)âÎą(2)β (1)]
che risulta essere una funzione di singoletto con 2S + 1 = 1. I possibili determinanti eccitati vengonocostruiti usando gli orbitali âvuotiâ (o virtuali) ottenuti nel calcolo HF (nel caso in esame il solo orbitale
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 67
molecolare Ď2). I possibili determinanti singolarmente eccitati risultano essere 4:
|Ψ21ă = |Ď1Ď2ă
|Ψ21ă = |Ď1Ď2ă
|Ψ21ă = |Ď1Ď2ă
|Ψ21ă = |Ď1Ď2ă
Dove col il segno di soprasegnato indichiamo spin giĂš. Esiste un solo determinante doppiamente eccitatoche risulta:
|Ψ2211ă= |Ď2Ď2ă
ed è anchâessa una funzione di singoletto con 2S+1 = 1. I vari determinanti sono riportati schematicamentein Figura 3.1. Dei 4 determinanti singolarmente eccitati, due sono autofunzioni di S2 con autovalore S = 1
Figura 3.1: Schema energetico qualitativo dei vari determinanti di Slater coinvolti in un ipotetico CI perH2 con un basis-set minimale.
|Ψ21ă = |Ď1Ď2ă= [Ď1(1)Ď2(2)âĎ1(2)Ď2(1)]β (1)β (2)
|Ψ21ă = |Ď1Ď2ă= [Ď1(1)Ď2(2)âĎ1(2)Ď2(1)]Îą(1)Îą(2)
e rappresentano stati di tripletto. Le altre due, invece, non sono direttamente autostati di S21. Se le
1Le 4 possibili combinazioni di due spin di due elettroni sono
Ď1(1,2) = Îą(1)Îą(2)
Ď2(1,2) = Îą(1)β (2)
Ď3(1,2) = β (1)Îą(2)
Ď4(1,2) = β (1)β (2)
tutte sono autofunzioni di Sz = S1z +S2z , ma non lo sono di S2 = S11 +S2
2 +2âS1 ¡S2. Per esempio per la prima abbiamo
S2Îą(1)Îą(2) = S2
1ι(1)ι(2)+S22ι(1)ι(2)+2S1 ¡S2ι(1)ι(2) =
34
Îą(1)Îą(2)+34
Îą(1)Îą(2)+ [2S1zS2z +S1+S2â +S1âS2+]Îą(1)Îą(2) =32
+[214
+0+0]Îą(1)Îą(2) = 2Îą(1)Îą(2)
perchĂŠ S+Îą = 0, SâÎą = β , S+β = Îą e Sâβ = 0.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 68
combiniamo lineramente possiamo peroâ ottenere:
|1Ψ21ă = |Ψ2
1ă+ |Ψ21ă= |Ď1Ď2ă+ |Ď1Ď2ă= [Ď1(1)Ď2(2)+Ď1(2)Ď2(1)][Îą(1)β (2)+β (1)Îą(2)]
|3Ψ21ă = |Ψ2
1ăâ |Ψ21ă= |Ď1Ď2ăâ |Ď1Ď2ă= [Ď1(1)Ď2(2)âĎ1(2)Ď2(1)][Îą(1)β (2)+β (1)Îą(2)]
la prima eâ un singoletto la seconda un tripletto. In totale abbiamo quindi estratto da sei determinanti diSlater sei âconfiguration state functionsâ (CSF) di cui uno stato di singoletto per lo stato fondamentale,3 stati di tripletto sigolarmente eccitati, 1 stato di singoletto singolarmente eccitato ed infine uno stato disingoletto doppiamente eccitato. In generale è possibile lavorare con entrambe le rappresentazioni, alcunemetodi usando la rappresentazione dei determinanti (determinantal CI) altri metodi le CFS (GUGA CI).
3.2.2 CI
Il metodo CI o Full-CI è il metodo concettualmente piĂš semplice, ma quello computazionalmente piĂšpesante e spesso decisamente irrealizzabile. La base concettuale del metodo CI è questa: una qualunquefunzione per N elettroni può essere espressa esattamente come una combinazione lineare di tutti i possibilideterminanti di Slater ad N elettroni (base polielettronica) formati partendo da un set completo di spinorbitali monoelettronici (base monoelettronica). Se i determinanti di Slater vengono indicati con Ψi gliautovettori dellâhamiltoniamo sono dati da
ÎŚk =I
âi
ckiΨi k = (0, 1, . . . , Iâ1)
dove I è il numero di determinanti possibili (I â â per una base completa di spin-orbitali) e ci j sonodetti coefficienti CI. La matrice H è costruita a partire dagli elementi Hi j = ăΨi|H|Ψ jă che possono esserescritti in termini di integrali bielettronici secondo le cosidette regole di Slater (vedi piĂš sotto). La forza delmetodo è tutta nella sua generalitĂ : il metodo in linea di principio fornisce la soluzione esatta qualunque siala configurazione elettronica da descrivere, sia essa uno stato eccitato, uno stato dissociativo, a shell apertao ad alto spin. In contrasto i metodi perturbativi e Coupled Clutser (vedi sotto) assumono sempre che unaconfigurazione sia dominante (detta configurazione di riferimento o semplicemente âriferimentoâ che ingenere è descritta da un determinante solo). In pratica uno non ha mai a disposizione una base completadi spinorbitali e quindi I sarĂ un numero finito. In genere uno si assicura che la base monoelettronica siasufficientemente buona incrementando la dimensione di tale base e monitorando le proprietĂ molecolari diinteresse2. La base N-elettronica di determinanti può essere ridotta nel caso si desideri una funzione dâondadi una determinata molteplicitĂ di spin o simmetria spaziale. Se uno risolve il problema CI utilizzando labase polielettronica completa (possibilmente ristretta per simmetria o per spin) in una base monoelettronicaincompleta o troncata (gli orbitali HF ottenuti da uno dei basis set per esempio) allora la metodologia isdice Full-CI. Purtroppo il Full-CI è intrattabile anche per basi mono-elettroniche molto piccole come sivede dagli esempi seguenti.
Dato un set di 2K orbitali molecolari che si ottengono da un calcolo HF di cui N occupati dagli N elettroni
del sistema è possibile formare(
2KN
)determinanti di Slater eccitati differenti. Consideriamo ad esem-
pio il caso di un calcolo sulla semplice molecola di H2O (10 elettroni) con un set di base di qualitĂ DZP (26
Per le altre risulta
S2Ď1 = 2Ď1
S2Ď2 = Ď2 + Ď3
S2Ď3 = Ď2 + Ď3
S2Ď4 = 2Ď4
da cui si capisce perchĂŠ utilizzare combinazioni lineari.2Nota bene: è del tutto inutile monitorare lâenergia totale della molecola al variare del set di base in quanto questâultima è una
funzione fortemente dipendente dalla dimensione del set stesso. Molto piÚ utile è monitorare una differenza di energia o qualche altraproprietà : dipolo, polarizzabilità ecc.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 69
funzioni e dunque 26 orbitali) e calcoliamo per esercizio il numero di determinanti, o meglio autofunzionidi spin, corrispondenti ad una funzione dâonda di singoletto (tale è lo spin dello stato fondamentale). Il cal-colo risulta molto facile se classifichiamo le funzioni in base al numero di orbitali singolarmente occupati,come mostra la tabella seguente:
Orbitali SO Determinanti Singoletti Stati
0(
265
)= 65780 1 65780
2(
262
)(244
)= 3435450 1 3453450
4(
264
)(223
)= 23023000 2 46046000
6(
266
)(202
)= 43743700 5 218718500
8(
268
)(181
)= 28120950 14 393693300
10(
2610
)= 5311735 42 223092870
Questa semplice FCI consterebbe dunque di circa 885 milioni di funzioni di spin di singoletto. Se im-maginassimo di dover calcolare la matrice hamiltoniana completa su questo insieme di funzioni, anchesupponendo di lavorare con funzioni reali per cui la matrice sarebbe simmetrica, e di memorizzare questamatrice sul disco occorrerebbero 8852
2 ¡ 8 byte, oppure 313290000 ⟠3 ¡ 109 Gbyte di memoria o di spaziodisco.
Questa situazione semplicemente inaffrontabile viene, in pratica, anche se di fatto in piccola misura, sem-plificata da alcune considerazioni. Innanzitutto, come sappiamo, il numero di elementi di matrice non nulliè relativamente piccolo, consistendo solo di quelli fra funzioni che siano al piĂš doppiamente eccitate lâunarispetto allâaltra. La matrice CI è, come si dice, altamente sparsa, mostrando, come è facile verificare,una dipendenza in pratica poco piĂš che lineare (anzichĂŠ quadratica) del numero di elementi non-nulli dalnumero di configurazioni. Questo tipicamente riduce il numero di elementi di matrice che sono effettiva-mente da calcolare di qualche ordine di grandezza. In secondo luogo, nel calcolo del numero di stati nonabbiamo tenuto alcun conto di argomenti di simmetria. Ă chiaro che la matrice hamiltoniana si fattorizzain base alle rappresentazioni irriducibili del gruppo di simmetria della molecola. Se gli orbitali impiegatiappartengono a rappresentazioni irriducibili del gruppo (come accade per gli orbitali risultanti da un cal-colo HF) questo è anche vero per i determinanti costruiti con essi: la rappresentazione irriducibile di undeterminante è il prodotto diretto delle rappresentazioni degli orbitali occupati. Questo riduce il numero difunzioni per ogni simmetria di un fattore mediamente pari allâordine del gruppo. Ă chiaro in definitiva chequeste considerazioni, che introducono fattori di riduzione delle dimensioni del problema di qualche ordinedi grandezza, sono effettivamente trascurabili rispetto alla velocitĂ di crescita esponenziale del numero distati con il numero di elettroni e con la dimensione del set di base. Si confronti ad esempio il caso appenavisto (H2O) con lâanalogo esempio del numero di stati di singoletto per la molecola di CO (14 elettroni e32 funzioni di base). Questo corrisponde ad un aumento di appena 1.4 volte nel numero di elettroni e 1.23volte nel numero di funzioni di base ma, come è facilmente calcolabile, comporta un aumento nel numerodi stati dellâhamiltoniano di oltre 2000 volte!
Cenni matematici della procedura Full-CI
Se indichiamo con il simbolo |Ψcd...ab...ă il determinante dove gli orbitali a e b sono stati sostituiti dagli orbitali
virtuali c e d, allora la funzione dâonda Full-CI è data da:
|ÎŚ0ă= c0 |Ψ0ă+âa,r
cra |Ψr
aă+1
(2!)2 âab,rs
crsab |Ψrs
abă+1
(3!)2 âabc,rst
crstabc |Ψrst
abcă+1
(4!)2 âabcd,rstu
crstuabcd |Ψrstu
abcdă+ ...
(3.2)
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 70
che sarebbe la somma dei determinanti relativi allo stato fondamentale e alle singole, doppie, triple, qua-druple eccitazioni fino alle N-uple eccitazioni dove N eâ il numero di elettroni. Per esempio per H2 e HeH+
bastano le singole e doppie eccitazioni, per He2 e LiH basta arrivare ad includere le quadruple. Di solitola serie Full-CI è intrattabile anche sui computer piÚ potenti in circolazione quando il numero di elettronisupera i 4-5.
Una volta costruite le funzioni eccitate ad N elettroni si possono determinare le energie degli stati ad essiassociati utilizzando il metodo della diagonalizzazione dellâHamiltoniano. La matrice che si deve dia-gonalizzare è detta matrice CI. Lâautovalore piĂš basso è un limite superiore allâenergia vera dello statofondamentale sel sistema. Solo se il nostro set di base fosse infinito otterremmo lâautovalore esatto. Al-lâinterno dello spazio determinato dal set di base utilizzato comunque la soluzione CI è quella âesattaâ. Ladifferenza tra lâautovalore piĂš basso della matrice CI e lâenergia di HF ottenuta con lo stesso set di base èdetta energia di correlazione del basis-set. La funzione dâonda CI si puoâ scrivere formalmente:
|ÎŚ0ă= c0 |Ψ0ă+ cS |Să+ cD |Dă+ cT |T ă+ cQ |Qă+ ... (3.3)
Eâ importante notare che la diagonalizzazione della matrice CI si limita a determinare i set di coefficientic0, cS, cD ecc., ma non ottimizza piĂš gli orbitali che sono stati determinati con il calcolo HF che hafornito gli orbitali molecolari. Eâ importante analizzare la struttura della matrice CI anche solo per avereunâidea di queli sono effettivamente i contributi importanti che vengono dalla serie della funzione dâonda.La matrice CI ha questa struttura:
ăΨ0|H|Ψ0ă ăΨ0|H|Să ăΨ0|H|Dă ăΨ0|H|T ă ăΨ0|H|Qă... ăS|H|Să ăS|H|Dă ăS|H|T ă ăS|H|Qă... ... ăD|H|Dă ăD|H|T ă ăD|H|Qă... ... ... ăT |H|T ă ăT |H|Qă... ... ... ... ăQ|H|Qă
(3.4)
Struttura che in realtĂ si semplifica nel momento in cui si analizzano i singoli elementi della matrice. Sipossono infarri dimostrare le seguenti proprietĂ :
⢠Non câè accoppiamento diretto tra lo stato fondamentale e le singole eccitazioni (teorema di Bril-louin):
ăΨ0|H|Ψraă= 0
⢠Non câè accoppiamento tra lo stato fondamentale e le eccitazioni triple o quadruple. Similmentenon câeâ accoppiamento tra le singole e le quadruple. In generale tutti gli elementi di matrice tradeterminanti che differiscono per piĂš di 2 spin-orbitali sono sempre zero.
La matrice CI risulta quindi piĂš semplice:ăΨ0|H|Ψ0ă 0 ăΨ0|H|Dă 0 0
... ăS|H|Să ăS|H|Dă ăS|H|T ă 0
... ... ăD|H|Dă ăD|H|T ă ăD|H|Qă
... ... ... ăT |H|T ă ăT |H|Qă
... ... ... ... ăQ|H|Qă
(3.5)
Ci sono alcuni commenti da fare:
1. A causa del fatto che le singole eccitazioni non accoppiano direttamente con lo stato fondamentale cisi aspetta che abbiano un effetto piccolo sulla sua energia anche se il loro effetto non sarĂ comunquenullo perchĂŠ accoppiano con le doppie. In realtĂ le singole eccitazioni sono molto importanti perdeterminare la distribuzione di carica molecolare.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 71
2. Le doppie eccitazioni apportano i contributi piĂš importanti allâenergia di correlazione. Anzi si puòdimostrare che una volta determinati coefficienti delle doppie tramite un Full-CI completo, lâenergiadi correlazione è data da
Ecorr =14 â
abârs
crsab ăΨ0 |H |Ψrs
abă (3.6)
3. Le quadruple eccitazioni sono piĂš importanti delle sigole o delle triple.
4. Tutti gli elementi di matrice che compaiono nella matrice CI si possono calcolare in termini degliintegrali di scambio e coulombiani:
⢠mentre gli elementi che coinvolgono lo stato fondamentale sono esprimibili direttamente intermini di integrali bielettronici come per esempio:
ăΨ0|H|Ψrsabă= ăra|sbăâărb|saă , (3.7)
⢠alcuni elementi richiedono la valutazione dei contributi di scambio e coulombiano direttamentesugli integrali molecolari, come per esempio:
ăΨrsab|H|Ψrs
abă = Îľr + Îľsâ Îľaâ Îľb + Jab + Jrs +KabâKrs
âJsbâ Jsaâ Jrbâ Jra +32(Ksb +Ksa +Krb +Kra) (3.8)
per poter valutare tali elementi di matrice qualunque calcolo variazionale di tipo CI o approssi-mazioni ad esso devono eseguire quella che viene detta âFour Index Transformationâ. Cioeâpassare dalla rappresentazione degli orbitali atomici a quella degli orbitali molecolari. Que-sta trasformazione è molto pesante e delicata da fare ed è un passo lento del calcolo post-HFvariazionale (è in generale piĂš pesante lei di un intero calcolo HF). La trasformazione è datada una somma quadrupla e permette di esprimere gli integrali bielettronici espressi nalla basedelle gaussiane in quella degli orbitali molecolari:
(ĎiĎ j|ĎkĎl) = âÂľ
âν
âÎť
âĎ
CâÂľiCν iCâ
ÎťkCĎ l(¾ν |ÎťĎ) (3.9)
In pratica il metodo Full-CI si può utilizzare solamente per sistemi con un limitatissimo numero di elettroni(in genere < 5). Inoltre, per il fatto che la pesantezza del calcolo Full-CI dipende dal set-di base (dal numerodi OM ottenuti da HF) in genere si utilizzano set di base piccoli. Lâerrore insito in questi set di base è spessomaggiore dellâaccuratezza che si ottiene dal fatto di usare un calcolo âesattoâ. Eâ in genere meglio utilizzareapprossimazioni alla serie CI (sono tutte basate su un qualche tipo di troncamento dellâespressione dellafunzione dâonda), ma basis set piĂš grandi.
3.2.3 Singole e doppie CI
Tra le approssimazioni al calcolo di tipo CI piĂš in voga è da ricordare il CI limitato alle singole e doppie ec-citazioni (SDCI o CISD) che è di facile gestione e piuttosto rapido. Questo metodo permette di recuperarecirca il 90% dellâenergia di correlazione di piccole molecole intorno alle geometrie di equilibrio.
La funzione dâonda viene scritta come:
|ÎŚDCIă= |Ψ0ă+âc,t
ctc |Ψt
că+ âc < dt < u
ctucd |Ψtu
cdă (3.10)
lâenergia di correlazione si può ottenere da
(HâE0) |ÎŚSDCIă= Ecorr |ÎŚSDCIă , (3.11)
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 72
equazione che può essere ridotta ad un problema matriciale piuttosto semplice. Come si vede qui noncâè nessun problema non lineare3e la situazione è del tutto analoga al problema variazionale lineare. Eâimportante notare che lâenergia di correlazione calcolata da un SDCI non è quella esatta: benchè lâenergiadi correlazione dipenda solo dai coefficienti delle doppie (vedi (3.6)), le doppie che darebbero lâenergiacorretta devono essere trovate risolvendo un Full-CI.
3.2.4 Come Full-CI risolve il problema della correlazione e il problema della dis-sociazione.
Prendiamo la molecola di H2 nel suo besis set minimale composto da due funzioni 1s, ĎA e ĎB. Un calcoloRHF produrrĂ due orbitali molecolari Ď1 e Ď2 che sono somma e differenza dei due orbitali atomici. Dati idue MO abbiamo il seguente determinante di riferimento
ÎŚ0 =âŁâŁâŁâŁ Ď1(1) Ď1(1)
Ď1(2) Ď1(2)
âŁâŁâŁâŁI due orbitali molecolari sono epressi come somma dei due orbitali atomici 1sA e 1sB dei due atomi diidrogeno Ď1,2 = ĎAÂąĎB, il riferimento è dato da (a parte la normalizzazione)
ÎŚ0 = Ď1(1)Ď1(2)âĎ1(1)Ď1(2) = Ď1(1)Ď2(2)[Îą(1)β (2)âÎą(2)β (1)]
cioè la parte spaziale di ÎŚ0 è data data due contributiĎA(1)ĎA(2)+ ĎB(1)ĎB(2) = ĎAĎA + ĎBĎB H+âHâ
ĎA(1)ĎB(2)+ ĎB(1)ĎA(2) = ĎAĎB + ĎBĎA HâH
Come si vede chiaramente quando la distanza internucleare va llâinfinito questa funzione di riferimentodissocia per un 50% in una situazione covalente (H-H) e per un altro 50% in una configurazione ioni-ca (H+Hâ) da cui lâerrore di degenerazione di cui abbimao giĂ ripetutamente discusso. In questa basepossiamo scrivere 4 determinanti singolarmente eccitati e uno doppiamente eccitato
ÎŚ1 =âŁâŁâŁâŁ Ď2(1) Ď2(1)
Ď2(2) Ď2(2)
âŁâŁâŁâŁÎŚ2 =
âŁâŁâŁâŁ Ď1(1) Ď2(1)Ď1(2) Ď2(2)
âŁâŁâŁâŁÎŚ3 =
âŁâŁâŁâŁ Ď1(1) Ď2(1)Ď1(2) Ď2(2)
âŁâŁâŁâŁÎŚ4 =
âŁâŁâŁâŁ Ď1(1) Ď2(1)Ď1(2) Ď2(2)
âŁâŁâŁâŁÎŚ5 =
âŁâŁâŁâŁ Ď1(1) Ď2(1)Ď1(2) Ď2(2)
âŁâŁâŁâŁCome giĂ ampiamente visto nella sezione 3.2.1, le configurazioni ÎŚ4e ÎŚ5 sono le componenti Sz = â1 eSz = 1 di uno stato di tripletto. La combinazione + di ÎŚ2 e ÎŚ3 è la componente Sz = 0 del tripletto, mentrela combinazione â è una configurazione singoletto. La molecola di H2 appartiene al gruppo puntuale Dâhe i due orbitali molecolari trasformano come le rappresentazioni Ďg(Ď1) e Ďu(Ď2). La CFS singolarmenteeccitata (ÎŚ2 âÎŚ3) ha simmetria ÎŁu (gĂ u â u), mentre il riferimento ÎŚ0 e ÎŚ1 sono di simmetria ÎŁg. Ilproblema Full-CI 6Ă 6 si fattorizza in tre blocchi: un blocco 2Ă 2 per il singoletto 1ÎŁg, un blocco 1Ă 1
3Anche se nel caso di Full-CI o SDCI il problema è lineare, non è detto che la particolare implementazione non faccia uso diiterazioni. Bisogna però rimarcare che queste iterazioni nulla hanno a che fare con quelle di tipo SCF di Hartree-Fock o dei metodiMCSCF, ma sono solo un modo piuttosto veloce per determinare gli autovalori piÚ bassi in energia di problemi lineari con dimensionimolto grandi. Il metodo che si usa piÚ spesso è detto metodo iterativo di Davidson.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 73
per il singoletto 1ÎŁu ed un blocco 3Ă3 per il tripletto 3ÎŁu (il quale è giĂ diagonale per lâortogonalitĂ delletre autofunzioni di Sz). La matrice Full-CI risulta:
ÎŚ01ÎŁg ÎŚ1
1ÎŁg (ÎŚ2âÎŚ3)1ÎŁu ÎŚ43ÎŁu (ÎŚ2 +ÎŚ3)3ÎŁu ÎŚ5
3ÎŁu
ÎŚ01ÎŁg H00 H01 0 0 0 0
ÎŚ11ÎŁg H10 H11 0 0 0 0
(ÎŚ2âÎŚ3)1ÎŁu 0 0 Hââ 0 0 0ÎŚ4
3ÎŁu 0 0 0 H44 0 0(ÎŚ2 +ÎŚ3)3ÎŁu 0 0 0 0 H++ 0
ÎŚ53ÎŁu 0 0 0 0 0 H55
Tabella 3.1: Struttura della matrice Full-CI per il problema di H2 in una base minimale.
Il problema Full-CI per lo stato 1ÎŁg coinvolge solamente ÎŚ0 e ÎŚ1 (riferimento e doppia) e genera unafunzione dâonda CI che è data da
ΨCI = (a0ÎŚ0 +a1ÎŚ1) = (a0 +a1)(ĎAĎA + ĎBĎB)+(a0âa1)(ĎAĎB + ĎAĎB)
Se si confronta questa funzione con quella di riferimento si vede come gli elettroni abbiano piĂš âlibertĂ â dimovimento (câeâ una funzione eccitata che si porta dietro lâorbitale antilegante che adesso è accessibile) equindi unâenergia minore (correlazione dinamica). Questa funzione inoltre, quando la distanza internuclea-re va allâinfinito, non contiene piĂš il termine ionico nel momento in cui a1 =âa0 risolvendo elegantementeil problerma della correlazione di degenerazione che affliggeva il solo riferimento.
3.2.5 MCSCF (CAS-SCF)
In generale la serie che determina la funzione dâonda CI converge molto lentamente quando si usanogli orbitali molecolari di HF, ma qualunque troncamento a quella serie produce degli errori apprezzabilisopratutto quando si hanno molti elettroni. Esiste una serie di metodi computationali detti Multi Confi-gurazionali (MCSCF) in cui vengono inclusi nella serie CI solamente pochi determinanti o poche CSF.Scegliere i determinanti da includere non sarebbe però possibile se si usassero gli orbitali molecolari for-niti da un calcolo HF in quanto, come abbiamo detto, la risultante serie CI converge lentamente con essi.Il metodo MCSCF quindi non si limita a determinare i coefficienti di mescolamento dei determinanti (co-me il Full-CI o il SDCI), ma ottimizza simultaneamente anche gli orbitali molecolari. Ricordiamo che imetodi CI in genere sono problemi lineari di diagonalizzazione e non di ottimizzazione di orbitali. Il me-todo MCSCF, come suggerisce la presenza dellâacronimo SCF, determina sia i coefficienti dellâespansionemulticonfigurazionale sia nuovi orbitali molecolari.
La funzione dâonda MCSCF è:ÎŚ = â
kAkΨk (3.12)
dove Ψk può essere un singolo determinante, una combinazione di determinanti o piĂš in generale unafunzione âspin-correctâ come le CSF che abbiamo visto in precedenza.
Le equazioni algebriche del metodo MCSCF sono piuttosto complicate, ma in termini generali il calcolo sipuò svolgere in due modi a seconda che i coefficenti CI Ak vengano o meno ottimizzati simultaneamente aquelli LCAO degli orbitali.
Il primo set di Ak viene determinato inizialmente risolvendo un problema lineare variazionale utilizzandocome orbitali molecolari quelli forniti da un calcolo HF condotto in precedenza. Non è in generale unabuona idea utilizzare guess semiempiriche per cominciare un MCSCF! La soluzione (lineare) al problemamatriciale fornisce le prime energie MCSCF e i coefficienti Ak. A questo punto il metodo MCSCF richiede,a seconda, uno o due insiemi di iterazioni per ottimizzare la funzione dâonda.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 74
In ogni caso il funzionale dellâenergia è lineare nei coefficienti Ak, ma ha una dipendenza non lineare(quartica) dai coefficienti LCAO. La condizione stazionaria in termini dei coefficienti LCAO deve esserequindi risolta iterativamente. Lâottimizzazione di una funzione (lâenergia in questo caso) di molti parametrinon lineari soffre di problemi di convergenza e può trovare minimi locali e non assoluti della Lagrangiana.In una funzione MCSCF lâenergia dipende debolmente da quei coefficienti che contribuiscono agli orbitalidebolmente occupati in tutte le configurazioni, mentre dipende fortemente da quelli delle configurazionidominanti. Anche per questo il numero di CSF che si utilizzano in un calcolo MCSCF deve rimanerepiccolo in modo da descrivere nel miglior modo possibile la correlazione non-dinamica. In questâultimocaso, infatti, lâenergia dipende fortemente da quasi tutti i parametri LCAO e il processo MCSCF è menoprono a comportamenti patologici.
Eâ comodo âvedereâ la funzione dâonda MCSCF come lâanalogo della funzione dâonda HF in quei casidove non è possibile ridursi alla semplice rappresentazione mono-configurazionale (anche nel caso ROHFsi deve poter usare un solo determinante o una piccola somma vincolata al fatto che lâeq ?? deve potersiridurre alla ??). Uno non dovrebbe aspettarsi che le energie calcolate con MCSCF siano accurate esat-tamente come non ci si aspetta lo siano quelle HF. Si dice che trattamenti MCSCF correggono lâenergiaHF per quanto riguarda il problema della correlazione di degenerazione dovuta allâesistenza di soluzionidegeneri del problema elettronico (cioĂŠ dovuta alla presenza di piĂš stati elettronici).
Tutti gli effetti di correlazione non palesemente attribuibili ad evidenti fenomeni di quasi-degenerazionevengono genericamente detti di correlazione dinamica. Ă evidente che la linea di demarcazione fra questecategorie è in generale piuttosto flessibile e mal definita. Possiamo dire che la correlazione dinamica èquella parte di correlazione piĂš strettamente attribuibile allâeffettiva interazione istantanea fra coppie dielettroni, cioè quella parte intrinsecamente trascurata in qualsiasi modello a particelle indipendenti. Men-tre effetti di quasi degenerazione possono essere facilmente incorporati nel trattamento teorico includendonella CI un numero di norma piccolo di configurazioni, la correlazione dinamica rappresenta il vero pro-blema: essa può essere rappresentata solo considerando lâeffetto combinato di un numero generalmentegrandissimo di configurazioni come giĂ detto prima. Lâesperienza indica indubbiamente che, una volta chesiano incorporate le configurazioni quasi degeneri, il resto della correlazione converge molto lentamentecon il numero di configurazioni incluse.
La correlazione dinamica non è quindi inclusa completamente nelle funzioni dâonda MCSCF ed in ge-nere è necessario proseguire il calcolo per includerla con altri metodi. La conclusione è che, sebbene lafunzione dâonda MCSCF possieda flessibilitĂ sufficiente a rappresentare i cambiamenti nelle strutture elet-troniche durante le reazioni chimiche, lâenergia che si ottiene non ha accuratezza sufficiente: lâerrore sudati sperimentali termodinamici eâ di circa 10-20 kcal/mol.
La metodologia concettualmente piĂš semplice per poter introdurre la correlazione elettronica è quella difare un calcolo SDCI dove però la funzione di riferimento da cui calcolare i determinanti eccitati non è piĂšun singolo determinante HF, ma lâintera funzione MCSCF. In questo caso il SDCI di chiama MR-SDCIo MR-CI dove MR sta per Multi-Reference. In generale gli orbitali che escono da un conto MCSCF4
vengono distinti in âinterniâ (o di valenza) che sono quelli occupati in almeno uno dei determinanti inclusinellâespansione MCSCF e in âesterniâ (o virtuali) che rimangono vuoti. Le singole e doppie eccitazionidel MRCI ovviamente vengono fatte promuovendo elettroni negli orbitali esterni. Inutile dire che MRCI èmolto pesante in termini computazionali.
Un altro metodo molto utile è quello nominato MR-PT (Multi Reference Perturbation Theory). La teoriadelle perturbazioni (vedi sotto) viene applicata ad una funzione riferimento multideterminantale. Lâaccu-ratezza di tale metodo eâ confrontabile con MRCI, ma il suo costo è decisamente inferiore.
4Che sono tanti quanti le contrazioni del set di base, esattamente come in un calcolo HF.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 75
Metodo Singlet-Triplet Splitting in CH2 (kcal/mol)HF 26.14
MP2 18.05MCSCF 12.82
MCSCF+SCI 14.48MCSCF+SDCI 12.00
MCSCF+PT2 (smaller basis) 12.95Full-CI 11.97
CAS-SCF
Lâimplementazione piĂš diffusa del metodo MCSCF si chiama CASSCF (Complete Active Space Self Con-sisten Field). La nuova sigla identifica solo un modo facilmente âautomatizzabileâ per la scelta delle Ψk dainserire nella funzione dâonda MCSCF. In pratica la ricetta è questa:
⢠si sceglie il cosidetto spazio attivo (di solito determinato dagli orbitali di valenza) e gli elettroni attivi.Per esempio se volessimo descrivere la molecola di H2 potremmo scegliere uno spazio attivo di dueorbitali molecolari (come chimici sappiamo che sono importanti gli 1s dellâidrogeno per H2) . Sevolessimo descrivere LiH potremmo scegliere gli orbitali 1s e 2s del Li e lâorbitale 1s dellâidrogenocioè useremmo uno spazio attivo di 1s + 2s + 1s = 3 orbitali molecolari. Oppure si potrebbe volerandare oltre la valenza per aumentare la flessibilitĂ della funzione e poter descrivere gli stati eccitati.La prima eccitazione elettronica possibile in LiH è ovviamente quella che porta il Li(2s) in Li(2p) equindi potremmo prendere: 1s+2s+3 ¡2p+1s = 6 orbitali attivi.
⢠Si scelgono gli elettroni attivi, cioè quelli che possono essere eccitati nella generazione dei deter-minanti. Quelli non eccitabili vengono chiamati elettroni di core. Nellâesempio di LiH potremmoinfatti considerare congelati i due 1s del Li riducendo lo spazio attivo a 5 orbitali molecolari e ilnumero di elettroni a 2.
⢠allâinterno dello spazio attivo e usando gli elettroni attivi si costruisce una serie Full-CI. Se lo spazioattivo è piccolo (da 3 a 10 orbitali molecolari e il numero di elettroni attivi contenuto <10) anche ilFull-CI risultante è facilmente gestibile.
⢠Il Full-CI è il punto di partenza cioè lâeq. (3.12) per lâalgoritmo MCSCF.
I metodi MCSCF non hanno mai avuto una grande diffusione fino a che non è stata introdotta la âricettaâCAS. Adesso sono molto utilizzati ogni qualvolta serve calcolare energie di stati elettronici eccitati. Ilfatto che si costruisca una piccola serie Full-CI allâinterno dello spazio attivo, infatti, permette di calcolarediversi autovalori dellâHamiltoniano con ragionevole accuratezza.
3.2.6 Il problema della size-consistency
Questo è un problema piuttosto complesso e ne accennerò solamente i concetti basilari. Per capirlo èmeglio fare un esempio pratico. Supponiamo di fare un calcolo con una qualunque versione di CI troncato(per esempio SDCI) sul sistema H2âH2a distanza infinita tra i due monomeri e poi di calcolare semprecon SDCI una molecola di H2 isolata. Ci si aspetta che lâenergia della supermolecola dissociata sia ugualealla somma delle energie dei due monomeri isolati cioè che:
EH2âH2(R â â) = 2 ¡E(H2)
Si trova invece che lâenergia SDCI della supermolecola H2âH2 quando la distanza tra le molecole è moltogrande non è uguale alla somma SDCI dei due monomeri calcolati isolati. Questo risultato è evidente se
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 76
consideriamo il fatto che una descrizione SDCI dei monomeri isolati contiene eccitazioni doppie su en-trambi i monomeri che sarebbero rappresentate da eccitazioni quadruple nella supermolecola che però nonsono incluse nel calcolo. I metodi di calcolo che soffrono di questo problema sono detti size-inconsistent.Tutte le approssimazioni conosciute a Full-CI non sono size-consistent. Full-CI, HF e i metodi perturbativilo sono.
I risultati SDCI sono spesso modificati utilizzando una semplice correzione introdotta da Langhoff eDavidson, che rende lâenergia approssimativamente size-consistent, ma non piĂš variazionale
âEcorrection = (1âC20)ESDCI
corr
In letteratura i due termini âsize extensivityâ e âsize consistencyâ sono spesso utilizzati in modo piuttostolibero e non rigoroso. La prima proprietà è forse quella meglio definita: un calcolo size extensive produceun energia che scala con il numero di particelle linearmente. La seconda proprietĂ invece ha piĂš a che farecon la dissociazione dei sistemi. Lâutilizzo dei due termini è piuttosto incerto e certi autori considerano peresempio il RHF size extensive, ma non size consistent perchĂŠ non produce una dissociazione corretta.
3.3 Metodi non variazionali
3.3.1 Metodi perturbativi MP2 e MP4
Questi metodi migliorano lâenergia Hartree-Fock a singolo determinante usando la teoria delle perturba-zioni. LâHamiltoniano viene partizionato in questo modo: lâhamiltoniano imperturbato è5
H0 = âi[h(i)+ vHF(i)] (3.13)
e il perturbatore è scelto comeV = â
i< jrâ1
i j ââi
vHF(i) (3.14)
dove vHF è il potenziale di HF cioè lâoperatore:
vHF(i) = âj
J j(i)âK j(i)
Lâenergia di ordine zero è lâautovalore di H0 corrispondente allâautofunzione di HF Ψ0 e cioè la sommadegli autovalori di HF (non lâenergia elettronica quindi!).
E(0)0 = â
iÎľi
La correzione al primo ordine è
E(1)0 = ăΨ0 |V |Ψ0ă
=
â¨Î¨0
âŁâŁâŁâŁâŁâi< jrâ1
i j |Ψ0
âŠâ
â¨Î¨0
âŁâŁâŁâŁâŁâivHF(i)|Ψ0
âŠ
=12 â
abăab||abăââ
aăa|vHF |aă
= â12 â
abăab||abă
5La scelta di quel perturbatore è dovuta al semplice fatto che il perturbatore deve essere piccolo rispetto allâHamiltoniano imper-turbato. Il termine âi< j râ1
i j ââi vHF (i) è piccolo perchĂŠ gran parte del contributo (precisamente quello medio) dellâoperatore râ1i j è
inlcuso nel potenziale di HF.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 77
Quindi la somma dellâordine zero e del primo ordine non è altro che lâenergia elettronica HF.
E0 = E(0)0 +E(1)
0 = âa
Îľaâ12 â
abăab||abă
La prima correzione dovuta alla correlazione è quindi quella al secondo ordine. La correzione di secondoordine allâenergia è data da
E(2)0 = â
n 6=0
| ă0|V |nă |2
E(0)0 âE(0)
n
cosa sono gli stati |nă? Lâunica è che siano eccitazioni doppie
E(2)0 = â
a<b,r<s
âŁâŁâŁâ¨Î¨0
âŁâŁâŁâi< j râ1i j |Ψrs
ab
âŠâŁâŁâŁ2Îľa + Îľbâ Îľr â Îľs
= âa<b,r<s
|ăab | |rsă|2
Îľa + Îľbâ Îľr â Îľs
Eâ possibile calcolare le correzioni al terzo, quarto e quinto ordine, ma le formule sono terribilmentecomplicate e molto poco interessanti. Il metodo MP2 usa la correzione al secondo ordine, mentre quelloMP4 arriva fino al quarto.
Il metodo MP2 è di poco piĂš costoso di HF in termini computazionali, ma piĂš accurato perchĂŠ calcolauna frazione significativa dellâenergia di correlazione. Può essere utiltaizzato su sistemi con molti elettro-ni (spesso, esclusa DFT, è lâunica possibilitĂ ab-initio) specialmente per le ottimizzazione delle geome-trie nucleari. Per esempio viene usato per ottimizzare preliminarmente una geometria per poi procederead un successivo miglioramento del risultato con MP4. MP4, insieme a Coupled-Cluster (CC) che nontrattiamo, è il metodo di elezione per lo studio dei legami deboli come quelli che si trovano nei cluster(Nen), nei sistemi di Van der Waals (CO-He) e nei dimeri molecolari (H2O-H2O). Questi metodi sonosize-consistent ma sono destinati a fallire quando non esiste chiaramente una configurazione dominante:includono infatti (specialmente MP4) molta della correlazione dinamica, ma non gestiscono quella dovutaalla degenerazione.
3.3.2 I metodi Coupled Cluster (cenni)
Il metodo SDCI, come tutti i troncamenti alla serie CI, è un metodo non size-consistent. Le teorie cou-pled cluster suppliscono a questo problema anche se a differenza delle metodologie perturbative sonoapprossimazioni alla serie CI, ma come vedremo non consistono in un semplice troncamento della serie.Trascurando per semplicità le singole, le triple e le eccitazioni dispari la serie CI è data da
|ÎŚ0ă= c0 |Ψ0ă+ âa < br < s
crsab |Ψrs
abă+ âa < b < c < dt < s < t < u
crstuabcd |Ψrstu
abcdă+ ... (3.15)
come abbiamo visto precedentemente, per trovare lâenergia di correlazione dobbiamo sostituire (3.15)nellâequazione seguente
(HâE0) |ÎŚ0ă= Ecorr |ÎŚ0ă
e poi premoltiplicare per ăΨ0|, ăΨrsab| ecc. per ottenere un set di equazioni lineari accoppiate del tipo (cfr.
con lâeq. (3.5))
âc < dt < u
â¨Î¨0âŁâŁH|Ψtu
cdâŠ
ctucd = Ecorr
ăΨrsab |H|Ψ0ă+ â
c < dt < u
â¨Î¨
rsab
âŁâŁHâE0|ΨtucdâŠ
ctucd +â
â¨Î¨rs
ab
âŁâŁH|Ψrstuabcd
âŠcrstu
abcd = Ecorrcrsab (3.16)
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 78
le quali formano una gerarchia di equazioni dove lâenergia di correlazione dipende dai coefficienti delledoppie, ma questi ultimi devono essere determinati includendo i coefficienti delle eccitazioni superiori.Come abbiamo ripetuto piĂš volte dobbiamo troncare questa gerarchia o disaccoppiarla in qualche modoper rendere il calcolo possibile. Eâ possibile approssimare i coefficienti delle quadruple come prodotto dicoefficenti di doppie, cioè formalmente
crstuabcd ' (crs
ab â ctucd) (3.17)
in realtĂ non esiste un modo solo di ottenere una particolare eccitazione quadrupla dalle doppie e quindicrstu
abcd deve essere la somma di tutti i modi possibili il che rende (3.18) una formula del tipo
(crsab â ctu
cd) = crsabctu
cd âăcrsab â ctu
cdă (3.18)
dove ăcrsab â ctu
cdă è unâespressione molto complicata. La seconda equazione delle (3.16) diventa
ăΨrsab |H|Ψ0ă+ â
c < dt < u
â¨Î¨
rsab
âŁâŁHâE0|ΨtucdâŠ
ctucd â â
c < dt < u
â¨Î¨0âŁâŁH|Ψtu
abcdâŠăcrs
ab â ctucdă= Ecorrcrs
ab
Risolvere una tale equazione è tuttâaltro che semplice dal punto di vista computazionale visto che lâequa-zione non è lineare nelle incognite crs
ab. Quello che è importante ricordare di tale metodologia è che questeequazioni danno vita ad unâenergia che è size-consistent.
3.4 Simboli di termine, configurazioni elettroniche (atomi e molecolelineari)
Atomi e molecole lineari hanno orbitali che possono essere etichettati secondo la simmetria: per gli atomiabbiamo orbitali di tipo s,p ecc., per le molecole abbiamo orbitali Ď , Ď ecc.. Questi orbitali possono es-sere visti come regioni di spazio in cui gli eletroni si muovono (al massimo due elettroni di spin oppostoalla volta ovviamente). Specificare lâoccupazione del set di orbitali di un atomo o di una molecola (Nota:il numero di orbitali che si ottiene da un calcolo HF o MCSCF è uguale al numero di funzioni di baseutilizzate) non riesce univocamente a specificare lo stato elettronico dellâatomo o molecola: se prendiamolâatomo di O nello stato fondamentale con configurazione elettronica 1s22s22p4 si può facilmente vedereche esistono 15 modi diversi di distribuire gli elettroni negli orbitali 2p. Esistono quindi 15 stati diversi chesi raggruppano in 3 livelli energetici distinti. Non tutti gli stati che provengono da una data configurazioneelettronica hanno la stessa energia perchĂŠ gli elettroni occupano gli orbitali degeneri in modo differente:nellâesempio dellâatomo di O abbiamo una configurazione 2p2
12p102p1
â1 ed anche una 2p212p2
02p0â1. Lâinte-
razione Coulombiana tra gli elettroni nelle due configurazioni è diversa e la prima ha unâenergia piĂš bassa(una delle regole di Hund).
Quindi, riassumendo, atomi e molecole hanno una serie di orbitali molecolari disponibili; gli elettroniriempiono questi orbitali in un determinato modo dando vita ad una configurazione. Se alcuni di questiorbitali sono parzialmente occupati, allora esiste piĂš di uno stato elettronico associato alla configurazione.Se, inoltre, alcuni degli orbitali parzialmente occupati sono degeneri questi stati possono dare vita a livellienergetici diversi.
LâHamiltoniano non relativistico di un atomo o di una molecola rispetta le seguenti regole di commutazio-ne:
⢠nel caso di un atomo lâhamiltoniano commuta con i momenti angolari orbitali e di spin totali L2,Lz, S2 e Sz che sono la somma vettoriale dei singoli momenti angolari degli elettroni (nota chelâhamiltonianio non commuta singolarmente con questi ultimi). I numeri quantici âbuoniâ sonoquindi: L, ML, S e MS.
⢠per una molecola lineare (biatomica) con Lz, S2 e Sz, dove lâasse z è lâasse internucleare (nota: Hnon commuta piĂš con L2perchĂŠ una molecola lineare non ha simmetria sferica). I numeri quanticiâbuoniâ sono quindi: Lz, S e MS.
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 79
3.4.1 Accoppiare gli spin
Stati di spin che sono autofunzioni di S2e di Sz possono essere ottenute utilizzando lâoperatore Sâ = Sxâ iSyche opera su uno stato |S, MSă in questo modo (abbassa di un valore il numero quantico MS: cioè potremmodire che inverte la proiezione dello spin di un elettrone).
Sâ |S,MSă= hâ
S(S +1)âMS(MSâ1) |S,Msâ1ă
Si inizia formando lo stato con il massimo MS compatibile con una data configurazione elettronica (cheè semplice da trovare perchĂŠ è lo stato con MS = S) e quindi creando stati a MS piĂš basso utilizzandolâoperatore Sâ. Per esempio in un sistema a 3 elettroni con configurazione 1s2s3s esistono 8 modi disistremare gli elettroni in 3 orbitali (23). Cominciamo con lo stato rappresentato dal determinante |1sÎą ¡2sÎą ¡ 3sÎą|che sarebbe | 3
2 , 32 ă. Applichiamo a questo stato Sâuna volta considerando che lâoperatore è la
somma dei vari operatori elettronici Sâ = s1â+ s2â+ s3â
SââŁâŁâŁâŁ32 ,
32
âŠ= (s1â+ s2â+ s3â)|1sÎą ¡2sÎą ¡3sÎą|=
h(|1sβ ¡2sι ¡3sι|+ |1sι ¡2sβ ¡3sι|+ |1sι ¡2sβ ¡3sι|) =
che, per la definizione di Sâ data piĂš sopra, deve essere uguale a
h
â32
(32
+1)â 3
2
(32â1)âŁâŁâŁâŁ32 ,
12
âŠ= h
â3âŁâŁâŁâŁ32 ,
12
âŠe quindi abbiamo âŁâŁâŁâŁ32 ,
12
âŠ=
1â3
(|1sβ ¡2sι ¡3sι|+ |1sι ¡2sβ ¡3sι|+ |1sι ¡2sβ ¡3sι|)
Gli stati | 32 ,â 1
2 ă e | 32 ,â 3
2 ă possono essere ottenuti da ulteriori applicazioni di Sâ (o piĂš facilmente inver-tendo la proiezione dello spin di tutti gli elettroni). Si sono cosĂŹ trovati 4 stati con S = 3
2 . I rimanenti 4 staticon S = 1
2 possono essere costruiti utilizzando combinazioni lineari dei determinanti con MS = Âą 12 che
risultino ortogonali alle 4 già trovate. Questo esempio dimostra come sia possibile trovare per costruzioneesplicita le 4 funzioni di quartetto e le 4 di doppietto per un sistema a tre elettroni. Nota: non tutti i sistemia tre elettroni hanno 8 stati elettronici, infatti la configurazione 1s22s non può avere stati di quartetto, mane ha solo due di doppietto.
3.4.2 Accoppiamento dei momenti angolari orbitali
Nel caso di atomi uno deve accoppiare direttamente i vari momenti angolari degli elettroni li a formare ilmomento orbitale totale L = âi li. Dati due momenti angolari l1e l2, il momento angolare somma ha comevalori permessi la serie |l1 â l2|, |l1 â l2| â 1, . . . , l1 + l2 â 1, l1 + l2. Per esempio una configurazione deltipo p1d1 accoppia i momenti angolari l1 = 1 e l2 = 2. I possibili valori di L sono quini 1, 2 e 3. Questidanno vita a 3 stati diversi P, D e F . Inoltre essendo la configurazione a 2 elettroni saranno possibili perognuno di questi ultimi lo stato di singoletto e di tripletto. Una configurazione atomica di tipo p1d1 da vitaa 6 stati elettronici.
Nel caso di molecole lineari, uno non deve accoppiare vettorialmente i momenti angolari orbitali perchĂŠL2 non commuta con H e L non è un buon numero quantico. Per lâaccoppiamento dei momenti angolari sidevono soltanto sommare tra loro i valori di lz dei singoli elettroni. Per esempio accoppiando due orbitaliĎ (ciascuno con lz = Âą1) si ottengono i possibili valori di Lz: 1+1, 1-1, -1+1, -1-1 cioè rispettivamente 2,0, 0 e -2. I due livelli con Lz = Âą2 sono detti livelli âe i due stati con Lz = 0 sono detti ÎŁ. Considerandoanche qui lo spin avremmo i seguenti 6 stati: 3â, 3ÎŁ, 3ÎŁ, 1â, 1ÎŁ e 1ÎŁ. Questo è quello che si ottiene nelcaso gli elettroni se ne stiano su orbitali non equivalenti cioè per esempio in un caso del tipo 1Ď12Ď1. Se,
CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 80
invece, gli elettroni riempiono orbitali equivalenti (configurazioni tipo Ď2 per esempio), la situazione si fapiĂš complessa perchĂŠ non tutti gli stati di prima sono compatibili con il principio di Pauli. Ricordandoche gli orbitali Ď sono doppiamente degeneri possiamo scrivere una tabella di questo tipo costruendo gliopportuni determinanti compatibili con i valori indicati di ML e di Sz (i valori negativi di tali n.q. nonvengono indicati perchĂŠ gli stati risultanti sono semplici immagini speculari di quelli esplicitati):
ML 2 1 0Sz 1 Ď1Îą ¡Ď1Îą / Ď1Îą ¡Ďâ1Îą
0 Ď1Îą ¡Ď1β / Ď1Îą ¡Ďâ1β
Si può vedere come non siano possibili stati com ML = 1 (nel caso di un atomo in configurazione p2
lo sarebbero!). Inoltre lo stato ML = 2 e Sz = 1 (Ď1Îą ¡ Ď1Îą) non è permesso dal principio di Pauli. Cirimangono 3 determinanti: uno corrisponde ad uno stato 1â, unâaltro ad uno 1ÎŁ e infine ad un 3ÎŁ.
Nel caso di molecole omonucleari esiste una simmetria addizionale che identifica gli orbitali: se sonosimmetrici rispetto allâinversione attraverso il centro di massa dei nuclei si dicono gerade (g) se sonoantisimmetrici si dicono ungerade (u). Calcolare il carattere g o u dello stato elettronico risultatnte dal-lâoccupazione degli orbitali è immediato e dato dal prodotto delle simmetrie6. Per esempio lo stato Ď4
u Ďâ2g
della molecola O2 si calcola dal prodotto u ¡ u ¡ u ¡ u ¡ g ¡ g = g e quindi la molecola ha come simbolo ditermine 3ÎŁg. Se lo stato è ÎŁ si aggiunge un quarto identificatore al simbolo di termine che tiene conto dellasimmetria di riflessione attraverso un piano passante per i due nuclei. Si avranno cosĂŹ termini + o â aseconda delle proprietĂ di simmetria dello stato.
6Orbitali Ď , Ďâ, δ , Ďâ sono sempre g, orbitali Ďâ, Ď, δ â, Ď sono sempre u.
Capitolo 4
Descrizione Born Oppenheimer dellemolecole
4.1 Calcolo degli stati legati delle curve Born Oppenheimer
Le incognite dellâequazione (1.86) sono sia la funzione dâonda usν j(R) sia gli autovalori Esν j. Per comoditĂ
da ora in poi ci riferiremo ad un solo stato elettronico e quindi elimineremo lâindice s dallâequazione (1.86)che risulta
â 12Âľ
d2
dR2 uν j(R)+Vj(R)uν j(R) = Eν juν j(R)
dove
Vj(R) = V (R)+l(l +1)2ÂľR2
è il potenziale efficace con le barriere centrifughe. Lâespressione si può ulteriormente semplificare:[d2
dR2 +2Âľ(Eν j âVj(R))]
uν j(r) = 0 (4.1)
La risoluzione numerica dellâequazione deve quindi trovare contemporaneamente sia gli autovalori siagli autovettori dellâHamiltoniano. Uno dei metodi possibili è quello di utilizzare la diagonalizzazionedella matrice Hamiltoniana calcolata sulla base di funzioni arbitrarie ortonormali come i polinomi di Her-mite. Un altro è quello di integrare numericamente lâequazione (1.86). Per un sistema monodimensionalei due metodi sono del tutto equivalenti anche se il primo risulterebbe decisamente piĂš rapido. In realtĂ lascelta tra i due metodi dipende fortemente dal sistema in esame ed entrambi vengono utilizzati (con dellevariazioni significative) per la descrizione di sistemi piĂš complessi come i sistemi poliatomici o per la ri-cerca delle funzioni dâonda del continuo. Ho scelto il secondo metodo (lâintegrazione numerica) percheâsecondo me è di gran lunga piĂš didattico rispetto al primo.
In entrambi i casi autofunzioni e autovalori vengono determinati risolvendo lâeq (1.86) e imponendo duecondizioni al contorno: per un qualunque stato legato, infatti, us
ν j(R) deve essere zero sia per R moltopiccoli sia per R grandi. La soluzione u deve quindi soddisfare contemporaneamente le due condizionial contorno: u(0) = 0 e u(R â â) = 0 come indicato in 1.2. Le regioni di spazio dove la u(r) deveandare a zero sono le regioni âclassicamente proibiteâ cioè regioni dove lâenergia cinetica del sistemarisulta negativa. In queste regioni si può dimostrare che le possibili soluzioni dellâ eq. (1.86) sono funzioniesponenziali decrescenti. Data unâenergia le intercette di questa retta orizzontale con il potenziale vengonodetti turning point. Se lâenergia è negativa si hanno due turning point se è positiva solo uno (quellodi sinistra). Per energie negative la funzione dâonda può oscillare solo allâinterno dei due turning point.Allâesterno si hanno gli esponenziali decrescenti. Ne consegue che la funzione dâonda non può avere nodiallâesterno dei tuning point.
81
CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE 82
4.1.1 Il metodo di integrazione di Numerov per le equazioni differenziali al secon-do ordine
Il metodo di Numerov serve ad integrare equazioni differenziali della forma
d2ydx2 =âg(x)y(x)+ s(x)
dove g(x) e s(x) sono funzioni date. Lâequazione radiale (4.1) ha questa forma con g(x) = 2Âľ[EâV (x)] es(x) = 0.
Per risolvere il problema si divide lâintevallo spaziale di interesse (cioè quello in cui si vuole trovare lasoluzione) in N intervallini di ampiezza âx. Siano xi i nodi della griglia cosĂŹ ottenuta e yi = y(xi) i valoridella funzione incognita y(x)in corrispondenza di tali punti. Nel caso dellâeq. (4.1) la funzione s(x) è nullae la formula di Numerov risulta molto semplice:
yn+1 =(12â10 fn)ynâ fnâ1ynâ1
fn+1
dove per convenienza si è posto:
fn = 1+2Âľ
h2 [EâV (xn)]âx2
12
Questa formula permette di ottenere la soluzione al punto yn+1 conoscendo la soluzione nei due punti pre-cedenti. Come è evidente bisogna avere due punti di partenza in cui la funzione è nota. Nel problemaspecifico dellâeq. (4.1) questi punti di partenza si trovano nella regione classicamente proibita a sinistradove sappiamo che u(0) ' 0. La soluzione viene infatti integrata punto per punto partendo dalla regioneclassicamente proibita di sinistra applicando la formula di Numerov. Condizione perchè questo meto-do funzioni è che il passo di integrazione (step size) sia molto piccolo dellâordine di 10â2 â 10â3 voltelâintervallo di integrazione.
4.1.2 Condizioni al contorno e divergenza della funzione dâonda
Come abbiamo visto esiste un modo semplice di integrare lâeq. (4.1) partendo da sinistra e proseguendopunto per punto verso destra. In questo modo abbiamo giĂ incluso nel nostro calcolo una delle due condi-zioni al contorno. Ma la nostra è unâequazione differenziale al secondo ordine e quindi richiede unâaltracondizione per rimuovere lâambiguitĂ sulla soluzione. Un problema è includere quindi correttamente lâaltracondizione al contorno u(â) = 0. Un altro problema è quello di trovare la giusta energia da infilare nel ter-mine noto 2Âľ
h2 [EâV (xn)] perchè come sappiamo lâenergia risulta quantizzata. In realtĂ questi due problemisono due facce della stessa medaglia in quanto è proprio lâimposizione delle due condizioni contempora-neamente a quantizzare lâenergia. Adesso dimostrerò in pratica come lâincludere la seconda condizione alcontorno ci permetta non solo di trovare la giusta funzione dâonda, ma anche lâenergia quantizzata.
Integriamo (4.1) utilizzando il metodo di Numerov utilizzando unâenergia negativa a caso scelta allâinternodella buca di potenziale e partendo da sinistra dalla condizione u(0) = 0 e procedendo verso destra finoad addentrarci nellâaltra regione classicamente proibita. Ovviamente non è necessario partire esttamenteda R = 0, ma basta partire da una regione che sia sufficientemente allâinterno del turning point di sinistra.Per cominciare ad integrare dobbiamo avere i valori della funzione in ynâ1=0 e yn=1 che possono esserepresi senza troppi problemi come valori molto piccoli per esempio usando la formula yn = r j+1
n . Quelloche succede è rappresentato in Figura 4.1. Dato un potenziale generico come quello indicato nel pannello(a) cominciamo ad integrare una soluzione dellâeq (4.1) partendo da sinistra e prendendo come valore del-lâenergia il valore -0.6. Quando cominciamo ad addentrarci nella regione classicamente proibita a destra lanostra soluzione comincia a crescere e a divergere rapidamente (unâesponenziale crescente è una possibilesoluzione della (4.1) in quella regione anche se quella fisicamente priva di senso). Questa soluzione non èfisicamente corretta perchĂŠ non rispetta la seconda condizione al contorno. Diminuiamo la nostra energia
CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE 83
Figura 4.1: Calcolo della funzione dâonda per alcune energie âtrialâ usando il propagatore di Numerov
di prova a -0.63 e ricominciamo. Questa volta la soluzione sembra comportarsi leggermente meglio, madiverge lo stesso. Se scendiamo in energia fino a -0.65 ottentiamo una soluzione che questa volta divergenel senso opposto. Usiamo quindi una via di mezzo come -0.645 e otteniamo una buona funzione dâondaalmeno fino ad un certo valore di R (pannello (e)). Unâulteriore piccola diminuzione dellâenergia a -0.6455ci fa ottenere una soluzione in cui la divergenza si è spostata ancora verso R maggiori. Continuando diquesto passo si può fare in modo che la divergenza numerica della funzione dâonda sia confinata semprepiĂš ad R maggiori e quindi ottenere una soluzione sempre piĂš vicina a quella vera. Contemporaneamentela nostra energia di prova sarĂ sempre piĂš simile allâautovalore cercato.
Questo metodo piuttosto semplice permette di trovare unâautofunzione ed un autovalore dellâeq. (4.1).In realtĂ per poter generalizzare il piĂš possibile questo metodo bisogna introdurre la conta dei nodi dellafunzione e un metodo di scelta delle energie di prova. In pratica un eventuale programma potrebbe usarequesto motodo per calcolare un numero fissato di stati legati partendo dal piĂš basso in energia. Questopotrebbe essere lâalgoritmo da seguire:
1. dividere la buca di potenziale [âDe,0] a metĂ in due intervalli di energia (alto [âDe/2,0] e basso[âDe,âDe/2]) e iniziare con lâenergia a metĂ della buca di potenziale (Etrial =âDe/2);
2. fissare il numero di nodi desiderato a zero per cercare lo stato fondamentale;
3. integrare una funzione dâonda di prova da destra verso sinistra fino al turning point di destra contandoil numero di cambi di segno (i nodi si possono avere solo prima del turning point);
(a) se il numero di nodi è superiore a quello desiderato cambiare il valore dellâenergia di prova inmodo che quella nuova sia a metĂ del semintervallo basso (Etrial =âDe/2âDe/4) (bisezionedellâenergia) e andare al punto 3;
(b) se il numero di nodi è inferiore a quello desiderato cambiare il valore dellâenergia di provaquesta volta scegliendo la metĂ del semintervallo alto (bisezione dellâenergia) e andare al punto3;
(c) se il numero dei nodi è quello cercato andare al punto 4;
4. integrare la funzione oltre il turning point e vedere quando comincia a crescere in valore assoluto;
(a) se diverge ad R sufficientemente grandi (la soluzione può essere considerata accurata) andareal punto 5;
(b) se diverge con valori positivi abbassare lâenergia bisezionando ulteriormente lâintervallo dienergie e andare al punto 3;
CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE 84
(c) se diverge con valori negativi alzare lâenergia con lo stesso metodo andare al punto 3;
5. aumentare il numero dei nodi desiderato di una unità e se questo è inferiore al numero di stati cercatiandare al punto 3; se è superiore o uguale uscire.
4.1.3 Il metodo dello âShootingâ
In pratica, benchè attuabile, il metodo precedente presenta alcune difficoltà :
⢠calcolare la funzione dâonda nelle regioni classicamente proibite è rischioso perchĂŠ il computerfacilmente va in overflow sugli esponenziali crescenti;
⢠stabilire un criterio di accuratezza sulle energie è difficile;
⢠lâalgoritmo è lento.
Il metodo che si utilizza in pratica è il metodo dello shooting che non presenta i problemi elencati ed èmolto piĂš rapido nel raggiungere la convergenza. Il programma va alla ricerca della soluzione u(R) conun determinato numero di nodi (la conta dei nodi viene fatta come nel metodo precedente) allâinternodi un certo intervallo di energie fissato [Emin, Emax] e considera inizialmente lâenergia E corrispondenteal punto medio dellâintervallo. Lâintegrazione viene fatta da destra verso sinistra partendo dalla regioneclassicamente proibita dove viene imposta la condizione ĎL = 0. Lâintegrazione viene portata avanti fino alturning point esterno Rc (right TP). Se il numero dei nodi è diverso dal numero richiesto, lâenergia è moltodiversa dallâautovalore e si procede a cambiare energia usando il metodo della bisezione: se il numero deinodi è maggiore di quello richiesto significa che E è troppo alta, se invece il numero di nodi è piĂš piccolo,significa che E è troppo bassa; Viene allora scelto il semintervallo opportuno: rispettivamente [Emin,E] o[E,Emax] e si ricomincia ad integrare dalla regione classicamente proibita (vedi Figura 4.2 ).
Figura 4.2: Prima fase del metodo dello shooting
Quando il numero dei nodi eâ quello giusto, si procede con lâintegrare una seconda soluzione uR(R) dadestra verso sinistra a partire dalla regione classicamente proibita di destra fino a Rc (vedi Figura 4.3).In Rc ci sono due valori della soluzione uL(Rc) e uR(Rc) che saranno in generale diversi. I due valorisarebbero uguali insieme alle loro derivate prime solo se E fosse un autovalore. Usiamo questa condizioneper trovare E. Per prima cosa si scala il valore di uR(R) di un fattore uL(Rc)/uR(Rc) in modo che le duefunzioni abbiano un raccordo continuo. Ottenuta cosĂŹ una funzione dâonda continua, la si normalizza.
La parte cruciale dellâalgoritmo eâ il calcolo della derivata prima delle due soluzioni al punto di contattoRc. La differenza Ď â˛
R(rc)âĎ â˛L(rc) è nulla quando E corrisponde ad un autovalore. Il segno nella differenza
delle derivate ci permette di capire se E è troppo alta o troppo bassa e quindi di applicare nuovamente ilmetodo della bisezione per migliorarne la stima. Si ritiene di essere giunti a convergenza quando lâampiezzadellâintervallo di energia è piĂš piccola di una certa tolleranza.
CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE 85
Figura 4.3: Seconda fase del metodo dello shooting
Appendice A
Gli spazi di Hilbert
Per definire matematicamente uno spazio di Hilbert e le sue proprietà geometriche è necessario partire daun concetto molto astratto chiamato spazio metrico. Uno spazio metrico è cosÏ generale che può contenerepraticamente qualunque cosa: in pratica è un insieme in cui esiste un modo di definire una distanza tra glielementi.
Riguardo la notazione ricordiamo brevemente: se X è un insieme allora x â X significa che x è elementodi X e x /â X che non ne è elemento; La dicitura âper tutti gli x in Xâ è abbreviata con (âx â X) e quellaâesiste un x in X tale cheâ con (âx â X). Il simbolo x|P(x) denota lâinsieme di x che hanno la proprietĂ P(x). Infine lâinsieme di coppie ordinate ăx, yă|x â X , y â Y è detto prodotto cartesiano degli insiemi Xe Y ed è indicato con X âY . Ricordiamo che data una funzione a singolo valore che connette due insiemif : X 7â Y esiste un solo elemento f (x) â Y per ogni x â X ; inoltre se A â Y allora f [A] = f (x)|x â Aè un sottoinsieme di Y e viceversa fâ1[B] = x| f (x) â B è un sottoinsieme di X se B â Y . X vienedetto il dominio di f e f [X ] il suo range indicato con Ran f . Una funzione è detta iniettiva (o one-one) seây â Ran f , âx â X tale che f (x) = y; è detta surriettiva se Ran f = Y . Se f è sia surriettiva che iniettiva èdetta biiniettiva.
A.1 Spazi metrici
Per prima cosa definiamo la distanza in modo piĂš generale di quanto si faccia in R3.
⢠Uno spazio metrico è un insieme M piĂš una funzione a valori reali d(¡, ¡) definita su MâM chesoddisfa
1. d(x, y)⼠0
2. d(x, y) = 0 se e solo se x = y
3. d(x, y) = d(y, x)
4. d(x, z)⤠d(x, y)+d(y, z) che è la disuguaglianza triangolare (vale anche per le normali distanzein R3 dove d(x, y) =
â(x1â y1)2 +(x2â y2)2 +(x3â y3)2.)
⢠Una sequenza di elementi xnân=1 di uno spazio metrico ăM, dă si dice convergere allâelemento
x â M se d(x, xn)â 0 as n â â. Questa proprietĂ si indica con xndââ x o con limnââ xn = x.
⢠Una sequenza di elementi xnân=1 di uno spazio metrico ăM, dă si dice sequenza di Cauchy se
âÎľ > 0 âN n, m ⼠N implica che d(xn, xm) < Îľ .
Tutte le sequenze convergenti sono sequenze di Cauchy, ma lâopposto non è vero: per esempio datolâinsieme di numeri razionali Q in cui la distanza d(x, y) è definita come al solito con |xâ y|, sia xâ
86
APPENDICE A. GLI SPAZI DI HILBERT 87
un numero irrazionale. Se xn è una sequenza di razionali tale che xndââ xâ, allora xn è una sequenza
di Cauchy, ma non converge perchÊ il limite non è elemento di Q.
Uno spazio metrico in cui tutte le le sequenze di Cauchy convergono si dice completo. Per esempio Rè un insieme completo, mentre Q non lo è. Questo esempio dovrebbe fare intuire quale è lâoperazionematematica necessaria a creare uno spazio metrico completo da uno incompleto: si devono aggiungere allospazio incompleto tutti i limiti delle sequenze di Cauchy. La condizione sotto cui questa cosa si può farenon è ovvia nĂŠ banale. Cominciamo con il definire il concetto di insieme denso: un insieme B si dice densonello spazio metrico M se ogni m â M è un limite degli elementi di B. PerchĂŠ uno spazio incompleto Xpossa essere trasformato nell spazio completo X , aggiugendo i limiti delle serie di Cauchy, dovrebbe essereun insieme denso nello spazio X . Nellâesempio precedente, se vogliamo completare lo spazio dei numerirazionali Q dobbiamo aggiungere tutti i limiti in modo da ottenere lo spazio completo R. La condizioneperchĂŠ questo possa essere fatto è che Q sia un insieme denso di R. Il problema è che se B non è giacontenuto in M (come Q lo è in R), la definzione di insieme denso non si sa bene cosa voglia dire. Perrisolvere la situazione si deve introdurre un ulteriore concetto, quello di isometria: una trasformazionebiiniettiva h da ăX , dă a ăY, Ďă che preserva la metrica
Ď(h(x), h(y)) = d(x, y)
è chiamata isometria. La cosa piĂš importante a proposito di isometrie è che, se una proprietĂ vale per lastruttura metrica ăX , dă, varrĂ anche in tutti gli spazi ad essa isometrici. Ora possiamo formalizzare cosasignifica completare uno spazio metrico: esiste, infatti, un teorema che ci assicura che è sempre possibileâingrossareâ uno spazio incompleto in modo da ârenderloâ completo:
dato uno spazio metrico incompleto ăM, dă è sempre possibile trovare uno spazio metricocompleto M tale che M sia isometrico ad un sottospazio denso di M.
A.2 Spazi vettoriali
Passiamo dagli astratti spazi metrici ai piĂš familiari spazi vettoriali. Definiremo prima gli spazi normatiperchĂŠ sono piĂš generali e quindi gli spazi dotati di prodotto scalare.
⢠Uno spazio lineare normato è uno spazio vettoriale V su R o su C piĂš una funzione norma â¡â da Va R che soddisfa
1. âvâ ⼠0 âv â V
2. âvâ= 0 se e solo se v = 0
3. âÎąvâ= Îą âvâ âv â V , âÎą â C4. âv+wâ ⤠âvâ+âwâ âv, w â V ,
â La norma nel caso di uno spazio Rn è quella tradizionale, cioĂŠ la lunghezza dei vettori â(x1, . . . , xn)â=ââi |xi|2
â La presenza di una norma induce una metrica naturale d(v, w) = âvâwâ. Questo significa chegli spazi normati sono un tipo particolare di spazi metrici.
Lâesistenza di una norma aggiunge alla possibilitĂ di misurare le distanze tra elementi (metrica) anche lapossibilitĂ di misurare la âlunghezzaâ dei vettori. Adesso introduciamo il concetto di prodotto scalare (ininglese âinner productâ o âdot productâ) che permette anche di definire in un certo senso anche il concettodi âangoloâ tra i vettori.
APPENDICE A. GLI SPAZI DI HILBERT 88
⢠Uno spazio vettoriale V sui complessi si dice uno spazio con prodotto scalare se esiste una fun-zione (detta prodotto scalare) a valore complesso (¡, ¡) definita su V âV che soddisfa le seguenticondizioni per tutti i x, y, z â V e Îą â C:
1. (x, x)⼠0 e (x, x) = 0 se e solo se x = 0
2. (x, y+ z) = (x, y)+(x, z)
3. (x, Îąy) = Îą(x, y) e (Îąx, y) = Îąâ(x, y)
4. (x, y) = (y, x)â
â Esempi:
â Se lo spazio Cn denota lâinsieme delle n-uple di numeri complessi, dati x = (x1, . . . , xn) ey = (y1, . . . , yn) allora una possibile definizione di prodotto scalare è (in analogia con lospazio dei vettori Rn)
(x, y) =n
âi=1
xâi yi
â Nello spazio C[a, b] che rappresenta lâinsieme delle funzioni complesse continue nellâin-tervallo [a, b] il prodotto scalare si definisce, date f (x), g(x) âC[a, b]
( f , g) =⍠b
af â(x)g(x)dx
â Una delle proprietĂ piĂš importante degli spazi con prodotto scalare è che sono anche spazinormati. Ogni spazio con prodotto scalare è anche uno spazio normato con norma data daâxâ= (x, x)
12 . Di conseguenza abbiamo una metrica definita in modo naturale
d(x, y) =â
(xâ y, xâ y)
⢠Uno spazio con prodotto scalare completo rispetto alla norma âxâ= (x, x)12 è detto spazio di Hilbert.
Due spazi di Hilbert H1 e H2 sono isomorfi se esiste un operatore lineare U da H1 a H2 tale che(Ux, Uy)H2 = (x, y)H1 âx, y â H1. Questi operatori lineari sono detto operatori unitari (perchĂŠpreservando il prodotto scalare, preservano anche la norma cioè âla lunghezzaâ dei vettori).
⢠Esempi:
â Definiamo L2[a, b] come il set di funzioni integrabili a valore complesso nellâintervallo [a, b]che rispettino la condizione
⍠ba | f (x)|2dx < â. Definiamo il prodotto scalare come⍠b
af â(x)g(x)dx
si può dimostrare che questo spazio è completo ed è quindi uno spazio di Hilbert in cui normaè data da
â fâ=(⍠b
a| f (x)|2dx
) 12
â Definiamo l2 lo spazio delle sequenze xnân=1 di numeri complessi che soddisfano â
ân=1 |xn|2 <
â. Il prodotto scalare può essere definito come
(xnân=1, ynâ
n=1) =â
ân=1
xânyn
Questo esempio è importante perchÊ si può dimostrare che ogni spazio di Hilbert a dimensioneinfinita, ma numerabile è isomorfo a l2.
APPENDICE A. GLI SPAZI DI HILBERT 89
A.3 Spazio duale
Adesso abbiamo tutti gli strumenti per poter affrontare il problema dello spazio duale. Prima dobbiamodefinire il concetto di trasformazione lineare limitata o operatore limitato. Questi oggetti esistono neglispazi normati (dove si può in un certo senso stabilire un limite). Un operatore limitato da uno spazionormato ăV1, â¡â1ă ad un altro ăV2, â¡â2ă è una funzione T che soddisfa
1. T (Îąv+βw) = ÎąT v+βTw (âv, w â V )(âÎą, β â C)
2. dato un numero C > 0, âT vâ2 â¤Câvâ1. Il numero C piĂš piccolo definisce la norma dellâoperatoreche quindi è lâestremo inferiore delle norme in V1
âTâ= infâvâ1=1
âT vâ2
Prendiamo lâinsieme di tutte le trasformazioni lineari limitate che connettono due spazi di Hilbert e chia-miamolo L (H1, H2) e poi interessiamoci del caso particolare in cui il secondo spazio di Hilbert coincidecon C. Lo spazio L (H1,C) è detto spazio duale di H e può essere idicato con H â. Gli elementi di H â
sono detti funzionali lineari continui. Esiste un teorema importante dellâanalisi (lemma di Riesz) che ciassicura che, preso un funzionale lineare T â H â qualunque, esiste ed è unico un elemento dello spaziodi Hilbert y âH tale che T (x) = (y, x) per ogni x âH . Inoltre âyâH = âTâH â . Per definizione risultavero anche lâinverso del lemma di Riesz cioĂŠ che ogni y â H definisce un funzionale lineare continuo Tsu H attraverso la relazione T (x) = (y, x) che è la definzione di prodotto scalare che abbiamo usato noiprecedentemente quando abbiamo introdotto il conceto di spazio dei bra.
A.3.1 Basi
Finiamo questa appendice menzionando 3 teoremi che completano le proprietĂ degli spazi di Hilber chesono rilevanti per la meccanica quantistica elementare:
1. Ogni spazio di Hilbert possiede una base ortonormale.
2. Se H è uno spazio di Hilbert e S = xιιâA una base ortonormale. Allora ogni y âH può essereespresso come combinazione lineare
y = âÎąâA
(xÎą , y)xÎą e âyâ2 = âÎąâA
|(xÎą , y)|2
questo teorema estende al caso infinito-dimensionale quello che siamo abituati a vedere come ilnormale teorema di espansione nel caso di basi o spazi vettoriali finiti.
3. Definizione: uno spazio metrico si dice separabile se ha un sottoinsieme numerabile denso. Unospazio di Hilbert è separabile se ha una base ortonormale numerabile S. Se ci sono N < â elementinella base, allora H è isomorfo a CN . Se ci sono infiniti elementi numerabili in S, allora H èisomorfo a l2. Questo teorema ci assicura che gli spazi di Hilber a dimensione finita rientrano nelcaso piĂš semplice di spazi vettoriali Cn o Rn.
Appendice B
Il programma LEVEL
Il programma LEVEL determina il numero, le energie e le proprietĂ dei livelli vibro-rotazionali di un datopotenziale monodimensionale. Il nucleo del programma quindi risolve per le autofunzioni e per le energiela seguente equazione
â h2
2Âľ
d2Ďν , j(R)dR2 +Vj(R)Ďν , j(R) = Eν , jĎν , j(R)
dove Âľ eâ la massa ridotta del sistema a due particelle, j è il numero quantico del momento angolare e ilpotentiale efficace Vj(R) è la somma dellâenergia elettronica Born-Oppenheimer piĂš il termine centrifugo.Per una molecola biatomica il termine centrifugo è dato da:
[ j( j +1)]2ÂľR2 .
Quello che fa il programma è determinare le energie Eν , j e le autofunzioni Ďν , j. Lâaccuratezza del calcolo èdeterminata in massima parte dalla dimensione della griglia radiale di integrazione [Rmin,Rmax] e dallo stepdi integrazioneâR cioè dalla variabile RH che viene letta a riga #4 del file di input. Se lo step di integrazioneè troppo grande si otterranno valori inaccurati delle energie, mentre se è troppo piccolo il tempo di calcolopuò diventare eccessivo. La dimensione della griglia invece deve essere abbastanza grande da poter inclu-dere anche gli stati vibrazionali piĂš diffusi (eccitati). Lâintegrazione viene condotta da Rmin verso destrae da a Rmaxverso sinistra con il propagatore di Numerov. Per iniziare la propagazione è necessario speci-ficare il valore della funzione in due punti adiacenti per ognuno dei due limiti di integrazione: poco oltreRmaxla funzione viene inizializzata ad un valore arbitrario (uno per esempio) mentre al punto adiacente (piĂšinterno) viene calcolata usando lâapprossimazione semiclassica WKB:
Ďν , j âź [Vj(R)âEν , j]â1/4 exp
(ââ
2Âľ
h2 [⍠Rmax
Rmin
[Vj(Râ˛)âEν , j]1/2dRâ˛)
.
A corto raggio i potenziali realistici crescono rapidamente con il diminuire della distanza R e la Ď âmuoreâmolto rapidamente nella regione classicamente proibita, quindi la funzione dâonda viene inizializzata azero ponendo Ďν , j(Rmin) = 0 e dando alla funzione al punto adiacente Ďν , j(Rmin + âR) un valore piccoloarbitrario. La procedura utilizzata è quella dello âshootingâ in cui, per una data energia di prova, lâinte-grazione viene effettuata verso lâinterno partendo da Rmax e verso lâesterno partendo da Rmin fino a quandoi due segmenti di funzione dâonda si incontrano ad un certo punto di matching Rx. La discontinuitĂ delleloro pendenze viene quindi utilizzata come indicatore per migliorare lâenergia di prova fino a convergenza.Il programma LEVEL sceglie Rx in modo che sia localizzato allâinterno dei due turning point nella regioneclassicamente permessa.
In genere le distanze Rmin e Rmax devono trovarsi ben allâinterno delle regioni classicamente proibite cosĂŹche la funzione dâonda sia vari ordini di grandezza piĂš piccola rispetto alla sua ampiezza nella regione clas-sicamente permessa. Il codice LEVEL stampa un messaggio di warning se questo rapido decadimento non è
90
APPENDICE B. IL PROGRAMMA LEVEL 91
almeno di un fattore 10â9. Se questo accade potrebbe essere necessario diminuire Rmin o aumentare Rmax.Al contrario se Rmin o Rmax sono troppo allâinterno delle regioni classicamente proibite il fattore [Vj(R)âE]potrebbe risultare troppo grande e il propagatore di Numerov diventare instabile. Per una molecola biato-mica questo può succedere solo per Rmin. Se è il caso un messaggio di warning viene stampato e il valoredi Rmin viene automaticamente aumentato internamente al programma finchĂŠ il problema scompare.
Allâinterno di LEVEL è possibile utilizzare molte forme analitiche di potenziale dalle piĂš semplici come ilpotenziale di Morse
V (R) = De
[1â eβ (RâReq)
]2
alle piĂš complicate come il potenziale HDF
V (R) = A(
RReq
)p
eâβ0R
Req âβ1
(R
Req
)2
âD(
RReq
)âm
Cm
Rm
o utilizzare direttamente i punti del calcolo ab-initio indicando a LEVEL stesso di utilizzare una forma diinterpolazione di questi punti (tipicamente una interpolazione tipo âcubic splineâ).