Download pdf - Istituzioni Di Meccanica Quantistica

Applicazioni di meccanica quantistica: appunti per le lezioni

E. Bodo

21 novembre 2008

Indice

1 Istituzioni di meccanica quantistica 5

1.1 Stati, operatori e osservabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.1 Stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.2 Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.3 Autovalori, autovettori, autostati . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.4 Basi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2 Postulati interpretativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2.1 Misure e valore medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2.2 Riduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2.3 Sovrapposizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2.4 Evoluzione temporale e costanti del moto . . . . . . . . . . . . . . . . . . . . . . 10

1.2.5 Osservabili compatibili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Rappresentazione matriciale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.1 Il cambio di base di rappresentazione . . . . . . . . . . . . . . . . . . . . . . . . 13

1.4 Sistemi a due stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.5 Lo spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.6 Momenti angolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.7 Sistemi a due particelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.8 Funzione d’onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.9 Simmetria in meccanica quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.10 L’equazione di Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.10.1 Autofunzioni ed energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.11 Principio e metodo variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.11.1 Principio variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.11.2 Metodo variazionale lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.12 Energie e strutture molecolari: problema elettronico (ab-initio) e problema nucleare (dina-mica) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

1.13 La dinamica delle molecole: l’approssimazione di Born-Oppenheimer, la vibrazione erotazione delle molecole biatomiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1

INDICE 2

1.13.1 L’approssimazione di Born-Oppenheimer . . . . . . . . . . . . . . . . . . . . . . 35

1.13.2 Il moto delle molecole biatomiche: rotazione e vibrazione . . . . . . . . . . . . . 37

1.13.3 L’approssimazione armonica alle energie molecolari . . . . . . . . . . . . . . . . 39

1.13.4 L’Hamiltoniano ro-vibrazionale “esatto”: la rotazione molecolare e le barriere cen-trifughe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

1.14 L’ottimizzazione delle geometrie molecolari usando l’energia elettronica (cenni). . . . . . 41

1.15 Teoria delle perturbazioni indipendente dal tempo . . . . . . . . . . . . . . . . . . . . . . 42

2 Energie elettroniche: Hartree Fock 45

2.1 Introduzione di una base atomica nel caso closed-shell: le equazioni di Roothaan. . . . . . 49

2.2 Un-restricted Harteee-Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.3 I Basis Set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

2.3.1 Slater e Gaussian type functions (GTO) . . . . . . . . . . . . . . . . . . . . . . . 54

2.3.2 Classificazione dei set di base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2.3.3 Basis set contratti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.3.4 Basi comuni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Basi di Pople . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Basi correlation consistent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.4 Orbitali molecolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3 Energie elettroniche: metodi post Hartee-Fock 64

3.1 Energia di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.2 Metodi Variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.2.1 Determinanti eccitati e autofunzioni di S2 (Configuration State Functions, CSF) . . 66

3.2.2 CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Cenni matematici della procedura Full-CI . . . . . . . . . . . . . . . . . . . . . . 69

3.2.3 Singole e doppie CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.2.4 Come Full-CI risolve il problema della correlazione e il problema della dissocia-zione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3.2.5 MCSCF (CAS-SCF) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

CAS-SCF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

3.2.6 Il problema della size-consistency . . . . . . . . . . . . . . . . . . . . . . . . . . 75

3.3 Metodi non variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

3.3.1 Metodi perturbativi MP2 e MP4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

3.3.2 I metodi Coupled Cluster (cenni) . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.4 Simboli di termine, configurazioni elettroniche (atomi e molecole lineari) . . . . . . . . . 78

3.4.1 Accoppiare gli spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

3.4.2 Accoppiamento dei momenti angolari orbitali . . . . . . . . . . . . . . . . . . . . 79

INDICE 3

4 Descrizione Born Oppenheimer delle molecole 81

4.1 Calcolo degli stati legati delle curve Born Oppenheimer . . . . . . . . . . . . . . . . . . . 81

4.1.1 Il metodo di integrazione di Numerov per le equazioni differenziali al secondo ordine 82

4.1.2 Condizioni al contorno e divergenza della funzione d’onda . . . . . . . . . . . . . 82

4.1.3 Il metodo dello “Shooting” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

A Gli spazi di Hilbert 86

A.1 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

A.2 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

A.3 Spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

A.3.1 Basi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

B Il programma LEVEL 90

INDICE 4

Lo scopo di questo corso (4 CFU, 40 ore) è quello di fornire agli studenti un’introduzione di alcuni con-cetti di base della chimica quantistica computazionale utilizzando anche esercitazioni pratiche. Si intendepresentare agli studenti un quadro il più generale possibile di alcune applicazioni che esistono nella ricer-ca moderna sulle proprietà nanoscopiche dei sistemi molecolari in fase gassosa. Lo scopo sarà quello didiscutere in dettaglio alcune tra le più semplici metodologie di calcolo oggi impiegate per costruire deimodelli realistici descriventi il comportamento elementare dei processi chimici.

La prima parte del corso riguarda lo studio delle proprietà elettroniche delle molecole. Verrà esaminato ilmetodo di Hartree-Fock per il calcolo delle energie molecolari e la questione della scelta del set di base. Aqueste lezioni verrà affiancata un’esercitazione pratica in cui si utilizza il programma GAMESS. Verrannopoi accennati i metodi di calcolo più avanzati con particolare attenzione alla loro applicazione nei variproblemi di calcolo. Una seconda esercitazione pratica verrà svolta utilizzando i metod ”post-Hartree-Fock” per la costruzione di curve di energia potenziale molecolari.

La seconda parte del corso riguarda invece il moto dei nuclei nel loro caso più semplice (una molecolabiatomica). Verrà descritto uno dei possibili metodi di integrazione comunemente utilizzato per calcolaregli stati legati vibrazionali di una molecola biatomica. Una terza esercitazione verrà utilizzata per il calcolopratico degli stati legati di due molecole.

Il materiale contenuto in questi appunti proviene in parte da diverse sorgenti: gli appunti di meccanicaquantistica di Elio Fabri (docente all’Università di Pisa), il libro “Advanced quantum chemistry” di A.Szabo e “Meccanica quantistica moderna” di J. J. Sakurai.

Capitolo 1

Istituzioni di meccanica quantistica

1.1 Stati, operatori e osservabili

1.1.1 Stati

La struttura matematica e concettuale della meccanica quantistica è abbastanza semplice: occorre introdur-re due concetti fondamentali, quello di stato di un sistema fisico e quello di osservabile. L’insieme deglistati possibili di un sistema fisico viene descritto in meccanica quantistica da uno spazio vettoriale suicomplessi dotato di prodotto scalare. Lo spazio vettoriale può essere a dimensione finita o infinita. Inmolti casi sarà sufficiente considerare uno spazio con numero finito di dimensioni ed in questo caso esso siriduce al familiare spazio Cn ( o anche Rn). Quando invece è necessario lavorare con un’infinità numerabiledi dimensioni, si richiede una struttura topologica e lo spazio diviene uno spazio di Hilbert. Indipenden-temente dalle dimensioni, lo spazio verrà sempre indicato con H . Ciò premesso, il concetto di stato hauna precisa traduzione matematica: quella di raggio unitario dello spazio H . Il termine "raggio" designaun sottospazio (s.s.) unidimensionale di H (l’equivalente di una retta passante per l’origine in R3), ossial’insieme dei vettori che differiscono tra loro solo per un moltiplicatore scalare (un numero complesso). Iltermine "unitario" restringe l’insieme ai vettori di norma 1 (che non formano quindi più un s.s. lineare).Due vettori di uno stesso raggio unitario possono differire solo per un moltiplicatore scalare di modulo 1,ossia per un fattore di fase eiφ (φ reale). Indicheremo uno stato per mezzo di uno dei vettori appartenenti alraggio unitario corrispondente. Occorrerà però non dimenticare mai l’arbitrarietà del fattore di fase.

Qui adotteremo il più possibile, per vettori, operatori, e per altri enti che incontreremo, la notazione diDirac, che differisce da quella in uso in matematica. E’ apparentemente più pesante, ma presenta sostanzialivantaggi per l’applicazione fisica. Il generico elemento di H (un vettore anche non unitario) sarà indicatocon un ket, ossia con la scrittura:

|. . .〉

ove al posto dei ". . ." scriveremo qualsiasi simbolo o insieme di simboli che risulti conveniente per indivi-duare il vettore. Per esempio, gli stati legati di un atomo d’idrogeno potranno essere descritti da |n, l,m〉;uno stato di polarizzazione di un fotone potrà essere indicato con |+〉, etc.

E’ noto che ad ogni spazio vettoriale si può associare il suo duale (vedi appendice A a pagina 86). Peruno spazio dotato di prodotto scalare, c’è un anti-isomorfismo naturale fra lo spazio e il suo duale, chefa corrispondere a un vettore u il funzionale prodotto scalare (u, v) (qui siamo temporaneamente tornatiall’usuale notazione matematica). E’ importante tener presente che il prodotto scalare (u, v) è lineare in v,ma è antilineare in u: se u = ax+by, vale (u, v) = a∗(x, v)+b∗(y, v)). Per ricordare questo, Dirac adottaper gli elementi del duale la notazione bra:

〈u| è il vettore duale di |u〉

5

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA 6

Coerentemente, il prodotto scalare fra 〈u| e |v〉 è indicato con 〈u|v〉. In particolare è importante il prodotto〈v|v〉 che per un vettore unitario (o normalizzato ) è 〈v|v〉= |v|2 = 1.

1.1.2 Operatori

Il concetto di osservabile fisica si traduce in quello di operatore lineare autoaggiunto (a.a.) su H . Se Hè finito, invece di a.a. basta dire hermitiano. Gli operatori e le corrispondenti osservabili verranno di solitoindicati con lettere latine maiuscole: pertanto l’azione di un operatore su un vettore potrà essere scrittacome

M |m,n, l〉

Se A è un operatore, si chiama elemento di matrice e fra i vettori u e v l’espressione 〈u|A|v〉. Si dice che A†

è l’operatore aggiunto di A se:〈v|A†|u〉∗ = 〈u|A|v〉 (1.1)

La definizione di operatore a.a. o hermitiano è ovvia ed è la seguente1: A è a.a. se A† = A, ossia se〈v|A|u〉 = 〈u|A|v〉∗. Gli operatori che rappresentano osservabili fisiche sono operatori lineari ed a.a. Selo spazio vettoriale degli stati possibili è finito, l’operatore può essere rappresentato come una matricedi numeri complessi e, in particolare, un operatore hermitiano verrà rappresentato da una matrice che hanumeri complessi nel triangolo superiore, i loro complessi coniugati nel triangolo inferiore e reali sulladiagonale. Se la matrice fosse reale sarebbe invece semplicemente simmetrica.

Il prodotto di due operatori AB rappresenta l’effetto combinato di agire con B su un vettore e quindi agirecon A sul vettore risultante. L’effetto di BA su uno stato arbitrario non è sempre uguale a AB: in questo casosi dice che gli operatori A e B non commutano. La differenza AB−BA è detta commutatore e si scrive inmaniera compatta [A, B]. In pratica, la maggior parte delle informazioni che abbiamo sugli operatori vieneproprio dallo studio dei loro commutatori.

1.1.3 Autovalori, autovettori, autostati

Richiamiamo la definizione di autovettore e autovalore di un operatore A: si dice che |a〉 è autovettore di Acon autovalore a 6= 0 e a ∈ C se

A |a〉= a |a〉 (1.2)

Si dimostra che gli autovalori di un operatore a.a. sono reali e che gli autovettori appartenenti ad autovaloridiversi sono ortogonali.

Dimostrazione: Dato un operatore autoaggiunto A e due suoi autovalori a1 e a2abbiamo

A |1〉 = a1 |1〉A |2〉 = a2 |2〉 (1.3)

1In notazione matematica le definizioni date sono più semplici da ricordare e da capire: il prodotto scalare (vediappendice A a pagina 86) si scrive (u, v) e il prodotto nell’ordine inverso ne è il complesso coniugato (u, v) = (v, u)∗.Questo nella notazione di Dirac sarebbe 〈u|v〉= 〈v|u〉∗. L’aggiunto di un operatore A è detto A† e soddisfa la relazione

∀u, v (u, Av) = (A†u, v)

che si può anche scrivere come(u, Av) = (v, A†u)∗

che viene tradotta nella notazione di Dirac come

〈u|A|v〉= 〈v|A†|u〉∗


premoltiplicando la prima per 〈2| e la seconda per 〈1| otteniamo

〈2|A|1〉 = a1 〈2|1〉〈1|A|2〉 = a2 〈1|2〉 (1.4)

sottraendo la coniugata della seconda dalla prima si ottiene

〈2|A|1〉−〈1|A|2〉∗ = 0 = (a1−a∗2)〈2|1〉 (1.5)

se i due autovettori sono uguali allora a1 = a∗2 che significa che i l’autovalore è reale. Se i due autovettori sono diversiallora risulta ncessariamente che 〈2|1〉= 0 cioè che siano ortogonali.

L’insieme degli autovalori di un operatore in generale viene detto spettro. Va osservato che se |a〉 è auto-vettore di A per l’autovalore a, lo stesso è vero per qualsiasi suo multiplo scalare: quindi ad ogni autovaloreè associato l’intero sottospazio unidimensionale così generato. E’ perciò naturale parlare di autostato.

Può però accadere che gli autovettori associati a un dato autovalore formino un sottospazio di H di dimen-sione n > 1. In questo caso si dice che l’autovalore è degenere, con degenerazione n (o n volte degenere).Quindi ad autovettori distinti corrisponde uno stesso autovalore. In generale non è detto che autovettori diquesto tipo siano ortogonali (in eq. (1.5) davamo per scontato che non ci fosse degenerazione). E’ semprepossibile comunque derivare una serie di autovettori ortogonali da un insieme di autovettori degeneri.

1.1.4 Basi ortonormali

Si chiama base ortonormale di H un insieme (finito o numerabile) di vettori |k〉 unitari e tra loro ortogonali,tale che ogni vettore |v〉 di H sia esprimibile come combinazione lineare dei |k〉:

v = ∑k

ck |k〉 (1.6)

Ancora una volta, la (1.6) è semplice solo se H è finito (è una somma finita). Altrimenti si tratta di unaserie, e l’uguaglianza va intesa nel senso di convergenza in norma (vedi l’appendice A). Si ricordi che dalla(1.6) segue

〈v|v〉= ∑k|ck|2 = 1 (1.7)

se |v〉 è unitario. Se H è finito si dimostra che ogni op. hermitiano possiede una base ortonormalecostituita dai suoi autovettori. Non è detto che tale base sia unica, come è dimostrato dal caso limitedell’op. I (identità), per il quale ogni base va bene. Se e solo se gli autovalori sono tutti non degeneri, ossiase esistono tanti autovalori distinti quanta è la dimensione di H , allora la base è unica.

Concludiamo questo argomento enunciando un problema: abbiamo visto che alcune osservabili hannouna base di autovettori. Se abbiamo due diverse osservabili, ciascuna avrà la sua base di autovettori; mapossono essere la stessa? Sotto quali condizioni? La risposta sta nel seguente teorema: condizione nec. esuff. perché due oss. A, B abbiano una base comune di autovettori è che esse commutino.

Dimostrazione: Se abbiamo due operatori che agiscono su s.s. di H differenti2, questi ovviamente commutano e iloro autostati in comune sono dati dal prodotto diretto dei loro autostati.

Se invece i due operatori agiscono sullo stesso spazio hanno una base di autovettori in comune solo se commutano:supponiamo di avere due operatori A e B che commutano e di conoscere gli autovettori |a〉 del primo

A |a〉= a |a〉

dato che i due operatori commutano potremo scrivere

AB |a〉= BA |a〉= Ba |a〉= aB |a〉2In termini di coordinate si direbbe che i due operatori agiscono su coordinate differenti.


il che significa che il vettore B |a〉 è a sua volta un’autofunzione di A con autovalore a e quindi deve essere proporzionalea |a〉. Questo implica che |a〉 è sia un autovettore di A che di B. Questo è vero nell’implicita assunzione che a nonfosse degenere, nel qual caso tutto quello che si può dire è che B |a〉 è una qualche combinazione degli autovettori |k〉del s.s. inviduato dall’autovalore a:

B |a〉=s.s.(a)

∑k

cak |k〉

1.2 Postulati interpretativi

1.2.1 Misure e valore medio

Sul sistema è possibile eseguire misure del genere più diverso. Poiché una misura fornisce sempre unrisultato (un numero reale), assumeremo che si tratti sempre della misura di una qualche osservabile e chetutte le osservabili possano essere sottoposte a misura. Un primo postulato interpretativo della meccanicaquantistica asserisce:

I possibili risultati della misura di un’osservabile sono i suoi autovalori.

Un secondo postulato è il seguente:

Se il sistema si trova nello stato |a〉 , autostato dell’osservabile A con autovalore a, la misuradi A fornirà con certezza il risultato a.

In questo genere di trattazione trascuriamo del tutto l’esistenza di errori di misura, ovvero assumiamoche possano essere ridotti piccoli a piacere. La questione non è affatto banale nel caso di osservabili conautovalori continui, che almeno per ora non vogliamo prendere in esame.

Che cosa accade se il sistema è in uno stato che non è autostato di A, ed eseguiamo una misura di A?Risponde un ulteriore postulato:

Se il sistema si trova nello stato |x〉 che non è autostato di A, una misura di A può fornire comerisultato uno qualsiasi degli autovalori di A.

Il risultato della misura è intrinsecamente indeterminato, nel senso che se si ripete la misura più volte sulsistema preparato sempre nello stesso stato, si ottengono in generale risultati diversi. E’ evidente che siamodi fronte al più caratteristico postulato della meccanica quantistica: è quello che afferma l’indeterminismointrinseco della teoria. Si tratta di un indeterminismo non derivante solo da insufficiente informazione dellosperimentatore.

L’asserzione dell’ultimo postulato è precisata dal seguente (teorema del valor medio):

Sia |k〉 una base di autovettori di A, per gli autovalori ak . Sia poi

|x〉= ∑k

ck |k〉 (1.8)

lo sviluppo di |x〉 nella base |k〉. Allora la misura di A sullo stato |x〉 , ripetuta piu volte, forniràil valore ak con probabilita |ck|2.


Non è escluso che A abbia autovalori degeneri, ossia che alcuni degli ak coincidano. In tal caso laprobabilita del risultato è la somma dei corrispondenti |ck|2.

Si puo dare, come conseguenza di questi postulati, un’interessante interpretazione dell’espressione 〈x|A|x〉. Calcoliamo infatti

〈x|A|x〉= ∑k

ck 〈x|A|k〉= ∑k

ckak 〈x|k〉= ∑k|ck|2ak (1.9)

Otteniamo quindi che se si ripete la misura di A sullo stato |x〉, la media dei risultati vale 〈x|A|x〉. Per questaragione useremo sempre il nome valore medio di A sullo stato |x〉. Nota: Abbiamo scritto "sullo stato,"e non "sul vettore," perché 〈x|A|x〉 rimane invariato se si moltiplica |x〉 per un fattore di fase. E’ quindideterminato dallo stato.

1.2.2 Riduzione

Per esaurire la lista dei postulati interpretativi ne manca ancora uno, che risponde alla domanda: che cosaaccade allo stato quando si esegue una misura? Nella fisica classica un problema del genere non si pone,perché si da per scontato che un’operazione di misura non alteri apprezzabilmente lo stato del sistema; omeglio, che si possa organizzare la misura in modo da rendere tale alterazione piccola quanto si vuole. Ilcomportamento dei sistemi quantistici mostra però che questo non è possibile: un’operazione di misuraperturba necessariamente il sistema e ne altera lo stato. Ecco il postulato:

Se si esegue sullo stato |x〉 una misura dell’osservabile A, che porta al risultato ak, immedia-tamente dopo la misura il sistema si trova nell’autostato |k〉 di A.

Nota: Si deve dire "immediatamente dopo" perché in genere lo stato cambierà nel tempo. In realtà ilpostulato di riduzione, nella formulazione appena scritta, non è sufficientemente generale, in quanto nondice che cosa accade quando un autovalore è degenere. Infatti in tal caso l’autostato di cui parla il postulatonon è unico. Occorre quindi precisarlo come segue:

Se l’autovalore ak è degenere, lo stato dopo la misura è la proiezione ortogonale normalizzatadi |x〉 nel s.s. appartenente ad ak.

E’ importante un caso particolare: se |x〉 è autostato di A, non solo la misura fornisce con certezza ilcorrispondente autovalore, ma lo stato non viene influenzato dalla misura.

Esempio: Consideriamo una f.d.o. di un atomo d’idrogeno data dalla seguente espressione

ψ = a[2p0 +2p−1−2p1]+b[3p0−3p−1]

dove abbiamo indicato le funzioni degli orbitali idrogenoidi con la notazione nlm.

1. Se venisse misurato il valore del momento angolare L2, essendo tutte funzioni di tipo p con l = 1 si otterrebbesicuramente l’autovalore 2h2. La f.d.o è infatti un’autofunzione di L2 e quindi rimane inalterata dopo l’azionedell’operatore e quindi dopo la misura.

2. Se si misura Lz si potrebbero ottenere invece i valori 0h, 1h e −1h con probabilità rispettivamente date da|a|2 + |b|2, |a|2 e |a|2 + |b|2.

3. Dopo una misura di Lz, se fosse stato ottenuto il valore −1h, la f.d.o sarebbe data da (rinormalizzando)

ψ =1√

|a|2 + |b|2(a ·2p−1−b ·3p−1)

che risulta ancora una autofunzione di L2.


1.2.3 Sovrapposizione

La connessione tra gli stati fisici di un sistema e i raggi unitari di uno spazio di Hilbert differenzia pro-fondamente la meccanica quantistica dalla fisica classica. Dati due stati |u〉, |v〉 ha senso eseguire una lorocombinazione lineare, con coefficienti complessi qualsiasi:

|w〉= α |u〉+β |v〉 (1.10)

Il nuovo stato |w〉 è diverso da ciascuno dei due di partenza, e si dice che ne è sovrapposizione. Il concettodi sovrapposizione è la novità della meccanica quantistica: non ha infatti alcun corrispettivo in fisica clas-sica. Per rendersene conto, consideriamo un caso particolare: quello in cui |u〉, |v〉 sono autostati di unastessa oss. A, con autovalori diversi au e av. E’ allora facile verificare che |w〉 non è autostato di A, e cheuna misura di A potrà fornire i due valori au, av con certe probabilità. In questo senso |w〉 appare essereuna specie di "miscela" dei due autostati. Si noti però che solo i valori au, av sono possibili risultati di unamisura di A, e nessun altro: neppure un qualche valore intermedio fra i due. L’esistenza di una sovrappo-sizione si manifesta solo col fatto che il risultato non è piu certo, ma si distribuisce fra due possibili, condate probabilità. Ma può anche accadere l’opposto: che né |u〉 né |v〉 siano autostati di A, mentre |w〉 lo è.Può dunque capitare che la misura non dia risultato certo né su |u〉 né su |v〉, mentre ciò accade se si fa lamisura sullo stato |w〉. Quindi una sovrapposizione non agisce sempre nel senso di accrescere l’incertezzadel risultato di una misura, e questo di nuovo esce da qualsiasi schema classico.

1.2.4 Evoluzione temporale e costanti del moto

Per concludere questo veloce sommario sugli elementi di base della meccanica quantistica, dobbiamoparlare del modo in cui evolve nel tempo lo stato di un sistema. Finora il tempo non è intervenuto neldiscorso; ora dovremo tener presente e che in generale lo stato di un sistema cambia nel tempo, e converràmostrare esplicitamente questo fatto, introducendo la variabile t fra i simboli che caratterizzano lo stato.Così |t〉 indicherà un generico stato con la sua variazione nel tempo: potremo supporre, ad esempio, cheesso sia stato preparato al tempo t0 come |t0〉 e poi lasciato evolvere indisturbato. La forma piu sempliceper la legge di evoluzione temporale di uno stato è l’equazione di Schrödinger

ih∂

∂ t|t〉= H |t〉 (1.11)

che è un’eq. differenziale di primo ordine; quindi la soluzione sarà determinata assegnando la condizioneiniziale |t0〉. A secondo membro compare l’operatore a.a. H, l’hamiltoniana del sistema. Come si vede,la conoscenza di H è tutto ciò che occorre per determinare l’evoluzione temporale. Si noti che la (1.11) èomogenea nella funzione incognita |t〉: ciò significa che una sovrapposizione si conserva nel tempo: se

|t0〉= α |a, t0〉+β |b, t0〉 (1.12)

anche, per ogni t:|t〉= α |a, t〉+β |b, t〉 (1.13)

Una seconda proprietà si trova facendo l’ipotesi che lo stato iniziale sia un autostato |E〉 di H. Allora la(1.11) ha l’integrale

|E, t〉= e−iEth |E,0〉 (1.14)

come si verifica direttamente. La (1.14) mostra che un autostato di H rimane inalterato nel tempo: infattiil corrispondente vettore viene moltiplicato solo per un fattore di fase. Per questa ragione gli autostati diH si chiamano stati stazionari. Invece, uno stato che sia sovrapposizione di due (o più) autostati di H conautovalori diversi cambia nel tempo perché il fattore di fase nella (1.14) è diverso per i vari autovettori.

Dato che H è a.a., ed ha quindi una base di autovettori, ogni vettore può essere sviluppato come combina-zione lineare di autovettori di H:

|x,0〉= ∑k

ck |Ek〉 (1.15)


e perciò, usando la (1.14) per ciascun termine a secondo membro:

|x, t〉= ∑k

cke−iEkt

h |Ek〉 (1.16)

che mostra come si risolve in generale l’eq. di Schrödinger se si conoscono gli stati stazionari. Conseguen-za ovvia, ma importante in sé, dell’esistenza degli stati stazionari è la seguente: il valor medio di qualsiasiosservabile su uno stato stazionario non cambia e nel tempo. Va da sé che se lo stato non è stazionario,le probabilità e i valori medi per una generica osservabile cambiano nel tempo. Ci si può chiedere se nonesistano particolari osservabili per cui questo non accade; più esattamente, se vi siano osservabili tali chele probabilità (e quindi il valor medio) su qualunque stato non dipendono dal tempo. Tale osservabile sidice costante del moto. Si può dimostrare che le costanti del moto sono tutte e sole le osservabili checommutano con H.

Problema: dato un sistema in uno stato non-stazionario descritto in generale da

|x〉= ∑j

C je−iE jth | j〉

mostrare che il valore medio dell’energia non varia con il tempo, mentre quello di altre osservabili varia.

Soluzione: Il valore medio dell’energia si scrive

〈x |H|x〉= ∑i j

C∗i ei Eit

h 〈i|H| j〉C je−iE jth

dal momento che i | j〉 sono autostati di H e quindi 〈i|H| j〉= δi jE j abbiamo

〈x |H|x〉= ∑i j

C∗i ei Eit

h δi jE jC je−iE jth = ∑

i jC∗

i C jδi jE je−i(E j−Ei) th = ∑

j|C j|2E j

che non dipende dal tempo. Per altre osservabili avremmo invece

〈x |A|x〉= ∑i j

C∗i e−i

E jth 〈i|A| j〉C je−i

E jth

che non si può ridurre perché, in generale, 〈i|A| j〉 6= A jδi j e quindi è dipendente dal tempo. Le uniche osservabili per lequali il valor medio è indipendente dal tempo su stati non stazionari, cioé le cosidette ”costanti del moto” sono quelleper cui 〈x|A|x〉= A jδi j cioé quelle per le quali [A, H] = 0.

1.2.5 Osservabili compatibili

I postulati interpretativi ci dicono che cosa aspettarsi quando si esegue la misura di un’oss. In fisica classicaperò è possibile misurare insieme due o più grandezze, ed è perciò naturale chiedersi come si presenta lasituazione secondo la meccanica quantistica. Cominciamo col rispondere a una domanda connessa: datouno stato |x〉 e due oss. A, B, in quali casi la probabilità congiunta delle misure di A e di B non dipendedall’ordine? Si dimostra che condizione nec. e suff. perché la probabilità congiunta dei risultati dellemisure di due oss. sia indipendente dal l’ordine, è che le oss. commutino. Se questo accade, l’ordine incui si eseguono le misure non conta; il che vuol dire che l’operazione di misura dell’una non influenzala misura dell’altra (come accade sempre in fisica classica). Si dice allora che le oss. sono compatibili.Dunque:

due osservabili sono compatibili se e solo se commutano.


1.3 Rappresentazione matriciale

Come abbiamo visto nella sezione precedente (e nell’appendice A), negli spazi di Hilbert a dimensionefinita H cioè nei familiari spazi vettoriali Rn o Cn, esistono basi complete di vettori ortonormali |i〉n

i=1con cui si possono esprimere tutti gli altri vettori di stato

|a〉=n

∑i=1

ai |i〉 (1.17)

Possiamo quindi descrivere il vettore di stato |a〉 semplicemente facendo riferimento alle sue componenti ainella base |i〉n

i=1. Le componenti ai sono numeri complessi (in generale) e sono dati dal prodotto scalare:ai = 〈i|a〉.

Le componenti sono in numero finito e possono essere arrangiate in un vettore colonna

a =

a1a2...

aN

(1.18)

Il vettore a è la rappresentazione dello stato astratto |a〉 nella base finita dei vettori |i〉. L’aggiunto di unvettore colonna è un vettore riga del tipo

a† = (a∗1, a∗2, . . .a∗N) (1.19)

che non è altro che la rappresentazione del vettore astratto 〈a|. Il prodotto scalare nello spazio Cn diventaquindi un prodotto righe per colonne cioe’ una somma di prodotti di componenti:

〈a|b〉= a†b = (a∗1, a∗2, . . .a∗N)

a1a2...

aN

= ∑i

a∗i bi (1.20)

Come abbiamo fatto precedentemente, possiamo definire un operatore A come un oggetto che agisce su unket trasformandolo in un altro

A |a〉= |b〉 (1.21)

Un operatore è completamente definito se conosciamo il suo effetto sui vettori di base

A |i〉= ∑j| j〉〈 j|A|i〉= ∑

j| j〉Ai j (1.22)

dove Ai j sono gli elementi della matrice A che è detta rappresentazione matriciale dell’operatore A nellabase |i〉.

In quest’ultimo passaggio abbiamo fatto uso del cosidetto teorema di completezza cioè che

∑i|i〉〈i|= 1 .

Quest’ultima relazione molto importante discende direttamente dal teorema di espansione:

|a〉= ∑i

ai |i〉 (1.23)

doveai = 〈i|a〉


quindi possiamo riscrivere la relazione (1.23) come

|a〉= ∑i|i〉ai = ∑

i|i〉〈i|a〉=

(∑

i|i〉〈i|

)|a〉

da cui si vede che l’espressione in parentesi è l’operatore identita I: La scrittura |i〉〈i| non è che il prodotto tensorialedi un vettore di H per uno del duale H ∗, quindi un operatore su H : lo indicheremo con Pi. Per capirne il significato,applichiamolo a un generico |u〉:

Pi |u〉= (|i〉〈i|) |u〉= |i〉〈i|u〉Otteniamo un vettore parallelo a |i〉, ma moltiplicato per il coefficiente 〈i|u〉. Si tratta dunque della proiezione di |u〉 su|i〉. Per questa ragione Pi prende il nome di proiettore associato al vettore |i〉.

E’ anche possibile ottenere la rappresentazione matriciale del prodotto di due operatori AB.

〈i|AB| j〉= ∑k〈i|A|k〉〈k|B| j〉= ∑

kAikBk j (1.24)

che rappresenta l’espressione di un prodotto righe per colonne tra due matrici A ·B.

1.3.1 Il cambio di base di rappresentazione

Abbiamo visto che in uno spazio di Hilbert la scelta della base di rappresentazione non è unica 3. E’importante conoscere il metodo per passare da una rappresentazione |i〉 ad un’altra |α〉. Entrambe le basisono complete quindi è possibile esprimere i ket di una nell’altra

|α〉= ∑i|i〉〈i|α〉= ∑

iUiα |i〉 (1.25)

dove abbiamo definito la matrice di trasformazione U di elementi Uiα . La trasformazione nella direzioneopposta ci fornisce

|i〉= ∑α

|α〉〈α|i〉= ∑α

U∗iα |α〉= ∑

α

(U†)αi |α〉 (1.26)

perché 〈α|i〉= 〈i|α〉∗ e dove abbiamo usato gli elementi U∗iα della matrice aggiunta (cioè trasposta coniu-

gata) U†. La matrice di trasformazione ha l’importante proprietà di essere unitaria4

UU† = 1 (1.27)

infatti i suoi elementi

(UU†)i j = ∑α

〈i|α〉〈α| j〉= ∑α

(U)iα(U†)α j = 〈i| j〉= δi j (1.28)

sono non-nulli solo sulla diagonale dove valgono uno. Quindi due basi di rappresentazione diverse sonoconnesse da una matrice unitaria. In uno spazio a dimensione finita le due basi sono connesse da unarotazione dei loro vettori di base.

3Questo è banalmente vero se si pensa a due basi date dagli autovettori di operatori non commutanti, ma può succedere anchequando i due operatori commutano: quando uno degli operatori possiede autovettori degeneri. Esiste però un teorema importantedell’algebra degli spazi vettoriali che ci assicura che ogni base in Rn, o in generale negli spazi a dimensione finita, ha lo stessonumero di elementi.

4Le matrici unitarie sono definite come quelle matrici la cui inversa è uguale all’aggiunta

A−1 = A†

in fisica sono importanti perche’ possono essere usate per rappresentare le operazioni di rotazione in quanto essendo “unitarie” nonalterano la lunghezza dei vettori su cui operano, ma solo la loro direzione. E’ altresì vero che non tutte le matrici unitarie rappresentinorotazioni.


Dato un operatore O la cui rappresentazione sia O nella base |i〉 e Ω in quella |α〉, la relazione tra O e Ω sitrova utilizzando il teorema di completezza

Ωαβ = 〈α|O|β 〉= ∑i j〈α|i〉〈i|O| j〉〈 j|β 〉== ∑

i jU∗

iα Oi jU jβ = ∑i j

(U†)

αi (O)i j (U) jβ (1.29)

che in forma matriciale può essere scritto come un prodotto righe per colonne delle tre matrici

= U†OU (1.30)

quindi anche le rappresentazioni di operatori sono legate da una trasformazione unitaria U.

L’importanza dell’esistenza di tale trasformazione sta nel fatto che, dato un operatore Hermitiano la cuirappresentazione nella base |i〉 O non è diagonale, è sempre possibile trovare una base |α〉 in cuil’operatore ha rappresentazione diagonale Ωαβ = ωα δαβ , dove ωα sono gli autovalori dell’operatore O. Inaltre parole, cambiando base di rappresentazione, si vuole diagonalizzare la matrice O. Il problema delladiagonalizzazione è quindi equivalente a quello di trovare una matrice unitaria U che converte O nel modoseguente

U†

o11 o12 · · · o1no21 o22 · · · o2n

......

. . ....

on1 on2 · · · onn

U = ω =

ω1 0

ω2. . .

0 ωn

(1.31)

Esistono molti differenti algoritmi che permettono di trovare U. In genere non è necessario conoscere tuttii dettagli dell’algoritmo, ma basta saperlo usare come una specie di “scatola nera” in cui entra O ed esconogli autovalori ω e U (quindi gli autovettori). Il procedimento per trovare gli autovalori di una matrice (cioèdi diagonalizzarla) corrisponde grossomodo alla trattazione seguente. Data la matrice O vogliamo trovarei numeri ωα e tutti i diversi vettori colonna cα per cui si ha

Ocα = ωα cα α = 1, . . . , n (1.32)

che può essere riscritta come(O−ω1)c = 0 (1.33)

dove 1 è la matrice identità. L’ultima equazione ammette soluzioni non banali solo se il determinantesecolare è nullo

|O−ω1|= 0 (1.34)

Questa condizione ci permette di trovare gli N autovalori (che sono le N radici dell’equazione secolare chesi ottiene dal determinante) che sostituiti uno per uno dentro l’eq. (1.32) ci permettono di trovare i variautovettori cα a meno di un fattore moltiplicativo che si trova imponendo la condizione di normalizzazioneper uno degli autovettori.

∑i

c∗αicαi = 1 (1.35)

In questo modo abbiamo risolto il problema trovando N soluzioni cα . Se costruiamo una matrice U usandogli N autovettori cα come colonne, possiamo scrivere

O

c11 c12 · · · c1Nc21 c22 · · · c2N...

.... . .

...cN1 cN2 · · · cN

=

c11 c12 · · · c1Nc21 c22 · · · c2N...

.... . .

...cN1 cN2 · · · cNN

ω1 0ω2

. . .0 ωn

cioè

OU = Uω (1.36)

Moltiplicando entrambi i membri di (1.36) per U† si ottiene proprio la relazione voluta

U†OU = ω. (1.37)

cioé che è possibile trovare una trasformazione unitaria con cui costruire una nuova base in cui l’operatoreè diagonale.


1.4 Sistemi a due stati

I sistemi a due stati sono sistemi in cui lo spazio H ha solo due dimensioni. Ci sono numerose situazionifisiche in cui uno spazio a due sole dimensioni è significativo: o perché si trascurano parte dei gradi diliberta del sistema (questo è il caso degli stati di spin di un elettrone, o degli stati di polarizzazione di unfotone) o perché per ragioni energetiche altri stati sono esclusi dalle condizioni sperimentali.

In un sistema a due stati una base di H è formata da due soli vettori, che a seconda dei casi potremoindicare con |1〉 e |2〉, oppure con |+〉 e |−〉. Il vettore generico potrà sempre essere scritto come |v〉 =v1 |1〉+ v2 |2〉 con |v1|2 + |v2|2 = 1. Un fattore di fase è sempre arbitrario e possiamo disporne in variomodo: ad es. scegliendo v1 sempre reale e ≥ 0. Si vede che restano liberi due soli parametri, e possiamoprendere

v1 = cosθ , v2 = eiφ sinθ , θ ∈ [0,π

2]

Non solo la rappresentazione degli stati è semplice, ma anche quella delle osservabili. Si vede infattifacilmente che esistono soltanto 4 operatori hermitiani (quindi autoaggiunti) linearmente indipendenti. E’tradizionale prendere i seguenti:

1. l’identità I

2. l’oss. che ha autovalori 1 e -1 sulla base scelta: la chiameremo σz;

3. l’oss. σx definita da σx |1〉= |2〉 e σx |2〉= |1〉;

4. l’oss. σy definita da σx |1〉= i |2〉 e σx |2〉=−i |1〉;

Gli elementi di matrice delle osservabili σx, σy, σz sono risp.(0 11 0

),

(0 −ii 0

),

(1 00 −1

)(1.38)

Si può verificare in più modi che ciascuna delle (1.38) ha un autovalore 1 e un autovalore -15. Le osservabiliσx, σy, σz si chiamano matrici di Pauli.

1.5 Lo spin

Consideriamo per cominciare un elettrone isolato. E noto che esso è dotato di un momento angolareintrinseco, per il quale si usa il termine inglese spin. Questo spin è un grado di libertà interno dellaparticella, che si aggiunge ai consueti gradi di libertà che ne descrivono il moto nello spazio.

Se ci disinteressiamo del moto dell’elettrone, possiamo limitarci a studiare questo grado di libertà interno,che è intrinsecamente quantistico: non ha analogo classico e non può essere descritto, neppure approssi-mativamente, con concetti classici (è perciò sbagliato e fonte di sicuri errori pensare all’elettrone come unaminuscola "trottola").

5 ∣∣∣∣ 0−λ 11 0−λ

∣∣∣∣ = λ2−1 = 0 −→ λ =±1∣∣∣∣ 0−λ −i

i 0−λ

∣∣∣∣ = λ2− (i)(−i) = λ

2−1 = 0 −→ λ =±1∣∣∣∣ 1−λ 00 −1−λ

∣∣∣∣ = (1−λ )(−1−λ ) =−1+λ2 = 0 −→ λ =±1


Il momento angolare di spin di un elettrone è un vettore e lo indicheremo con s. Se fissiamo una direzione,che prendiamo come asse z, e misuriamo la componente sz di s, troviamo due soli valori: ± 1

2 h. Per questaragione si dice che l’elettrone ha spin 1/2. Più esattamente, il sistema dello spin dell’elettrone ha duesoli stati possibili: si applicano perciò tutte le considerazioni fatte nella sez. precedente. In particolarepossiamo usare le matrici di Pauli, ponendo

s =12

hσ (1.39)

Si noti che la (1.39) è molto di più che una semplice definizione, in quanto determina le relazioni algebrichefra la componenti del momento di spin; in particolare il commutatore

[sx,sy] = ihsz

La (1.39) mostra che due diverse componenti dello spin non sono mai compatibili e non potranno quindiessere misurate insieme.

Dato che un sistema di spin 1/2 è formalmente identico al sistema delle polarizzazioni di un fotone, ènaturale parlare di polarizzazione anche per lo spin. Possiamo e quindi parlare di fasci di elettroni (o diatomi) variamente polarizzati, oppure non polarizzati. Ci sono però alcune differenze, non nel formalismomatematico, ma nell’interpretazione fisica. In primo luogo, mentre la polarizzazione dei fotoni è neces-sariamente trasversale (polarizzazione x e y per un fotone che viaggia lungo z) questa restrizione non c’èper lo spin elettronico: qualunque stato di spin è autostato di una certa componente dello spin, il che puòessere espresso dicendo che lo spin è polarizzato nella corrispondente direzione. In secondo luogo due statiortogonali corrispondono ad autovalori opposti per es. della componente sz: sarà quindi naturale indicarlicon |+〉 e |−〉. Parlando alla buona si dice spesso "spin in su" e "spin in giù" ma questo modo di dire èscorretto: vediamo perché. L’espressione "spin su" fa pensare che il vettore di spin sia diretto ad es. nelverso positivo dell’asse z. Allora le componenti sx e sy di s dovrebbero essere nulle, mentre questo non èvero, per due ragioni:

1. Un autostato di sz non è autostato di sx né di sy, come si vede ad esempio dalle matrici di Pauli: nellabase |+〉, |−〉 l’oss. sz è diagonale, come è giusto; ma sx e sy non sono affatto diagonali, anzi glielementi diagonali sono nulli (vedi le matrici di Pauli).

2. L’ultima osservazione mostra che espressioni come 〈+|sx|+〉 ecc. sono nulle, ossia è nullo il valormedio di sx e sy tanto sullo stato |+〉 quanto su |−〉6, ma se si esegue una misura di queste osservabilinon si trovera mai zero (che non è fra gli autovalori) ma solo ± 1

2 h.

1.6 Momenti angolari

Il momento angolare totale di un sistema isolato è una costante del moto (vedi Sezione 1.9). Sia classi-camente che quantisticamente, la conservazione del momento angolare è una conseguenza dell’isotropiadello spazio. Le componenti del momento angolare J = (Jx, Jy, Jz) in meccanica quantistica obbedisconole seguenti regole di commutazione:

[Ji, J j] = εi jkihJk [J2, Ji] = 0

dove J2 = J2x + J2

y + J2z . E’ quindi possibile individuare autofunzioni simultanee di J2 e di una sola com-

ponente Ji alla volta. Come nel caso dello spin infatti componenti diverse del momento angolare sonoincompatibili.

Si può dimostrare che gli autovalori di J2 sono dati da h2 j( j + 1) mentre quelli di una sua componente Jzsono nella forma mh. Valgono inoltre le seguenti condizioni:

6Ad esempio

〈+|sx|+〉=(

1 0)( 0 1

1 0

)(10

)=(

1 0)( 0

1

)= 0


1. i soli possibili valori del numero quantico j sono gli interi e i semi-interi non negativi 0, 12 , 1, 3

2 , . . .

2. dato un j fissato i possibili valori per m sono i (2 j +1) valori (− j,− j +1, . . . , j−1, j).

Per poter utilizzare le regole di commutazione nel trovare gli autovalori e, più in generale, per usare imomenti angolari è necessario indrodurre i due “operatori scala”:

J± = Jx± iJy

che hanno le seguenti regole di commutazione

[J+, J−] = 2hJz , [Jz, J±] =±hJ± e [J2,J±] = 0

Si può dimostrare che gli stati | j, m〉 non sono autostati di J±, ma che valgono le seguenti relazioni

J+ | j, m〉 =√

( j−m)( j +m+1) | j, m+1〉J− | j, m〉 =

√( j +m)( j−m+1) | j, m−1〉

I due operatori J2 e Jz in generale non formano un set completo di osservabili commutanti; sarà infattispesso necessario aggiungere a questi due operatori l’hamiltoniano del sistema H con cui commutano. Peresempio nella trattazione dell’atomo di idrogeno il momento angolare totale del sistema può essere descrittotramite i due operatori momento angolare orbitale L2e Lz (trascurando lo spin). Questi due operatori nondeterminano completamente lo stato dell’elettrone perché i vari autostati |l, m〉 descrivono solo il motoangolare. Gli autostati di un sistema saranno quindi identificati da l, m e da un indice addizionale cherisulta determinante per stabilire, per esempio, l’energia degli stati. Nel caso dell’atomo di idrogeno glistati possibili sono indicati dalla terna |n, l,m〉.

In meccanica quantistica esiste l’analogo del momento angolare orbitale L(Lx, Ly, Lz) e il momento di spindi cui abbiamo già trattato. Si può quindi definire il momento angolare totale del sistema J(Jx, Jy, Jz) =L+S che è quello che effettivamente si conserva. Inoltre in sistemi a molte particelle i momenti angolaridelle singole particelle devono combinarsi tra loro a dare delle risultanti totali. Per esempio nel caso di unatomo il momento angolare orbitale di tutti gli elettroni è dato dalla somma vettoriale di tutti i momentirelativi ad ogni elettrone L = ∑i li. Lo stesso vale per il momento di spin S = ∑i si.

Vediamo brevemente come si fa a comporre due momenti angolari. Dato un sistema con due momentiangolari L e S con autovalori e autostati identificati da |l, lz〉 e |s, sz〉, esistono due possibilità per trattare ladinamica dei momenti angolari:

1. utilizzare autoket simultanei di L2, S2, Lz e Sz denotati da |ls; lzsz〉. I 4 operatori commutano e leequazioni agli autovalori sono

L2 |ls; lzsz〉 = l(l +1)h2 |ls; lzsz〉S2 |ls; lzsz〉 = s(s+1)h2 |ls; lzsz〉Lz |ls; lzsz〉 = lzh |ls; lzsz〉Sz |ls; lzsz〉 = szh |ls; lzsz〉

2. l’altra possibilità è quella di usare autoket simultanei di J2, L2, S2 e Jz dove J2 è la somma vettorialedei momenti angolari. Anche questi operatori commutano, infatti

[J2, L2] = 0 e [J2, S2] = 0


Le equazioni agli autovalori per gli stati |ls; jm〉 sono

L2 |ls; jm〉 = l(l +1)h2 |ls; jm〉S2 |ls; jm〉 = s(s+1)h2 |ls; jm〉J2 |ls; jm〉 = j( j +1)h2 |ls; jm〉Jz |ls; jm〉 = mh |ls; jm〉

E’ importante notare che se [J2, Jz] = 0 è pur vero che [J2, Lz] 6= 0 e [J2, Sz] 6= 0. Non è possibile aggiungereJ2 all’insieme degli operatori della possibilità 1, mentre non si possono aggiungere Lz e Sz alla possibilità2. Abbiamo due possibili insiemi di ket di base corrispondenti ai due insiemi massimali di osservabilicompatibili.

E’ possibile trasformare una base nell’altra utilizzando una trasformazione unitaria. Per esempio possiamoscrivere

|ls; jm〉= ∑lz

∑sz

|ls; lzsz〉〈ls; lzsz|ls; jm〉

gli elementi della matrice di trasformazione 〈ls; lzsz|ls; jm〉 sono i coefficienti di Clebsh-Gordan. Questicoefficienti non sono nulli solo se

m = lz + sz e |l− s| ≤ j ≤ l + s

che sono condizioni ovvie se si considera un modello vettoriale di addizione dei momenti angolari. Alcunevolte al posto dei coefficienti di C-G si usano quantità ad essi proporzionali detti simboli 3− j.

1.7 Sistemi a due particelle

I sistemi di due particelle hanno un posto importante nella discussione sui fondamenti della meccanicaquantistica, almeno a partire dal famoso "paradosso di Einstein-Podolski-Rosen" di cui accenneremo inseguito. Dal punto di vista generale si tratta di definire stati e osservabili di un sistema fisico composto didue particelle, per ciascuna delle quali, prese separatamente, stati e osservabili siano già ben identificati.Per semplificare il discorso ci limiteremo agli stati di spin (o di polarizzazione). Cominciamo perciò ariferirci, per concretezza, a un sistema formato da due elettroni. Per ciascuno dei due lo spazio deglistati è bidimensionale: li indicheremo con H1 e H2. Come si costruisce lo spazio degli stati del sistemacomplessivo? Prendiamo in ciascuno dei due spazi una base; per esempio quella degli autovettori di sz. Liindicheremo rispettivamente con |1+〉, |1−〉 e con, |2+〉 |2−〉. E’ allora chiaro che l’insieme delle coppieordinate

|1+〉 |2+〉 , |1+〉 |2−〉 , |1−〉|2+〉 , |1−〉|2−〉 (1.40)

forma una base per lo spazio H degli stati del sistema complessivo. Indicheremo questo scrivendo H =H1⊗H2. In parole, H è il prodotto tensoriale di H1 e H2.

Il prodotto tensoriale ha dimensione 4: però non si tratta di 2+2, ma di 2×2, come si vede ripetendo il ra-gionamento per spazi con un numero diverso di dimensioni. Conviene semplificare la notazione, indicandoi vettori scritti in (1.40) come segue:

|++〉 , |+−〉 , |−+〉 , |−−〉 (1.41)

sottintendendo che il primo simbolo si riferisce sempre all’elettrone 1, l’altro all’elettrone 2. I 4 vettoridella (1.41) (appartenenti per definizione a H ) hanno un’interpretazione fisica immediata: sono autovettorisimultanei delle due oss. s1z e s2z. Si noti che in partenza queste due oss. sono definite (come operatori)risp. in H1 e in H2 , ma si estendono in modo ovvio a H , proprio attraverso la loro azione sui vettori(1.41). L’operatore s1z, per esempio, è esprimibile nella base dei 4 stati (1.41) come prodotto tensoriale


s1z(1)⊗ I(2) e la matrice corrispondente nella base (1.41) può essere generata come (usiamo il fatto chesz = 1

2 hσz)

((s1z)11 · I (s1z)12 · I(s1z)21 · I (s1z)22 · I

)=

h2

1 ·(

1 00 1

)0 ·(

1 00 1

)0 ·(

1 00 1

)−1 ·

(1 00 1

)=

h2

1 0 0 00 1 0 00 0 −1 00 0 0 −1

Le osservabili del sistema composto non sono soltanto quelle dei due sistemi componenti, come s1z, s2z. Peresempio è un’osservabile in H la somma s1z +s2z e le altre analoghe; ma anche il prodotto s1z ·s2z e simili.In particolare, è importante considerare lo spin totale S = s1 + s2 . Ci servirà conoscere il comportamentodi S sui 4 vettori della base (1.41); cominciamo con Sz = s1z + s2z. Dalla definizione di Sz è facile ricavareche i (1.41) sono tutti autovettori di Sz risp. con gli autovalori 1, 0, 0, -1 (qui e in seguito esprimeremo glispin in unità di h). Per esempio prendiamo Sz |++〉 dove |++〉= (1, 0, 0, 0):

Sz |++〉= h

1 0 0 00 0 0 00 0 0 00 0 0 −1

1000

= h

1000

Come si vede, gli autovalori 1 e -1 non sono degeneri, mentre l’autovalore 0 è due volte degenere. In realtàtutto il sottospazio

|w〉= α |+−〉+β |−+〉 (1.42)

appartiene a questo autovalore. Per capire che cosa ciò significhi, proviamo ad applicare Sx = s1x + s2x a|w〉: otteniamo

Sx |w〉=12(α +β )(|++〉+ |−−〉) (1.43)

Ci si arriva esprimendo Sx = s1x(1)⊗ I(2)+ I(1)⊗ s2x(2), ricordando che in generale sx = 12 hσx e quindi

ottenendo((s1x)11 · I (s1x)12 · I(s1x)21 · I (s1x)22 · I

)+(

I11 · s1x I12 · s1xI21 · s1x I22 · s1x

)=

=h2

0 ·(

1 00 1

)1 ·(

1 00 1

)1 ·(

1 00 1

)0 ·(

1 00 1

)+

h2

1 ·(

0 11 0

)0 ·(

0 11 0

)0 ·(

0 11 0

)1 ·(

0 11 0

)

che risulta nella matrice

Sx = h

0 1 1 01 0 0 11 0 0 10 1 1 0

Il vettore |w〉 della (1.42) è dato nella base (1.41) dalla quadrupla (0, α, β , 0)e quindi l’azione di Sx su |w〉è data da

h

0 1 1 01 0 0 11 0 0 10 1 1 0

0α

β

0

= h

α +β

00

α +β

Che è appunto il risultato riportato espresso in (1.43).

Adesso, data l’arbitrarietà di |w〉, se in particolare scegliamo che α +β = 0, troviamo

Sx(|+−〉−|−+〉) = 0


e allo stesso modo ancheSy(|+−〉−|−+〉) = 0

Dunque il vettore

|0〉=1√2(|+−〉−|−+〉) (1.44)

è autovettore simultaneo di Sx, Sy, Sz, tutti con autovalore 0 (il fattore 1/√

2 serve per normalizzare). E’quindi ragionevole dire che lo stato |0〉 rappresenta uno stato di spin totale 0 del sistema di due elettroni.Procedendo in maniera analoga si dimostra che con i tre vettori

|1, 1〉= |++〉 |1, 0〉=1√2(|+−〉+ |−+〉) |1,−1〉= |−−〉 (1.45)

che sono per costruzione autovettori di Sz, con autovalori 1, 0, -1, si riesce a costruire, per sovrapposizione,autovettori di Sx e di Sy con gli stessi autovalori. Perciò diciamo che essi rappresentano tre stati di spintotale 1. Poiché lo stato di spin 0 è unico, lo si chiama spesso stato di singoletto, mentre quelli di spin1 si chiamano stati di tripletto. Un modo alternativo di procedere è quello di esprimere l’operatore S2 =s2

1 + s22 +2s1 · s2 nella base (1.41) e di trovarne direttamente gli autovalori e autovettori.

Stati intrecciati o “entangled”

Degli stati di due particelle finora introdotti, sono particolarmente interessanti

|0〉=1√2(|+−〉−|−+〉) e |1, 0〉=

1√2(|+−〉+ |−+〉)

Entrambi sono autostati di Sz per l’autovalore 0, e hanno anche in comune di essere costruiti con combinazioni linearidei due stati |+−〉 e |−+〉. Ma la cosa interessante è questa: mentre |+−〉 e |−+〉 sono autostati e di s1z (e anchedi s2z), |0〉e |1, 0〉 non lo sono: se si esegue una misura di s1z sul sistema preparato nello stato di singoletto, si potràtrovare tanto il risultato +1/2 quanto -1/2 (con la stessa probabilità). Per dimostrarlo, basta vedere che l’azione di s1ztrasforma |0〉 in |1, 0〉 e viceversa. Per esempio l’azione di s1z = s1z(1)⊗ I(2) sul vettore |0〉= (0, 1,−1, 0) è data da

h2

1 0 0 00 1 0 00 0 −1 00 0 0 −1

01−10

=h2

0110

= |1, 0〉

Lo stesso è vero per s2z, e uguale discorso si può fare per il tripletto. Tra l’altro, questo mostra che la misura di s1z o dis2z non basta a distinguere singoletto da tripletto.

Applicando il postulato della riduzione del pacchetto si vede che se si parte con |0〉 e si misura s1z, quando il risultatoè per es. +1/2 si cade nello stato |+−〉; perciò una successiva misura di s2z da con certezza il risultato -1/2. Viceversa:se si misura prima s2z tutto va in maniera simmetrica, e lo stato dopo la misura è autostato anche di s1z. Quindi se simisura s1z non c’è bisogno di misurare s2z, perché il risultato è prevedibile. Si vede dunque che le operazioni di misuradi s1z e s2z sono intrecciate, nel senso che il risultato dell’una determina il risultato dell’altra, sebbene in partenzanessuno dei due sia determinato. In un certo senso la cosa è ovvia: lo stato di singoletto è autostato di Sz, quindi ilvalore della somma di s1z e di s2z è perfettamente noto. Nessuna meraviglia che se si conosce il valore e di una delledue oss. ne segua il valore dell’altra. Tuttavia questa situazione coesiste con l’iniziale indeterminazione di ciascunadelle due oss. Per questo motivo stati come |0〉 o |1, 0〉 vengono chiamati intrecciati (inglese entangled).

Consideriamo un sistema di due particelle a spin 12 in uno stato globale di singoletto che si muovono in direzioni

opposte come in Figura 1.1. L’osservatore in A misura s1z della particella 1 mentre l’osservatore in B misura s2z. Se Atrova s1z positivo, allora può predire con certezza, prima che B faccia una qualche misura, il risultato della misura diB: s2z negativo. Se A non fa alcuna misura, B ha una probabilità del 50% di trovare s2z positivo o negativo.

La situazione però può complicarsi considerando le altre componenti dello spin. Se consideriamo la direzione x comeasse di quantizzazione avremmo che il singoletto sarà descritto da una funzione analoga alla (1.44):

|0〉= |0〉=1√2(|x+,x−〉−|x−,x+〉) (1.46)


Figura 1.1: Misure di spin in uno stato di singoletto

Supponiamo che l’osservatore A possa adesso scegliere quale componente dello spin misurare, mentre B possa misura-re solo s2x della particella 2. Se A determina s1z > 0, B, chiaramente avrà il 50% di probabilià di misurare s2x positivoo negativo. Anche se s2z è determinato, non lo è s2x. Se, invece, A misura s1x, allora la misura di B sarà determinata.Se A decide di non fare misure, B avrà il 50% di probabilià di misurare s2x positivo o negativo. Queste considerazionimostrano che i risultati delle misure di B dipendono da cosa A ha deciso di fare. Questo succede anche se A e B sono adistanze macroscopiche e senza possibilità di comunicare. Tutto va come se la particella 2 “sappia” quale componentedi spin della particella 1 è stata misurata. Al di là dei problemi epistemiologici che questo tipo di fenomeni hannoportato, mi preme di assicurare una cosa: nonostante queste peculiarità non si possono utilizzare queste misure pertrasmettere informazioni utili tra due punti separati dello spazio a velocità superluminali. Supponiamo che A e B simettano d’accordo di misurare la componente sz. Pur senza chiedere nulla ad A, B sa cosa A ha misurato, cionono-stante B osserva solamente una sequenza di valori positivi o negativi casuali e nessuna informazione utile. Anche se Acambiasse il suo apparato in modo da misurare sx, B otterrebbe risultati completamente scorrelati da quello che fa A.

1.8 Funzione d’onda

La definizione ”formale” di funzione d’onda è la proiezione nello spazio delle coordinate dello stato a cuiessa si riferisce. Cioè la f.d.o è data dal prodotto scalare dello stato per un autobra dell’operatore dellaposizione x. L’operatore della posizione è un operatore ad autovalori continui e quindi prima di procederealla definizione della funzione d’onda dobbiamo trattare brevemente gli autovalori a spettro continuo. Ab-biamo fino ad ora considerato operatori con uno spettro discreto di autovalori e quindi un numero discreto(finito per lo più) di autovettori. Ora generalizzeremo le relazioni trovate al caso di operatori con uno spet-tro continuo. Questa generalizzazione dal punto di vista matematico non è semplice, né priva di problemi.Non c’è spazio qui per una trattazione dettagliata e ci limiteremo ad generalizzare senza andare troppo peril sottile le relazioni già esaminate: sostituiremo il simbolo δi j con la funzione δ di Dirac e le somme congli integrali sulla variabile continua (che va a rappresentare l’autovalore)

〈i| j〉= δi j → 〈x|x′〉= δ (x− x′)

∑i|i〉〈i|= 1 →

∫|x〉〈x|dx = 1

∑i| 〈i|α〉 |2 = 1 →

∫dx| 〈x|α〉 |2 = 1

〈i|A| j〉= aiδi j → 〈x|A|x′〉= δ (x− x′)a

Esempi di operatore a spettro continuo sono l’operatore della posizione e dell’impulso. Per la posizioneinfatti abbiamo

x |x〉= x |x〉

se gli autovettori |x〉 formano una base completa possiamo esprimere ogni ket come

|α〉=∫

dx |x〉〈x|α〉


il coefficiente dello sviluppo 〈x|α〉 viene come al solito interpretato in modo tale che

| 〈x|α〉 |2dx

sia la probabilità di trovare la particella in un intorno dx di x. Nel formalismo di Dirac 〈x|α〉 è quelloche nella meccanica ondulatoria di Schrödinger si chiama Funzione d’onda ed è indicata con ψα(x). Seprendiamo il prodotto scalare 〈α|β 〉 infatti abbiamo

〈α|β 〉=∫

dx〈β |x〉〈x|α〉=∫

dxψ∗β(x)ψα(x)

Possiamo reinterpretare anche lo sviluppo

∑i|i〉〈i|α〉= |α〉

dove |i〉 sono gli autoket dell’operatore A. Moltiplichiamo entrambi i membri per 〈x| risulta

〈x|α〉= ∑i〈x|i〉〈i|α〉

che sarebbe l’usuale espansione della f.d.o

ψα(x) = ∑i

ciα ui(x)

dove le uα(x) sono le autofunzioni dell’operatore A. Come si vede da questi esempi è facile passaredalla notazione di Dirac degli autostati a quella matriciale degli autovettori e a quella di Schrödinger delleautofunzioni.

Problema: determinare l’espressione in termini della funzione d’onda dell’elemento di matrice 〈α|A|β 〉 nel caso cheA sia una funzione dell’operatore posizione.

Soluzione: L’elemento di matrice può essere riscritto utilizzando le identità dei ket

〈α|A|β 〉=∫

dxdx′ 〈α|x〉〈x|A|x′〉〈x′|β 〉=∫

dxdx′ψ∗α (x)〈x|A|x′〉ψβ (x′)

dove 〈x|A|x′〉 è la rappresentazione nelle coordinate dell’operatore A. Se A = f (x) abbiamo che [A, x] = 0e gli autovaloridi A sono uguali ad una funzione degli autovalori di x: a = f (x). Cioè in generale

〈x| f (x)|x′〉= f (x)δ (x− x′)

e quindi

〈α| f (x)|β 〉=∫

dxψ∗α (x) f (x)ψβ (x)

1.9 Simmetria in meccanica quantistica

Data una famiglia di operatori U(λ ), lineari, unitari (U†U = 1) e differenziabili nel parametro λ , per i qualivalga la condizione U(0) = I, allora l’operatore

X = ih∂U∂λ

∣∣∣∣λ=0

è un operatore hermitiano. Se l’operatore U(λ ) descrive un’invarianza di una osservabile Q, allora X èuna costante del moto. L’operatore U(λ ) viene scelto in modo tale da soddisfare la seguente relazioni dicomposizione

U(λ + µ) |x〉= U(λ )U(µ) |x〉


e quindi se µ diventa infinitesimo

U(λ +dλ ) |x〉= U(λ )U(dλ ) |x〉

Per ipotesi la famiglia U(λ ) è differenziabile e quindi possiamo scrivere (usiamo il fatto che U(dλ ) =U(0+dλ ) = U(0)+U ′(0)dλ )

U(λ )(

I+∂U(λ )

∂λ

∣∣∣∣λ=0

dλ

)|x〉= U(λ )

(I− i

hXdλ

)|x〉

da cui si ha la seguente relazione operatoriale

U(λ +dλ )−U(λ ) =− ih

XdλU(λ )

che a sua volta diventa∂U(λ )

∂λ=− i

hXU(λ )

che è un’equazione differenziale che ammette la soluzione formale:

U(λ ) = e−ih Xλ

dove X prende il nome di operatore generatore della famiglia U(λ ).

Per esempio consideriamo la famiglia di operatori delle traslazioni U(Ta) che traslano un ket di stato delladistanza a:

U(Ta) |x〉= |x+a〉

per ipotesi U(Ta) è differenziabile rispetto ad a e quindi per spostamenti infinitesimi da otteniamo l’opera-tore di uno spostamento infinitesimo

U(Tda) = U(T0)+∂U(Ta)

∂a

∣∣∣∣a=0

da = I+Dda (1.47)

Adesso calcoliamo l’effetto di U(Ta) su una funzione d’onda ψα(x) = 〈x|α〉. La funzione d’onda relativaallo stato traslato U(Ta) |α〉 è data da

ψ′α(x) = 〈x|U(Ta)α〉= 〈U†(Ta)x|α〉

essendo ovviamente U†(Ta) |x〉= |x−a〉, avremo

ψ′α(x) = 〈x−a|α〉= ψα(x−a)

e quindi l’effetto di operare con l’operatore delle traslazioni su una funzione d’onda è quello di produrneuna copia il cui valore in x+a è uguale a quello di ψα(x), o in termini matematici U(Ta)ψα(x) = ψα(x−a).Per uno spostamento infinitesimo, usando la (1.47) avremo che

U(Tdx)ψα(x) = ψα(x−dx) = ψα(x)+Dψα(x)dx (1.48)

inoltre la funzione d’onda traslata di dx sarà anche data da

ψα(x−dx) = ψα(x)− ∂ψα(x)∂x

dx (1.49)

e quindi confrontando la (1.48) e la (1.49) otteniamo

D =−∂ψα(x)∂x


Si può quindi vedere che l’operatore impulso dato da

p =−ihD =−ih∂

∂x

è il generatore della famiglia degli operatori di traslazione (x → x+a)

U(Ta) = e−ih p·a

quindi la conservazione dell’impulso lineare è una conseguenza della simmetria traslazionale o omogeneitàdello spazio.

Allo stesso modo si può far vedere che l’operatore hamiltoniano di un sistema è il generatore dell’ operatoreevoluzione temporale

U(t) = e−ih Ht

Infine il momento angolare totale di un sistema è il generatore degli operatori rotazione attorno all’asse ndi un angolo φ

R(n,φ) = e−ih J·nφ

il che ci dice che la conservazione del momento angolare è la conseguenza dell’isotropia dello spazio.

Abbiamo visto che tre proprietà del nostro sistema fisico (invarianza per traslazione, rotazione o sposta-mento temporale) si riflettono nel fatto che impulso lineare totale, momento angolare totale e energia siano3 costanti del moto in ogni sistema isolato. Matematicamente la struttura della meccanica quantistica ri-flette questa situazione associando alle tre operazioni traslazione, rotazione ed evoluzione gli operatorihermitiani p, J e H.

Esiste però in meccanica quantistica un’altra importante simmetria di cui tenere conto che è una simmetriadiscreta (contrariamente a quanto visto prima); essa è la parità o simmetria di inversione spaziale. L’ope-ratore π che inverte tutte le coordinate di un sistema è unitario π†π = 1 e opera sui ket in questo modoπ |x〉 = |−x〉. Essendo unitario si può provare che π anticommuta con x l’operatore posizione. Questodovrebbe essere ovvio nel momento in cui pensiamo che il valore di aspettazione di x (il valor medio dellaposizione della particella) dovrà cambiare di segno quando lo stato viene invertito spazialmente

〈α|π†xπ|α〉=−〈α|x|α〉

questo si verifica solo se π†xπ =−xe cioè quando xπ =−π x. Altre proprietà interessanti dell’operatore π

sono che è hermitiano con autovalori ±1 e che π2 = I. Che succede quando applichiamo π ad una funzioned’onda?

πψα(x) = 〈x|π|α〉= 〈−x|α〉= ψα(−x).

il che è piuttosto banale. Una cosa più interessante succede alle funzioni d’onda che sono autofunzioni diπ cioè che provengono da un autostato |α〉 autostato di π:

〈x|π|α〉=±〈x|α〉

cioèψα(−x) =±ψα(x) (1.50)

esistono quindi funzioni d’onda pari e dispari rispetto alla simmetria di inversione di tutte le coordinate.E’ ovvio che non tutte le funzioni d’onda soddifano la relazione (1.50). Per esempio un’autofunzionedell’operatore impulso (un’onda piana) non è autofunzione di π (anche perché π e p anticommutano),mentre lo sono le autofunzioni del momento angolare (si può dimostrare che J2e Jz commutano con π eche le loro autofunzioni sono autofunzioni di π con autovalore (−1) j). Cosa succede alle autofunzionidell’hamiltoniano? Supponiamo di avere un hamiltoniano tale che [H, π] = 0 e che |n〉 sia un autoket di Hnon degenere e con autovalore En. Si può vedere che |n〉 è anche un autoket della parità. Quindi quandotroviamo un autostato dell’hamiltoniana non degenere abbiamo anche un autostato della parità. Il problemanei sistemi fisici reali è che la degenerazione è la regola più che l’eccezione. Per esempio una particellalibera ha come autostati dell’energia gli autostati dell’impulso, ma i due autostati |p〉 e |−p〉 sono degeneriin energia e quindi gli autostati dell’impuslo non sono autostati della parità.


1.10 L’equazione di Schrödinger

In meccanica quantistica la struttura dell’equazione di Schrödinger è postulata, anche se esistono giustifica-zioni più o meno complesse alla sua forma. Uno dei postulati della meccanica quantistica (anche se primane abbiamo dato una giustificazione in termini di simmetria) è quello di assumere per l’operatore associatoal momento lineare la forma −ih∇. L’equazione di Schrödinger per una particella soggetta all’azione di unpotenziale è

ih∂Ψ(x, t)

∂ t=(− h2

2m∇

2 +V (x))

Ψ(x, t)

Come abbiamo già visto, se il potenziale non dipende esplicitamente da t si può risolvere l’eq. di Schrödin-ger indipendente dal tempo in modo da ottenere quelli che si chiamano stati stazionari (la cui variazione neltempo si riduce ad un fattore oscillante exp(−iEt/h)). Uno stato stazionario è quindi dato dall’equazioneagli autovalori (

− h2

2m∇

2 +V (x))

ψ(x) = Eψ(x) (1.51)

Questa equazione può essere risolta in diversi modi: una soluzione analitica è possibile solo in pochissimicasi tra i quali il più importante è certamente l’atomo di idrogeno che risulta il “modello base” con cuicostruiamo anche le molecole. Molto più comune è risolvere (1.51) numericamente. Questi metodi nu-merici diventano sempre più complicati all’aumentare del numero di gradi di libertà interni del sistema edinoltre per sistemi molto complessi è di solito possibile trovare solo lo stato fondamentale e solo con sforzicomputationali notevoli. In questo corso noi ci occuperemo di un metodo numerico per risolvere (1.51) nelcaso mono-dimensionale cioe’ in cui il vettore x si riduce ad una sola coordinata. Benché possano sembraresemplici, in realtà i problemi monodimensionali con potenziali arbitrari sono molto importanti sia come ba-se per capire le applicazioni di metodi analoghi a problemi multidimensionali, sia perché, non di rado, sonogià descrizioni accurate di alcuni sistemi fisici reali: per esempio la dinamica dei nuclei di una molecolabiatomica se trattata in approssimazione di Born-Oppenheimer è un problema monodimensionale.

L’equazione di Schrödinger monodimensionale per una funzione d’onda u(x) è

d2u(x)dx2 +

2mh2 [E−V (x)]u(x) = 0

dove V (x) è un potenziale qualunque.

Figura 1.2:

La quantità [E−V (x)] divide l’asse delle x in diversi segmenti separati dai punti in cui vale zero (che ven-gono detti Turning Point). Supponiamo che quella quantità si annulli due volte in un intorno di un minimo


del potenziale: otterremo tre regioni come indicato in Figura 1.2. La prima e la terza regione cioè quelleper valori x < T P−1 e x > T P−2 sono regioni in cui [E−V (x)] < 0 cioè in cui il potenziale è maggioredell’energia totale ovvero l’energia cinetica è negativa. Queste sono regioni a cui una particella classica nonpuò accedere. In meccanica quantistica invece la funzione d’onda penetra leggermente all’interno di questeregioni a seconda di quanto è rapido l’incremento dell’energia potenziale7. In generale la funzione d’ondaha un andamento esponenziale decrescente al loro interno. Inoltre all’interno delle regioni classicamenteproibite, la funzione d’onda ha sempre concavità rivolta verso l’alto e non può avere nodi.

1.10.1 Autofunzioni ed energie

L’insieme degli autovalori di un operatore è detto “spettro”. La quasi totalità degli operatori Hamiltonia-ni che si incontrano in meccanica quantistica ha una parte dello spettro composta da autovalori discreti adenergia negativa ed una parte da autovalori continui di energia positiva. Per esempio se prendiamo l’Hamil-toniano dell’atomo di idrogeno (che già conoscete) sappiamo che esso ha un numero infinito di autovaloridiscreti ad energia negativa (negativa rispetto alla frammentazione protone+elettrone) le cui energie corri-spondenti sono quantizzate e date dalla formula En = −1/2n2 (in unità atomiche e nel caso di un sistemadi riferimento centrato nel protone). Queste ultime corrispondono ai livelli energetici degli stati legati del-l’atomo d’idrogeno e sono quantizzati cioè anche se in numero infinito sono autovalori discreti. Lo stessoHamiltoniano però ammette un numero infinito di autovalori ad energia positiva, energie che corrispondonoai possibili stati non legati di un elettrone e di un protone. Questi ultimi non sono discreti e rappresentanoun continuo di valori.

Come vedremo nell’approssimazione di Born-Oppenheimer è possibile ridurre il moto vibrazionale di unamolecola biatomica ad un problema monodimensionale. Una curva di energia potenziale e la strutturagenerale dello spettro per una molecola biatomica ha la forma riportata in Figura 1.3. L’equazione di

Figura 1.3: Potenziale intermolecolare tipico e autovalori dell’Hamiltoniano

Schrödinger ha due tipi di soluzione a seconda del segno dell’autovalore corrispondente:

• autofunzioni corrispondenti ad autovalori negativi (negativi rispetto all’energia della dissociazioneA+B dove abbiamo posto lo zero dell’energia) che rappresentano gli stati legati del sistema moleco-lare quindi le vibrazioni e le rotazioni della molecola legata. Il numero di queste soluzioni è di solito

7Se l’energia potenziale diventa infinita nei turning point, come nel caso della particella nella scatola, allora la funzione nonpenetra nelle regioni classicamente proibite, ma si annullerà identicamente nei due turning point.


finito (solo nel caso di potenziali di tipo Coulombiano come nell’atomo di idrogeno si hanno infinitistati legati) e gli autovalori sono discreti.

• autofunzioni corrispondenti ad autovalori ad energia positiva che rappresentano il moto dei due atominon legati cioè i processi di urto tra i due atomi (scattering states). Il numero di queste autofunzioniè infinito e non numerabile nel senso che gli autovalori rappresentano un insieme continuo di valori.

In Figura 1.4 nel pannello di sinistra sono riportate alcune funzioni d’onda tipiche per stati legati legati diuna molecola biatomica sovrapposti al potenziale. All’aumentare dell’energia (identificata approssimati-vamente dalla posizione della funzione sul potenziale) aumenta il numero di nodi perché le autofunzioni diun operatore Hermitiano sono ortogonali.

Figura 1.4: Stati legati e di scattering di una molecola biatomica

Nella stessa figura, ma nel pannello di destra, sono invece disegnate tre autofunzioni del continuo o trestati di “scattering”. Questi stati rappresentano i processi di urto tra gli atomi costituenti la molecola.All’aumentare dell’energia anch’essi mostrano un più elevato numero di oscillazioni. A lungo raggio peròquesti stati non sono nulli, ma diventano delle semplici onde di particella libera (combinazioni di funzioniseno e coseno). Quello che succede è che la seconda condizione al contorno per r → ∞ non è la stessadegli stati legati e quindi gli stati non sono discreti. Un altra peculiarità è che gli stati del continuo nonsono evidentemente normalizzabili (l’integrale su tutto l’asse x di sinx o cosx è indefinito). Gli autostatidel continuo (cioè ad energia positiva) non appartengono a L2 cioè allo spazio delle funzioni che sono alquadrato integrabili. Trattare gli stati del continuo è in generale più complesso rispetto al caso degli statilegati. L’analisi della struttura e delle proprietà degli stati del continuo va sotto il nome di “scatteringtheory” e ricopre un ruolo di fondamentale importanza in chimica (anche se non viene mai affrontata nelpiano di studi): basti pensare che una qualunque reazione chimica in fase gassosa benché avvenga tra dueo più stati legati (i due o più reagenti) ha a che fare con il loro moto relativo che produce i prodotti che aloro volta si allontanano gli uni dagli altri. Nel caso più semplice avremmo

AB+B −→ B2 +A

dove siamo ovviamente interessati alla funzione d’onda del sistema ad energia positiva (cioè allo stato discattering tra AB e B), energia che è semplicemente l’energia cinetica relativa tra AB e B.

1.11 Principio e metodo variazionale

L’equazione di Schrödinger time-independent è un’equazione agli autovalori

H |Φ〉= E |Φ〉 . (1.52)


Il metodo variazionale, basandosi sul principio variazionale, permette di trovare una soluzione approssi-mata a questa equazione. Questo metodo è estremamente importante perché, a parte pochi e semplici casi,l’eq. di Schrödinger non può essere risolta esattamente. Dalla teoria degli operatori nello spazio di Hilbertsappiamo che, essendo H un operatore Hermitiano, ammette uno spettro composto da infiniti autovalorireali Eα a cui corrispondono infinite autofunzioni ortonormali (che in genere non sappiamo trovare) e cheindichiamo con |Φα〉

H |Φα〉= Eα |Φα〉 α = 0, 1, 2, . . . (1.53)

Si può assumere per semplicità che il set di autovalori Eα sia discreto. Il set di autofunzioni |Φα〉 e’una base di rappresentazione completa dello spazio di Hilbert e quindi qualunque funzione di questo spaziosi può esprimere come combinazione lineare delle autofunzioni:

|Φ〉= ∑α

cα |Φα〉= ∑α

〈Φα |Φ〉 |Φα〉 (1.54)

1.11.1 Principio variazionale

Il teorema variazionale recita:

data una funzione d’onda normalizzata |Φ〉 con cui si cerca di approssimare lo stato fonda-mentale di un sistema, il valore medio dell’energia calcolato su questa funzione è un limitesuperiore all’energia dello stato fondamentale vero

〈Φ|H|Φ〉 ≥ E0

La dimostrazione è molto semplice: usando l’eq. (1.54), possiamo scrivere:

1 = 〈Φ|Φ〉= ∑αβ

〈Φ|Φα〉〈Φα |Φβ 〉〈Φβ |Φ〉=

= ∑αβ

〈Φ|Φα〉δαβ 〈Φβ |Φ〉= ∑α

〈Φ|Φα〉〈Φα |Φ〉= ∑α

∣∣〈Φα |Φ〉∣∣2 (1.55)

dove abbiamo fatto uso del fatto che le autofunzioni di H sono ortonormali. Il valore medio dell’energiapuò essere scritto usando lo stesso procedimento come

〈Φ|H|Φ〉= ∑αβ

〈Φ|Φα〉〈Φα |H|Φβ 〉〈Φβ |Φ〉= ∑α

Eα

∣∣〈Φα |Φ〉∣∣2 (1.56)

Ora, essendo Eα ≥ E0 per definizione, otteniamo:

〈Φ|H|Φ〉= ∑α

Eα

∣∣〈Φα |Φ〉∣∣2 ≥ E0 ∑

α

∣∣〈Φα |Φ〉∣∣2 = E0 (1.57)

dove abbiamo usato (1.55) per l’ultima uguaglianza che dimostra il teorema.

Il teorema ci dice una cosa molto importante: il valore medio dell’energia di una funzione d’onda approssi-mata e’ sempre troppo alta ed è quindi possibile misurare la qualità di una funzione usando la sua energia:più bassa l’energia, migliore sarà la funzione approssimata. Questo è alla base del metodo variazionalein cui una funzione approssimata (funzione di prova) che dipende da alcuni parametri viene ottimizzatavariando tali parametri in modo che il valore medio di H sia il minimo possibile.


1.11.2 Metodo variazionale lineare

Data una funzione di prova dipendente da alcuni parametri il valore medio dell’energia di tale funzione〈Φ|H|Φ〉 dipende anch’esso dagli stessi parametri. Se la funzione di prova contiene solo parametri lineariil problema di ottimizzare questi parametri si riduce ad una diagonalizzazione di una opportuna matrice.Se prendiamo, infatti, un set composto da un numero finito (N) di funzioni di base fissate |Ψα〉, si puo’esprimere la funzione di prova come combinazione lineare di queste funzioni

|Φ〉=N

∑i=1

ci |Ψi〉 (1.58)

e si puo’ ridurre il problema di trovare un set di coefficienti ci ottimali ad una diagonalizzazione di matrice.

A questo punto bisogna precisare qualcosa sulle funzioni di base utilizzate: abbiamo due diversi casi aseconda se le funzioni |Ψα〉 siano o meno ortonormali (assumiamo siano reali per comodità). Il caso confunzioni ortonormali è ovviamente matematicamente più semplice.

La rappresentazione matriciale di H sulla base scelta è una matrice H reale simmetrica (H è hermitiano)N×N con elementi

H ji = Hi j = 〈Ψi|H|Ψ j〉 (1.59)

Il valore medio di H è dato da

〈Φ|H|Φ〉= ∑i j

ci · c j ·⟨Ψi∣∣H|Ψ j

⟩= ∑

i jcic jHi j (1.60)

ed è una funzione dei coefficienti dell’espansione. Il nostro problema consiste nel trovare i migliori cicioè quelli che rendono minima l’energia (1.60) (rendono minima sta per “rendono più vicina possibileall’energia vera”). Il problema si riduce quindi a quella che si chiama una minimizzazione vincolata (oproblema di Lagrange) perché la minimizzazione dell’energia deve comunque avvenire mantenendo inal-terata la condizione (il vincolo) che la funzione di prova sia normalizzata. Il vincolo in termini matematiciè

〈Φ|Φ〉= ∑i j

ci · c j · 〈Ψi|Ψ j〉= ∑i|ci|2 = 1 (1.61)

Per poter minimizzare una funzione vincolata si ricorre al metodo dei Moltiplicatori di Lagrange, cioè sicostruisce una funzione Langragiana (che contiene il moltiplicatore di Lagrange E che moltiplica il vincoloin forma implicita):

L (c1, . . . , cn,E) = 〈Φ|H|Φ〉−E(〈Φ|Φ〉−1

)= (1.62)

= ∑i j

cic jHi j −E

(∑

i|ci|2−1

)(1.63)

Il minimo della funzione Langragiana e quello di 〈Φ|H|Φ〉 coincidono. Per trovare tale minimo imponiamoche la variazione L sia nulla per variazioni degli N coefficienti:

∂L

∂ck= ∑

jc jHk j +∑

iciHik −2Eck = 0 (1.64)

essendo H una matrice simmetrica possiamo scrivere:

∑j

Hi jc j −Eci = 0 i = 1, . . . , N (1.65)

In notazione matriciale il primo è il prodotto di una matrice con un vettore colonna e quindi si può scrivere

Hc =Ec (1.66)


che è un comune problema agli autovalori della matrice H. Essendo una matrice simmetrica H ammette Nautovalori reali e N autovettori ortogonali. Quindi esplicitamentre si ha:

Hcα =Eα cαα = 0,1, . . .N−1

dove(cα)†cβ = ∑

icα

i cβ

i = 1

Se si usano questi autovettori come colonne di una matrice C si può generalizzare le relazione (1.65) a

HC = CE

dove si è costruita la matrice diagonale E con elementi Ei j = δi jEi. Quindi abbiamo trovato N soluzioni(N serie differenti di coefficienti ci) diverse che rappresentano altrettanti stati del sistema e che risultanoortonormali:

〈Φα |Φβ 〉 = ∑i j

C jαC jβ 〈Ψi|Ψ j〉= ∑i j

CiαC jβ δi j = ∑i

cαi cβ

i = δαβ

I vari Ei che appaiono sono approssimazioni alle energie dei vari stati del sistema. Il valore più basso diEi cioè E0 è la migliore approssimazione possibile all’energia dello stato fondamentale vero del sistemaall’interno della base prescelta. Si può dimostrare che i valori E1, E2 ecc. sono una buona approssimazionedegli stati eccitati del sistema. La condizione per gli stati eccitati è tuttavia un po’ più complessa, infatti sela funzione “vera” dello stato fondamentale è Ψ0 di energia Ev

0 e l’energia “vera” del primo stato eccitatoè Ev

1 , le due energie approssimate E0 ed E1 che corrispondono alle due funzioni variazionali Φ0 e Φ1obbediscono alle seguenti condizioni

E0 ≥ Ev0

E1 ≥ Ev1 − ε0(Ev

1 −Ev0)

dove la prima condizione è il teorema variazionale, e la seconda rappresenta la condizione più debole validaper stati eccitati dove ε0 = 1−|〈Ψ0|Φ0〉 |2. Perché anche la seconda sia valida è necessario che la funzionedi prova per lo stato fondamentale sia il più simile possibile a quella vera.

Benché il metodo possa apparire molto semplice, è di fondamentale importanza perché su di esso si basanoper esempio i calcoli CI (configuration interaction) che vedremo più avanti e che possono essere consideratii metodi con cui si ottengono le migliori energie energie elettroniche molecolari.

Lo stesso risultato si ottiene in maniera molto semplice (quando si usa una base ortonormale) approssimando diret-tamente la funzione d’onda vera su una base finita di funzioni ottenuta dal troncamento di qualche set completo (peresempio):

|Φ〉=N

∑i=1

ci |Ψi〉 (1.67)

Sostituendo questa espressione nell’eq. (1.52) si ottiene

∑i

ciH |Ψi〉= E ∑i|Ψi〉

premoltiplicando a sinistra per 〈Ψ j|

∑i

⟨Ψ j∣∣H|Ψi

⟩= E ∑

ici⟨Ψ j∣∣Ψi⟩

= Ec j

cioè∑

iH jici = Ec j

che è esattamente uguale all’eq. (1.65).

Naturalmente, l’equivalenza fra l’equazione di autovalore per l’operatore e quella per la sua matrice di rappresen-tazione in una base ortonormale di funzioni vale rigorosamente se e solo se queste funzioni costituiscono un insieme


completo, cioè se la base descrive l’intero spazio di Hilbert. Altrimenti è chiaro che in generale non sarà possibileesprimere qualsiasi funzione, ed in particolare le autofunzioni, come combinazione lineare delle funzioni di base. Lacompletezza dell’insieme di base non è però sempre realizzabile in pratica in quanto lo spazio ha spesso dimensioneinfinita. Tuttavia, costruire e diagonalizzare la matrice appare una procedura ragionevole anche in un sottospazio finitoper trovare delle autofunzioni approssimate, e viene usata comunemente.

Nel caso che si scelgano invece funzioni di base non ortonormali le cose si fanno più complesse, ma ilprocedimento resta lo stesso. Definiamo la Langragiana come prima, ma teniamo conto delle funzioni nonortonormali

L (c1, . . . , cn,E) = 〈Φ|H|Φ〉−E(〈Φ|Φ〉−1

)=

= ∑i j

cic jHi j −E

(∑i j

cic j 〈Ψi|Ψ j〉−1

)(1.68)

dove⟨Ψi∣∣Ψ j

⟩= Si j sono gli elementi della matrice di sovrapposizione. La differenziazione dell’espres-

sione qui sopra è ora leggermente più complicata

∂L

∂ck= ∑

jc jHk j +∑

iciHik −E

(∑

jc jSk j +∑

iciSik

)(1.69)

che può essere riscritta come

∂L

∂ck= ∑

j

(c jHk j −Ec jSk j

)+∑

i(ciHik −EciSik) = (1.70)

L’unica è che si annullino le quantità tra parentesi cioè sia verificata la condizione seguente:

∑j

Hi jc j = E ∑j

Si jc j (1.71)

o in notazione matricialeHc =ESc (1.72)

dove S è la matrice di sovrapposizione. Questa è essenzialmente una generalizzazione della relazione (1.66)dove avevamo S = I. Questa volta però il problema lineare è decisamente più complesso da risolvere e sidice problema agli autovalori generalizzato. Come vedremo il metodo di Hartree-Fock si basa proprio sullasoluzione di questo tipo di problema (la formulazione di Roothan usa infatti una base non ortogonale).La soluzione si ottiene in genere ortogonalizzando la base e riducendo il problema generalizzato ad unproblema lineare tradizionale.


1.12 Energie e strutture molecolari: problema elettronico (ab-initio)e problema nucleare (dinamica)

Il problema terribilmente complesso del moto di M + N particlelle quantistiche, M nuclei e N elettroni,può essere “scomposto” in due fasi grazie all’approssimazione di Born-Oppenheimer (BO). Il problemaelettronico viene in genere risolto prima e fornisce quella che si chiama la PES (superficie di energiapotenziale) che, secondo BO rappresenta il potenziale in cui si muovono i nuclei.

Figura 1.5:

Come indicato schematicamente in Figura 1.5 tramite l’approssimazione di Bon Oppenheimer uno puòrisolvere il problema elettronico senza prendere in considerazione i moti nucleari. In pratica si risolve ilproblema elettronico considerando i nuclei fissi e infinitamente massivi. Si ottengono le energie degli statielettronici (a volte solo lo stato fondamentale) e si spostano i nuclei. Continuando in questo modo si cal-colano le energie degli stati elettronici come una funzione delle coordinate nucleari (le energie elettronichenon sono ovviamente funzioni analitiche, ma semplici insiemi di punti discreti). Queste funzioni punto-a-punto forniscono, a meno di una costante arbitraria e previa una qualche forma di interpolazione/fitting, lesuperfici di energia potenziale (PES). La PES può (nell’ambito di validità della Born-Oppenheimer) essereinterpretata come il potenziale agente tra i nuclei. Una volta ottenuto questo potenziale è possibile farmuovere i nuclei sia classicamente sia quantomeccanicamente. Nel secondo caso non si va oltre i pochiatomi e sono veramente rari i casi in cui si raggiungano i 4 atomi. Nel caso si voglia calcolare solo lostato fondamentale si possono usare metodi sofisticati e raggiungere le poche decine di atomi. Se invece inuclei vengono trattati classicamente come particelle puntiformi si può arrivare a trattarne anche migliaia.In quest’ultimo caso esistono due possibili approcci al sistema:

1. Calcolare l’energia elettronica con un metodo ab-initio e poi usare il potenziale risultante per muo-vere i nuclei: che è il modo in cui funzionano i metodi di dinamica molecolare di tipo Car-Parrinelloe similari (numero di atomi inferiore a cento).

2. Bypassare completamente il calcolo delle energie elettroniche assumendo un campo di forze più omeno armonico tra i vari nuclei dato da costanti empiriche e ottimizzate su molecole più semplici(MM2 per esempio): che sarebbero i metodi di meccanica molecolare classica dove il numero diatomi arriva anche ad alcune migliaia.

Il metodo Hartree-Fock fornisce la più semplice approssimazione variazionale alla funzione d’onda dellostato stazionario fondamentale che si possa costruire rigorosamente (ab-initio) dai principi teorici (cioè


dall’hamiltoniano elettronico non-relativistico esatto) senza intervento di parametri aggiustabili empirica-mente. Esso corrisponde al minimo sviluppo della funzione d’onda dotato di senso fisico: un singolodeterminante o una combinazione lineare di pochi determinanti dettata dai requisiti di simmetria spaziale edi spin. Nonostante ciò, oltre a costituire un modello fisico di particolarmente facile interpretazione, essofornisce risultati per alcuni aspetti soddisfacenti e perfino di validità semiquantitativa. Ad esempio, l’ener-gia totale HF rappresenta tipicamente oltre il 90% dell’energia totale vera (non-relativistica) di un sistemaelettronico. Questo naturalmente riflette il fatto che i termini di accoppiamento coulombiano nell’hamil-toniano sono termini “piccoli” rispetto all’energia cinetica e a quella di attrazione verso i nuclei. Questoè vero in particolare per gli elettroni di core, per i quali questi ultimi termini sono molto grandi visto cheessi orbitano ad altissima velocità vicino ai nuclei, ed il cui moto è in pratica trascurabilmente correlato aquello degli elettroni di valenza.

Tuttavia, per la gran parte degli scopi di interesse chimico e spettroscopico, il modello HF è insufficientee, al più, solo qualitativo. Le osservabili di interesse più comune sono infatti in generale differenze dienergia fra stati elettronici diversi (spettroscopia) o fra diverse configurazioni nucleari di uno stesso stato(energetica delle reazioni chimiche). Queste differenze di energia, che originano essenzialmente da diffe-renze nelle distribuzioni elettroniche degli elettroni di valenza, sono tipicamente proprio dello stesso ordinedi grandezza degli errori nelle energie totali HF e spesso inferiori. Per alcune osservabili che coinvolga-no significativamente rotture o formazioni di legami chimici (un esempio evidente è quello dei processidi dissociazione) il modello HF è in generale già a priori qualitativamente sbagliato. Così pure, si verificaspesso una fondamentale inadeguatezza della funzione d’onda HF per la riproduzione di osservabili diversedall’energia. La differenza (teorica) fra l’energia esatta non-relativistica di un sistema elettronico e quella(esatta) HF viene definita energia di correlazione elettronica, e tutti i fenomeni e le alterazioni del valore diosservabili che possono essere riprodotti solo da funzioni d’onda più accurate di quella HF vengono dettieffetti di correlazione.

Ecco qui di seguito una breve rassegna di metodologie che vengono comunemente utilizzate per calcolarele energie elettroniche

1. Hartree-Fock (HF): è il metodo concettualmente più semplice. In pratica è la metodologia principaleche abbiamo per costrire gli orbitali molecolari. Il metodo inoltre permette di calcolare rapidamenteuna buona apprissimazione all’energia di molecole fortemente legate la cui geometria non sia troppodiversa da quella di equilibrio. Il suo limite è che non tiene conto della correlazione elettronica equindi commette un errore sistematico sull’energia. Anticipiamo qui la definizione di un concettomolto importante nell’ambito dei calcoli ab-initio: l’energia di correlazione. Tale energia è moltosemplicemente definita come “quello che manca ad un calcolo Hartree-Fock”. Se confrontiamo irisultati ottenuti da HF con quelli “esatti” ottenuti da metodi migliori vediamo che manca semprequalcosa di simile ad un 10% dell’energia. Questo ammontare è detto energia di correlazione chederiva fisicamente dall’interazione “istantanea” tra elettroni che il metodo di HF necessariamentenon include perché è un metodo basato sull’approssimazione di campo medio (cioè non considera leposizioni istantanee relative degli elettroni).

Esistono 3 tipi di HF: Restricted HF, Restricted Open-Shell HF, Unrestricted HF. La differenza stanel modo in cui vengono accoppiati gli spin degli elettroni negli orbitali molecolari. Il primo tra i trenon può trattare problemi di rottura omolitica di legami.

Il costo computazionale di HF è relativamente modesto e viene ormai prevalentemente usato quasiesclusivamente per generare orbitali molecolari che possono servire come partenza per metodologiepiù complesse e accurate. Se necessario, è comunque possibile usare HF per ottimizzare le geometriedelle molecole, ma sarebbe meglio usare metodi computazionalmente equivalenti, ma più accuraticome MP2 o DFT.

2. Density Functional Theory (DFT): è una metodologia che si basa sul calcolo della densità elettro-nica della molecola. Il suo costo computazionale è di poco superiore ad HF, ma può raggiungereaccuratezze molto maggiori grazie ad un approccio “quasi semiempirico”. Viene comunemente im-piegata per il calcolo dell’energia in sistemi con molti elettroni come i solidi per esempio. Il suo


problema principale è che il calcolo dell’energia di correlazione (cioè la parte mancante ad un calco-lo HF) è “empirica” e si basa su formule più o meno complicate che possono o meno funzionare suun dato sistema. Semplificando molto, tali formule vengono detti funzionali. Ne esistono diversi aseconda delle esigenze e, purtroppo, i risultati sono fortemente dipendenti dalla loro scelta.

Alcuni tra i chimici teorici più intransigenti considerano la DFT alla stregua di un metodo “se-miempirico”. Parte del suo successo è anche dovuto al fatto che viene usata per calcolare l’energiaelettronica nei metodi di tipo Car-Parrinello dove il calcolo del moto classico dei nuclei è accoppiatocon un calcolo ab-initio di tipo DFT dell’energia elettronica.

3. Many Body Perturbation Theory (MBPT) o Møller Plesset Theory (MP2-MP4): questi due me-todi non sono variazionali e potrebbero produrre energie più basse di quelle esatte. Questi metodi,infatti, calcolano le energie elettroniche utilizzando la teoria delle perturbazioni al secondo e quartoordine. Il costo di MP2, come vedremo, non è di molto superiore ad un calcolo HF che viene co-munque eseguito in quanto entrambi i metodi perturbativi necessitano di orbitali molecolari. MP2include però gran parte della correlazione elettronica e si può utilizzare per ottimizzare geometriemolecolari. MP4 invece risulta computazionalmente molto pesante, ma rappresenta uno dei metodipiù accurati in circolazione per il calcolo delle energie elettroniche degli stati fondamentali.

4. CI, Full-CI (Configuration Interaction): é un metodo che in linea di principio permetterebbe diottenere le energie elettroniche “esatte” dello stato fondamentale e di tutti gli stati eccitati. Purtroppoè anche pressoché inutilizzabile dato lo sforzo computazionale richiesto. E’ stato usato solo in sistemicon pochissimi elettroni. Anche se concettualmente importante, nella pratica gli si preferisconometodi come i seguenti.

5. DCI, SDCI, QCI e MRCI (Doubles-Configuration Interaction, Singles and Doubles CI, Quadratic-CI e Multi Reference CI): sono diversi modi di semplificare un calcolo Full-CI. Possono esseremolto accurati, ma è sempre difficile giudicare la loro accuratezza. Vengono utilizzati per calcolarele energie elettroniche degli stati eccitati.

6. MCSCF e CASSCF (Multi Configurational Self Consisten Field, Complete Active Space Self Con-sisten Field): sono l’equivalente di HF per situazioni in cui HF non può funzionare. Sono metodiche servono a costruire orbitali molecolari (ma queata volta adatti anche a descrivere stati elettronicieccitati). Anche loro non includono la correlazione dinamica che deve essere ”aggiunta” utilizzandocalcoli di tipo perturbativo o SDCI. Per quello si sente spesso parlate di metodologie CAS-PT2 oCAS-MRCI. Questo ultimo tipo di calcoli è molto complesso dal punto di vista teorico, difficile dafare e pesante computazionalmente, ma fornisce energie molto accurate.

7. CC (Coupled Cluster): una serie di metodologie la cui teoria è molto complessa. Permette di rag-giungere un’accuratezza molto alta, ma solo per lo stato fondamentale a scapito di una notevolepesantezza computazionale. Metodo d’elezione per lo studio dei legami deboli (dimeri molecolari,sistemi di Van der Waals).

8. Metodi semiempirici (Huckel): vengono utilizzati hamiltoniani modello con cui si costruisconodeterminanti secolari in grado di fornire energie molecolari approssimate: sono metodi utili per latrattazione di molecole organiche con molti atomi.

I vari metodi hanno accuratezze e campi di applicazione molto diversi che sono riportati qualitativamentein Figura 1.6.


Figura 1.6:

1.13 La dinamica delle molecole: l’approssimazione di Born-Oppenheimer,la vibrazione e rotazione delle molecole biatomiche

1.13.1 L’approssimazione di Born-Oppenheimer

La massa degli elettroni è molto più piccola di quella dei nuclei. Le forze a cui sono sottoposti elettroni enuclei sono invece dello stesso ordine di grandezza. Il moto dei nuclei, quindi, è molto “lento” rispetto aquello elettronico. In chimica è importante che sia possibile descrivere i moti nucleari disaccoppiandoli daquelli elettronici. Questo è quello che fa l’approssimazione di Born-Oppenheimer. Qui ci limiteremo aduna molecola biatomica per evitare una notazione inutilmente complessa.

Figura 1.7: Coordinate utilizzate per descrivere l’approssimazione di Born-Oppenheimer

L’equazione di Schrödinger indipendente dal tempo per una molecola biatomica composta da due nuclei di


massa MAe MB e da N elettroni è:

[TN +Te +V +Hmp]ψ(R,r) = Etotψ(R,r) (1.73)

dove con R abbiamo indicato il vettore tra i due nuclei e con r le varie coordinate elettroniche rispetto ad unopportuno sistema di riferimento il cui centro è nel centro di massa della molecola (vedi Figura 1.7). I varitermini dell’Hamiltoniano sono l’energia cinetica relativa dei nuclei e quella elettronica (in unità atomiche)

TN =− 12µ

∇2R e Te =

N

∑i=1

(−1

2∇

2ri

)(1.74)

dove µ = MAMB/(MA + MB) è la massa ridotta tra i due nuclei. Il termine Hmp è detto termine di pola-rizzazione di massa ed è dovuto al fatto che in un sistema descritto dalle coordinate di figura Figura 1.7l’operatore di energia cinetica non è una somma di laplaciani. Tale termine è dato da

Hmp =− 12(MA +MB)

(N

∑i=1

∇ri

)2

(1.75)

Il potenziale consiste nell’energia elettrostatica tra le particelle

V =−N

∑i=1

ZA

|ri−RA|−

N

∑i=1

ZB

|ri−RB|+ ∑

i< j

1ri j

+ZAZB

R(1.76)

Adesso fissiamo i nuclei, otteniamo un’equazione per gli elettroni che possiamo in linea di principiorisolvere con uno dei metodi studiati predentemente e quindi trovarne autovalori e autofunzioni:

(Te +V )Φq(R;r) = Eq(R)Φq(R;r) (1.77)

L’autovalore Eq(R) e la funzione d’onda elettronica Φq(R;r) dipendono parametricamente, per ogni statoelettronico q, dalla coordinata internucleare R. Se il set di funzioni elettroniche è un set completo Φq eortonormale, possiamo espandere (tale espansione è detta adiabatica) la funzione d’onda totale come

ψ(R;r) = ∑q

Fq(R)Φq(R;r) (1.78)

dove i coefficienti di espansione Fq(R) sono coefficienti dipendenti da R. Li possiamo interpretare comefunzioni d’onda che rappresentano il moto nucleare quando lo stato elettronico è q. Sostituendo (1.78)nell’eq. di Schrödinger (1.73) e moltiplicando a sinistra per Φ∗

s e integrando si ottiene

∑q

∫drΦ

∗s (R;r)[TN +Te +V −Etot]Fq(R)Φq(R;r) = 0 (1.79)

che è un set di equazioni integro-differenziali per i valori possibili di s = 1, 2, . . .. Queste equazioni sonoaccoppiate perchè Φq non è un autofunzione di TN . L’azione degli altri operatori invece è quella dell’eq.(1.77). Quindi si ottiene

∑q

[∫drΦ

∗s (R;r)TNFq(R)Φq(R;r)

]+[Es(R)−Etot]Fs(R) = 0 (1.80)

dove abbiamo usato la condizione 〈Φs|Φq〉 = δqs e dove il secondo termine contenente energie è disac-coppiato (compare solo l’indice s), mentre il primo termine è accoppiato. E’ importante notare che finoad ora non abbiamo utilizzato alcuna approssimazione. Fino ad ora il calcolo è esatto. Vediamo qual è lastruttura del primo termine andando a calcolare l’azione dell’operatore TN sul prodotto di funzione (ΦqFq).Entrambe le funzioni dipendono da R e quindi TN che è una derivata seconda rispetto alle stesse coordinatedarà

TN(ΦqFq) =− 12µ

[Fq · (∇2

RΦq)+2(∇RFq ·∇RΦq)+Φq · (∇2RFq)

](1.81)


da cui si vede come compaiano due termini d’accoppiamento che coinvolgono il gradiente rispetto allecoordinate nucleari delle funzioni d’onda elettroniche.

L’approssimazione di Born-Oppenheimer consiste nel trascurare |∇RΦq| rispetto a |∇RFq|. Questo fa sì chele equazioni in (1.80) disaccoppino e diventino une serie di equazioni agli autovalori per il moto nucleare[

− 12µ

∇2R +Es(R)−Etot

]Fs(R) = 0 (1.82)

dove se interpretiamo l’autovalore dell’eq. d’onda elettronica (1.77) come un potenziale abbiamo un’e-quazione del tutto analoga ad un’equazione di Schrödinger8. Il senso dell’approssimazione di Born-Oppenheimer è quello di interpretare l’energia totale elettronica della molecola come il potenziale in cui simuovono i nuclei.

1.13.2 Il moto delle molecole biatomiche: rotazione e vibrazione

L’approssimazione di Born Oppenhemier permette la separazione del moto elettronico da quello nucleare.In pratica abbiamo visto che è possibile risolvere il problema elettronico a diverse geometrie nucleari eottenere l’energia elettronica totale come funzione delle coordinate nucleari. Nel caso di una molecolabiatomica si ottiene quindi una curva di energia che è funzione della distanza tra i nuclei, mentre nel casodi molecole poliatomiche si ottiene una funzione a più dimensioni. L’approssimazione di Born Oppen-heimer permette di considerare questa energia totale elettronica come il potenziale in cui si muovono inuclei. Per questo motivo si parla di Curve di Energia Potenziale (PEC) o Superfici di Energia Potenzia-le (PES). Per semplicità da ora in poi considereremo solemente il caso monodimensionale della curva dienergia potenziale in quanto il caso multidimensionale rappresenta una notevole (e a volte insormontabile)complicazione formale e di calcolo.

Il moto dei nuclei all’interno del potenziale generato dagli elettroni può essere trattato in modo quantisticoo classico. In questo corso ci limiteremo a sistemi molto semplici e quindi alla soluzione quantistica“esatta”, ma in problemi più complessi la scelta della meccanica classica è l’unica ragionevole. Con buonaapprossimazione, a parte sistemi particolari, non si procede alla dinamica quantistica in sistemi con piu’ di6-8 gradi di libertà.

Il nostro sistema è costituito da due particelle A e B che interagiscono tramite un potenziale che dipendesolamente dalla distanza tra le particelle e non dall’orientazione della molecola nello spazio V (R)≡V (R).L’equazione di Schrödinger per il moto di due particelle rispetto al centro di massa è data, in termini di unaparticella di massa ridotta µ , da: (

− 12µ

∇2 +V (R)

)ψ(R) = Eψ(R)

8Un altro modo di vedere l’approssimazione di BO è questo: consideriamo l’eq. (1.80) e riscriviamola in notazione compatta

∑q〈s|TNFq|q〉+[Es(R)−Etot ]Fs = 0

esplicitando TNsi ha

− 12µ

∑q

(〈s|∇2

R|q〉Fq +2〈s|∇R|q〉∇RFq)− 1

2µ∇

2RFs +[Es(R)−Etot]Fs = 0

I termini nella sommatoria sono detti termini non-adiabatici di primo e secondo ordine. L’approssimazione adiabatica si ottienetroncando la sommatoria e tenendo solo il primo termine non-adiabatico al secondo ordine (quello al primo ordine va a zero per s = q)

− 12µ

(〈s|∇2

R|s〉+∇2R)

Fs +[Es(R)−Etot]Fs = 0

Quest’ultima equazione si può scrivere in forma più esplicita come[− 1

2µ∇

2R +Es(R)+Us(R)−Etot

]Fs(R) = 0

dove il termine Us(R) è detto correzione diagonale ed è molto piccolo quando confrontato con Es(R). L’approssimazione di Born-Oppenhemier si ottiene trascurando anche Us(R).


Nel caso di potenziali centrali la risoluzione dell’equazione di Schrödinger è semplificata e procede comeper l’atomo di idrogeno separando la parte radiale della funzione d’onda da quella angolare. L’Hamiltonia-no espresso in coordinate polari infatti diventa

H =− 12µ

∇2R +V (R) =− 1

2µ

(1

R2∂

∂R

(R2 ∂

∂R

)− L2

R2

)+V (R) (1.83)

dove L2 è il solito operatore di momento angolare con autovalori l(l + 1) in unità atomiche. Come nellatrattazione dell’atomo di idrogeno possiamo fattorizzare la funzione d’onda (nel caso di potentiali centralifattorizzare la funzione d’onda non è un’approssimazione!) e scrivere

ψ(R) = Rl(R) ·Yl,m(θ ,φ) (1.84)

dove con Yl,m(θ ,φ) abbiamo indicato le armoniche sferiche che sappiamo essere soluzioni della parteangolare dell’equazione. Sostituendo l’eq.(1.84) in (1.83) si ottiene l’equazione per il moto radiale (latrattazione è del tutto analoga a quella dell’atomo di idrogeno)

− 12µ

[1

R2∂

∂R

(R2 ∂

∂R

)− l(l +1)

R2

]+V (R)

Rl(R) = E ′Rl(R). (1.85)

Questa equazione descrive il moto radiale di qualunque sistema a due particelle che interagiscono tramiteun potenziale centrale. Nel caso dell’atomo di idrogeno il potenziale è dato dall’espressione V (R) = 1/Re la soluzione dell’eq. (1.85) è analitica ed è data, per gli stati legati, dai polinomi associati di LaguerreL2l+1

n+l (2r/n) moltiplicati per degli esponenziali decrescenti. Purtroppo nel caso di una molecola biatomicail potenziale non è noto analiticamente e come vedremo l’equazione radiale va risolta numericamente. Unaforma “comoda” dell’eq. (1.85) si ottiene scrivendo

ul(R) = r ·Rl(R)

e quindi ottenendo [− 1

2µ

d2

dR2 +l(l +1)2µR2 +V (R)

]ul(R) = E ′ul(R).

Abbiamo trasformato il problema del moto di due atomi nella risoluzione di un’equazione mono-dimensionalecon potenziale dato da

Ve f f (R) =l(l +1)2µR2 +V (R)

dove il termine l(l+1)/2µR2 è detto barriera centrifuga e rappresenta il contributo all’energia del momentoangolare della molecola.

In genere nelle molecole biatomiche il momento angolare l viene indicato con j e il potenziale è quellofornito dalla soluzione dell’equazione d’onda elettronica Es(R); quindi l’equazione che ci permette dianalizzare il moto degli atomi in una molecola biatomica è semplicemente:[

− 12µ

d2

dR2 +j( j +1)2µR2 +(Es(R)−Erif)−Es jν

]us

ν , j(R) = 0 (1.86)

dove abbiamo indicato con Es jν l’autovalore dell’energia dell’equazione nucleare, con j il momento ango-lare della molecola e con ν il numero quantico che identifica lo stato energetico all’interno della buca dipotenziale (l’equivalente di n per l’atomo di idrogeno) e che vedremo sarà il numero quantico vibrazionale.Abbiamo inoltre specificato esplicitamente che il potentiale V (r) = Es(R)−Erif è dato dall’energia di unparticolare stato elettronico s calcolato a diverse geometrie usando un metodo ab-initio a meno di una co-stante che di solito è il limite di dissociazione molecolare più basso cioé l’energia elettronica dei due atomisparati Erif = Es(R → ∞) = Es(A) + Es(B). L’energia totale Es jν della molecola dipenderà quindi dallostato elettronico scelto s, dal numero quantico principale ν e dal momento angolare presente nel sistemaj. In Figura 1.8 è riportato uno schema per i primi due stati elettronici in una generica molecola biatomicasenza eccitazione rotazionale cioè con j = 0. Se i due o più stati elettronici sono molto lontani in energiaallora i singoli stati legati al loro interno possono considerarsi indipendenti e quindi possono essere trattatiseparatamente9.

9Nota bene: gli stati legati che si trovano all’interno dello stato elettronico eccitato nella figura 4 (identificati da E(s = 2)) non


Figura 1.8: Schema dei livelli vibro-elettronici di una molecola biatomica

1.13.3 L’approssimazione armonica alle energie molecolari

E’ possibile ottenere una stima dei valori di Es jν usando l’approssimazione armonica. E’ infatti possibileespandere il potenziale di un determinato stato elettronico in serie di Taylor per distanze vicine alla geo-metria di equilibrio. Vicino al minimo la derivata prima è nulla e il potenziale al secondo ordine è datodall’approssimazione armonica

Es(R)∼ Es(Req)+12

d2Es

dR2 (R−Req)2 = Es(Req)+12

k(R−Req)2.

Allo stesso tempo si approssima l’energia rotazionale utilizzando il valore di equilibrio di R (esplicitandole unità atomiche):

E j ∼h2

2µR2eq

j( j +1) =h2

2Ij( j +1) = B j( j +1)

in modo che l’energia totale risulti una semplice somma (dove le costanti dipendono dallo stato elettronicos: ω perché dipende dalla forma della curva, B perche’ dipende da Req che è diverso per stati elettronicidiversi)

Esν j = hωs(ν +12)+Bs j( j +1).

In realtà questa è una descrizione piuttosto cruda delle energie molecolari e di solito si aggiungono deitermini correttivi per poter “fittare” i risultati spettroscopici delle transizioni tra i livelli ro-vibrazionali.L’espressione generale a cui si giunge con varie aggiunte è la seguente

Es, j,ν = hωs

[(ν +

12

)−βs

(ν +

12

)2]

+Bs j( j +1)−Ds j2( j +1)2 (1.87)

dove βs è la costante di anarmonicità e D è una costante che introduce la distorsione centrifuga.

sono veri stati legati, ma stati quasi-legati o metastabili in quanto è sempre possibile che decadano nello stato fondamentale peremissione spontanea (rilassamento radiativo). Tutti quegli stati hanno un tempo di vita finito e per il principio di indeterminazionela loro energia è afflitta da un’incertezza data dall’inverso del loro tempo di vita ∆E ∼ h/τ . Questa incertezza affligge tutti gli statieccitati e come è noto le probabilità di emissione spontanea sono proporzionali al cubo della frequenza della transizione e quindi itempi di vita degli stati elettronici eccitati sono particolarmente brevi e le loro energie molto incerte (spettroscopicamente si parla dirighe molto allargate perche’ non esiste una “precisa” condizione di risonanza non essendoci una precisa energia dello stato). Peresempio è pressoché impossibile accorgersi dell’incertezza dell’energia uno stato vibrazionale eccitato come E(s=1, v=1, j=0), mentreè facile misurarla per uno stato come E(s=2, v=0, j=0).


1.13.4 L’Hamiltoniano ro-vibrazionale “esatto”: la rotazione molecolare e le bar-riere centrifughe

L’espressione (1.87) benché spieghi qualitativamente l’origine dei vari contributi all’energia molecola, nonè quantitativamente corretta sopratutto nel considerare le rotazioni. La cosa migliore è trovare tutte lesoluzioni del problema (??) integrando numericamente. Per prima cosa uno determina le auto-funzioni e leenergie ponendo j = 0, quindi passa a j = 1, j = 2 e coì via. I vari problemi a diverso valore di j vengonotrattati indipendentemente perché j è l’unico momento angolare e quindi una costante del moto e quindi siconserva10. Quello che succede al cambiare di j è semplice da interpretare se si guarda la dipendenza delpotentiale

Ve f f (R) =j( j +1)2µR2 +Es(R)

da j cioè si analizza il problema delle barriere centrifughe. In Figura 1.9 ho riportato il comportamentodi Ve f f per diversi valori di j per un potenziale generico. Quello che succede è che all’aumentare di j il

Figura 1.9: Comportamento di Ve f f per diversi valori di j.

potenziale diventa sempre più repulsivo e la buca viene sempre più ridotta perché appaiono delle contributidetti barriere centrifughe generate dal termine positivo j( j + 1)/2µR2. Come si vede chiaramente dallaFigura 1.9 il potenziale non avrebbe più la possibilità di sistemare stati legati già con j = 15 perche’ ilminimo del potenziale si trova ad energie positive. Una trattazione esatta della rotazione e dei momentiangolari deve tenere conto del fatto che non è piu’ possibile avere una molecola legata per certi valori dij. Le barriere sono dette centrifughe perché in una visione classica di un processo d’urto le traiettorie conenergia positiva minore della barriera non possono “avvicinarsi” alla buca di potenziale perché in mecca-nica classica la penetrazione delle barriere è proibita. L’aumentare di j in genere provoca una diminuzionedel numero di stati legati che la molecola supporta: in figura 6 infatti vediamo lo stesso potenziale di pri-ma per due diversi valori di j, 0 e 10. Ho calcolato gli stati legati del sistema e mentre il potenziale perj = 0 supporta 3 stati legati ne ha solo uno per j = 10. Come detto prima per j = 15 la molecola dissocia.Ovviamente i valori di j che riescono a dissociare la molecola dipendono dalla forza del legame chimico edalle masse in gioco: molecole fortemente legate hanno moltissimi stati legati e ci vogliono valori altissimidi j per dissociarle.

10Ogni sistema invariante per rotazioni nello spazio cioè ogni sistema isolato ha come costante del moto il momento angolare totaleJ. In una molecola biatomica isolata di tipo Σ, j è l’unico momento angolare e quindi si conserva.


Figura 1.10: Diminuzione degli stati legati vibrazionali all’aumentare di j

1.14 L’ottimizzazione delle geometrie molecolari usando l’energiaelettronica (cenni).

Come si è visto è possibile calcolare una curva di energia potenziale per una determinata molecola. Inquesto modo risulta possibile per esempio determinare il minimo della curva di energia potenziale. Questominimo identifica anche una determinata geometria molecolare che è detta geometria di minima energiao di equilibrio. Questa geometria è quanto di più vicino a quella che si potrebbe chiamare la geometriadella molecola. In realtà le molecole sono oggetti quantistici cioé oggetti in cui i nuclei componenti sonodelocalizzati e quindi descritti da funzioni d’onda. Ne consegue che non è possibile sapere con precisione laposizione di un nucleo all’interno della molecola. Tuttavia, è vero che nel caso in cui si stiano analizzandosistemi fortemente interagenti la posizione media dei nuclei, quando la molecola si trova nel suo statofondamentale, identificherà una geometria molto simile a quella minima. Bisogna però tenere conto chenel caso di legami più deboli che la delocalizzazione nucleare è molto pronunciata e non si riesce a stabilireuna reale geometria molecolare (questo è tanto più vero quanto più sono leggeri i nuclei come per esempionel caso del legame idrogeno).

Per sistemi fortemente legati la determinazione della geometria minima è molto importante perché permettedi fare confronti con dati di tipo cristallografico o spettroscopico (NMR) e quindi di determinare la bontà omeno di un calcolo. Spesso non è possibile ottenere dati sperimentali sulla posizione dei nuclei e il calcoloquantomeccanico della geometria di equilibrio è l’unico modo per ipotizzare una struttura.

Se nel caso di una molecola biatomica è possibile calcolare tutta la curva per poi localizzare il minimo,in sistemi con più di due o tre atomi non è certo possibile esplorare tutta la PES. Per trovare un minimoquindi si usa il gradiente dell’energia elettronica calcolata con un metodo ab-initio HF o Post-HF per farsiquidare verso il minimo. In un sistema a molti gradi di libertà il numero dei minimi relativi aumenta inmodo vertiginoso: con N atomi si possono avere ∼ 2N!eN minimi relativi! Uno dei problemi dei metodidi ottimizzazione è che non si possono distinguere i minimi relativi da quello assoluto. L’unica stradapossibile è quella di calcolare tantissimi minimi e confrontarne le energie.

Possiamo dire che l’ottimizzazione delle geometrie molecolari è un problema complicatissimo e esistonomoltissimi modi diversi di affrontarlo. Nell’approssimazione di B.O. l’energia di una molecola è unafunzione continua delle 3N coordinate nucleari E(X) con X = (X1, X2, . . . , X3N). Nell’intorno del puntoX0 è possibile espandere l’energia in serie di Taylor

E(X) = E(X0)+q†f(X0)+12

q†H(X0)q+ . . . (1.88)


dove q = (X−X0)

fi =∂E(X)

∂Xie Hi j =

∂ 2E(X)∂Xi∂X j

(1.89)

sono rispettivamente il gradiente e l’Hessiano dell’energia. Allo stesso modo anche il gradiente può essereespanso in serie di Taylor

f(X) = f(X0)+H(X0)q (1.90)

Se X0 è un punto stazionario, una forma quadratica ottenuta dal troncamento di (1.88) dovrebbe esseresufficiente a descrivere l’energia, infatti f (X0) = 0 e quindi abbiamo

E(X) = E(X0)+12

q†H(X0)q+ . . . (1.91)

Se vogliamo trovare lo spostamento q che da un punto qualsiasi ci porta verso un punto stazionario (nel-l’approssimazione che questo spostamento sia piccolo abbastanza da poter considerare la funzione energiadata da una forma quadratica) imponiamo che tale spostamento debba portarci dal punto X verso il puntoXe in cui il gradiente è nullo e quindi (usando un’equazione analoga alla (1.90)) otteniamo l’equazione cheè il punto di partenza dei metodi di minimizzazione:

f(X) =−H(X)q (1.92)

Se H non è singolare questo spostamento è dato da

q =−H−1(X)f(X) (1.93)

Dalla (1.91) si ottiene una stima dell’energia del punto Xe in cui ci porta lo spostamento q:

E(Xe) = E(X)− 12

f(X)H−1(X)f(X) = E(X)− 12

q†H−1(X)q

La valutazione delle derivate dell’energia è piuttosto complessa e quindi non la trattiamo qui: esistonosostanzialmente due possibilità a seconda che si abbia o meno la possibilità di valutare analiticamente lederivate dell’energia rispetto alle coordinate nucleari. Per alcuni metodi ab-initio questo è possibile conrelativamente poco sforzo (per esempio HF o MP2), mentre per altri è praticamente impossibile (metodiCI).

1.15 Teoria delle perturbazioni indipendente dal tempo

Data un’equazione di SchrödingerHΦk = EkΦk (1.94)

non risolubile esattamente, la teoria delle perturbazioni permette di trovare delle soluzioni approssimate siaper suoi autovalori Ek che per le sue autofunzioni Φk. La condizione necessaria per applicarla è che esistaun hamiltoniano più semplice H(0) di cui si conoscano le autofunzioni e gli autovalori:

H(0)Φ

(0)k = E(0)

k Φ(0)k (1.95)

Si definisce perturbatore la differenza H −H(0) = H(1) anche se si preferisce introdurre un parametroarbitrario 0 ≤ λ ≤ 1 detto parametero di ”switch” che misura l’entità della perturbazione e quindi scriverel’hamiltoniano totale come

H = H(0) +λH(1) . (1.96)

Per trovare le correzioni all’energia si espandono le funzioni Φk e gli autovalori Ek in serie di potenze di λ

Ek(λ ) = E(0)k +λE(1)

k +λ2E(2)

k + . . .

Φk(λ ) = Φ(0)k +λΦ

(1)k +λ

2Φ

(2)k + . . . (1.97)


Sostituendo queste equazioni in (1.94) si ottiene

(H(0) +H(1))(Φ(0)k +λΦ

(1)k +λ

2Φ

(2)k ) = (E(0)

k +λE(1)k +λ

2E(2)k )(Φ(0)

k +λΦ(1)k +λ

2Φ

(2)k )(1.98)

che da vita ad un’equazione piuttosto complicata.

H(0)Φ

(0)k +λH(0)

Φ(1)k +λ

2H(0)Φ

(2)k +λH(1)

Φ(0)k +λ

2H(1)Φ

(1)k =

= E(0)k Φ

(0)k +λE(0)

k Φ(1)k +λ

2E(0)k Φ

(2)k +λE(1)

k Φ(0)k +λ

2E(1)k Φ

(1)k +λ

2E(2)k Φ

(0)k (1.99)

Quest’ultima si può ridurre ad un set di equazioni equivalenti notando che i coefficienti delle stesse po-tenze di λ devono essere uguali. Uguagliando quindi i fattori di λ 0 = 1 abbiamo l’equazione di partenzaH(0)Φ

(0)k = E(0)

k Φ(0)k ; eguagliando, invece quelli di λ otteniamo:

H(0)Φ

(1)k +H(1)

Φ(0)k = E(0)

k Φ(1)k +E(1)

k Φ(0)k (1.100)

che può essere riscritta e premoltiplicata per 〈Φ(0)k |

〈Φ(0)k |(H(0)−E(0)

k )|Φ(1)k 〉= 〈Φ(0)

k |(−H(1) +E(1)k )|Φ(0)

k 〉 . (1.101)

L’hamiltoniano H(0)è ovviamente Hermitiano e quindi 〈Φ(0)k |H(0) = 〈Φ(0)

k |E(0)k e quindi (1.101) risulta

〈Φ(0)k |(−H(1) +E(1)

k )|Φ(0)k 〉= 0

che ci fornisce la regola per calcolare la correzione al primo ordine per l’energia

E(1)k = 〈Φ(0)

k |H(1)|Φ(0)k 〉 . (1.102)

Con la stessa procedura si identificano i termini corrispondenti ad λ 2, si premoltiplica per 〈Φ(0)k | e si ottiene

E(2)k = 〈Φ(0)

k |H(1)−E(1)k |Φ(1)

k 〉 . (1.103)

Per poter trovare la funzione d’onda al primo ordine Φ(1)k la si espande negli autostati di H(0)

Φ(1)k = ∑

ia(1)

i Φ(0)i (1.104)

e la si sostituisce nell’eq. al primo ordine (1.100) ottenendo

H(0)∑

ia(1)

i Φ(0)i +H(1)

Φ(0)k = E(0)

k ∑i

a(1)i Φ

(0)i +E(1)

k Φ(0)k

(H(0)−E(0)k )∑

ia(1)

i Φ(0)i = (E(1)

k −H(1))Φ(0)k . (1.105)

Premoltiplichiamo per una qualunque delle Φ(0)j e integriamo per ottenere

a(1)j (E(0)

j −E(0)k )+ 〈Φ(0)

j |H(1)|Φ(0)k 〉−E(1)

k δ jk = 0 (1.106)

Per j = k questa equazione si riduce al risultato (1.102), ma per j 6= k si ha

a j =〈Φ(0)

j |H(1)|Φ(0)k 〉

E(0)k −E(0)

j

, k 6= j

Possiamo riscrivere (1.104)

Φ(1)k = ∑

i6=ka(1)

i Φ(0)i = ∑

i6=k

〈Φ(0)i |H(1)|Φ(0)

k 〉E(0)

k −E(0)i

Φ(0)i (1.107)


e infine trovare la correzione la secondo ordine sostituendo quest’ultimo risultato in (1.103)

E(2)k =

⟨Φ

(0)k

∣∣∣∣∣H(1)−E(1)k |∑

i6=k

〈Φ(0)i |H(1)|Φ(0)

k 〉E(0)

k −E(0)i

Φ(0)i

⟩=

= ∑i6=k

〈Φ(0)i |H(1)|Φ(0)

k 〉E(0)

k −E(0)i

〈Φ(0)k |H(1)−E(1)

k |Φ(0)i 〉=

= ∑i6=k

〈Φ(0)i |H(1)|Φ(0)

k 〉E(0)

k −E(0)i

(〈Φ(0)

k |H(1)|Φ(0)i 〉−〈Φ(0)

k |E(1)k |Φ(0)

i 〉)

=

= ∑i6=k

〈Φ(0)i |H(1)|Φ(0)

k 〉〈Φ(0)k |H(1)|Φ(0)

i 〉E(0)

k −E(0)i

= ∑i6=k

∣∣∣〈Φ(0)i |H(1)|Φ(0)

k 〉∣∣∣2

E(0)k −E(0)

i

(1.108)

Capitolo 2

Energie elettroniche: Hartree Fock

In questa sezione vedremo come funziona il metodo di HF. Questo metodo permette di calcolare in buonaapprossimazione l’energia elettronica Born-Oppenheimer (a nuclei fissi) di una molecola qualsiasi utiliz-zando l’approssimazione degli orbitali molecolari. L’approssimazione di HF non solo è importante in sé,ma anche perche’ gli orbitali molecolari che si ottengono possono essere utilizzati come punto di partenzaper calcoli molto più complessi che includono gli effetti della correlazione elettronica. Questi ultimi sonospesso chiamati metodi post-HF.

Il metodo di HF si basa sul metodo variazionale. In pratica si cerca di determinare i migliori spin-orbitaliche generano un determinante di Slater capace di descrivere lo stato fondamentale elettronico di una mole-cola ad una fissata geometria nucleare. Il problema è che come vedremo il metodo di HF è più complessodel semplice metodo variazionale lineare.

L’Hamiltoniano elettronico privo delle energie cinetiche nucleari per una molecola con N nuclei e nelettroni e’ dato da:

Hel = Te +V =−12

n

∑i=1

∇2i −

n

∑i=1

(N

∑J=1

ZJ

RJi

)+

12 ∑

i, j

1ri j

+∑J,I

ZJZI

RJI. (2.1)

La funzione d’onda di prova e’ data da un determinante di Slater costruito con spin-orbitali molecolari

|Ψ0〉=1√n!

∣∣∣∣∣∣∣∣φ1(1) φ2(1) · · · φn(1)φ1(2) φ2(2) · · · φn(2)· · · · · · · · · · · ·

φ1(n) φ2(n) · · · φn(n)

∣∣∣∣∣∣∣∣= A [φ1(1)φ2(2) · · ·φn(n)] = A Π (2.2)

dove con la notazione φi(i) intendiamo φi(ri,σi) l’i-esimo spin-orbitale molecolare popolato dall’i-esimoelettrone e con A abbiamo indicato l’operatore di antisimmetrizzazione dato dalla seguente somma dipermutatori

A =1√n!

n−1

∑p=0

(−1)pP =1√n!

(1−∑

i jPi j +∑

i jkPi jk − . . .

)L’energia che vogliamo minimizzare rispetto agli spin-orbitali è data da:

E = 〈Ψ0 |Hel |Ψ0〉 (2.3)

L’Hamiltoniano elettronico può essere scritto in forma semplificata:

Hel =n

∑i=1

−1

2∇

2i −

(N

∑J=1

ZJ

RJi

)+

12 ∑

i, j

1ri j

+ cost =n

∑i=1

hi +12 ∑

i, jgi j + cost (2.4)

45

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK 46

dove cost è il termine o i termini di repulsione nucleare (è una costante e non ha importanza), i vari hi sonoHamiltoniani mono-elettronici e rappresentano l’energia di un singolo elettrone nel campo generato dai varinuclei presenti nella molecola e gi j sono gli operatori bielettronici. L’energia che vogliamo minimizzare èquindi data data da:

E[Ψ0] =

⟨Ψ0

∣∣∣∣∣ n

∑i=1

hi +12 ∑

i, jgi j|Ψ0

⟩. (2.5)

In pratica vogliamo determinare il migliore set di spin-orbitali molecolari secondo la prescrizione delteorema variazionale. 1

L’energia (2.5) può essere riscritta in modo più comodo tenendo conto dell’espressione del determinantedi Slater che si ottiene utilizzando l’operatore di antisimmetrizzazione e le proprietà :

A A =√

n!A A H = HA (2.6)

E = 〈Ψ0 |Hel |Ψ0〉= 〈A Π |Hel |A Π〉= (2.7)√

n!〈Π |Hel |A Π〉= ∑p

(−1)p ⟨Π∣∣Hel |PΠ

⟩(2.8)

Per il termine monoelettronico hi sopravvive solamente la permutazione nulla

∑p

(−1)p ⟨Π∣∣hi|PΠ

⟩= 〈Π |hi|Π〉=

= 〈φ1(1)φ2(2) . . .φn(n)|hi|φ1(1)φ2(2) . . .φn(n)〉= 〈φ1(1)|φ1(1)〉 . . .〈φi(i)|hi|φi(i)〉 . . .〈φn(n)|φn(n)〉= 〈φi(i)|hi|φi(i)〉

Per il termine bielettronico solo l’identità e il termine Pi j danno un contributo non nullo:

∑p

(−1)p ⟨Π∣∣gi j|PΠ

⟩=⟨Π∣∣gi j|Π

⟩−⟨Π∣∣gi jPi j|Π

⟩il primo contributo è dato da⟨

Π∣∣gi j|Π

⟩= 〈φ1(1)φ2(2) . . .φn(n)|gi j|φ1(1)φ2(2) . . .φn(n)〉= 〈φ1(1)|φ1(1)〉 . . .〈φi(i)φ j( j)|gi j|φi(i)φ j( j)〉 . . .〈φn(n)|φn(n)〉= 〈φi(i)φ j( j)|gi j|φi(i)φ j( j)〉= Ji j

mentre il secondo è uguale, ma con lo scambio delle particelle:⟨Π∣∣gi jPi j|Π

⟩= 〈φ1(1)φ2(2) . . .φn(n)|gi j|φ1(1)φ2(2) . . .φn(n)〉= 〈φ1(1)|φ1(1)〉 . . .〈φi(i)φ j( j)|gi j|Pi jφi(i)φ j( j)〉 . . .〈φn(n)|φn(n)〉= 〈φi(i)φ j( j)|gi j|φi( j)φ j(i)〉= Ki j

L’energia da minimizzare è quindi data dalle espressioni seguenti:

1E’ importante notare che oltre a Born-Openheimer abbiamo introdotto una nuova approssimazione: l’approssimazione a singolaparticella cioè abbiamo implicitamente assunto che la funzione d’onda totale elettronica Ψ0 sia data da un prodotto di funzioni disingola particella (gli spin-orbitali molecolari) anche se opportunamente antisimmetrizzato (determinante di Slater).


E0[φi] =n

∑i=1

〈φi|h|φi〉+12 ∑

i, j(〈i j|i j〉−〈i j| ji〉) (2.9)

=n

∑i=1

〈φi|h|φi〉+12 ∑

i j〈i j||i j〉 (2.10)

=n

∑i=1

〈φi|h|φi〉+12 ∑

i j(Ji j −Ki j) (2.11)

=n

∑i=1

〈φi|h|φi〉+12 ∑

i j(〈φ j|Ji|φ j〉−〈φ j|Ki|φ j〉) (2.12)

dove gli operatori di Coulomb e di scambio sono definiti dalle loro operazioni sull’orbitale φ j

Jiφ j(2) =[∫

dx1φi(1)1

r12φi(1)

]φ j(2)

Kiφ j(2) =[∫

dx1φi(1)1

r12φ j(1)

]φi(2) (2.13)

Mentre il primo operatore non è altro che una moltiplicazione dell’orbitale con un’elemento di matrice,il secondo è un operatore molto più complesso che integra l’orbitale su cui opera (operatore non loca-le). Ripetiamo ancora una volta per chiarezza gli integrali bielettronici e la notazione ”fisica” compattacorrispondente:

〈φi(1)φ j(2)| 1r12

|φi(1)φ j(2)〉 =∫

φ∗i (1)φ ∗j (2)

1r12

φi(1)φ j(2)dx1dx2

=∫ |φi(1)φ j(2)|2

r12dx1dx2 = 〈i j|i j〉

〈φi(1)φ j(2)| 1r12

|φ j(1)φi(2)〉 =∫

φ∗i (1)φ ∗j (2)

1r12

φ j(1)φi(2)dx1dx2 = 〈i j| ji〉 (2.14)

Il primo è detto integrale di Coulomb, il secondo integrale di scambio.

Adesso dobbiamo trovare il minimo di questa espressione seguendo la variazione degli spinorbitali e quindidella funzione d’onda Ψ0 = Ψ0 +δΨ0. La Lagrangiana risultante è (eq. (1.62)):

L [φi] = E0[φi]−n

∑i

n

∑j

λi j (〈φi|φ j〉−δi j) (2.15)

dove λi j sono moltiplicatori di Lagrange. Variamo gli spin-orbitali di una quantità infinitesema φi →φi +δφi e imponiamo la condizione di stazionarietà della Lagrangiana:

δE0−∑i j

λi jδ 〈φi|φ j〉= 0 (2.16)

il primo termine risulta:

δE0 =n

∑i=1

(〈δφi|hi|φi〉+ 〈φi|hi|δφi〉)

+12 ∑

i, j(〈δφ j|Ji−Ki|φ j〉+ 〈φ j|Ji−Ki|δφ j〉+

+〈δφi|J j −K j|φi〉+ 〈φi|J j −K j|δφi〉) (2.17)


Il terzo e quinto termine sono uguali perché la somma è estesa su tutti gli indici i, j e così è anche per ilquarto e sesto. Riscriviamo l’espressione semplificando il fattore 1/2:

δE0 =n

∑i=1

(〈δφi|hi|φi〉+ 〈φi|hi|δφi〉)+∑i, j

(〈δφi|J j −K j|φi〉+ 〈φi|J j −K j|δφi〉) (2.18)

=n

∑i=1

(〈δφi|Fi|φi〉+ 〈φi|Fi|δφi〉) (2.19)

dove abbiamo definito l’operatore di Fock

Fi = hi +∑j(J j −K j)

che è un operatore mono-elettronico (apparentemente! bisogna sempre ricordarsi della non località di K)che descrive l’energia cinectica dell’elettrone, l’attrazione di tutti i nuclei su esso, e la repulsione versotutti gli altri elettroni. Da notare che l’operatore di Fock è associato ad una variazione dell’energia, manon all’energia stessa, infatti H non è la somma di operatori di Fock. La variazione della Lagrangiana èdiventata

δL =n

∑i=1

(〈δφi|Fi|φi〉+ 〈φi|Fi|δφi〉)−∑i j

λi j(〈δφi|φ j〉+ 〈φi|δφ j〉= 0

che, tenendo conto del fatto che 〈φ |δφ〉= 〈φ |δφ〉∗e che 〈φi|Fi|δφi〉= 〈δφi|Fi|φi〉∗, diventa

δL =n

∑i=1

〈δφi|Fi|φi〉−∑i j

λi j 〈δφi|φ j〉+n

∑i=1

〈φi|Fi|δφi〉−∑i j

λi j 〈φi|δφ j〉=

n

∑i=1

〈δφi|Fi|φi〉−∑i j

λi j 〈δφi|φ j〉+n

∑i=1

〈δφi|Fi|φi〉∗−∑i j

λi j 〈δφi|φ j〉∗

La variazione sia di 〈δφ | che di 〈δφ |∗ deve rendere δL = 0 e quindi sia i primi due termini che i secondidevono essere zero: prendendo la complessa coniugata dei due ultimi termini e sottraendoli ai primi due siottiene

∑i j

(λi j −λ∗ji)〈δφi|φ j〉= 0

il che significa che i moltiplicatori di Lagrange sono elementi di una matrice Hermitiana. Siamo arrivatiad una espressione matematica semplice della condizione che deve essere soddisfatta dagli spin-orbitaliperche’ diano una energia minima. Questa condizione e’ un’insieme di equazioni accoppiate integro-differenziali di Hartree-Fock:

Fφi(1) =n

∑j=1

λi jφ j(1) i = 1,2,3, ...n (2.20)

Malgrado nel membro di destra di (2.20) compaia una somma dei moltiplicatori di Lagrange è semprepossibile fare in modo che compaia un singolo autovalore (spin-orbitali in forma canonica) e le equazionidi HF prendono la forma:

Fφi(1) = εiφi(1) (2.21)

dove le energie εi possono essere considerate le energie dei vari spin-orbitali molecolari. Per esempio bastamodificare gli spin-orbitali ottenuti dalle eq. (2.20) attraverso una trasformazione unitaria: i moltiplicatoridi Lagrange che appaiono in (2.20) infatti sono elementi della matrice di Fock

〈φi|F |φ j〉= ∑k

λki 〈φi|φk〉= λi j

che, essendo una matrice hermitiana, è sempre possibile diagonalizzare con una trasformazione unitaria U:

ε = U†λU.


Esiste quindi un diverso set di spin-orbitali detti canonici che soddisfa le equazioni (2.21).

In generale ogni arbitraria trasformazione unitaria degli N orbitali ottenuti come soluzione delle equazionidi HF è perfettamente equivalente nel senso che non altera il determinante e quindi la sua energia. Tuttaviain generale gli orbitali trasformati pur soddisfacendo le (2.20) non diagonalizzano l’operatore di Fock. Leautofunzioni dell’operatore di Fock (orbitali canonici) sono speciali e vengono distinte da qualunque altroinsieme equivalente di orbitali.

Occorre inoltre notare che un operatore di Fock, come ogni altro hamiltoniano, ha uno spettro di soluzionicompleto (discreto se abbiamo elettroni legati ai nuclei). Le prime n soluzioni dell’eq. (2.21) sono gli spin-orbitali occupati, mentre i rimanenti vengono comunemente detti orbitali virtuali. Questo significa che nelcostruire F bisogna prendere quegli orbitali che compaiono nel determinante cioè gli orbitali occupati. Inrelazione all’osservazione fatta più sopra dovrebbe essere chiaro che, durante la soluzione delle equazionidi HF, le uniche variazioni orbitaliche significative (al fine di rendere stazionaria l’energia) sono quelle chemodificano gli orbitali occupati attraverso l’introduzione di componenti dello spazio degli orbitali virtuali.Infatti una combinazione lineare di orbitali occupati non altera l’energia ed quest’ultima non dipende dagliorbitali virtuali.

Le energie degli orbitali possono essere espresse in termini degli integrali di Coulomb e di scambio

εi = 〈φi| f |φi〉=

⟨φi

∣∣∣∣∣h+∑j(J j −K j)|φi

⟩= 〈φi|h|φi〉+∑

j(〈φi|J j|φi〉−〈φi|K j|φi〉)

= 〈i|h|i〉+∑j〈i j | |i j〉

questa espressione è leggermente diversa a seconda se l’orbitale i sia o meno occupato. Se φi è occupatoabbiamo

εi = 〈i|h|i〉+n

∑j 6=i〈i j | |i j〉 (2.22)

perché 〈ii||ii〉= 0. Un fatto molto importante è che la somma degli autovalori di Fock degli orbitali occupati(2.22) non è l’energia elettronica della molecola:

n

∑i

εi =n

∑i〈i|h|i〉+

n

∑i j, j 6=i

〈i j | |i j〉

dove invece l’energia ottenuta minimizzando la Langragiana è data dall’eq. (2.9), cioè da

Eo =n

∑i〈i|h|i〉+ 1

2 ∑i j〈i j | |i j〉 .

La ragione è che la somma degli autovalori conta l’interazione dell’elettrone i con l’elettrone j, ma anchequella dell’elettrone j con i. Cioé conta due volte l’energia di interazione tra gli elettroni. L’energia totalecorrettamente, invece, divide per due questi contributi. In realtà gli autovalori di Fock sono importantilo stesso perché, anche se non lo dimostriamo, quelli relativi ad orbitali occupati rappresentano anche seapprossimativamente il potenziale di ionizzazione dell’i-esimo elettrone, mentre quelli relativi ad orbitalivirtuali l’affinità elettronica.

2.1 Introduzione di una base atomica nel caso closed-shell: le equa-zioni di Roothaan.

Non è possibile risolvere direttamente le equazioni di HF nel caso di molecole. Un metodo numeri-co è stato proposto da Roothaan ed è ancora oggi quasi esclusivamente utilizzato. Il metodo prevede di


espandere ogni spin-orbitale molecolare su una base di funzioni atomiche centrate sui nuclei della mole-cola (LCAO). La trattazione non può più essere generale e cominceremo con vedere cosa succede in unamolecola con tutti gli spin appaiati cioè closed-shell (N elettroni). In una molecola closed-shell il numerodi spin α è uguale a quelli con spin β ed quindi è possibile considerare che ogni coppia di elettroni siadescritta dallo stesso orbitale spaziale e da diverse parti di spin. In pratica adesso possiamo occuparci solodella parte spaziale degli spin-orbitali. Un set ristretto di orbitali ha la forma

φi(x) =

ψi(r)α(ω)ψi(r)β (ω)

dove la parte spaziale ψ dello spin-orbitale è la stessa. L’equazione i-esima di HF è quindi data da

f (x1)ψi(r)α(ω1) = εiψi(r)α(ω1),

si assume che l’equivalente per spin β dia lo stesso autovalore. Se premoltiplichiamo per α∗(ω) e integria-mo sullo spin: ∫

α∗(ω1) f (x1)ψi(r)α(ω1)dω1 = εiψi(r)

∫α(ω1)α(ω1)dω1 = εiψi(r)

dove l’operatore di Fock adesso è solo un operatore nelle variabili spaziali e può essere espresso comesegue

f (r1)ψi(r1) =∫

α∗(ω1) f (x1)ψi(r1)α(ω1)dω1 =∫

α∗(ω1)

[h1 +

N

∑l(Jl −Kl)

]ψi(r1)α(ω1)dω1 =

∫α∗(ω1)h(1)ψi(r1)α(ω1)dω1+

N

∑l

(∫dω1α

∗(ω1)φ ∗l (x2)r−112 φl(x2)dx2ψi(r1)α(ω1)−

∫dω1α

∗(ω1)φ ∗l (x2)r−112 φl(x1)dx2ψi(r2)α(ω2)

)L’ultima espressione va valutata separatamente a seconda dello spin di φl(x2). La prima somma vale perspin α , la seconda per spin β :

f (r1)ψi(r1) = h(r1)+N/2

∑l spinα

[∫dω1dω2dr2α

∗(ω1)ψ∗l (r2)α∗(ω2)r−1

12 ψl(r2)α(ω2)ψi(r1)α(ω1)−

∫dω1dω2dr2α

∗(ω1)ψ∗l (r2)α∗(ω2)r−1

12 ψl(r1)α(ω1)ψi(r2)α(ω2)]+

N/2

∑l spinβ

[∫dω1dω2dr2α

∗(ω1)ψ∗l (r2)β ∗(ω2)r−1

12 ψl(r2)β (ω2)ψi(r1)α(ω1)−

∫dω1dω2dr2α

∗(ω1)ψ∗l (r2)β ∗(ω2)r−1

12 ψl(r1)β (ω1)ψi(r2)α(ω2)]

della seconda somma l’ultimo termine scompare durante l’integrazione in dω2 per l’ortonormalità dellefunzioni di spin. Quindi per ogni equazione di HF nel caso restricted abbiamo due contributi identici diCoulomb e uno solo di scambio per ogni coppia di elettroni. Per una molecola closed-shell l’espressionedell’operatore di Fock e dell’energia sono quindi:

f (r1) = h(r1)+n/2

∑a

(2Ja(1)−Ka(1)) (2.23)

E = 2n/2

∑a〈a|h|a〉+

n/2

∑a,b

[2〈ab|ab〉−〈ab|ba〉] = 2n/2

∑a

haa +n/2

∑a,b

[2Jab−Kab] (2.24)


dove Jab e Kab sono gli integrali di Coulomb e di scambio.

Nel metodo di Roothaan gli spin-orbitali molecolari sono espansi in un set di base atomico di M funzioniatomiche non ortonormali (LCAO):

ψi(r1) =M

∑µ=1

Cµiχµ (2.25)

Lo sviluppo qui sopra ha senso solo se il numero di funzioni di base impiegate è molto più grande del nu-mero di orbitali che dobbiamo determinare (orbitali occupati). Se così non fosse quell’espansione sarebbeuna combinazione linerare che lascia invariante l’energia del sistema. Sostituendo questa espressione nelleequazioni di HF si ottiene:

fM

∑ν=1

Cν iχν = εi

M

∑ν=1

Cν iχν (2.26)

premoltiplicando per χ∗µ e integrando si ottiene

M

∑ν=1

〈µ| f |ν〉Cν i = εi 〈µ|ν〉Cν i

cioè in forma matricialeFC = εSC (2.27)

dove S è la matrice di sovrapposizione e F quella di Fock. Le incognite sono i coefficienti cioè C.L’espressione degli elementi della matrice F in termini del set di base χµ è piuttosto complessa:

Fµν = Hcoreµν +

n/2

∑a

M

∑λσ

CλaC∗σa [2〈µν |σλ 〉−〈µν |λσ〉] (2.28)

dove

Hcoreµν = Tµν +V nucl

µν =∫

dr1χ∗µ(1)

(−1

2∇

21

)χν(1)+

∫dr1χµ(1)

[−

N

∑J=1

ZJ

RJ1

]χν(1) (2.29)

è il termine monoelettronico. L’espressione

Pσλ = 2n/2

∑a

C∗σaCλa (2.30)

è detta “density matrix”. In termini di matrice densità l’operatore di Fock risulta:

Fµν = Hcoreµν +

M

∑λσ

Pλσ

[〈µν |σλ 〉− 1

2〈µν |λσ〉

]= Hcore

µν +Gµν (2.31)

Problema: trovare l’espressione degli elementi della matrice di Fock.

Soluzione: l’operatore di Fock nella base orbitalica è dato da

〈φ j|F |φi〉 =

⟨φ j

∣∣∣∣∣h+n/2

∑a

(2Ja(1)−Ka(1)) |φi

⟩

=⟨φ j∣∣h|φi

⟩+

n/2

∑a

[2〈ia| ja〉−〈ia|a j〉] = hi j +Vi j

e soddisfa l’equazione seguente(hi j +Vi j) = δi jεi (2.32)


gli orbitali sono espansi nella base atomica

φi =M

∑µ

Cµiχµ , φ j =M

∑ν

Cν jχν φa =M

∑σ

Cσaχσ =M

∑λ

Cλaχλ

L’hamiltoniano bielettronico Vi j diventa

n/2

∑a

[2

⟨M

∑µ

Cµiχµ ·M

∑σ

Cσaχσ

∣∣∣∣∣ M

∑ν

Cν jχν ·M

∑λ

Cλaχλ

⟩−

⟨M

∑µ

Cµiχµ ·M

∑σ

Cσaχσ

∣∣∣∣∣ M

∑λ

Cλaχλ ·M

∑ν

Cν jχν

⟩]=

n/2

∑a

∑µνγλ

C∗µiC

∗γaCν jCλa [2〈µσ |νλ 〉−〈µσ |λν〉] = ∑

µν

C∗µiCν jVµν

dove

Vµν = ∑σλ

Pλσ

[〈µσ |νλ 〉− 1

2〈µσ |λν〉

], con Pλσ = 2

n/2

∑a

C∗σaCλa

abbiamo poi per l’hamiltoniano monoelettronico

hi j = ∑µν

C∗µiCν jhµν

infine dobbiamo anche esprimere il termine di destra di (2.32) in termini della base atomica

δi j = 〈i| j〉=

⟨M

∑µ

Cµiχµ

∣∣∣∣∣ M

∑ν

Cν jχν

⟩= ∑

µν

C∗µiSµνCν j

L’equazione (2.32) diventa quindi

∑µν

C∗µiCν jhµν +∑

µν

C∗µiCν jVµν = ∑

µν

(C∗µiSµνCν j)εi

∑µν

(C∗µiSµνCν j)εi−∑

µν

C∗µiCν jhµν − ∑

µν

C∗µiCν jVµν = 0

∑µν

Cµi[εiSµν −hµν −Vµν ]Cν j = 0

e quindi alla fine avremo∑ν

[hµν −Vµν − εiSµν ]Cν j = 0

che altro non è che F ·C =E ·S ·C.

Il problema contenuto nelle equazioni di HF-Roothan non è di banale soluzione perché l’operatore F (se-condo l’eq. (2.28)) dipende dagli stessi coefficienti che vogliamo trovare. Questo è la conseguenza delfatto che nelle equazioni di HF si volevano trovare gli spin-orbitali utilizzando un operatore che ne di-pende. Quindi il problema FC = εSC non e’ un “semplice” problema lineare, ma richiede una soluzioneiterativa tipica dei problemi non lineari. Inoltre anche assumendo di conoscere l’operatore di Fock (almenoall’inizio) e quindi di ridursi ad un problema lineare non e’ comunque semplice risolvere il problema ma-triciale FC = SCε; sarebbe molto più semplice risolvere un problema come quello che si ottiene nel casodi basi ortonormali:

FC = εC ,

ma questo vorrebbe dire ortogonalizzare la base di orbitali atomici χµ . Effettivamente questo è quello chesi fa in pratica. Si cerca cioè una matrice unitaria X tale che X†SX non solo sia diagonale, ma sia anchela matrice identità. Cioè si diagonalizza e si rinormalizza la matrice di sovraposizione S. Esistono diversimodi per farlo, uno molto comune è quello dell’ortogonalizzazione canonica: si cerca la matrice Xnellaforma

X = U · s−12

dove U è una matrice che diagonalizza S:U†SU = s


con s diagonale. Diagonalizzare (e rinormalizzare) S significa modificare gli spin-orbitali e quindi lamatrice C. La nuova matrice sarà data da C′ = X−1C. Sostituendo nelle equazioni (2.27) C = XC′

otteniamo:

FXC′ = SXC′ε

X†FXC′ = X†SXC′ε

cioe’ infineF′C′ = C′

ε.

Che è quello che volevamo. Lo schema di un calcolo HF-Roothan per una molecola closed-shell e’relativamente semplice:

1. Specificare la geometria molecolare e le cariche dei nuclei.

2. Calcolare Sµν , Hcoreµν e gli integrali (µν |λσ).

3. Diagonalizzare la matrice S ottenuta dai Sµν , ottenere s e U, e quindi X.

4. Effettuare una guess ragionevole per la matrice densità Pµν .

5. Calcolare il pezzo bielettronico di F cioè gli elementi Gµν a partire dalla matrice densità e dagliintegrali bielettronici.

6. Aggiungere ad Hcore la matrice G ottenendo quindi F.

7. Calcolare F nella base ortogonale F′ = X†FX.

8. Diagonalizzare F′ e quindi ottenere C′e gli autovalori ε .

9. Calcolare C = XC′.

10. Formare una nuova P con i coefficienti ottenuti.

11. Controllare se gli autovalori ε appena calcolati sono molto diversi da quelli precedenti. Se sì tornareal punto 5, se no terminare il programma.

Avendo definito un basis set χ j c’è bisogno di calcolare e conservare gli integrali mono e bielettronici chevengono calcolati all’inizio del calcolo HF. Gli integrali di sovrapposizione e quelli monoelettronici sonopochi e di facile gestione. Il problema leggermente più complicato è rappresentato da quelli bielettroniciinfatti se abbiamo K funzioni di base allora il numero di integrali sarà dell’ordine di K4/8. Alcuni peròsi annullano se le funzioni sono centrate su nuclei molto lontani. La “guess” più semplice che possiamoimmaginare per P è zero che corrisponde ad approssimare F con Hcore, ma di solito si preferisce una“guess” semiempirica di tipo Huckel.

2.2 Un-restricted Harteee-Fock

In maniera analoga a quanto visto per caso restricted , gli spin-orbitali vengono espressi come prodotti difunzioni di spin per orbitali spaziali: questa volta però le parti spaziali non sono le stesse, ma lasciamo chegli elettroni α e β siano descritti da orbitali diversi:

φi(x)

ψα

i (r)α(ω)ψ

β

i (r)β (ω)

da cui è possibile ricavare le espressioni delle equazioni di Fock esattamente nella stessa maniera che è stataseguita per il caso restricted. E’ comunque possibile costruire gli operatori di Fock in modo meno rigoroso


considerando la situazione delle occupazioni degli spin-orbitali. L’operatore di Fock f α(1) non è altro cheil campo medio subito da un elettrone di spin α: questo include l’hamiltoniano di singola particella h1, gliintegrali di Coulomb e di scambio con tutti gli altri Nα elettroni a spin α e gli integrali di Coulomb contutti gli altri Nβ elettroni a spin β (lo scambio si annulla con elettroni a spin opposto):

f α(1) = h1 +Nα

∑a

[Jαa (1)−Kα

a (1)]+Nβ

∑a

[Jβ

a (1)]

analogamente per simmetria si deve avere

f β (1) = h1 +Nβ

∑a

[Jβ

a (1)−Kβa (1)

]+

Nα

∑a

[Jαa (1)]

Le due equazioni non possono essere risolte indipendentemente perche’ sono accoppiate: per esempiof α dipende dagli orbitali occupati ψ

βa attraverso Jα

a .

In termini di integrali mono e bielettronici l’energia di un UHF è data dall’espressione seguente

E0 =Nα

∑a

hαaa +

Nβ

∑a

hβaa +

12

Nα

∑ab

(Jααab −Kαα

ab )+12

Nβ

∑ab

(Jββ

ab −Kββ

ab )+Nα

∑a

Nβ

∑b

Jαβ

ab

L’introduzione di una base atomica per ottenere la trasformazione da equazioni integro-differenziali inequazioni matriciali da risolvere iterativamente si ottiene analogamente al caso restricted e le equazioniche si ottengono vengono dette di Pople-Nesbet:

Fα Cα = SCαε

α

Fβ Cβ = SCβε

β

dove i coefficienti della base sono adesso distinti per spin. Le matrici di Fock hanno espressioni analoghea quelle del caso restricted, ma la parte di scambio è diversa.

Benché il caso UHF sia utilizzato in pratica ha un grave difetto: i suoi determinanti non sono autofunzioni diS2 e questo può rappresentare un problema piuttosto serio quando si utilizzano le soluzioni (MO) Hartree-Fock per calcoli più sofisticati.

2.3 I Basis Set

2.3.1 Slater e Gaussian type functions (GTO)

Storicamente, il calcolo quanto-meccanico dell’energia elettronica delle molecole è stato quasi semprefatto usando l’approssimazione LCAO-MO (Linear Combination of Atomic Orbitals - Molecular Orbi-tals). Come abbiamo visto gli orbitali molecolari vengono costruiti come combinazione lineare di orbitaliatomici:

φi =M

∑µ=1

Cµiχµ

dove φi è l’i-esimo orbitale molecolare, Cµi sono i coefficienti della combinazione lineare, χµ è il µ-esimoorbitale atomico e M è il numero totale di orbitali atomici di base utilizzati.

Rigorosamente parlando, gli orbitali atomici sarebbero la soluzione dell’equazione di Hartree-Fock per unatomo, cioè una funzione d’onda monoelettronica atomica. Qualunque altra funzione non è un orbitale ato-mico propriamente detto. Alcune funzioni sono tuttavia molto simili e la terminologia è piuttosto confusa ariguardo. Ora come ora il termine orbitale atomico è stato quasi interamente sostituito da funzione di baseo contrazione.


Fino a non molto tempo fa, i cosidetti Orbitali di Slater (STO - Slater Type Orbital) venivano utilizzatiperché erano molto simili alle soluzioni degli atomi idrogenoidi. Questo tipo di orbitali sono descritti dauna funzione che dipende da coordinate sferiche e da 3 “numeri quantici”:

χi(ξ ,n, l,m|r,θ ,φ) = Nrn−1e−ξ rYlm(θ ,φ)

dove N è un fattore di normalizzazione e ξ viene detto esponente. Le r, θ , e φ sono coordinate sferiche, eYl,m è un’armonica sferica. I numeri n, l, e m sono numeri quantici analoghi a quelli idrogenoidi.

Sfortunatamente, funzioni come queste non sono facilmente utilizzabili nei calcoli degli integrali bielettro-nici che devono essere necessariamente veloci. Questo è il motivo per cui, storicamente, vennero introdottele funzioni gaussiane o GTO (Gaussian Type Orbitals). E’ infatti possibile approssimare una funzionedi tipo STO combinando linearmente alcune gaussiane. Anche se la procedura richiede 5 o 6 gaussiane ilcalcolo di un integrale bielettronico risulta più rapido con le funzioni GTO. I GTO possono essere espressidalla seguente formula generale:

g(ζ , lx, ly, lz|x,y,z) = Ne−ζ r2xlx ylyzlz

o ancheg(ζ , l,m,n|r,θ ,φ) = Nr(2n−2−l)e−ζ r2

Ylm(θ ,φ)

dove N è una costante di normalizzazione, ζ è l’esponente, x, y, e z sono coordinate cartesiane centrate sulnucleo. I numeri interi lx, ly, e lz non sono numeri quantici, ma semplici potenze delle coordinate carte-siane dal momento che queste funzioni non sono orbitali atomici. Questi sono alcuni esempi di funzionigaussiane:

1s = Ne−αr2

2px = Ne−αr2x

2py = Ne−αr2y

2pz = Ne−αr2z

3dxx = Ne−αr2x2

3dxz = Ne−αr2xz

...

4 fxxx = Ne−αr2x3

4 fxyz = Ne−αr2xyz

...

La somma delle potenze delle coordinate cartesiane L = lx + ly + lz viene usata analogamente al numeroquantico di momento angolare per gli atomi in modo da contraddistinguere le funzioni per shell: funzionis (L = 0), p (L = 1), d (L = 2), f (L = 3), ecc.

C’è un problema per quanto riguarda le funzioni di tipo d e quelle corrispondenti a valori di L più alti:esistono 5 orbitali linearmente indipendenti e ortogonali, ma ci sono 6 gaussiane possibili (le terne dinumeri lx, ly, lz sarebbero: 2,0,0 o 0,2,0 o 0,0,2 e 1,1,0 o 0,1,1 o 1,0,1). Se le usiamo tutte e 6 in realtàstiamo utilizzando anche un orbitale STO di tipo 3s, infatti:

3dxx(2,0,0)+3dyy(0,2,0)+3dzz(0,0,2) = N(x2 + y2 + z2)e−αr2= Nr2eαr2

Per quanto riguarda le funzioni di tipo f , abbiamo 10 possibili gaussiane, ma solo 7 orbitali. Le gaussianeintroducono gli orbitali 4px, 4pye 4pz. Questo effetto si chiama contaminazione. Quasi tutti i metodiab-initio sono variazioni più o meno complesse del metodo variazionale lineare. La contaminazione non èquindi un problema visto che la base in questi metodi è arbitraria. In generale sarebbe meglio eliminare icontaminanti da un set di base per diminuire la dipendenza lineare delle funzioni di base.


La funzioni gaussiane non sono delle buone funzioni di base per gli orbitali atomici e molecolari. Ladipendenza da r2 all’esponente infatti rende le GTO inferiori allo STO sotto due punti di vista: sul nucleouna GTO ha derivata prima uguale a zero, mentre uno STO ha la tipica ”cuspide”; inoltre una o in generaledecresce troppo velocemente con la distanza dal nucleo rispetto alla vera densità elettronica. Sia gli STOche i GTO possono essere utilizzati come base per calcoli variazionali, ma ovviamente ci vorranno moltipiù GTO per ottenere una data accuratezza rispetto al numero di STO. Tuttavia la facilità e velocità con cuisi possono valutare gli integrali utilizzando GTO rende questi ultimi più convenienti computazionalmente.

2.3.2 Classificazione dei set di base

I set di base che contengono il più piccolo numero di GTO sono detti basi minimali. Per l’idrogeno el’elio questo significa utilizzare solo una funzione 1s, per gli elementi del primo periodo due funzioni s(1s e 2s) e un set di funzioni di p. Anche se litio e berillio formalmente richiedono solo due funzioni ssi è soliti utilizzare anche il set p(ibridizzazione). Il miglioramento successivo è quello di raddoppiare ilnumero di funzioni producendo un basis set double zeta (DZ). Una base DZ quindi impiega due funzionis per idrogeno ed elio, 4 funzioni s(1s, 1s′, 2s, 2s′) e due set di funzioni p per gli elementi del primoperiodo. L’importanza della presenza delle funzioni aggiuntive in un set DZ rispetto al basis set minimalepuò essere illustrata considerando la molecola HCN. Il legame C-H consiste prevalentemente dell’orbitales dell’idrogeno e dell’orbitale pz del carbonio. Il legame π tra carbonio e azoto d’altro canto consiste nelmescolamento degli orbitali px (o py) dei due atomi pesanti ed ha una distribuzione di carica molto piùdiffusa. L’esponente ottimale per l’orbitale p del carbonio sarebbe quindi più piccolo nella direzione x chein quella z. Un set di base minimale ha una sola funzione p e quindi un solo esponente e sarebbe possibilesolo un compromesso, mentre un set di base DZ ha due orbitali p e quindi due esponenti: la funzione piùcontratta andrà principalmente nella combinazione del legame σ C-H, mentre la funzione più diffusa andràa contribuire al legame π C-N. Raddoppiare il numero di funzioni di base quindi permette una descrizionemigliore del fatto che in una molecola la densità di carica è differente in direzioni diverse. I legami chimicicoinvolgono prevalentemente orbitali atomici di valenza. Raddoppiare le funzioni 1s su un atomo del primoo secondo periodo come il carbonio permette una descrizione più accurata degli elettroni di core che peròsono piuttosto insensibili all’intorno chimico dell’atomo. Una variazione del set minimale che raddoppiail numero di funzioni di valenza è detto split valence double zeta. In realtà i set di base split valencesono diffusissimi in quanto si rivela del tutto inutile raddoppiare le funzioni degli orbitali di core. L’ovviostep successivo è quello di creare un set di base triple zeta (TZ) triplicando le funzioni di base di un setminimale. Anche in questo caso è più comune triplicare solo le funzioni di valenza.

E’ ovviamente possibile creare dei set di base che includano delle funzioni di base dette polarizzazioniche vanno oltre la shell di valenza. Queste funzioni servono a fornire al set di base una certa flessibilitàangolare per formare orbitali molecolari migliori. Le funzioni di polarizzazione hanno il valore del mo-mento angolare più alto di una unità rispetto alla shell di valenza: includono per esempio funzioni di tipop per idrogeno ed elio e di tipo d per gli elementi del secondo periodo. In generale le funzioni di pola-rizzazione vengono aggiunte non contratte. Le funzioni di polarizzazione hanno esponenti tali da averecome estensione radiale quella della shell di valenza. Le funzioni di polarizzazione non sono quindi unadescrizione degli orbitali con momento angolare più alto perché questi ultimi sarebbero molto più diffusi diquanto siano le funzioni di polarizzazione. La polarizzazione è assolutamente necessaria quando vengonoutilizzati metodi di calcolo altamente correlati (post-HF). Le polarizzazioni vengono aggiunte ai set di basecome il DZ creando i set di base polarizzato come il DZP (double zeta plus polarization).

Esiste un ulteriore modo di migliorare i set di base (per esempio se si vogliono descrivere anioni) checonsiste nell’aggiungere funzioni molto diffuse ad un set già polarizzato. Questi set di base sono dettiaumentati. Gli esponenti di tali funzioni vengono di solito determinati ricostruendo le affinità elettronichesperimentali degli atomi (infatti non esistono basi aumentate per gli alcalini).

Una domanda spontanea a questo punto è: come vengono determinati gli esponenti delle funzioni gaus-siane? Gli esponenti delle funzioni s e p vengono di solito determinati con calcoli variazionali tipo HF(più complessi di un calcolo HF come quello illustrato precedentemente dove venivano ottimizzati solo


i coefficienti). Questa procedura non può essere utilizzata per determinare gli esponenti delle funzionidi polarizzazione. Tali esponenti possono venire infatti determinati con calcoli variazionali su piccolemolecole.

2.3.3 Basis set contratti

Uno degli svantaggi di tutti i basis set ottimizzati energeticamente è il fatto che dipendono fortemente dallaregione interna della funzione d’onda: gli elettroni 1s infatti hanno energie molto grandi e minimizzarel’energia tenderà a rendere ottimale il basis set per gli elettroni di core e meno ottimale per quelli divalenza. Il problema è che le proprietà chimiche dipendono dagli elettroni di valenza e non da quelli dicore. Inoltre alcune proprietà chimicamente rilevanti come la polarizzabilità dipendono dalla parte diffusadella densità di carica che è energeticamente irrilevante. Un set di base con una buona descrizione dellaporzione esterna della funzione d’onda deve essere molto grande e questo non è certamente un criterioefficiente per la costruzione di set di base.

Il fatto che molte funzioni di base finiscano per descrivere gli elettroni di core che risultano energeticamen-te dominanti, ma chimicamente irrilevanti, è il motivo dell’esistenza dei set di base contratti. Prendiamoad esempio un set di base di 10 funzioni s e qualche funzione p per il carbonio. Ottimizzando tale setdi base energeticamente si otterrebbe che almeno 6 delle funzioni s vanno a descrivere gli elettroni 1s ealtre due descrivono la parte interna dell’orbitale 2s. Solo due funzioni s rimangono a descrivere la partechimicamente rilevante della funzione d’onda. Dato che gli orbitali di core cambiano molto poco al cam-biare dell’intorno chimico dell’atomo anche i coefficienti della loro combinazioni lineari sono pressochéinsensibili al resto della molecola (i MO risultanti sarebbero localizzati solo un atomo della molecola e laloro forma ricorderebbe molto quella di un piccolo guscio sferico). Quello che si ottiene in questo modo èche lo sforzo computazionale di ottimizzazione viene speso per ottimizzare una parte della funzione d’ondachimicamente inutile e che risulta praticamente costante.

Dato che gli orbitali interni di un atomo richiedo più o meno sempre le stesse combinazioni di GTO erisultano sostanzialmente indipendenti dall’intorno molecolare è possibile fissare i coefficienti della com-binazione una volta per tutte ed usare tale combinazione come funzione di base. Questo meccanismoè alla base della creazione dei set di base contratti: nel nostro esempio sarebbe infatti possibile fissare icoefficienti di mescolamento dei primi 6 GTO e delle due coppie seguenti ottenendo 3 funzioni di base da10 (ecco perché si parla di contrazione) a scapito della flessibilità, ma come si è poi visto senza perderetroppo in accuratezza e sicuramente guadagnando in efficienza. La combinazione di più GTO, dette in que-sto caso primitive gaussiane (PGTO), in piccole combinazioni è detta contrazione e le funzioni risultatosono dette contracted GTO (CGTO). Nel caso di set di base contratti la notazione precedente (DZ, TZ,ecc.) si riferisce al numero di CGTO. La contrazione serve sopratutto a descrivere gli elettroni di core peri quali sono necessarie molte PGTO che servono a riprodurre la condizione di ”cuspide” sul nucleo. Perspecificare la contrazione si usa la seguente (ovvia) notazione

(10s4p1d)→ [3s2p1d]

Esistono due modi per contrarre un determinato set di base, e si parla quindi di segmented o generalcontraction. La contrazione del primo tipo è quella utilizzata nell’esempio precedente: un dato set diPGTO viene partizionato in set più piccoli di funzioni che sono poi combinate in CGTO attraverso deicoefficienti opportuni. Un set di base 10s viene contratto 3s prendendo 6 funzioni interne per una CGTO,le seguenti 3 per la seconda CGTO e l’ultima rimanente come l’ultima CGTO

χCGTO1 =

6

∑i=1

aiχPGTOi

χCGTO2 =

9

∑i=7

aiχPGTOi

χCGTO3 = χ

PGTO10


In una contrazione di tipo generale invece tutte le PGTO di un determinato momento angolare sonoutilizzate a formare la CGTO con coefficienti diversi

χCGTO1 =

10

∑i=1

aiχPGTOi

χCGTO2 =

10

∑i=1

biχPGTOi

χCGTO3 =

10

∑i=1

ciχPGTOi

2.3.4 Basi comuni

Basi di Pople

• STO-nG

Sono costruite con Slater Type Orbitals a loro volta costituiti da n PGTO combinate insieme. Sonobasi minimali dove gli esponenti delle PGTO sono determinate fittando la loro combinazione alrelativo STO piuttosto che ottimizzando l’energia dell’atomo. Vengo utilizzate le basi con n = 2 o 3anche se esistono basi con n fino a 6. La base STO-3G è la base minimale più utilizzata.

• k−nlmG

Questo tipo di base sono di tipo split-valence dove il k iniziale indica il numero di PGTO utilizzate pergli orbitali di core. Il gruppo nlm dopo il trattino indica sia in quante funzioni sono divisi gli orbitalidi valenza sia quante PGTO sono utilizzate per la loro rappresentazione. Eventuali polarizzazionisono indicate dopo la G. In questo tipo di basi gli esponenti delle funzioni s sono uguali a quelli dellefunzioni p e sono determinati variazionalmente.

– 3− 21G: questo è un set di base in cui gli orbitali di core sono una contrazione di 3 PGTO ela parte interna di valenza è costituita da due PGTO e quella esterna da una sola PGTO. Peril carbonio la contrazione sarebbe (6s3p)→ [3s2p]. Questa base contiene lo stesso numero diPGTO della STO-3G, ma ha il doppio di funzioni di valenza.

– 6− 31G: anche questo è uno split valence dove gli elettroni di core sono una contrazione di6 PGTO, la valenza è rappresentata da una contrazione di 3 e di 1 PGTO. Per il carbonio lacontrazione sarebbe (10s4p)→ [3s2p].

Ad ognuno di questi possono essere aggiunte funzioni di polarizzazione o diffuse. Le funzioni diffusesono di tipo s o p e vengono indicate da un + o un ++. Il primo sta ad indicare delle funzionidiffuse sugli atomi pesanti, il secondo l’aggiunta di una diffusa anche per l’idrogeno. Le funzioni dipolarizzazione sono invece indicate dopo la G con designazioni diverse a seconda se siano aggiunteagli atomi pesanti o all’idrogeno. Il set di base 6− 31 + G(d) è uno split valence con un set didiffuse sp sugli atomi pesanti una singola polarizzazione d sugli stessi. Un set di base 6− 311 ++G(2d f ,2pd) è un set split valence con funzioni diffuse addizionali sugli atomi pesanti e sugliidrogeni e con funzioni polarizzanti di tipo d e f sugli atomi pesanti e p e d sull’idrogeno. DAnotare che esiste una seconda notazione che usa il simbolo ∗: per cui la notazione 6−31G∗ indica ilset 6−31G(d).

Basi correlation consistent

Un’intera serie di set di base tra le più utilizzate per calcoli molto accurati riassume tutte queste caratteristi-che ed è la cosidetta correlation consistent (cc) inventati da Dunning. Sono ottenuti tentando di recuperarel’energia di correlazione degli elettroni di valenza e sono molto utilizzati per calcoli su molecole piccole. Il


nome deriva dal fatto che le basi sono disegnate in modo che le funzioni che contribuiscono similmente allacorrelazione sono introdotte allo stesso stadio indipendentemente dal tipo di funzione. L’introduzione delleprime funzioni d provoca un notevole abbassamento dell’energia, ma il contributo delle seconde funzionid è simile a quello delle prime f . L’aggiunta delle polarizzazioni viene quindi fatta nel seguente modo: 1d,2d1 f , 3d2 f 1g ecc.

Esistono diverse basi cc che usano la notazione tradizionale: cc− pV DZ, cc− pV T Z, cc− pV QZ, cc−pV 5Z. La loro composizione è data nella tabella seguente.

Base PGTO(atom/H) CGTO(atom/H)cc-pVDZ 9s,4p,1d/4s,1p 3s,2p,1d/2s,1pcc-pVTZ 10s,5p,2d,1f/5s,2p,1d 4s,3p,2d,1f/3s,2p,1dcc-pVQZ 12s,6p,3d,2f,1g/6s,3p,2d,1f 5s,4p,3d,2f,1g/4s,3p,2d,1fcc-pV5Z 14s,9p,4d,3f,2g,1h/8s,4p,3d,2f,1g 6s,5p,4d,3f,2g,1h/5s,4p,3d,2f,1gcc-pV6Z 16s,10p,5d,4f,3g,2h,1i/10s,5p,4d,3f,2g,1h 7s,6p,5d,4f,3g,2h,1i/6s,5p,4d,3f,2g,1h

Tabella 2.1: Basi correlation consistent

Questi set di base possono essere aumentati da funzioni diffuse e in questo caso prendono il suffisso aug. Ilvantaggio principale di questi set di base è quello di poter generare una serie di calcoli sempre più accuratiche convergono verso il cosidetto limite della base (basis set limit).

BASIS="cc-pVTZ"

H 0

S 3 1.00

33.8700000 0.606800000E-02

5.09500000 0.453080000E-01

1.15900000 0.202822000

S 1 1.00

0.325800000 1.00000000

S 1 1.00

0.102700000 1.00000000

P 1 1.00

1.40700000 1.00000000

P 1 1.00

0.388000000 1.00000000

D 1 1.00

1.05700000 1.00000000


BASIS="aug-cc-pVTZ"

H 0

S 3 1.00

33.8700000 0.606800000E-02

5.09500000 0.453080000E-01

1.15900000 0.202822000

S 1 1.00

0.325800000 1.00000000

S 1 1.00

0.102700000 1.00000000

P 1 1.00

1.40700000 1.00000000

P 1 1.00

0.388000000 1.00000000

D 1 1.00

1.05700000 1.00000000

S 1 1.00

0.252600000E-01 1.00000000

P 1 1.00

0.102000000 1.00000000

D 1 1.00

0.247000000 1.00000000

2.4 Orbitali molecolari

Gli orbitali molecolari vengono creati combinando orbitali atomici (nella forma di CGTO come abbiamovisto). Tradizionalmente gli orbitali vengono distinti in orbitali di core e di valenza. Gli orbitali di corenon hanno molta importanza per la formazione dei legami chimici perché derivano sostanzialmente dallacombinazione degli orbitali atomici più interni che, a distanze nucleari non troppo piccole non hannopraticamente sovrapposizione. Gli orbitali di valenza sono invece i principali responsabili del legamechimico e delle sue proprietà. La loro struttura è determinata dalle forze elettrostatiche interagenti tra gliatomi e quindi dipende dalle distanze interatomiche. A grandi distanze la loro struttura è sostanzialmentequella degli orbitali atomici di partenza.

In una molecola biatomica o lineare esistono diversi tipi di orbitali. La caratteristica importante delle mo-lecole biatomiche è la presenza di una chiara simmetria assiale cioé la molecola appartiene al gruppo disimmetria C∞v o D∞h (nel caso sia simmetrica rispetto al piano ortogonale all’asse di legame: per esempioCO2). Questo è semplicemente dovuto al fatto che il potenziale elettrostatico che compare nell’Hamilto-niana di una molecola lineare è invariante per rotazioni attorno all’asse di legame. Una regola della m.q.ci assicura che le operazioni di rotazione sono “generate” dai momenti angolari nella forma di operatoriesponenziali. Nel caso specifico, la rotazione di un angolo δφ attorno all’asse di legame Czδφ è data dalmomento angolare Lz dove z è l’asse di legame

Czδφ = eiδφ

h Lz

Abbiamo detto che l’Hamiltoniano è invariante per rotazioni attorno all’asse z, quindi comuta con Czδφ , diconseguenza commuta anche con Lz. Un orbitale molecolare sarà quindi descritto, oltre che da un’energia,anche dal n.q. m autovalore di Lz

LzΨMO =−ih∂

∂φΨMO = hmΨMO

Inoltre dato che l’energia dell’orbitale dipende dal quadrato del momento angolare le coppie di orbitali conm =±1 o ±2 ecc. sono doppiamente degeneri. Il valore assoluto di m in genere è detto λ : gli orbitali conλ = 0 sono gli orbitali σ , quelli con λ = 1 gli orbitali π , con λ = 2 δ .

In molecole di tipo D∞h si ha un centro di simmetria aggiuntivo e ogni orbitale molecolare viene anchedistinto per la sua simmetria rispetto al piano perpendicolare all’asse molecolare. Si usano i simboli g(gerade) per gli orbitali pari rispetto alla riflessione e u (ungerade) per quelli dispari.


Prendiamo la molecola più semplice di tutte, H2 e vediamone gli orbitali molecolari che otteniamo da unaminimale fatta di due funzioni 1s. In Figura 2.1 i due orbitali legante (σg o ψ−) sono riportati in terminidegli orbitali di partenza e di densità. Come è noto si hanno due orbitali molecolari di diversa energia cheschemticamente possono essere visti come in

Figura 2.1: In alto a sinistra: Combinazione legante di due orbitali 1s; in alto a destra: combinazioneantilegante. In basso a sinistra: densità risultante per l’orbitale molecolare σg; in basso a destra: densitàrisultante per l’orbitale σu

Come è noto si ottengono due orbitali molecolari di diversa energia che schematicamente possono esserevisti come in 2.2.


Figura 2.2: In alto a sinistra: Schema degli orbitali molecolari in H2; in alto a destra: andamento energe-tico dei due autovalori degli orbitali al variare della distanza internucleare. In basso a sinistra: superficieisodensità per l’orbitale molecolare σg; in basso a destra: superficie isodensità risultante per l’orbitale σu

In altre molecole omonucleari o utilizzando basi più grandi che includano anche orbitali p si avrebbe lapossibilità di avere orbitali σ o π dovuti a questi orbitali. I superfici di isodensità sono riportate in 2.3.


Figura 2.3: In alto: superficie isodensità della combinazione legante(sinistra) e antilegante (destra) di dueorbitali pz. In basso: superficie isodensità della combinazione legante(sinistra) e antilegante (destra) di dueorbitali px.

Capitolo 3

Energie elettroniche: metodi postHartee-Fock

Il metodo Hartree-Fock fornisce la più semplice approssimazione variazionale alla funzione d’onda di unostato stazionario e corrisponde al minimo sviluppo della funzione d’onda dotato di senso fisico: un singolodeterminante di Slater. Sfortunatamente, come visto in precedenza, nella maggior parte delle situazionidi interesse chimico (rottura e formazione di legami) il modello di HF è completamente inadeguato.

Una prima macroscopica manifestazione dell’errore insito nel modello RHF emerge nella descrizione delladissociazione della più semplice molecola biatomica: H2. Nell’intorno della distanza internucleare di equi-librio, la funzione d’onda elettronica dello stato fondamentale è ben descritta dalla configurazione restrictedHF 1σ2

g . È evidente a priori, tuttavia, che questo modello non può essere corretto per qualsiasi valore delladistanza R fra i due nuclei: man mano che quest’ultima aumenta, la funzione d’onda deve, con continuità,gradualmente trasformarsi in quella asintotica che, rimanendo in un modello mono-configurazionale, deveessere del tipo 1s1

A · 1s1B con spin opposti a dare S = s1 + s2 = 0. Una configurazione con un solo orbi-

tale doppiamente occupato non può mai evidentemente trasformarsi in questa, divenendo, al più, del tipo1s2

A ·1s0B e cioè corrispondente ad una dissociazione ionica H+ e H−. Questo succede perché nella rappre-

sentazione RHF i due elettroni devono avere la stessa parte spaziale. Il risultato di questo errore qualitativoè una energia di dissociazione più che doppia di quella reale (oltre 10 eV contro 4.75 eV). Vale la pena diosservare che nell’esempio precedente la deficienza qualitativa del modello a particelle indipendenti nonè assoluta ma va in pratica interamente attribuita al modo in cui nel metodo RHF si separa il problema dispin da quello spaziale, imponendo l’uso di orbitali doppiamente occupati. Un modello a spin non ristretti(UHF) descrive almeno al livello qualitativo correttamente la dissociazione di H2. Questa osservazionemette in evidenza, in generale, una certa ambiguità nella definizione di errore di correlazione, la cui entitàe natura fisica viene a dipendere dal particolare modello Hartree-Fock cui ci si riferisce. La differenza(teorica) fra l’energia esatta non-relativistica di un sistema elettronico e quella HF viene definita energiadi correlazione elettronica, e tutti i fenomeni e le alterazioni del valore di osservabili che possono essereriprodotti solo da funzioni d’onda più accurate di quella HF vengono detti effetti di correlazione.

Il metodo di gran lunga più usato per trattare effetti di correlazione elettronica è anche quello teoricamentepiù semplice ed intuitivo, e cioè l’interazione di configurazione (CI, configuration interaction). Dal puntodi vista strettamente teorico formale ben poco c’è da aggiungere, e lo faremo fra poco, all’analisi di questometodo che già abbiamo sostanzialmente discusso: dato un insieme di orbitali (quale, ad esempio e cometipicamente accade, quello generato da un calcolo HF) si tratta di costruire la matrice dell’hamiltonianoin uno spazio più grande possibile di determinanti e di calcolarne uno o più autovalori ed autovettori. Etuttavia l’interazione di configurazione è il metodo che è stato oggetto, nel corso degli anni, di forse ilmaggior numero di studi pubblicati in chimica teorica, rivolti allo sviluppo di sempre nuove e più efficientitecniche computazionali.

Come vedremo più sotto per mezzo di alcuni esempi, fare un calcolo CI è semplicemente fuori discussione

64

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK 65

per la maggior parte dei sistemi a molti elettroni a prescindere da qualsiasi prevedibile sviluppo nelletecniche computazionali e nella potenza dei calcolatori. Sono stati quindi inventati altri metodi oltre CI percercare di “aggiungere” la correlazione elettronica ad HF:

• metodi variazionali basati su approssimazioni a CI come MCSCF (multi configurational self consi-sten field) e MRCI (multi reference CI);

• metodi basati sulla teoria delle perturbazioni a molti corpi (MBPT o MP2/4)

• metodi basati sul funzionale della densità (DFT)

In questa sede ci limiteremo ad accennare le tecniche basate sui metodi Full-CI, MCSCF e MBPT.

3.1 Energia di correlazione

La correlazione dinamica è quel contributo energetico strettamente attribuibile all’effettiva interazioneistantanea fra coppie di elettroni, cioè quella parte intrinsecamente trascurata in qualsiasi modello a parti-celle indipendenti. La correlazione dinamica rappresenta un vero problema: essa può essere rappresentatasolo considerando l’effetto combinato di un numero generalmente grandissimo di determinanti, non indi-viduabili a priori e i cui pesi sono tutti confrontabilmente importanti. L’esperienza indica indubbiamenteche la correlazione converge molto lentamente con il numero di configurazioni incluse.

Riprendiamo in esame il semplice esempio della dissociazione di H2. Sebbene il processo di dissociazione(cioè la curva di energia elettronica) sia disastrosamente descritto a livello RHF, l’energia di dissociazionepuò nondimeno essere ragionevolmente calcolata con questo metodo: basta sottrarre al doppio dell’energiadi un atomo di idrogeno (nota esattamente) l’energia RHF dello stato fondamentale di H2 alla distanza diequilibrio, dove la descrizione RHF è almeno qualitativamente corretta. Si ottiene in questo modo un valorecon un errore di circa il 10%. Questo errore è dunque dovuto alla correlazione dinamica. È ragionevole sup-porre che il contributo di energia di correlazione dinamica sia (molto approssimativamente) proporzionaleal numero di coppie di elettroni nel sistema. È comunque chiaro che, in sistemi più grandi, con più elettronidi valenza, l’errore assoluto nelle energie di dissociazione dovuto alla correlazione dinamica è destinato adaumentare. Naturalmente, non solo le energie ma anche tutte le altre osservabili calcolate teoricamente so-no affette dall’errore di correlazione. È facile immaginare quanto sia importante essere in grado di stimarea priori, se non l’entità, se non altro il segno delle correzioni di correlazione. Questo è tutt’altro che facilein generale. Parlando ad esempio di differenze di energia, occorre poter stimare la variazione di energiadi correlazione fra gli estremi della transizione considerata (sia essa fra due stati elettronici distinti o frapunti diversi della stessa superficie di energia elettronica). Ancora più complessa è l’analisi di proprietàelettriche o magnetiche che dipendano dalla effettiva distribuzione di densità elettronica (ad esempio, ilmomento di dipolo).

In termini più formali l’energia di correlazione è definita come

Ecorr = E0−EHF (3.1)

cioé come la differenza tra l’energia ”esatta” di un sistema polielettronico e l’energia HF ottenuta nel limitedi una base monoelettronica completa. Quando, come in pratica, il calcolo HF viene fatto in una baseincompleta si determina l’energia di correlazione per quella base monoelettronica (basis set correlationenergy). L’energia di correlazione come abbiamo detto è dovuta alle interazioni tra gli elettroni e quindici si potrebbe aspettare che questa energia diminuisca all’aumentare della distanza tra i nuclei visto che ilnumero di ”coppie” elettroniche interagenti diminuisce quando le molecole si frammentano. Quello chesuccede è esattamente l’opposto come testimoniato dalla seguente tabella calcolata per la molecola di H2Onella base DZ.


Geometry Ecorr(u.a.)Req -0.14

1.5 ·Req -0.212.5 ·Req -0.31

Questo succede perché la definizione (3.1) non include il contributo dovuto alla cosidetta correlazione didegenerazione o correlazione non-dinamica. Questo tipo di errore di correlazione si manifesta quandouna sola configurazione elettronica (determinante) non è più dominante, ma lo stato elettronico realisticosarebbe dato da una somma di determinanti di Slater con una differente occupazioni degli orbitali (nediscutiamo più lungamente in Sezione 3.2.5).

Cercando di fare un po’ di chiarezza potremmo dire che quando sono coinvolte rotture di legame e sta-ti eccitati, la correlazione non-dinamica può essere ottenuta aggiungendo alla configurazione dominantequalche configurazione aggiuntiva (come vedremo questo è quello che fa MCSCF). Questa correlazione èdovuta ad artefatti del modello monodeterminatale di HF. L’altro tipo di correlazione (quella dinamica) èdovuta alle interazioni elettroniche e si può calcolare includendo un numero molto grande di configurazionielettroniche aggiuntive.

3.2 Metodi Variazionali

L’idea dei metodi variazionali post-HF o di tipo CI è molto semplice: diagonalizzare l’Hamiltoniano N-elettronico in una base di funzioni N-elettroniche (determinanti di Slater). In altre parole, non limitarsia trovare un solo determinante, ma rappresentare la funzione d’onda come combinazione lineare di moltideterminanti. E’ importante notare che questi metodi hanno bisogno di un determinante di base dettoriferimento con cui generare tutti gli altri. Questo determinante di solito è dato da un calcolo HF.

3.2.1 Determinanti eccitati e autofunzioni di S2 (Configuration State Functions,CSF)

Cercheremo di vedere con un esempio molto semplice in che modo vengono ottenuti gli altri determinantidi Slater oltre quello HF e che proprietà debbano avere per essere utilizzabili. I determinanti di Slater ingenerale sono autofunzioni dell’operatore Sz, ma non sono sempre autofunzioni dell’operatore di spin totaleS2. E’ possibile formare tali autofunzioni usando delle combinazioni lineari di determinanti di Slater. Molticalcoli in effetti sono più semplici quando vengono effettuati utilizzando autofunzioni dello spint totale (el’interpretazione dei risultati risulta più semplice).

Al posto di fare una trattazione generale ci limitamo ad un esempio semplice: la molecola H2 descritta conun LCAO ed un basis set minimale STO-3G. Nel basis set STO-3G ogni atomo di idrogeno è descritto dauna contrazione di tipo 1s ottenuto dalla contrazione di 3 GTO di tipo s. Durante un procedimento HFvengono “ottimizzati” (in realtà per una base minimale c’è poco da ottimizzare) i due orbitali molecolari

ψ1 = χA + χB

ψ2 = χA−χB

il determinante dello stato fondamentale (due elettroni nell’orbitale legante ψ1) di HF è:

|Ψ0〉= |ψ1ψ1〉= ψ1(1)α(1)ψ1(2)β (2)−ψ1(2)α(2)ψ1(1)β (1) = ψ1(1)ψ1(2)[α(1)β (2)−α(2)β (1)]

che risulta essere una funzione di singoletto con 2S + 1 = 1. I possibili determinanti eccitati vengonocostruiti usando gli orbitali “vuoti” (o virtuali) ottenuti nel calcolo HF (nel caso in esame il solo orbitale


molecolare ψ2). I possibili determinanti singolarmente eccitati risultano essere 4:

|Ψ21〉 = |ψ1ψ2〉

|Ψ21〉 = |ψ1ψ2〉

|Ψ21〉 = |ψ1ψ2〉

|Ψ21〉 = |ψ1ψ2〉

Dove col il segno di soprasegnato indichiamo spin giù. Esiste un solo determinante doppiamente eccitatoche risulta:

|Ψ2211〉= |ψ2ψ2〉

ed è anch’essa una funzione di singoletto con 2S+1 = 1. I vari determinanti sono riportati schematicamentein Figura 3.1. Dei 4 determinanti singolarmente eccitati, due sono autofunzioni di S2 con autovalore S = 1

Figura 3.1: Schema energetico qualitativo dei vari determinanti di Slater coinvolti in un ipotetico CI perH2 con un basis-set minimale.

|Ψ21〉 = |ψ1ψ2〉= [ψ1(1)ψ2(2)−ψ1(2)ψ2(1)]β (1)β (2)

|Ψ21〉 = |ψ1ψ2〉= [ψ1(1)ψ2(2)−ψ1(2)ψ2(1)]α(1)α(2)

e rappresentano stati di tripletto. Le altre due, invece, non sono direttamente autostati di S21. Se le

1Le 4 possibili combinazioni di due spin di due elettroni sono

χ1(1,2) = α(1)α(2)

χ2(1,2) = α(1)β (2)

χ3(1,2) = β (1)α(2)

χ4(1,2) = β (1)β (2)

tutte sono autofunzioni di Sz = S1z +S2z , ma non lo sono di S2 = S11 +S2

2 +2∗S1 ·S2. Per esempio per la prima abbiamo

S2α(1)α(2) = S2

1α(1)α(2)+S22α(1)α(2)+2S1 ·S2α(1)α(2) =

34

α(1)α(2)+34

α(1)α(2)+ [2S1zS2z +S1+S2− +S1−S2+]α(1)α(2) =32

+[214

+0+0]α(1)α(2) = 2α(1)α(2)

perché S+α = 0, S−α = β , S+β = α e S−β = 0.


combiniamo lineramente possiamo pero’ ottenere:

|1Ψ21〉 = |Ψ2

1〉+ |Ψ21〉= |ψ1ψ2〉+ |ψ1ψ2〉= [ψ1(1)ψ2(2)+ψ1(2)ψ2(1)][α(1)β (2)+β (1)α(2)]

|3Ψ21〉 = |Ψ2

1〉− |Ψ21〉= |ψ1ψ2〉− |ψ1ψ2〉= [ψ1(1)ψ2(2)−ψ1(2)ψ2(1)][α(1)β (2)+β (1)α(2)]

la prima e’ un singoletto la seconda un tripletto. In totale abbiamo quindi estratto da sei determinanti diSlater sei “configuration state functions” (CSF) di cui uno stato di singoletto per lo stato fondamentale,3 stati di tripletto sigolarmente eccitati, 1 stato di singoletto singolarmente eccitato ed infine uno stato disingoletto doppiamente eccitato. In generale è possibile lavorare con entrambe le rappresentazioni, alcunemetodi usando la rappresentazione dei determinanti (determinantal CI) altri metodi le CFS (GUGA CI).

3.2.2 CI

Il metodo CI o Full-CI è il metodo concettualmente più semplice, ma quello computazionalmente piùpesante e spesso decisamente irrealizzabile. La base concettuale del metodo CI è questa: una qualunquefunzione per N elettroni può essere espressa esattamente come una combinazione lineare di tutti i possibilideterminanti di Slater ad N elettroni (base polielettronica) formati partendo da un set completo di spinorbitali monoelettronici (base monoelettronica). Se i determinanti di Slater vengono indicati con Ψi gliautovettori dell’hamiltoniamo sono dati da

Φk =I

∑i

ckiΨi k = (0, 1, . . . , I−1)

dove I è il numero di determinanti possibili (I → ∞ per una base completa di spin-orbitali) e ci j sonodetti coefficienti CI. La matrice H è costruita a partire dagli elementi Hi j = 〈Ψi|H|Ψ j〉 che possono esserescritti in termini di integrali bielettronici secondo le cosidette regole di Slater (vedi più sotto). La forza delmetodo è tutta nella sua generalità: il metodo in linea di principio fornisce la soluzione esatta qualunque siala configurazione elettronica da descrivere, sia essa uno stato eccitato, uno stato dissociativo, a shell apertao ad alto spin. In contrasto i metodi perturbativi e Coupled Clutser (vedi sotto) assumono sempre che unaconfigurazione sia dominante (detta configurazione di riferimento o semplicemente ”riferimento” che ingenere è descritta da un determinante solo). In pratica uno non ha mai a disposizione una base completadi spinorbitali e quindi I sarà un numero finito. In genere uno si assicura che la base monoelettronica siasufficientemente buona incrementando la dimensione di tale base e monitorando le proprietà molecolari diinteresse2. La base N-elettronica di determinanti può essere ridotta nel caso si desideri una funzione d’ondadi una determinata molteplicità di spin o simmetria spaziale. Se uno risolve il problema CI utilizzando labase polielettronica completa (possibilmente ristretta per simmetria o per spin) in una base monoelettronicaincompleta o troncata (gli orbitali HF ottenuti da uno dei basis set per esempio) allora la metodologia isdice Full-CI. Purtroppo il Full-CI è intrattabile anche per basi mono-elettroniche molto piccole come sivede dagli esempi seguenti.

Dato un set di 2K orbitali molecolari che si ottengono da un calcolo HF di cui N occupati dagli N elettroni

del sistema è possibile formare(

2KN

)determinanti di Slater eccitati differenti. Consideriamo ad esem-

pio il caso di un calcolo sulla semplice molecola di H2O (10 elettroni) con un set di base di qualità DZP (26

Per le altre risulta

S2χ1 = 2χ1

S2χ2 = χ2 + χ3

S2χ3 = χ2 + χ3

S2χ4 = 2χ4

da cui si capisce perché utilizzare combinazioni lineari.2Nota bene: è del tutto inutile monitorare l’energia totale della molecola al variare del set di base in quanto quest’ultima è una

funzione fortemente dipendente dalla dimensione del set stesso. Molto più utile è monitorare una differenza di energia o qualche altraproprietà: dipolo, polarizzabilità ecc.


funzioni e dunque 26 orbitali) e calcoliamo per esercizio il numero di determinanti, o meglio autofunzionidi spin, corrispondenti ad una funzione d’onda di singoletto (tale è lo spin dello stato fondamentale). Il cal-colo risulta molto facile se classifichiamo le funzioni in base al numero di orbitali singolarmente occupati,come mostra la tabella seguente:

Orbitali SO Determinanti Singoletti Stati

0(

265

)= 65780 1 65780

2(

262

)(244

)= 3435450 1 3453450

4(

264

)(223

)= 23023000 2 46046000

6(

266

)(202

)= 43743700 5 218718500

8(

268

)(181

)= 28120950 14 393693300

10(

2610

)= 5311735 42 223092870

Questa semplice FCI consterebbe dunque di circa 885 milioni di funzioni di spin di singoletto. Se im-maginassimo di dover calcolare la matrice hamiltoniana completa su questo insieme di funzioni, anchesupponendo di lavorare con funzioni reali per cui la matrice sarebbe simmetrica, e di memorizzare questamatrice sul disco occorrerebbero 8852

2 · 8 byte, oppure 313290000 ∼ 3 · 109 Gbyte di memoria o di spaziodisco.

Questa situazione semplicemente inaffrontabile viene, in pratica, anche se di fatto in piccola misura, sem-plificata da alcune considerazioni. Innanzitutto, come sappiamo, il numero di elementi di matrice non nulliè relativamente piccolo, consistendo solo di quelli fra funzioni che siano al più doppiamente eccitate l’unarispetto all’altra. La matrice CI è, come si dice, altamente sparsa, mostrando, come è facile verificare,una dipendenza in pratica poco più che lineare (anziché quadratica) del numero di elementi non-nulli dalnumero di configurazioni. Questo tipicamente riduce il numero di elementi di matrice che sono effettiva-mente da calcolare di qualche ordine di grandezza. In secondo luogo, nel calcolo del numero di stati nonabbiamo tenuto alcun conto di argomenti di simmetria. È chiaro che la matrice hamiltoniana si fattorizzain base alle rappresentazioni irriducibili del gruppo di simmetria della molecola. Se gli orbitali impiegatiappartengono a rappresentazioni irriducibili del gruppo (come accade per gli orbitali risultanti da un cal-colo HF) questo è anche vero per i determinanti costruiti con essi: la rappresentazione irriducibile di undeterminante è il prodotto diretto delle rappresentazioni degli orbitali occupati. Questo riduce il numero difunzioni per ogni simmetria di un fattore mediamente pari all’ordine del gruppo. È chiaro in definitiva chequeste considerazioni, che introducono fattori di riduzione delle dimensioni del problema di qualche ordinedi grandezza, sono effettivamente trascurabili rispetto alla velocità di crescita esponenziale del numero distati con il numero di elettroni e con la dimensione del set di base. Si confronti ad esempio il caso appenavisto (H2O) con l’analogo esempio del numero di stati di singoletto per la molecola di CO (14 elettroni e32 funzioni di base). Questo corrisponde ad un aumento di appena 1.4 volte nel numero di elettroni e 1.23volte nel numero di funzioni di base ma, come è facilmente calcolabile, comporta un aumento nel numerodi stati dell’hamiltoniano di oltre 2000 volte!

Cenni matematici della procedura Full-CI

Se indichiamo con il simbolo |Ψcd...ab...〉 il determinante dove gli orbitali a e b sono stati sostituiti dagli orbitali

virtuali c e d, allora la funzione d’onda Full-CI è data da:

|Φ0〉= c0 |Ψ0〉+∑a,r

cra |Ψr

a〉+1

(2!)2 ∑ab,rs

crsab |Ψrs

ab〉+1

(3!)2 ∑abc,rst

crstabc |Ψrst

abc〉+1

(4!)2 ∑abcd,rstu

crstuabcd |Ψrstu

abcd〉+ ...

(3.2)


che sarebbe la somma dei determinanti relativi allo stato fondamentale e alle singole, doppie, triple, qua-druple eccitazioni fino alle N-uple eccitazioni dove N e’ il numero di elettroni. Per esempio per H2 e HeH+

bastano le singole e doppie eccitazioni, per He2 e LiH basta arrivare ad includere le quadruple. Di solitola serie Full-CI è intrattabile anche sui computer più potenti in circolazione quando il numero di elettronisupera i 4-5.

Una volta costruite le funzioni eccitate ad N elettroni si possono determinare le energie degli stati ad essiassociati utilizzando il metodo della diagonalizzazione dell’Hamiltoniano. La matrice che si deve dia-gonalizzare è detta matrice CI. L’autovalore più basso è un limite superiore all’energia vera dello statofondamentale sel sistema. Solo se il nostro set di base fosse infinito otterremmo l’autovalore esatto. Al-l’interno dello spazio determinato dal set di base utilizzato comunque la soluzione CI è quella “esatta”. Ladifferenza tra l’autovalore più basso della matrice CI e l’energia di HF ottenuta con lo stesso set di base èdetta energia di correlazione del basis-set. La funzione d’onda CI si puo’ scrivere formalmente:

|Φ0〉= c0 |Ψ0〉+ cS |S〉+ cD |D〉+ cT |T 〉+ cQ |Q〉+ ... (3.3)

E’ importante notare che la diagonalizzazione della matrice CI si limita a determinare i set di coefficientic0, cS, cD ecc., ma non ottimizza più gli orbitali che sono stati determinati con il calcolo HF che hafornito gli orbitali molecolari. E’ importante analizzare la struttura della matrice CI anche solo per avereun’idea di queli sono effettivamente i contributi importanti che vengono dalla serie della funzione d’onda.La matrice CI ha questa struttura:

〈Ψ0|H|Ψ0〉〈Ψ0|H|S〉〈Ψ0|H|D〉〈Ψ0|H|T 〉〈Ψ0|H|Q〉... 〈S|H|S〉〈S|H|D〉〈S|H|T 〉〈S|H|Q〉... ... 〈D|H|D〉〈D|H|T 〉〈D|H|Q〉... ... ... 〈T |H|T 〉〈T |H|Q〉... ... ... ... 〈Q|H|Q〉

(3.4)

Struttura che in realtà si semplifica nel momento in cui si analizzano i singoli elementi della matrice. Sipossono infarri dimostrare le seguenti proprietà:

• Non c’è accoppiamento diretto tra lo stato fondamentale e le singole eccitazioni (teorema di Bril-louin):

〈Ψ0|H|Ψra〉= 0

• Non c’è accoppiamento tra lo stato fondamentale e le eccitazioni triple o quadruple. Similmentenon c’e’ accoppiamento tra le singole e le quadruple. In generale tutti gli elementi di matrice tradeterminanti che differiscono per più di 2 spin-orbitali sono sempre zero.

La matrice CI risulta quindi più semplice:〈Ψ0|H|Ψ0〉 0 〈Ψ0|H|D〉 0 0

... 〈S|H|S〉〈S|H|D〉〈S|H|T 〉 0

... ... 〈D|H|D〉〈D|H|T 〉〈D|H|Q〉

... ... ... 〈T |H|T 〉〈T |H|Q〉

... ... ... ... 〈Q|H|Q〉

(3.5)

Ci sono alcuni commenti da fare:

1. A causa del fatto che le singole eccitazioni non accoppiano direttamente con lo stato fondamentale cisi aspetta che abbiano un effetto piccolo sulla sua energia anche se il loro effetto non sarà comunquenullo perché accoppiano con le doppie. In realtà le singole eccitazioni sono molto importanti perdeterminare la distribuzione di carica molecolare.


2. Le doppie eccitazioni apportano i contributi più importanti all’energia di correlazione. Anzi si puòdimostrare che una volta determinati coefficienti delle doppie tramite un Full-CI completo, l’energiadi correlazione è data da

Ecorr =14 ∑

ab∑rs

crsab 〈Ψ0 |H |Ψrs

ab〉 (3.6)

3. Le quadruple eccitazioni sono più importanti delle sigole o delle triple.

4. Tutti gli elementi di matrice che compaiono nella matrice CI si possono calcolare in termini degliintegrali di scambio e coulombiani:

• mentre gli elementi che coinvolgono lo stato fondamentale sono esprimibili direttamente intermini di integrali bielettronici come per esempio:

〈Ψ0|H|Ψrsab〉= 〈ra|sb〉−〈rb|sa〉 , (3.7)

• alcuni elementi richiedono la valutazione dei contributi di scambio e coulombiano direttamentesugli integrali molecolari, come per esempio:

〈Ψrsab|H|Ψrs

ab〉 = εr + εs− εa− εb + Jab + Jrs +Kab−Krs

−Jsb− Jsa− Jrb− Jra +32(Ksb +Ksa +Krb +Kra) (3.8)

per poter valutare tali elementi di matrice qualunque calcolo variazionale di tipo CI o approssi-mazioni ad esso devono eseguire quella che viene detta “Four Index Transformation”. Cioe’passare dalla rappresentazione degli orbitali atomici a quella degli orbitali molecolari. Que-sta trasformazione è molto pesante e delicata da fare ed è un passo lento del calcolo post-HFvariazionale (è in generale più pesante lei di un intero calcolo HF). La trasformazione è datada una somma quadrupla e permette di esprimere gli integrali bielettronici espressi nalla basedelle gaussiane in quella degli orbitali molecolari:

(ψiψ j|ψkψl) = ∑µ

∑ν

∑λ

∑σ

C∗µiCν iC∗

λkCσ l(µν |λσ) (3.9)

In pratica il metodo Full-CI si può utilizzare solamente per sistemi con un limitatissimo numero di elettroni(in genere < 5). Inoltre, per il fatto che la pesantezza del calcolo Full-CI dipende dal set-di base (dal numerodi OM ottenuti da HF) in genere si utilizzano set di base piccoli. L’errore insito in questi set di base è spessomaggiore dell’accuratezza che si ottiene dal fatto di usare un calcolo “esatto”. E’ in genere meglio utilizzareapprossimazioni alla serie CI (sono tutte basate su un qualche tipo di troncamento dell’espressione dellafunzione d’onda), ma basis set più grandi.

3.2.3 Singole e doppie CI

Tra le approssimazioni al calcolo di tipo CI più in voga è da ricordare il CI limitato alle singole e doppie ec-citazioni (SDCI o CISD) che è di facile gestione e piuttosto rapido. Questo metodo permette di recuperarecirca il 90% dell’energia di correlazione di piccole molecole intorno alle geometrie di equilibrio.

La funzione d’onda viene scritta come:

|ΦDCI〉= |Ψ0〉+∑c,t

ctc |Ψt

c〉+ ∑c < dt < u

ctucd |Ψtu

cd〉 (3.10)

l’energia di correlazione si può ottenere da

(H−E0) |ΦSDCI〉= Ecorr |ΦSDCI〉 , (3.11)


equazione che può essere ridotta ad un problema matriciale piuttosto semplice. Come si vede qui nonc’è nessun problema non lineare3e la situazione è del tutto analoga al problema variazionale lineare. E’importante notare che l’energia di correlazione calcolata da un SDCI non è quella esatta: benchè l’energiadi correlazione dipenda solo dai coefficienti delle doppie (vedi (3.6)), le doppie che darebbero l’energiacorretta devono essere trovate risolvendo un Full-CI.

3.2.4 Come Full-CI risolve il problema della correlazione e il problema della dis-sociazione.

Prendiamo la molecola di H2 nel suo besis set minimale composto da due funzioni 1s, χA e χB. Un calcoloRHF produrrà due orbitali molecolari φ1 e φ2 che sono somma e differenza dei due orbitali atomici. Dati idue MO abbiamo il seguente determinante di riferimento

Φ0 =∣∣∣∣ φ1(1) φ1(1)

φ1(2) φ1(2)

∣∣∣∣I due orbitali molecolari sono epressi come somma dei due orbitali atomici 1sA e 1sB dei due atomi diidrogeno φ1,2 = χA±χB, il riferimento è dato da (a parte la normalizzazione)

Φ0 = φ1(1)φ1(2)−φ1(1)φ1(2) = φ1(1)φ2(2)[α(1)β (2)−α(2)β (1)]

cioè la parte spaziale di Φ0 è data data due contributiχA(1)χA(2)+ χB(1)χB(2) = χAχA + χBχB H+−H−

χA(1)χB(2)+ χB(1)χA(2) = χAχB + χBχA H−H

Come si vede chiaramente quando la distanza internucleare va ll’infinito questa funzione di riferimentodissocia per un 50% in una situazione covalente (H-H) e per un altro 50% in una configurazione ioni-ca (H+H−) da cui l’errore di degenerazione di cui abbimao già ripetutamente discusso. In questa basepossiamo scrivere 4 determinanti singolarmente eccitati e uno doppiamente eccitato

Φ1 =∣∣∣∣ φ2(1) φ2(1)

φ2(2) φ2(2)

∣∣∣∣Φ2 =

∣∣∣∣ φ1(1) φ2(1)φ1(2) φ2(2)

∣∣∣∣Φ3 =

∣∣∣∣ φ1(1) φ2(1)φ1(2) φ2(2)

∣∣∣∣Φ4 =

∣∣∣∣ φ1(1) φ2(1)φ1(2) φ2(2)

∣∣∣∣Φ5 =

∣∣∣∣ φ1(1) φ2(1)φ1(2) φ2(2)

∣∣∣∣Come già ampiamente visto nella sezione 3.2.1, le configurazioni Φ4e Φ5 sono le componenti Sz = −1 eSz = 1 di uno stato di tripletto. La combinazione + di Φ2 e Φ3 è la componente Sz = 0 del tripletto, mentrela combinazione − è una configurazione singoletto. La molecola di H2 appartiene al gruppo puntuale D∞he i due orbitali molecolari trasformano come le rappresentazioni σg(φ1) e σu(φ2). La CFS singolarmenteeccitata (Φ2 −Φ3) ha simmetria Σu (g× u → u), mentre il riferimento Φ0 e Φ1 sono di simmetria Σg. Ilproblema Full-CI 6× 6 si fattorizza in tre blocchi: un blocco 2× 2 per il singoletto 1Σg, un blocco 1× 1

3Anche se nel caso di Full-CI o SDCI il problema è lineare, non è detto che la particolare implementazione non faccia uso diiterazioni. Bisogna però rimarcare che queste iterazioni nulla hanno a che fare con quelle di tipo SCF di Hartree-Fock o dei metodiMCSCF, ma sono solo un modo piuttosto veloce per determinare gli autovalori più bassi in energia di problemi lineari con dimensionimolto grandi. Il metodo che si usa più spesso è detto metodo iterativo di Davidson.


per il singoletto 1Σu ed un blocco 3×3 per il tripletto 3Σu (il quale è già diagonale per l’ortogonalità delletre autofunzioni di Sz). La matrice Full-CI risulta:

Φ01Σg Φ1

1Σg (Φ2−Φ3)1Σu Φ43Σu (Φ2 +Φ3)3Σu Φ5

3Σu

Φ01Σg H00 H01 0 0 0 0

Φ11Σg H10 H11 0 0 0 0

(Φ2−Φ3)1Σu 0 0 H−− 0 0 0Φ4

3Σu 0 0 0 H44 0 0(Φ2 +Φ3)3Σu 0 0 0 0 H++ 0

Φ53Σu 0 0 0 0 0 H55

Tabella 3.1: Struttura della matrice Full-CI per il problema di H2 in una base minimale.

Il problema Full-CI per lo stato 1Σg coinvolge solamente Φ0 e Φ1 (riferimento e doppia) e genera unafunzione d’onda CI che è data da

ΨCI = (a0Φ0 +a1Φ1) = (a0 +a1)(χAχA + χBχB)+(a0−a1)(χAχB + χAχB)

Se si confronta questa funzione con quella di riferimento si vede come gli elettroni abbiano più ”libertà” dimovimento (c’e’ una funzione eccitata che si porta dietro l’orbitale antilegante che adesso è accessibile) equindi un’energia minore (correlazione dinamica). Questa funzione inoltre, quando la distanza internuclea-re va all’infinito, non contiene più il termine ionico nel momento in cui a1 =−a0 risolvendo elegantementeil problerma della correlazione di degenerazione che affliggeva il solo riferimento.

3.2.5 MCSCF (CAS-SCF)

In generale la serie che determina la funzione d’onda CI converge molto lentamente quando si usanogli orbitali molecolari di HF, ma qualunque troncamento a quella serie produce degli errori apprezzabilisopratutto quando si hanno molti elettroni. Esiste una serie di metodi computationali detti Multi Confi-gurazionali (MCSCF) in cui vengono inclusi nella serie CI solamente pochi determinanti o poche CSF.Scegliere i determinanti da includere non sarebbe però possibile se si usassero gli orbitali molecolari for-niti da un calcolo HF in quanto, come abbiamo detto, la risultante serie CI converge lentamente con essi.Il metodo MCSCF quindi non si limita a determinare i coefficienti di mescolamento dei determinanti (co-me il Full-CI o il SDCI), ma ottimizza simultaneamente anche gli orbitali molecolari. Ricordiamo che imetodi CI in genere sono problemi lineari di diagonalizzazione e non di ottimizzazione di orbitali. Il me-todo MCSCF, come suggerisce la presenza dell’acronimo SCF, determina sia i coefficienti dell’espansionemulticonfigurazionale sia nuovi orbitali molecolari.

La funzione d’onda MCSCF è:Φ = ∑

kAkΨk (3.12)

dove Ψk può essere un singolo determinante, una combinazione di determinanti o più in generale unafunzione “spin-correct” come le CSF che abbiamo visto in precedenza.

Le equazioni algebriche del metodo MCSCF sono piuttosto complicate, ma in termini generali il calcolo sipuò svolgere in due modi a seconda che i coefficenti CI Ak vengano o meno ottimizzati simultaneamente aquelli LCAO degli orbitali.

Il primo set di Ak viene determinato inizialmente risolvendo un problema lineare variazionale utilizzandocome orbitali molecolari quelli forniti da un calcolo HF condotto in precedenza. Non è in generale unabuona idea utilizzare guess semiempiriche per cominciare un MCSCF! La soluzione (lineare) al problemamatriciale fornisce le prime energie MCSCF e i coefficienti Ak. A questo punto il metodo MCSCF richiede,a seconda, uno o due insiemi di iterazioni per ottimizzare la funzione d’onda.


In ogni caso il funzionale dell’energia è lineare nei coefficienti Ak, ma ha una dipendenza non lineare(quartica) dai coefficienti LCAO. La condizione stazionaria in termini dei coefficienti LCAO deve esserequindi risolta iterativamente. L’ottimizzazione di una funzione (l’energia in questo caso) di molti parametrinon lineari soffre di problemi di convergenza e può trovare minimi locali e non assoluti della Lagrangiana.In una funzione MCSCF l’energia dipende debolmente da quei coefficienti che contribuiscono agli orbitalidebolmente occupati in tutte le configurazioni, mentre dipende fortemente da quelli delle configurazionidominanti. Anche per questo il numero di CSF che si utilizzano in un calcolo MCSCF deve rimanerepiccolo in modo da descrivere nel miglior modo possibile la correlazione non-dinamica. In quest’ultimocaso, infatti, l’energia dipende fortemente da quasi tutti i parametri LCAO e il processo MCSCF è menoprono a comportamenti patologici.

E’ comodo “vedere” la funzione d’onda MCSCF come l’analogo della funzione d’onda HF in quei casidove non è possibile ridursi alla semplice rappresentazione mono-configurazionale (anche nel caso ROHFsi deve poter usare un solo determinante o una piccola somma vincolata al fatto che l’eq ?? deve potersiridurre alla ??). Uno non dovrebbe aspettarsi che le energie calcolate con MCSCF siano accurate esat-tamente come non ci si aspetta lo siano quelle HF. Si dice che trattamenti MCSCF correggono l’energiaHF per quanto riguarda il problema della correlazione di degenerazione dovuta all’esistenza di soluzionidegeneri del problema elettronico (cioé dovuta alla presenza di più stati elettronici).

Tutti gli effetti di correlazione non palesemente attribuibili ad evidenti fenomeni di quasi-degenerazionevengono genericamente detti di correlazione dinamica. È evidente che la linea di demarcazione fra questecategorie è in generale piuttosto flessibile e mal definita. Possiamo dire che la correlazione dinamica èquella parte di correlazione più strettamente attribuibile all’effettiva interazione istantanea fra coppie dielettroni, cioè quella parte intrinsecamente trascurata in qualsiasi modello a particelle indipendenti. Men-tre effetti di quasi degenerazione possono essere facilmente incorporati nel trattamento teorico includendonella CI un numero di norma piccolo di configurazioni, la correlazione dinamica rappresenta il vero pro-blema: essa può essere rappresentata solo considerando l’effetto combinato di un numero generalmentegrandissimo di configurazioni come già detto prima. L’esperienza indica indubbiamente che, una volta chesiano incorporate le configurazioni quasi degeneri, il resto della correlazione converge molto lentamentecon il numero di configurazioni incluse.

La correlazione dinamica non è quindi inclusa completamente nelle funzioni d’onda MCSCF ed in ge-nere è necessario proseguire il calcolo per includerla con altri metodi. La conclusione è che, sebbene lafunzione d’onda MCSCF possieda flessibilità sufficiente a rappresentare i cambiamenti nelle strutture elet-troniche durante le reazioni chimiche, l’energia che si ottiene non ha accuratezza sufficiente: l’errore sudati sperimentali termodinamici e’ di circa 10-20 kcal/mol.

La metodologia concettualmente più semplice per poter introdurre la correlazione elettronica è quella difare un calcolo SDCI dove però la funzione di riferimento da cui calcolare i determinanti eccitati non è piùun singolo determinante HF, ma l’intera funzione MCSCF. In questo caso il SDCI di chiama MR-SDCIo MR-CI dove MR sta per Multi-Reference. In generale gli orbitali che escono da un conto MCSCF4

vengono distinti in “interni” (o di valenza) che sono quelli occupati in almeno uno dei determinanti inclusinell’espansione MCSCF e in “esterni” (o virtuali) che rimangono vuoti. Le singole e doppie eccitazionidel MRCI ovviamente vengono fatte promuovendo elettroni negli orbitali esterni. Inutile dire che MRCI èmolto pesante in termini computazionali.

Un altro metodo molto utile è quello nominato MR-PT (Multi Reference Perturbation Theory). La teoriadelle perturbazioni (vedi sotto) viene applicata ad una funzione riferimento multideterminantale. L’accu-ratezza di tale metodo e’ confrontabile con MRCI, ma il suo costo è decisamente inferiore.

4Che sono tanti quanti le contrazioni del set di base, esattamente come in un calcolo HF.


Metodo Singlet-Triplet Splitting in CH2 (kcal/mol)HF 26.14

MP2 18.05MCSCF 12.82

MCSCF+SCI 14.48MCSCF+SDCI 12.00

MCSCF+PT2 (smaller basis) 12.95Full-CI 11.97

CAS-SCF

L’implementazione più diffusa del metodo MCSCF si chiama CASSCF (Complete Active Space Self Con-sisten Field). La nuova sigla identifica solo un modo facilmente “automatizzabile” per la scelta delle Ψk dainserire nella funzione d’onda MCSCF. In pratica la ricetta è questa:

• si sceglie il cosidetto spazio attivo (di solito determinato dagli orbitali di valenza) e gli elettroni attivi.Per esempio se volessimo descrivere la molecola di H2 potremmo scegliere uno spazio attivo di dueorbitali molecolari (come chimici sappiamo che sono importanti gli 1s dell’idrogeno per H2) . Sevolessimo descrivere LiH potremmo scegliere gli orbitali 1s e 2s del Li e l’orbitale 1s dell’idrogenocioè useremmo uno spazio attivo di 1s + 2s + 1s = 3 orbitali molecolari. Oppure si potrebbe volerandare oltre la valenza per aumentare la flessibilità della funzione e poter descrivere gli stati eccitati.La prima eccitazione elettronica possibile in LiH è ovviamente quella che porta il Li(2s) in Li(2p) equindi potremmo prendere: 1s+2s+3 ·2p+1s = 6 orbitali attivi.

• Si scelgono gli elettroni attivi, cioè quelli che possono essere eccitati nella generazione dei deter-minanti. Quelli non eccitabili vengono chiamati elettroni di core. Nell’esempio di LiH potremmoinfatti considerare congelati i due 1s del Li riducendo lo spazio attivo a 5 orbitali molecolari e ilnumero di elettroni a 2.

• all’interno dello spazio attivo e usando gli elettroni attivi si costruisce una serie Full-CI. Se lo spazioattivo è piccolo (da 3 a 10 orbitali molecolari e il numero di elettroni attivi contenuto <10) anche ilFull-CI risultante è facilmente gestibile.

• Il Full-CI è il punto di partenza cioè l’eq. (3.12) per l’algoritmo MCSCF.

I metodi MCSCF non hanno mai avuto una grande diffusione fino a che non è stata introdotta la “ricetta”CAS. Adesso sono molto utilizzati ogni qualvolta serve calcolare energie di stati elettronici eccitati. Ilfatto che si costruisca una piccola serie Full-CI all’interno dello spazio attivo, infatti, permette di calcolarediversi autovalori dell’Hamiltoniano con ragionevole accuratezza.

3.2.6 Il problema della size-consistency

Questo è un problema piuttosto complesso e ne accennerò solamente i concetti basilari. Per capirlo èmeglio fare un esempio pratico. Supponiamo di fare un calcolo con una qualunque versione di CI troncato(per esempio SDCI) sul sistema H2−H2a distanza infinita tra i due monomeri e poi di calcolare semprecon SDCI una molecola di H2 isolata. Ci si aspetta che l’energia della supermolecola dissociata sia ugualealla somma delle energie dei due monomeri isolati cioè che:

EH2−H2(R → ∞) = 2 ·E(H2)

Si trova invece che l’energia SDCI della supermolecola H2−H2 quando la distanza tra le molecole è moltogrande non è uguale alla somma SDCI dei due monomeri calcolati isolati. Questo risultato è evidente se


consideriamo il fatto che una descrizione SDCI dei monomeri isolati contiene eccitazioni doppie su en-trambi i monomeri che sarebbero rappresentate da eccitazioni quadruple nella supermolecola che però nonsono incluse nel calcolo. I metodi di calcolo che soffrono di questo problema sono detti size-inconsistent.Tutte le approssimazioni conosciute a Full-CI non sono size-consistent. Full-CI, HF e i metodi perturbativilo sono.

I risultati SDCI sono spesso modificati utilizzando una semplice correzione introdotta da Langhoff eDavidson, che rende l’energia approssimativamente size-consistent, ma non più variazionale

∆Ecorrection = (1−C20)ESDCI

corr

In letteratura i due termini ”size extensivity” e ”size consistency” sono spesso utilizzati in modo piuttostolibero e non rigoroso. La prima proprietà è forse quella meglio definita: un calcolo size extensive produceun energia che scala con il numero di particelle linearmente. La seconda proprietà invece ha più a che farecon la dissociazione dei sistemi. L’utilizzo dei due termini è piuttosto incerto e certi autori considerano peresempio il RHF size extensive, ma non size consistent perché non produce una dissociazione corretta.

3.3 Metodi non variazionali

3.3.1 Metodi perturbativi MP2 e MP4

Questi metodi migliorano l’energia Hartree-Fock a singolo determinante usando la teoria delle perturba-zioni. L’Hamiltoniano viene partizionato in questo modo: l’hamiltoniano imperturbato è5

H0 = ∑i[h(i)+ vHF(i)] (3.13)

e il perturbatore è scelto comeV = ∑

i< jr−1

i j −∑i

vHF(i) (3.14)

dove vHF è il potenziale di HF cioè l’operatore:

vHF(i) = ∑j

J j(i)−K j(i)

L’energia di ordine zero è l’autovalore di H0 corrispondente all’autofunzione di HF Ψ0 e cioè la sommadegli autovalori di HF (non l’energia elettronica quindi!).

E(0)0 = ∑

iεi

La correzione al primo ordine è

E(1)0 = 〈Ψ0 |V |Ψ0〉

=

⟨Ψ0

∣∣∣∣∣∑i< jr−1

i j |Ψ0

⟩−

⟨Ψ0

∣∣∣∣∣∑ivHF(i)|Ψ0

⟩

=12 ∑

ab〈ab||ab〉−∑

a〈a|vHF |a〉

= −12 ∑

ab〈ab||ab〉

5La scelta di quel perturbatore è dovuta al semplice fatto che il perturbatore deve essere piccolo rispetto all’Hamiltoniano imper-turbato. Il termine ∑i< j r−1

i j −∑i vHF (i) è piccolo perché gran parte del contributo (precisamente quello medio) dell’operatore r−1i j è

inlcuso nel potenziale di HF.


Quindi la somma dell’ordine zero e del primo ordine non è altro che l’energia elettronica HF.

E0 = E(0)0 +E(1)

0 = ∑a

εa−12 ∑

ab〈ab||ab〉

La prima correzione dovuta alla correlazione è quindi quella al secondo ordine. La correzione di secondoordine all’energia è data da

E(2)0 = ∑

n 6=0

| 〈0|V |n〉 |2

E(0)0 −E(0)

n

cosa sono gli stati |n〉? L’unica è che siano eccitazioni doppie

E(2)0 = ∑

a<b,r<s

∣∣∣⟨Ψ0

∣∣∣∑i< j r−1i j |Ψrs

ab

⟩∣∣∣2εa + εb− εr − εs

= ∑a<b,r<s

|〈ab | |rs〉|2

εa + εb− εr − εs

E’ possibile calcolare le correzioni al terzo, quarto e quinto ordine, ma le formule sono terribilmentecomplicate e molto poco interessanti. Il metodo MP2 usa la correzione al secondo ordine, mentre quelloMP4 arriva fino al quarto.

Il metodo MP2 è di poco più costoso di HF in termini computazionali, ma più accurato perché calcolauna frazione significativa dell’energia di correlazione. Può essere utiltaizzato su sistemi con molti elettro-ni (spesso, esclusa DFT, è l’unica possibilità ab-initio) specialmente per le ottimizzazione delle geome-trie nucleari. Per esempio viene usato per ottimizzare preliminarmente una geometria per poi procederead un successivo miglioramento del risultato con MP4. MP4, insieme a Coupled-Cluster (CC) che nontrattiamo, è il metodo di elezione per lo studio dei legami deboli come quelli che si trovano nei cluster(Nen), nei sistemi di Van der Waals (CO-He) e nei dimeri molecolari (H2O-H2O). Questi metodi sonosize-consistent ma sono destinati a fallire quando non esiste chiaramente una configurazione dominante:includono infatti (specialmente MP4) molta della correlazione dinamica, ma non gestiscono quella dovutaalla degenerazione.

3.3.2 I metodi Coupled Cluster (cenni)

Il metodo SDCI, come tutti i troncamenti alla serie CI, è un metodo non size-consistent. Le teorie cou-pled cluster suppliscono a questo problema anche se a differenza delle metodologie perturbative sonoapprossimazioni alla serie CI, ma come vedremo non consistono in un semplice troncamento della serie.Trascurando per semplicità le singole, le triple e le eccitazioni dispari la serie CI è data da

|Φ0〉= c0 |Ψ0〉+ ∑a < br < s

crsab |Ψrs

ab〉+ ∑a < b < c < dt < s < t < u

crstuabcd |Ψrstu

abcd〉+ ... (3.15)

come abbiamo visto precedentemente, per trovare l’energia di correlazione dobbiamo sostituire (3.15)nell’equazione seguente

(H−E0) |Φ0〉= Ecorr |Φ0〉

e poi premoltiplicare per 〈Ψ0|, 〈Ψrsab| ecc. per ottenere un set di equazioni lineari accoppiate del tipo (cfr.

con l’eq. (3.5))

∑c < dt < u

⟨Ψ0∣∣H|Ψtu

cd⟩

ctucd = Ecorr

〈Ψrsab |H|Ψ0〉+ ∑

c < dt < u

⟨Ψ

rsab

∣∣H−E0|Ψtucd⟩

ctucd +∑

⟨Ψrs

ab

∣∣H|Ψrstuabcd

⟩crstu

abcd = Ecorrcrsab (3.16)


le quali formano una gerarchia di equazioni dove l’energia di correlazione dipende dai coefficienti delledoppie, ma questi ultimi devono essere determinati includendo i coefficienti delle eccitazioni superiori.Come abbiamo ripetuto più volte dobbiamo troncare questa gerarchia o disaccoppiarla in qualche modoper rendere il calcolo possibile. E’ possibile approssimare i coefficienti delle quadruple come prodotto dicoefficenti di doppie, cioè formalmente

crstuabcd ' (crs

ab ∗ ctucd) (3.17)

in realtà non esiste un modo solo di ottenere una particolare eccitazione quadrupla dalle doppie e quindicrstu

abcd deve essere la somma di tutti i modi possibili il che rende (3.18) una formula del tipo

(crsab ∗ ctu

cd) = crsabctu

cd −〈crsab ∗ ctu

cd〉 (3.18)

dove 〈crsab ∗ ctu

cd〉 è un’espressione molto complicata. La seconda equazione delle (3.16) diventa

〈Ψrsab |H|Ψ0〉+ ∑

c < dt < u

⟨Ψ

rsab

∣∣H−E0|Ψtucd⟩

ctucd − ∑

c < dt < u

⟨Ψ0∣∣H|Ψtu

abcd⟩〈crs

ab ∗ ctucd〉= Ecorrcrs

ab

Risolvere una tale equazione è tutt’altro che semplice dal punto di vista computazionale visto che l’equa-zione non è lineare nelle incognite crs

ab. Quello che è importante ricordare di tale metodologia è che questeequazioni danno vita ad un’energia che è size-consistent.

3.4 Simboli di termine, configurazioni elettroniche (atomi e molecolelineari)

Atomi e molecole lineari hanno orbitali che possono essere etichettati secondo la simmetria: per gli atomiabbiamo orbitali di tipo s,p ecc., per le molecole abbiamo orbitali σ , π ecc.. Questi orbitali possono es-sere visti come regioni di spazio in cui gli eletroni si muovono (al massimo due elettroni di spin oppostoalla volta ovviamente). Specificare l’occupazione del set di orbitali di un atomo o di una molecola (Nota:il numero di orbitali che si ottiene da un calcolo HF o MCSCF è uguale al numero di funzioni di baseutilizzate) non riesce univocamente a specificare lo stato elettronico dell’atomo o molecola: se prendiamol’atomo di O nello stato fondamentale con configurazione elettronica 1s22s22p4 si può facilmente vedereche esistono 15 modi diversi di distribuire gli elettroni negli orbitali 2p. Esistono quindi 15 stati diversi chesi raggruppano in 3 livelli energetici distinti. Non tutti gli stati che provengono da una data configurazioneelettronica hanno la stessa energia perché gli elettroni occupano gli orbitali degeneri in modo differente:nell’esempio dell’atomo di O abbiamo una configurazione 2p2

12p102p1

−1 ed anche una 2p212p2

02p0−1. L’inte-

razione Coulombiana tra gli elettroni nelle due configurazioni è diversa e la prima ha un’energia più bassa(una delle regole di Hund).

Quindi, riassumendo, atomi e molecole hanno una serie di orbitali molecolari disponibili; gli elettroniriempiono questi orbitali in un determinato modo dando vita ad una configurazione. Se alcuni di questiorbitali sono parzialmente occupati, allora esiste più di uno stato elettronico associato alla configurazione.Se, inoltre, alcuni degli orbitali parzialmente occupati sono degeneri questi stati possono dare vita a livellienergetici diversi.

L’Hamiltoniano non relativistico di un atomo o di una molecola rispetta le seguenti regole di commutazio-ne:

• nel caso di un atomo l’hamiltoniano commuta con i momenti angolari orbitali e di spin totali L2,Lz, S2 e Sz che sono la somma vettoriale dei singoli momenti angolari degli elettroni (nota chel’hamiltonianio non commuta singolarmente con questi ultimi). I numeri quantici “buoni” sonoquindi: L, ML, S e MS.

• per una molecola lineare (biatomica) con Lz, S2 e Sz, dove l’asse z è l’asse internucleare (nota: Hnon commuta più con L2perché una molecola lineare non ha simmetria sferica). I numeri quantici“buoni” sono quindi: Lz, S e MS.


3.4.1 Accoppiare gli spin

Stati di spin che sono autofunzioni di S2e di Sz possono essere ottenute utilizzando l’operatore S− = Sx− iSyche opera su uno stato |S, MS〉 in questo modo (abbassa di un valore il numero quantico MS: cioè potremmodire che inverte la proiezione dello spin di un elettrone).

S− |S,MS〉= h√

S(S +1)−MS(MS−1) |S,Ms−1〉

Si inizia formando lo stato con il massimo MS compatibile con una data configurazione elettronica (cheè semplice da trovare perché è lo stato con MS = S) e quindi creando stati a MS più basso utilizzandol’operatore S−. Per esempio in un sistema a 3 elettroni con configurazione 1s2s3s esistono 8 modi disistremare gli elettroni in 3 orbitali (23). Cominciamo con lo stato rappresentato dal determinante |1sα ·2sα · 3sα|che sarebbe | 3

2 , 32 〉. Applichiamo a questo stato S−una volta considerando che l’operatore è la

somma dei vari operatori elettronici S− = s1−+ s2−+ s3−

S−∣∣∣∣32 ,

32

⟩= (s1−+ s2−+ s3−)|1sα ·2sα ·3sα|=

h(|1sβ ·2sα ·3sα|+ |1sα ·2sβ ·3sα|+ |1sα ·2sβ ·3sα|) =

che, per la definizione di S− data più sopra, deve essere uguale a

h

√32

(32

+1)− 3

2

(32−1)∣∣∣∣32 ,

12

⟩= h

√3∣∣∣∣32 ,

12

⟩e quindi abbiamo ∣∣∣∣32 ,

12

⟩=

1√3

(|1sβ ·2sα ·3sα|+ |1sα ·2sβ ·3sα|+ |1sα ·2sβ ·3sα|)

Gli stati | 32 ,− 1

2 〉 e | 32 ,− 3

2 〉 possono essere ottenuti da ulteriori applicazioni di S− (o più facilmente inver-tendo la proiezione dello spin di tutti gli elettroni). Si sono così trovati 4 stati con S = 3

2 . I rimanenti 4 staticon S = 1

2 possono essere costruiti utilizzando combinazioni lineari dei determinanti con MS = ± 12 che

risultino ortogonali alle 4 già trovate. Questo esempio dimostra come sia possibile trovare per costruzioneesplicita le 4 funzioni di quartetto e le 4 di doppietto per un sistema a tre elettroni. Nota: non tutti i sistemia tre elettroni hanno 8 stati elettronici, infatti la configurazione 1s22s non può avere stati di quartetto, mane ha solo due di doppietto.

3.4.2 Accoppiamento dei momenti angolari orbitali

Nel caso di atomi uno deve accoppiare direttamente i vari momenti angolari degli elettroni li a formare ilmomento orbitale totale L = ∑i li. Dati due momenti angolari l1e l2, il momento angolare somma ha comevalori permessi la serie |l1 − l2|, |l1 − l2| − 1, . . . , l1 + l2 − 1, l1 + l2. Per esempio una configurazione deltipo p1d1 accoppia i momenti angolari l1 = 1 e l2 = 2. I possibili valori di L sono quini 1, 2 e 3. Questidanno vita a 3 stati diversi P, D e F . Inoltre essendo la configurazione a 2 elettroni saranno possibili perognuno di questi ultimi lo stato di singoletto e di tripletto. Una configurazione atomica di tipo p1d1 da vitaa 6 stati elettronici.

Nel caso di molecole lineari, uno non deve accoppiare vettorialmente i momenti angolari orbitali perchéL2 non commuta con H e L non è un buon numero quantico. Per l’accoppiamento dei momenti angolari sidevono soltanto sommare tra loro i valori di lz dei singoli elettroni. Per esempio accoppiando due orbitaliπ (ciascuno con lz = ±1) si ottengono i possibili valori di Lz: 1+1, 1-1, -1+1, -1-1 cioè rispettivamente 2,0, 0 e -2. I due livelli con Lz = ±2 sono detti livelli ∆e i due stati con Lz = 0 sono detti Σ. Considerandoanche qui lo spin avremmo i seguenti 6 stati: 3∆, 3Σ, 3Σ, 1∆, 1Σ e 1Σ. Questo è quello che si ottiene nelcaso gli elettroni se ne stiano su orbitali non equivalenti cioè per esempio in un caso del tipo 1π12π1. Se,


invece, gli elettroni riempiono orbitali equivalenti (configurazioni tipo π2 per esempio), la situazione si fapiù complessa perché non tutti gli stati di prima sono compatibili con il principio di Pauli. Ricordandoche gli orbitali π sono doppiamente degeneri possiamo scrivere una tabella di questo tipo costruendo gliopportuni determinanti compatibili con i valori indicati di ML e di Sz (i valori negativi di tali n.q. nonvengono indicati perché gli stati risultanti sono semplici immagini speculari di quelli esplicitati):

ML 2 1 0Sz 1 π1α ·π1α / π1α ·π−1α

0 π1α ·π1β / π1α ·π−1β

Si può vedere come non siano possibili stati com ML = 1 (nel caso di un atomo in configurazione p2

lo sarebbero!). Inoltre lo stato ML = 2 e Sz = 1 (π1α · π1α) non è permesso dal principio di Pauli. Cirimangono 3 determinanti: uno corrisponde ad uno stato 1∆, un’altro ad uno 1Σ e infine ad un 3Σ.

Nel caso di molecole omonucleari esiste una simmetria addizionale che identifica gli orbitali: se sonosimmetrici rispetto all’inversione attraverso il centro di massa dei nuclei si dicono gerade (g) se sonoantisimmetrici si dicono ungerade (u). Calcolare il carattere g o u dello stato elettronico risultatnte dal-l’occupazione degli orbitali è immediato e dato dal prodotto delle simmetrie6. Per esempio lo stato π4

u π∗2g

della molecola O2 si calcola dal prodotto u · u · u · u · g · g = g e quindi la molecola ha come simbolo ditermine 3Σg. Se lo stato è Σ si aggiunge un quarto identificatore al simbolo di termine che tiene conto dellasimmetria di riflessione attraverso un piano passante per i due nuclei. Si avranno così termini + o − aseconda delle proprietà di simmetria dello stato.

6Orbitali σ , π∗, δ , φ∗ sono sempre g, orbitali σ∗, π, δ ∗, φ sono sempre u.

Capitolo 4

Descrizione Born Oppenheimer dellemolecole

4.1 Calcolo degli stati legati delle curve Born Oppenheimer

Le incognite dell’equazione (1.86) sono sia la funzione d’onda usν j(R) sia gli autovalori Esν j. Per comodità

da ora in poi ci riferiremo ad un solo stato elettronico e quindi elimineremo l’indice s dall’equazione (1.86)che risulta

− 12µ

d2

dR2 uν j(R)+Vj(R)uν j(R) = Eν juν j(R)

dove

Vj(R) = V (R)+l(l +1)2µR2

è il potenziale efficace con le barriere centrifughe. L’espressione si può ulteriormente semplificare:[d2

dR2 +2µ(Eν j −Vj(R))]

uν j(r) = 0 (4.1)

La risoluzione numerica dell’equazione deve quindi trovare contemporaneamente sia gli autovalori siagli autovettori dell’Hamiltoniano. Uno dei metodi possibili è quello di utilizzare la diagonalizzazionedella matrice Hamiltoniana calcolata sulla base di funzioni arbitrarie ortonormali come i polinomi di Her-mite. Un altro è quello di integrare numericamente l’equazione (1.86). Per un sistema monodimensionalei due metodi sono del tutto equivalenti anche se il primo risulterebbe decisamente più rapido. In realtà lascelta tra i due metodi dipende fortemente dal sistema in esame ed entrambi vengono utilizzati (con dellevariazioni significative) per la descrizione di sistemi più complessi come i sistemi poliatomici o per la ri-cerca delle funzioni d’onda del continuo. Ho scelto il secondo metodo (l’integrazione numerica) perche’secondo me è di gran lunga più didattico rispetto al primo.

In entrambi i casi autofunzioni e autovalori vengono determinati risolvendo l’eq (1.86) e imponendo duecondizioni al contorno: per un qualunque stato legato, infatti, us

ν j(R) deve essere zero sia per R moltopiccoli sia per R grandi. La soluzione u deve quindi soddisfare contemporaneamente le due condizionial contorno: u(0) = 0 e u(R → ∞) = 0 come indicato in 1.2. Le regioni di spazio dove la u(r) deveandare a zero sono le regioni “classicamente proibite” cioè regioni dove l’energia cinetica del sistemarisulta negativa. In queste regioni si può dimostrare che le possibili soluzioni dell’ eq. (1.86) sono funzioniesponenziali decrescenti. Data un’energia le intercette di questa retta orizzontale con il potenziale vengonodetti turning point. Se l’energia è negativa si hanno due turning point se è positiva solo uno (quellodi sinistra). Per energie negative la funzione d’onda può oscillare solo all’interno dei due turning point.All’esterno si hanno gli esponenziali decrescenti. Ne consegue che la funzione d’onda non può avere nodiall’esterno dei tuning point.

81

CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE 82

4.1.1 Il metodo di integrazione di Numerov per le equazioni differenziali al secon-do ordine

Il metodo di Numerov serve ad integrare equazioni differenziali della forma

d2ydx2 =−g(x)y(x)+ s(x)

dove g(x) e s(x) sono funzioni date. L’equazione radiale (4.1) ha questa forma con g(x) = 2µ[E−V (x)] es(x) = 0.

Per risolvere il problema si divide l’intevallo spaziale di interesse (cioè quello in cui si vuole trovare lasoluzione) in N intervallini di ampiezza ∆x. Siano xi i nodi della griglia così ottenuta e yi = y(xi) i valoridella funzione incognita y(x)in corrispondenza di tali punti. Nel caso dell’eq. (4.1) la funzione s(x) è nullae la formula di Numerov risulta molto semplice:

yn+1 =(12−10 fn)yn− fn−1yn−1

fn+1

dove per convenienza si è posto:

fn = 1+2µ

h2 [E−V (xn)]∆x2

12

Questa formula permette di ottenere la soluzione al punto yn+1 conoscendo la soluzione nei due punti pre-cedenti. Come è evidente bisogna avere due punti di partenza in cui la funzione è nota. Nel problemaspecifico dell’eq. (4.1) questi punti di partenza si trovano nella regione classicamente proibita a sinistradove sappiamo che u(0) ' 0. La soluzione viene infatti integrata punto per punto partendo dalla regioneclassicamente proibita di sinistra applicando la formula di Numerov. Condizione perchè questo meto-do funzioni è che il passo di integrazione (step size) sia molto piccolo dell’ordine di 10−2 − 10−3 voltel’intervallo di integrazione.

4.1.2 Condizioni al contorno e divergenza della funzione d’onda

Come abbiamo visto esiste un modo semplice di integrare l’eq. (4.1) partendo da sinistra e proseguendopunto per punto verso destra. In questo modo abbiamo già incluso nel nostro calcolo una delle due condi-zioni al contorno. Ma la nostra è un’equazione differenziale al secondo ordine e quindi richiede un’altracondizione per rimuovere l’ambiguità sulla soluzione. Un problema è includere quindi correttamente l’altracondizione al contorno u(∞) = 0. Un altro problema è quello di trovare la giusta energia da infilare nel ter-mine noto 2µ

h2 [E−V (xn)] perchè come sappiamo l’energia risulta quantizzata. In realtà questi due problemisono due facce della stessa medaglia in quanto è proprio l’imposizione delle due condizioni contempora-neamente a quantizzare l’energia. Adesso dimostrerò in pratica come l’includere la seconda condizione alcontorno ci permetta non solo di trovare la giusta funzione d’onda, ma anche l’energia quantizzata.

Integriamo (4.1) utilizzando il metodo di Numerov utilizzando un’energia negativa a caso scelta all’internodella buca di potenziale e partendo da sinistra dalla condizione u(0) = 0 e procedendo verso destra finoad addentrarci nell’altra regione classicamente proibita. Ovviamente non è necessario partire esttamenteda R = 0, ma basta partire da una regione che sia sufficientemente all’interno del turning point di sinistra.Per cominciare ad integrare dobbiamo avere i valori della funzione in yn−1=0 e yn=1 che possono esserepresi senza troppi problemi come valori molto piccoli per esempio usando la formula yn = r j+1

n . Quelloche succede è rappresentato in Figura 4.1. Dato un potenziale generico come quello indicato nel pannello(a) cominciamo ad integrare una soluzione dell’eq (4.1) partendo da sinistra e prendendo come valore del-l’energia il valore -0.6. Quando cominciamo ad addentrarci nella regione classicamente proibita a destra lanostra soluzione comincia a crescere e a divergere rapidamente (un’esponenziale crescente è una possibilesoluzione della (4.1) in quella regione anche se quella fisicamente priva di senso). Questa soluzione non èfisicamente corretta perché non rispetta la seconda condizione al contorno. Diminuiamo la nostra energia


Figura 4.1: Calcolo della funzione d’onda per alcune energie “trial” usando il propagatore di Numerov

di prova a -0.63 e ricominciamo. Questa volta la soluzione sembra comportarsi leggermente meglio, madiverge lo stesso. Se scendiamo in energia fino a -0.65 ottentiamo una soluzione che questa volta divergenel senso opposto. Usiamo quindi una via di mezzo come -0.645 e otteniamo una buona funzione d’ondaalmeno fino ad un certo valore di R (pannello (e)). Un’ulteriore piccola diminuzione dell’energia a -0.6455ci fa ottenere una soluzione in cui la divergenza si è spostata ancora verso R maggiori. Continuando diquesto passo si può fare in modo che la divergenza numerica della funzione d’onda sia confinata semprepiù ad R maggiori e quindi ottenere una soluzione sempre più vicina a quella vera. Contemporaneamentela nostra energia di prova sarà sempre più simile all’autovalore cercato.

Questo metodo piuttosto semplice permette di trovare un’autofunzione ed un autovalore dell’eq. (4.1).In realtà per poter generalizzare il più possibile questo metodo bisogna introdurre la conta dei nodi dellafunzione e un metodo di scelta delle energie di prova. In pratica un eventuale programma potrebbe usarequesto motodo per calcolare un numero fissato di stati legati partendo dal più basso in energia. Questopotrebbe essere l’algoritmo da seguire:

1. dividere la buca di potenziale [−De,0] a metà in due intervalli di energia (alto [−De/2,0] e basso[−De,−De/2]) e iniziare con l’energia a metà della buca di potenziale (Etrial =−De/2);

2. fissare il numero di nodi desiderato a zero per cercare lo stato fondamentale;

3. integrare una funzione d’onda di prova da destra verso sinistra fino al turning point di destra contandoil numero di cambi di segno (i nodi si possono avere solo prima del turning point);

(a) se il numero di nodi è superiore a quello desiderato cambiare il valore dell’energia di prova inmodo che quella nuova sia a metà del semintervallo basso (Etrial =−De/2−De/4) (bisezionedell’energia) e andare al punto 3;

(b) se il numero di nodi è inferiore a quello desiderato cambiare il valore dell’energia di provaquesta volta scegliendo la metà del semintervallo alto (bisezione dell’energia) e andare al punto3;

(c) se il numero dei nodi è quello cercato andare al punto 4;

4. integrare la funzione oltre il turning point e vedere quando comincia a crescere in valore assoluto;

(a) se diverge ad R sufficientemente grandi (la soluzione può essere considerata accurata) andareal punto 5;

(b) se diverge con valori positivi abbassare l’energia bisezionando ulteriormente l’intervallo dienergie e andare al punto 3;


(c) se diverge con valori negativi alzare l’energia con lo stesso metodo andare al punto 3;

5. aumentare il numero dei nodi desiderato di una unità e se questo è inferiore al numero di stati cercatiandare al punto 3; se è superiore o uguale uscire.

4.1.3 Il metodo dello “Shooting”

In pratica, benchè attuabile, il metodo precedente presenta alcune difficoltà:

• calcolare la funzione d’onda nelle regioni classicamente proibite è rischioso perché il computerfacilmente va in overflow sugli esponenziali crescenti;

• stabilire un criterio di accuratezza sulle energie è difficile;

• l’algoritmo è lento.

Il metodo che si utilizza in pratica è il metodo dello shooting che non presenta i problemi elencati ed èmolto più rapido nel raggiungere la convergenza. Il programma va alla ricerca della soluzione u(R) conun determinato numero di nodi (la conta dei nodi viene fatta come nel metodo precedente) all’internodi un certo intervallo di energie fissato [Emin, Emax] e considera inizialmente l’energia E corrispondenteal punto medio dell’intervallo. L’integrazione viene fatta da destra verso sinistra partendo dalla regioneclassicamente proibita dove viene imposta la condizione ψL = 0. L’integrazione viene portata avanti fino alturning point esterno Rc (right TP). Se il numero dei nodi è diverso dal numero richiesto, l’energia è moltodiversa dall’autovalore e si procede a cambiare energia usando il metodo della bisezione: se il numero deinodi è maggiore di quello richiesto significa che E è troppo alta, se invece il numero di nodi è più piccolo,significa che E è troppo bassa; Viene allora scelto il semintervallo opportuno: rispettivamente [Emin,E] o[E,Emax] e si ricomincia ad integrare dalla regione classicamente proibita (vedi Figura 4.2 ).

Figura 4.2: Prima fase del metodo dello shooting

Quando il numero dei nodi e’ quello giusto, si procede con l’integrare una seconda soluzione uR(R) dadestra verso sinistra a partire dalla regione classicamente proibita di destra fino a Rc (vedi Figura 4.3).In Rc ci sono due valori della soluzione uL(Rc) e uR(Rc) che saranno in generale diversi. I due valorisarebbero uguali insieme alle loro derivate prime solo se E fosse un autovalore. Usiamo questa condizioneper trovare E. Per prima cosa si scala il valore di uR(R) di un fattore uL(Rc)/uR(Rc) in modo che le duefunzioni abbiano un raccordo continuo. Ottenuta così una funzione d’onda continua, la si normalizza.

La parte cruciale dell’algoritmo e’ il calcolo della derivata prima delle due soluzioni al punto di contattoRc. La differenza ψ ′

R(rc)−ψ ′L(rc) è nulla quando E corrisponde ad un autovalore. Il segno nella differenza

delle derivate ci permette di capire se E è troppo alta o troppo bassa e quindi di applicare nuovamente ilmetodo della bisezione per migliorarne la stima. Si ritiene di essere giunti a convergenza quando l’ampiezzadell’intervallo di energia è più piccola di una certa tolleranza.


Figura 4.3: Seconda fase del metodo dello shooting

Appendice A

Gli spazi di Hilbert

Per definire matematicamente uno spazio di Hilbert e le sue proprietà geometriche è necessario partire daun concetto molto astratto chiamato spazio metrico. Uno spazio metrico è così generale che può contenerepraticamente qualunque cosa: in pratica è un insieme in cui esiste un modo di definire una distanza tra glielementi.

Riguardo la notazione ricordiamo brevemente: se X è un insieme allora x ∈ X significa che x è elementodi X e x /∈ X che non ne è elemento; La dicitura ”per tutti gli x in X” è abbreviata con (∀x ∈ X) e quella”esiste un x in X tale che” con (∃x ∈ X). Il simbolo x|P(x) denota l’insieme di x che hanno la proprietàP(x). Infine l’insieme di coppie ordinate 〈x, y〉|x ∈ X , y ∈ Y è detto prodotto cartesiano degli insiemi Xe Y ed è indicato con X ⊗Y . Ricordiamo che data una funzione a singolo valore che connette due insiemif : X 7→ Y esiste un solo elemento f (x) ∈ Y per ogni x ∈ X ; inoltre se A ⊂ Y allora f [A] = f (x)|x ∈ Aè un sottoinsieme di Y e viceversa f−1[B] = x| f (x) ∈ B è un sottoinsieme di X se B ⊂ Y . X vienedetto il dominio di f e f [X ] il suo range indicato con Ran f . Una funzione è detta iniettiva (o one-one) se∀y ∈ Ran f , ∃x ∈ X tale che f (x) = y; è detta surriettiva se Ran f = Y . Se f è sia surriettiva che iniettiva èdetta biiniettiva.

A.1 Spazi metrici

Per prima cosa definiamo la distanza in modo più generale di quanto si faccia in R3.

• Uno spazio metrico è un insieme M più una funzione a valori reali d(·, ·) definita su M⊗M chesoddisfa

1. d(x, y)≥ 0

2. d(x, y) = 0 se e solo se x = y

3. d(x, y) = d(y, x)

4. d(x, z)≤ d(x, y)+d(y, z) che è la disuguaglianza triangolare (vale anche per le normali distanzein R3 dove d(x, y) =

√(x1− y1)2 +(x2− y2)2 +(x3− y3)2.)

• Una sequenza di elementi xn∞n=1 di uno spazio metrico 〈M, d〉 si dice convergere all’elemento

x ∈ M se d(x, xn)→ 0 as n → ∞. Questa proprietà si indica con xnd−→ x o con limn→∞ xn = x.

• Una sequenza di elementi xn∞n=1 di uno spazio metrico 〈M, d〉 si dice sequenza di Cauchy se

∀ε > 0 ∃N n, m ≥ N implica che d(xn, xm) < ε .

Tutte le sequenze convergenti sono sequenze di Cauchy, ma l’opposto non è vero: per esempio datol’insieme di numeri razionali Q in cui la distanza d(x, y) è definita come al solito con |x− y|, sia x∗

86

APPENDICE A. GLI SPAZI DI HILBERT 87

un numero irrazionale. Se xn è una sequenza di razionali tale che xnd−→ x∗, allora xn è una sequenza

di Cauchy, ma non converge perché il limite non è elemento di Q.

Uno spazio metrico in cui tutte le le sequenze di Cauchy convergono si dice completo. Per esempio Rè un insieme completo, mentre Q non lo è. Questo esempio dovrebbe fare intuire quale è l’operazionematematica necessaria a creare uno spazio metrico completo da uno incompleto: si devono aggiungere allospazio incompleto tutti i limiti delle sequenze di Cauchy. La condizione sotto cui questa cosa si può farenon è ovvia né banale. Cominciamo con il definire il concetto di insieme denso: un insieme B si dice densonello spazio metrico M se ogni m ∈ M è un limite degli elementi di B. Perché uno spazio incompleto Xpossa essere trasformato nell spazio completo X , aggiugendo i limiti delle serie di Cauchy, dovrebbe essereun insieme denso nello spazio X . Nell’esempio precedente, se vogliamo completare lo spazio dei numerirazionali Q dobbiamo aggiungere tutti i limiti in modo da ottenere lo spazio completo R. La condizioneperché questo possa essere fatto è che Q sia un insieme denso di R. Il problema è che se B non è giacontenuto in M (come Q lo è in R), la definzione di insieme denso non si sa bene cosa voglia dire. Perrisolvere la situazione si deve introdurre un ulteriore concetto, quello di isometria: una trasformazionebiiniettiva h da 〈X , d〉 a 〈Y, ρ〉 che preserva la metrica

ρ(h(x), h(y)) = d(x, y)

è chiamata isometria. La cosa più importante a proposito di isometrie è che, se una proprietà vale per lastruttura metrica 〈X , d〉, varrà anche in tutti gli spazi ad essa isometrici. Ora possiamo formalizzare cosasignifica completare uno spazio metrico: esiste, infatti, un teorema che ci assicura che è sempre possibile”ingrossare” uno spazio incompleto in modo da ”renderlo” completo:

dato uno spazio metrico incompleto 〈M, d〉 è sempre possibile trovare uno spazio metricocompleto M tale che M sia isometrico ad un sottospazio denso di M.

A.2 Spazi vettoriali

Passiamo dagli astratti spazi metrici ai più familiari spazi vettoriali. Definiremo prima gli spazi normatiperché sono più generali e quindi gli spazi dotati di prodotto scalare.

• Uno spazio lineare normato è uno spazio vettoriale V su R o su C più una funzione norma ‖·‖ da Va R che soddisfa

1. ‖v‖ ≥ 0 ∀v ∈ V

2. ‖v‖= 0 se e solo se v = 0

3. ‖αv‖= α ‖v‖ ∀v ∈ V , ∀α ∈ C4. ‖v+w‖ ≤ ‖v‖+‖w‖ ∀v, w ∈ V ,

– La norma nel caso di uno spazio Rn è quella tradizionale, cioé la lunghezza dei vettori ‖(x1, . . . , xn)‖=√∑i |xi|2

– La presenza di una norma induce una metrica naturale d(v, w) = ‖v−w‖. Questo significa chegli spazi normati sono un tipo particolare di spazi metrici.

L’esistenza di una norma aggiunge alla possibilità di misurare le distanze tra elementi (metrica) anche lapossibilità di misurare la ”lunghezza” dei vettori. Adesso introduciamo il concetto di prodotto scalare (ininglese ”inner product” o ”dot product”) che permette anche di definire in un certo senso anche il concettodi ”angolo” tra i vettori.


• Uno spazio vettoriale V sui complessi si dice uno spazio con prodotto scalare se esiste una fun-zione (detta prodotto scalare) a valore complesso (·, ·) definita su V ⊗V che soddisfa le seguenticondizioni per tutti i x, y, z ∈ V e α ∈ C:

1. (x, x)≥ 0 e (x, x) = 0 se e solo se x = 0

2. (x, y+ z) = (x, y)+(x, z)

3. (x, αy) = α(x, y) e (αx, y) = α∗(x, y)

4. (x, y) = (y, x)∗

– Esempi:

∗ Se lo spazio Cn denota l’insieme delle n-uple di numeri complessi, dati x = (x1, . . . , xn) ey = (y1, . . . , yn) allora una possibile definizione di prodotto scalare è (in analogia con lospazio dei vettori Rn)

(x, y) =n

∑i=1

x∗i yi

∗ Nello spazio C[a, b] che rappresenta l’insieme delle funzioni complesse continue nell’in-tervallo [a, b] il prodotto scalare si definisce, date f (x), g(x) ∈C[a, b]

( f , g) =∫ b

af ∗(x)g(x)dx

– Una delle proprietà più importante degli spazi con prodotto scalare è che sono anche spazinormati. Ogni spazio con prodotto scalare è anche uno spazio normato con norma data da‖x‖= (x, x)

12 . Di conseguenza abbiamo una metrica definita in modo naturale

d(x, y) =√

(x− y, x− y)

• Uno spazio con prodotto scalare completo rispetto alla norma ‖x‖= (x, x)12 è detto spazio di Hilbert.

Due spazi di Hilbert H1 e H2 sono isomorfi se esiste un operatore lineare U da H1 a H2 tale che(Ux, Uy)H2 = (x, y)H1 ∀x, y ∈ H1. Questi operatori lineari sono detto operatori unitari (perchépreservando il prodotto scalare, preservano anche la norma cioè ”la lunghezza” dei vettori).

• Esempi:

– Definiamo L2[a, b] come il set di funzioni integrabili a valore complesso nell’intervallo [a, b]che rispettino la condizione

∫ ba | f (x)|2dx < ∞. Definiamo il prodotto scalare come∫ b

af ∗(x)g(x)dx

si può dimostrare che questo spazio è completo ed è quindi uno spazio di Hilbert in cui normaè data da

‖ f‖=(∫ b

a| f (x)|2dx

) 12

– Definiamo l2 lo spazio delle sequenze xn∞n=1 di numeri complessi che soddisfano ∑

∞n=1 |xn|2 <

∞. Il prodotto scalare può essere definito come

(xn∞n=1, yn∞

n=1) =∞

∑n=1

x∗nyn

Questo esempio è importante perché si può dimostrare che ogni spazio di Hilbert a dimensioneinfinita, ma numerabile è isomorfo a l2.


A.3 Spazio duale

Adesso abbiamo tutti gli strumenti per poter affrontare il problema dello spazio duale. Prima dobbiamodefinire il concetto di trasformazione lineare limitata o operatore limitato. Questi oggetti esistono neglispazi normati (dove si può in un certo senso stabilire un limite). Un operatore limitato da uno spazionormato 〈V1, ‖·‖1〉 ad un altro 〈V2, ‖·‖2〉 è una funzione T che soddisfa

1. T (αv+βw) = αT v+βTw (∀v, w ∈ V )(∀α, β ∈ C)

2. dato un numero C > 0, ‖T v‖2 ≤C‖v‖1. Il numero C più piccolo definisce la norma dell’operatoreche quindi è l’estremo inferiore delle norme in V1

‖T‖= inf‖v‖1=1

‖T v‖2

Prendiamo l’insieme di tutte le trasformazioni lineari limitate che connettono due spazi di Hilbert e chia-miamolo L (H1, H2) e poi interessiamoci del caso particolare in cui il secondo spazio di Hilbert coincidecon C. Lo spazio L (H1,C) è detto spazio duale di H e può essere idicato con H ∗. Gli elementi di H ∗

sono detti funzionali lineari continui. Esiste un teorema importante dell’analisi (lemma di Riesz) che ciassicura che, preso un funzionale lineare T ∈ H ∗ qualunque, esiste ed è unico un elemento dello spaziodi Hilbert y ∈H tale che T (x) = (y, x) per ogni x ∈H . Inoltre ‖y‖H = ‖T‖H ∗ . Per definizione risultavero anche l’inverso del lemma di Riesz cioé che ogni y ∈ H definisce un funzionale lineare continuo Tsu H attraverso la relazione T (x) = (y, x) che è la definzione di prodotto scalare che abbiamo usato noiprecedentemente quando abbiamo introdotto il conceto di spazio dei bra.

A.3.1 Basi

Finiamo questa appendice menzionando 3 teoremi che completano le proprietà degli spazi di Hilber chesono rilevanti per la meccanica quantistica elementare:

1. Ogni spazio di Hilbert possiede una base ortonormale.

2. Se H è uno spazio di Hilbert e S = xαα∈A una base ortonormale. Allora ogni y ∈H può essereespresso come combinazione lineare

y = ∑α∈A

(xα , y)xα e ‖y‖2 = ∑α∈A

|(xα , y)|2

questo teorema estende al caso infinito-dimensionale quello che siamo abituati a vedere come ilnormale teorema di espansione nel caso di basi o spazi vettoriali finiti.

3. Definizione: uno spazio metrico si dice separabile se ha un sottoinsieme numerabile denso. Unospazio di Hilbert è separabile se ha una base ortonormale numerabile S. Se ci sono N < ∞ elementinella base, allora H è isomorfo a CN . Se ci sono infiniti elementi numerabili in S, allora H èisomorfo a l2. Questo teorema ci assicura che gli spazi di Hilber a dimensione finita rientrano nelcaso più semplice di spazi vettoriali Cn o Rn.

Appendice B

Il programma LEVEL

Il programma LEVEL determina il numero, le energie e le proprietà dei livelli vibro-rotazionali di un datopotenziale monodimensionale. Il nucleo del programma quindi risolve per le autofunzioni e per le energiela seguente equazione

− h2

2µ

d2ψν , j(R)dR2 +Vj(R)ψν , j(R) = Eν , jψν , j(R)

dove µ e’ la massa ridotta del sistema a due particelle, j è il numero quantico del momento angolare e ilpotentiale efficace Vj(R) è la somma dell’energia elettronica Born-Oppenheimer più il termine centrifugo.Per una molecola biatomica il termine centrifugo è dato da:

[ j( j +1)]2µR2 .

Quello che fa il programma è determinare le energie Eν , j e le autofunzioni ψν , j. L’accuratezza del calcolo èdeterminata in massima parte dalla dimensione della griglia radiale di integrazione [Rmin,Rmax] e dallo stepdi integrazione∆R cioè dalla variabile RH che viene letta a riga #4 del file di input. Se lo step di integrazioneè troppo grande si otterranno valori inaccurati delle energie, mentre se è troppo piccolo il tempo di calcolopuò diventare eccessivo. La dimensione della griglia invece deve essere abbastanza grande da poter inclu-dere anche gli stati vibrazionali più diffusi (eccitati). L’integrazione viene condotta da Rmin verso destrae da a Rmaxverso sinistra con il propagatore di Numerov. Per iniziare la propagazione è necessario speci-ficare il valore della funzione in due punti adiacenti per ognuno dei due limiti di integrazione: poco oltreRmaxla funzione viene inizializzata ad un valore arbitrario (uno per esempio) mentre al punto adiacente (piùinterno) viene calcolata usando l’approssimazione semiclassica WKB:

ψν , j ∼ [Vj(R)−Eν , j]−1/4 exp

(−√

2µ

h2 [∫ Rmax

Rmin

[Vj(R′)−Eν , j]1/2dR′)

.

A corto raggio i potenziali realistici crescono rapidamente con il diminuire della distanza R e la ψ “muore”molto rapidamente nella regione classicamente proibita, quindi la funzione d’onda viene inizializzata azero ponendo ψν , j(Rmin) = 0 e dando alla funzione al punto adiacente ψν , j(Rmin + ∆R) un valore piccoloarbitrario. La procedura utilizzata è quella dello “shooting” in cui, per una data energia di prova, l’inte-grazione viene effettuata verso l’interno partendo da Rmax e verso l’esterno partendo da Rmin fino a quandoi due segmenti di funzione d’onda si incontrano ad un certo punto di matching Rx. La discontinuità delleloro pendenze viene quindi utilizzata come indicatore per migliorare l’energia di prova fino a convergenza.Il programma LEVEL sceglie Rx in modo che sia localizzato all’interno dei due turning point nella regioneclassicamente permessa.

In genere le distanze Rmin e Rmax devono trovarsi ben all’interno delle regioni classicamente proibite cosìche la funzione d’onda sia vari ordini di grandezza più piccola rispetto alla sua ampiezza nella regione clas-sicamente permessa. Il codice LEVEL stampa un messaggio di warning se questo rapido decadimento non è

90

APPENDICE B. IL PROGRAMMA LEVEL 91

almeno di un fattore 10−9. Se questo accade potrebbe essere necessario diminuire Rmin o aumentare Rmax.Al contrario se Rmin o Rmax sono troppo all’interno delle regioni classicamente proibite il fattore [Vj(R)−E]potrebbe risultare troppo grande e il propagatore di Numerov diventare instabile. Per una molecola biato-mica questo può succedere solo per Rmin. Se è il caso un messaggio di warning viene stampato e il valoredi Rmin viene automaticamente aumentato internamente al programma finché il problema scompare.

All’interno di LEVEL è possibile utilizzare molte forme analitiche di potenziale dalle più semplici come ilpotenziale di Morse

V (R) = De

[1− eβ (R−Req)

]2

alle più complicate come il potenziale HDF

V (R) = A(

RReq

)p

e−β0R

Req −β1

(R

Req

)2

−D(

RReq

)∑m

Cm

Rm

o utilizzare direttamente i punti del calcolo ab-initio indicando a LEVEL stesso di utilizzare una forma diinterpolazione di questi punti (tipicamente una interpolazione tipo “cubic spline”).