41
Uniwersytet Jagiello´ nski Wydzial Chemii, Zaklad Chemii Teoretycznej praca magisterska Implementacja efektywnych metod opisu korelacji elektronowej w du ˙ zych ukladach molekularnych Krzysztof Kowalczyk Promotor: dr Marcin Makowski Krak´ow2009

Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Embed Size (px)

Citation preview

Page 1: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Uniwersytet Jagiellonski

Wydzia l Chemii, Zak lad Chemii Teoretycznej

praca magisterska

Implementacja efektywnych metod opisukorelacji elektronowej w duzych uk ladach

molekularnych

Krzysztof Kowalczyk

Promotor: dr Marcin Makowski

Krakow 2009

Page 2: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Implementacja efektywnych metod opisu korelacji elektronowej w duzych

uk ladach molekularnych

Streszczenie

Metoda rachunku zaburzen Møllera-Plesseta drugiego rz edu jest jedn a z podstawowych me-

tod ab initio chemii kwantowej uwzgl edniaj acych efekty korelacji kulombowskiej. Jednakze

jej wysoka z lozonosc czasowa i pami eciowa czyni j a bezuzyteczn a dla duzych uk ladow mo-

lekularnych. Celem niniejszej pracy by la implementacja przeformu lowanego formalizmu tej

metody wykorzystuj acego transformacj e Laplace’a. Algorytm ten operuje w bazie orbitali

atomowych, wykazuj ac kwadratow a z lozonosc czasow a i pami eciow a dla duzych uk ladow.

Zaimplelentowano takze algorytm wykorzystuj acy rozwini ecie multipolowe, co umozliwi lo

osi agni ecie liniowego skalowania pami eciowego. Ponadto wykonano za pomoc a zaimplemen-

towanego algorytmu obliczenia dla wybranych uk ladow modelowych celem potwierdzenia

jego poprawnosci i wydajnosci.

S lowa kluczowe: rachunek zaburzen, MP2, transformacja Laplace’a, momenty multipo-

lowe, z lozonosc czasowa, z lozonosc pami eciowa

Page 3: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Implementation of the effective methods of description of the coulombic

correlation in large molecular systems

Abstract

Møller-Plesset second-order perturbation theory is a cornerstone of ab initio quantum

chemistry methods which takes into account effects of the coulombic correlation. However,

high time and memory complexity of this method makes it unusable for large molecular

systems. The aim of this work was an implementation of the re-formulated formalism of

the method, which uses Laplace transform and operates in atomic orbitals basis. This led

to the algorithm that scales quadratically in time and memory domain. An algorithm us-

ing multipole expansion was also implemented and memory linear scaling was achieved.

Additionally, calculations for selected model systems were made, to prove its correctness

and efficiency.

Keywords: perturbation theory, MP2, Laplace transform, multipole moments, memory

scaling, time scaling

Page 4: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Sk ladam podzi ekowania

Panu Doktorowi Marcinowi Makowskiemu

oraz Panu Doktorowi Grzegorzowi Mazurowi

za zyczliwosc oraz pomoc okazan a mi przy pisaniu tej pracy

Page 5: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Spis tresci

1 Wprowadzenie 4

1.1 Metoda MP2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Metoda LT-AO MP2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2.1 Transformacja Laplace’a . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.2 MP2 w bazie orbitali atomowych . . . . . . . . . . . . . . . . . . . 7

1.2.3 Wst epna selekcja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3 Wykorzystanie rozwini ecia multipolowego . . . . . . . . . . . . . . . . . . . 11

2 Implementacja 17

2.1 Kwadratura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1.1 Metoda najmniejszych kwadratow . . . . . . . . . . . . . . . . . . . 18

2.1.2 Kwadratura Eulera-McLaurina . . . . . . . . . . . . . . . . . . . . 19

2.2 Struktury do przechowywania ca lek . . . . . . . . . . . . . . . . . . . . . . 20

2.3 Opis algorytmu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3 Wyniki 25

3.1 Dok ladnosc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 Kontrola dok ladnosci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 Z lozonosc czasowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.4 Z lozonosc pami eciowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Podsumowanie 38

3

Page 6: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1

Wprowadzenie

Intensywny rozwoj takich dziedzin nauki jak biochemia czy inzynieria materia lowa sta-

wia coraz wi eksze wymagania metodom obliczeniowym chemii. Rosnie zapotrzebowanie na

wydajne i dok ladne algorytmy umozliwiaj ace teoretyczne przewidywanie w lasciwosci coraz

bardziej z lozonych uk ladow. Stale zwi ekszaj ace si e mozliwosci obliczeniowe wspo lczesnych

komputerow nie nad azaj a jednakze za wzrostem wymagan stawianych im przez coraz bar-

dziej zaawansowane modele teoretyczne i algorytmy obliczeniowe. Konieczne staje si e zatem

wypracowanie metod, ktore wykorzystaj a mozliwosci obliczeniowe komputera w najbardziej

wydajny sposob, zapewniaj ac otrzymanie dok ladnych wynikow w jak najkrotszym czasie.

Optymalnym zachowaniem algorytmu jest jego liniowe skalowanie czasowe wraz ze wzro-

stem rozmiaru uk ladu. Jednakze nawet podstawowe metody chemii kwantowej, takie jak

metoda Hartree-Focka, nie osi agaj a liniowego skalowania czasowego bez z lozonych modyfi-

kacji algorytmu. Metody te nie uwzgl edniaj a w dodatku efektow korelacji kulombowskiej,

co czyni je ma lo przydatnymi w swietle problemow, z ktorymi zmaga si e wspo lczesna

chemia kwantowa. Zaawansowane metody wychodz ace poza przyblizenie Hartree-Focka,

takie jak metoda sprz ezonych klastrow lub metoda mieszania konfiguracji, pozwalaj a na

osi agni ecie bardzo dobrej dok ladnosci, lecz ich skalowanie czasowe czyni je praktycznie

bezuzytecznymi w zastosowaniach odnosz acych si e do duzych uk ladow. Alternatyw a dla

metod opartych na funkcji falowej jest teoria funkcjona low g estosci, jednakze metody na

4

Page 7: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 5

niej oparte, jakkolwiek maj a z lozonosc obliczeniow a porownywaln a ze z lozonosci a metody

Hartree-Focka oraz dobrze odtwarzaj a korelacj e kulombowsk a, cz esto nie opisuj a poprawnie

efektow przeniesienia ladunku oraz efektow dyspersyjnych.

Niniejsza praca opisuje implementacj e przeformu lowanego w 1991 roku formalizmu me-

tody MP2 [1], pozwalaj acego na uzyskanie algorytmu skaluj acego si e kwadratowo dla du-

zych uk ladow. Opisano takze implementacj e zaproponowanego w 2005 roku formalizmu

wykorzystuj acego rozwini ecie multipolowe [2-3], co pozwala na osi agni ecie liniowego skalo-

wania czasowego i pami eciowego dla duzych uk ladow. Motywacj a do wykonania tej pracy

by l brak publicznie dost epnej implementacji tych metod do zastosowan produkcyjnych.

W drugiej cz esci pracy przedstawiono takze wyniki obliczen dla wybranych uk ladow.

1.1 Metoda MP2

Metoda rachunku zaburzen Møllera-Plesseta [4] jest jedn a z najprostszych metod chemii

kwantowej wychodz acych poza przyblizenie Hartree-Focka. Jednoczesnie pozwala ona na

efektywne oszacowanie efektow kulombowskiej korelacji elektronowej, jak rowniez, w prze-

ciwienstwie do metod opartych na teorii funkcjona low g estosci, na odtworzenie efektow

dyspersyjnych oraz efektow przeniesienia ladunku. Metoda ta dobrze odtwarza wi eksz a

cz esc dynamicznej korelacji kulombowskiej dla stanu podstawowego jakosciowo opisanego

jednym wyznacznikiem, nie nadaje si e jednak do opisu stanow wzbudzonych i korelacji

statycznej. Pomimo tego jest ona obecnie podstaw a obliczen ab initio dla wielu uk ladow,

w znacz acym stopniu rekompensuj ac niedoskona losci metody Hartree-Focka.

Metoda MP2 pozwala na wyznaczenie poprawki do energii elektronowej otrzymanej

metod a Hartree-Focka. Poprawka do energii dla metody Møllera-Plesseta drugiego rz edu

(MP2) dla uk ladow zamkni etopow lokowych wyraza si e nast epuj aco [4]:

∆E = −occ∑ij

virt∑ab

(ia|jb)[2(ia|jb)− (ib|ja)]

εa + εb − εi − εj(1.1)

gdzie i, j oznaczaj a zaj ete, a a, b - wirtualne orbitale molekularne, otrzymane z obliczen

Page 8: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 6

metodami SCF, εa, εb, εi, εj - energie orbitalne, zas (ia|jb) jest ca lk a dwuelektronow a:

(ia|jb) =∫i(~r1)j(~r2)

1

r12

a(~r1)b(~r2)d~r1d~r2 (1.2)

Pomimo, ze metoda MP2 ma relatywnie niewielkie jak na metod e post-HF wymagania

dotycz ace mocy obliczeniowej i pami eci operacyjnej komputera, w swym konwencjonalnym

sformu lowaniu wykazuje wci az nieproporcjonalny wzrost wymagan dotycz acych zasobow

sprz etowych wraz ze wzrostem rozmiaru uk ladu. Z powodu koniecznosci wykonania trans-

formacji ca lek dwuelektronowych z bazy orbitali atomowych do bazy orbitali molekular-

nych:

(ia|jb) =∑µνλσ

(µν|λσ)CµiCνaCλjCσb (1.3)

metoda ta osi aga z lozonosc czasow a O(N5) [4], gdzie N jest liczb a funkcji bazy. Koniecz-

nosc przechowywania cz esciowo przetransformowanych ca lek oznacza z kolei z lozonosc pa-

mi eciow a algorytmu wynosz ac a O(N4) [4]. Transformacja bazy jest etapem limituj acym

szybkosc obliczen metody MP2, ograniczaj ac jej stosowalnosc do cz asteczek zawieraj acych

maksymalnie oko lo 100 elektronow lub odznaczaj acych si e wysok a punktow a grup a syme-

trii [5].

1.2 Metoda LT-AO MP2

Duza z lozonosc czasowa i pami eciowa metody MP2 stoi w sprzecznosci z fizyk a efektow

korelacyjnych. Korelacja kulombowska w uk ladach niemetalicznych jest bowiem zjawiskiem

lokalnym i krotkozasi egowym, a efekt ten przek lada si e na przyk lad na rzadk a struktur e

macierzy g estosci. Metoda MP2, operuj ac w zdelokalizowanej bazie orbitali molekularnych,

nie wykorzystuje tej w lasnosci macierzy g estosci, dlatego tez pojawi la si e koniecznosc prze-

formu lowania jej formalizmu, tak, aby uzyskac lepsze skalowanie czasowe i pami eciowe przy

jednoczesnym zachowaniu dok ladnosci obliczen.

Przeszkod a w sformu lowaniu alternatywnego formalizmu metody MP2 jest mianownik

w wyrazeniu na poprawk e do energii (rown. 1.1), poniewaz uniemozliwia on dokonanie

Page 9: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 7

transformacji unitarnych na orbitalach molekularnych wyst epuj acych w tym wyrazeniu.

W 1991 roku Almlof zaproponowa l metod e usuni ecia tego problemu poprzez zastosowanie

transformacji Laplace’a [6].

1.2.1 Transformacja Laplace’a

Transformacja Laplace’a, zdefiniowana wzorem:

L[f ](x) =∫ ∞0

f(t)e−txdt (1.4)

w przypadku funkcji sta lej pozwala na zast apienie dzielenia ca lkowaniem:

L[1](x) =∫ ∞0

e−txdt =1

x(1.5)

Zastosowanie tej transformacji do wyrazenia na poprawk e do energii metody MP2:

∆E = −∫ ∞0

∑ijab

(ia|jb)[2(ia|jb)− (ib|ja)]e−(εa+εb−εi−εj)tdt (1.6)

a przez to usuni ecie mianownika z u lamka, sprawia, ze wyrazenie to staje si e niezmiennicze

ze wzgl edu na transformacj e unitarn a wazonych energi a orbitali:

|i′〉 = |i〉eεit/2 (1.7)

|j′〉 = |j〉eεjt/2 (1.8)

|a′〉 = |a〉e−εat/2 (1.9)

|b′〉 = |b〉e−εbt/2 (1.10)

Poprawka do energii wyrazona w wazonych energi a orbitalach molekularnych przyjmuje

postac:

∆E = −∫ ∞0

∑i′j′a′b′

(i′a′|j′b′)[2(i′a′|j′b′)− (i′b′|j′a′)]dt (1.11)

1.2.2 MP2 w bazie orbitali atomowych

Zastosowanie transformacji Laplace’a do wyrazenia na poprawk e do energii pozwala

na wyrazenie jej w dowolnej bazie orbitalnej. Maj ac swobod e wyboru bazy szukamy ta-

kiej, ktora jest mozliwie dobrze zlokalizowana (w przeciwienstwie do zdelokalizowanej bazy

Page 10: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 8

orbitali molekularnych) i pozwala la na mozliwie szybkie wyznaczenie ca lek dwuelektrono-

wych. Baza orbitali atomowych, jako optymalna baza spe lniaj aca powyzsze warunki, jest

najbardziej oczywistym wyborem [1].

Orbital molekularny mozna przedstawic jako kombinacj e liniow a orbitali atomowych:

|i〉 =∑µ

|µ〉Cµi (1.12)

|j〉 =∑ν

|ν〉Cνj (1.13)

|a〉 =∑κ

|κ〉Cκa (1.14)

|b〉 =∑λ

|λ〉Cλb (1.15)

Wstawienie powyzszych rownan do wyrazenia na poprawk e do energii (rown. 1.11) prowadzi

do uzyskania sumy:

∆E = −∫ ∞0

∑ijab

∑µνκλ

∑αβγδ

(µν|κλ)[2(αβ|γδ)− (αδ|γβ)] (1.16)

CµiCνjCκaCλbCαiCβjCγaCδbeεiteεjte−εate−εbtdt

Wprowadzaj ac tzw. macierze pseudog estosci X i Y, zdefiniowane przez Hasera [1] jako:

Xµν =occ∑i

CµiCνieεit (1.17)

Yµν =virt∑a

CµaCνae−εat (1.18)

oraz oznaczaj ac:

µ =∑ν

Xµνν (1.19)

µ =∑ν

Yµνν (1.20)

mozna zapisac wyrazenie na poprawk e do energii w postaci:

∆E = −∫ ∞0

∑µνλσ

(µν|λσ)[2(µν|λσ)− (µσ|λν)]dt (1.21)

Podstawowym zagadnieniem obliczeniowym metody LT-AO MP2 staje si e wyznaczenie

wartosci ca lek typu (µν|λσ). Uzywaj ac macierzy pseudog estosci, mozna wyznaczyc wartosc

Page 11: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 9

ca lki dwuelektronowej (µν|λσ), wykonuj ac czteroetapow a transformacj e:

(µν|κλ) =∑σ

Xµσ(σν|κλ) (1.22)

(µν|κλ) =∑σ

Yνσ(µσ|κλ) (1.23)

(µν|κλ) =∑σ

Xκσ(µν|σλ) (1.24)

(µν|κλ) =∑σ

Yλσ(µν|κσ) (1.25)

Taka transformacja funkcji bazy wydaje si e byc rownie kosztowna czasowo i pami eciowo,

co zmiana bazy w konwencjonalnym sformu lowaniu metody MP2 (rown. 1.3). Dodatkowo

pojawia si e koszt wynikaj acy z koniecznosci ca lkowania numerycznego zwi azanego z zasto-

sowaniem transformacji Laplace’a.

Zysk dotycz acy czasu obliczen i zaj etosci pami eci uzyskuje si e, wykorzystuj ac fakt,

iz macierze pseudog estosci s a dla duzych uk ladow macierzami rzadkimi. Oznacza to, ze

wiele ca lek dwuelektronowych mozna pomin ac przy obliczeniach, zas wybor adekwatnych

struktur danych, w ktorych wartosci obliczonych ca lek b ed a przechowywane, pozwala zre-

dukowac takze z lozonosc pami eciow a problemu. Zysk dotycz acy czasu obliczen i z lozonosci

pami eciowej uzyskuje si e po zastosowaniu mechanizmu wst epnej selekcji.

1.2.3 Wstepna selekcja

Wst epna selekcja (ang. prescreening) jest metod a redukcji z lozonosci obliczeniowej al-

gorytmu, polegaj ac a na wykrywaniu i pomijaniu w obliczeniach zaniedbywalnie ma lych

wielkosci (zazwyczaj ca lek dwuelektronowych). Algorytm wst epnej selekcji dla metody

LT-AO MP2 zaproponowany przez Hasera [1] opiera si e na wykorzystaniu szeregu typu

nierownosci Schwarza [7] do szacowania wk ladow do poprawki do energii od poszczegol-

nych ca lek. Mechanizm ten zostanie zilustrowany na przyk ladzie selekcji ca lek atomowych

w pierwszym etapie transformacji.

B l ad wartosci ca lkowitej energii zwi azany z zaniedbaniem pojedynczej ca lki (µν|λσ)

jest pojedynczym wyrazem sumy z wyrazenia 1.21:

θ = (µν|λσ)[2(µν|λσ)− (µσ|λν)] (1.26)

Page 12: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 10

Rownanie 1.16 mozna przepisac, dokonuj ac transformacji na ca lkach wewn atrz nawiasow

kwadratowych. W takim przypadku wyrazenie 1.26 przyjmuje postac:

θ = (µν|λσ)[2(µν|λσ)− (µσ|λν)] (1.27)

Zgodnie z powyzszym wyrazeniem szacuje si e wartosci bezwzgl edne ca lek dwuelektrono-

wych:

|θ| ≤ |(µν|λσ)|[2|(µν|λσ)|+ |(µσ|λν)|] (1.28)

Z nierownosci Schwarza:

|(µν|λσ)| ≤√

(µν|µν)(λσ|λσ) (1.29)

wynika postac wyrazenia, za pomoc a ktorego szacowana jest wartosc b l edu w wartosci

poprawki do energii po zaniedbaniu pojedynczej ca lki:

|θ| ≤√

(µν|µν)(λσ|λσ)[2√

(µν|µν)(λσ|λσ) +√

(µσ|µσ)(λν|λν)]

(1.30)

Wyznaczenie wartosci b l edu dla diagonalnych ca lek typu (µν|λσ) ca lek wymaga jednakze

obliczenia wszystkich atomowych ca lek dwuelektronowych ze wzgl edu na koniecznosc wy-

konania sumowania po wszystkich czterech indeksach ca lki (rown. 1.22-1.25). Zamiast tego

Haser [1], opieraj ac si e na nierownosci Schwarza oraz nierownosci trojk ata, poda l wyrazenia

pozwalaj ace na oszacowanie tych wartosci:

|(µν|µν)| =∑κλ

|Xµκ||Xµλ||(κν|λν)| ≤(∑

κ

|Xµκ|√|(κν|κν)|

)2

(1.31)

|(µν|µν)| =∑κλ

|Yνκ||Yνλ||(µκ|µλ)| ≤(∑

κ

|Yνκ|√|(µκ|µκ)|

)2

(1.32)

Poniewaz wartosci ca lek szacowane s a ”z gory”, do obliczen bierze si e mniejsz a z dwoch

powyzszych wartosci:1

√|(µν|µν)| ≤ min

(∑κ

|Xµκ|√|(κν|κν)|,

∑κ

|Yνκ|√|(µκ|µκ)|

)(1.33)

1Wzor (1.33) jest zgodny z wyrazeniami (31) i (32) w pracy Hasera [1]; analogiczny wzor (3.9) w pracy

Ayali i Scuserii [12] zawiera b l edy drukarskie.

Page 13: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 11

Opieraj ac si e na zdefiniowanych przez Hasera [1] macierzach A, B, C i D:2

Aµν =√|(µν|µν)| (1.34)

Bµν =√|(µν|µν)| (1.35)

Cµν =√|(µν|µν)| (1.36)

Dµν = min

(∑κ

|Xµκ|Cκν ,∑κ

|Yνκ|Bνκ

)(1.37)

mozna zapisac wyrazenie na oszacowanie wartosci b l edu wniesionego do poprawki do energii

przez pomini ecie ca lki (µν|λσ):

θ ≤ AµνAλσ(2DµνDλσ +DµσDλν) (1.38)

Analogiczna procedura wst epnej selekcji moze byc zastosowana na kazdym etapie trans-

formacji, co pozwala znacz aco zredukowac liczb e potrzebnych do obliczenia ca lek dwuelek-

tronowych. Zamiast obliczenia i transformacji N4 ca lek, wyznacza si e cztery dwuindeksowe

wielkosci A, B, C i D i za ich pomoc a eliminuje si e ca lki, ktorych wk lad do poprawki do

energii jest mniejszy od zadanej wartosci ε. Przyk ladowo, na pierwszym etapie transforma-

cji ca lka (µν|λσ) nie b edzie liczona, jezeli:

AµνAλσ(2DµνDλσ +DµσDλν) ≤ ε (1.39)

Zastosowanie powyzszego warunku pozwala na znacz ace zmniejszenie liczby ca lek potrzeb-

nych do transformacji. Na kolejnych etapach transformacji algorytm ten pozwala na elimi-

nacj e cz esciowo przetransformowanych ca lek, co prowadzi do zmniejszenia ich liczby w na-

st epnym etapie. Formalne rozwazania pozwalaj a na pokaznie, ze prowadzi to do otrzymania

kwadratowo skaluj acego si e algorytmu [12].

1.3 Wykorzystanie rozwiniecia multipolowego

W sytuacji, gdy centra dystrybucji ladunku ΩA i ΩB:

ΩA(~r1) = |µν〉 ≡ |A〉 (1.40)

2Nazewnictwo zgodne z prac a Ayali i Scuserii [12]; odpowiednie macierze w pracy Hasera [1] oznaczane

s a jako Q, X, Y i Z.

Page 14: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 12

ΩB(~r2) = |λσ〉 ≡ |B〉 (1.41)

s a od siebie znacznie oddalone, nierownosc Schwarza znacz aco przeszacowuje wartosc ca lki

dwuelektronowej (A|B):

(A|B) =∫µ(~r1)ν(~r1)

1

r12

λ(~r2)σ(~r2)d~r1d~r2 =∫

ΩA(~r1)1

r12

ΩB(~r2)d~r1d~r2 (1.42)

Innymi s lowy, nierownosc Schwarza nie uwzgl ednia zaleznosci 1/r12. Dla duzych uk ladow

molekularnych eliminacja ca lek dwuelektronowych, ktorych wartosc jest zaniedbywalnie

ma la ze wzgl edu na odleg losc pomi edzy opisywanymi przez nie rozk ladami ladunku, moze

przyniesc istotny zysk obliczeniowy.

W 2005 roku Lambrecht i Ochsenfeld [9] zaproponowali metod e preselekcji uwzgl ednia-

j ac a charakter zanikania oddzia lywania kulombowskiego pomi edzy dystrybucjami ladun-

kow. Wykorzystali oni rozwini ecie multipolowe operatora oddzia lywania 1/r12 i na jego

podstawie wyprowadzili nierownosci pozwalaj ace oszacowac”z gory” wartosc ca lki dwu-

elektronowej za pomoc a momentow multipolowych.

Rozwini ecie multipolowe operatora 1/r12 ma postac:

1

r12

=∞∑n=0

∆rn12

Rn+1Pn(cosθ) (1.43)

gdzie Pn(cosθ) jest wielomianem Legendre’a rz edu n, θ jest k atem pomi edzy wektorami

∆~r12 = ~r1A − ~r2B oraz ~R = ~r2 − ~r1. Wektory ~r1A i ~r2B s a zdefiniowane nast epuj aco:

~r1A ≡ ~r1 − ~A (1.44)

~r2B ≡ ~r2 − ~B (1.45)

Wstawiaj ac rozwini ecie multipolowe we wspo lrz ednych sferycznych (rown. 1.43) do wy-

razenia na ca lk e dwuelektronow a, otrzymuje si e:

(A|B) =∑lm

∑jk

qAlmΘABlm,jkq

Bjk (1.46)

gdzie wyrazenia qAlm i qBjk oznaczaj a momenty multipolowe liczone wzgl edem centrum dys-

trybucji A lub B:

qAlm =∫Rlm(~rA)ΩA(~rA)d~r (1.47)

qBjk =∫Rjk(~rB)ΩB(~rB)d~r (1.48)

Page 15: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 13

Rlm i Rjk to regularne tensory kuliste dla zestawow liczb kwantowych lm i jk:

Rnm(~r) =1√

(n−m)!(n+m)!rnCnm(ϕ, ϑ) (1.49)

Wyrazenie Cnm jest cz esci a k atow a tensora kulistego zwi azan a z funkcj a kulist a zaleznosci a:

Cnm(ϕ, ϑ) =

√4π

2n+ 1Ylm(ϕ, ϑ) (1.50)

Rz ad momentu multipolowego wyrazonego we wspo lrz ednych sferycznych wynosi odpo-

wiednio l i j. Wyrazenie ΘABlm,jk jest elementem macierzy oddzia lywan:

Θlm,jk(~R) = (−1)jIl+j,m+k(~R) (1.51)

gdzie Il+j,m+k(~R) jest nieregularnym tensorem kulistym:

Ilm(~R) =

√(n−m)!(n+m)!

Rn+1Cnm(ϕ, ϑ) (1.52)

Alternatywnie, mozna wyrazic rozwini ecie multipolowe ca lki dwuelektronowej we wspo l-

rz ednych kartezjanskich:

(A|B) =∑klm

∑k′l′m′

(−1)k′+l′+m′

QAklmT

ABk+k′,l+l′,m+m′QB

k′l′m′ (1.53)

gdzie odpowiednie sk ladowe momentow multipolowych liczonych wzgl edem centrum dys-

trybucji A lub B, wyrazone we wspo lrz ednych kartezjanskich, maj a postac:

QAklm =

1

k!l!m!

∫xkAy

lAz

mAΩA(~rA)d~r (1.54)

QBk′l′m′ =

1

k′!l′!m′!

∫xk

Byl′

Bxm′

B ΩB(~rB)d~r (1.55)

Ca lkowity rz ad tak zdefiniowanego momentu multipolowego (rown. 1.54) wyraza si e jako

n = k+l+m, gdzie k, l orazm s a sk ladowymi momentu multipolowego wzgl edem odpowied-

nich wspo lrz ednych. T klmAB jest tensorem multipolowym we wspo lrz ednych kartezjanskich:

T klmAB =∂n

∂Rkx∂R

ly∂R

mz

(1

R

)(1.56)

=(−1)nk!l!m!

2nRn+1

k/2∑s=0

l/2∑t=0

m/2∑u=0

× (−1)s+t+u(2n− 2s− 2t− 2u)!

s!t!u!(k − 2s)!(l − 2t)!(m− 2u)!(n− s− t− u)!

×(Rx

R

)k−2s (Ry

R

)l−2t (Rx

R

)m−2u

Page 16: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 14

Rozwijaj ac wyrazenie 1.53 oraz oznaczaj ac kombinacj e liniow a iloczynow QAklmQ

Bk′l′m′

jako MM (n) takich ze k + l + m + k′ + l′ + m′ ≤ n, mozna wyrazic rozwini ecie ca lki

dwuelektronowej w szereg:

|(A|B)| ≤ |MM (0)|R

+|MM (1)|R2

+ · · ·+ |MM (n)|Rn+1

+ · · · (1.57)

Takie rozwini ecie ma jednakze istotn a wad e: nie wiadomo nic o monotonicznosci elemen-

tow powyzszego szeregu, zatem nie wiadomo a priori, na ktorej wartosci n obci ac jego

rozwini ecie. W zwi azku z tym Lambrecht i Ochsenfeld zaproponowali alternatywn a metod e

szacowania wartosci ca lki za pomoc a sferycznie usrednionego momentu multipolowego [2].

Sferycznie usredniony moment multipolowy wyraza si e jako:

M(n)A =

∫|ΩA(~rA)rn|r2dr (1.58)

Ca lka taka ma t e w lasciwosc, ze jej wartosc jest oszacowaniem”z gory” wartosci modu lu

dowolnej sk ladowej nie usrednionego sferycznie momentu multipolowego:

|M (n)| ≤ |M(n)| (1.59)

Wprowadzaj ac efektywne zasi egi rozk ladow ladunku, RA i RB, zdefiniowane jako odleg losc,

dla ktorej wartosc iloczynu funkcji nalez acych do dystrybucji ΩA lub ΩB liczona wzgl edem

centrum dystrybucji jest mniejsza co do modu lu od zadanej wartosci (wartosc ta ma analo-

giczn a rol e do wspo lczynnika obci ecia w metodzie MP2) oraz oznaczaj ac R′ jako efektywn a

odleg losc bior ac a pod uwag e te zasi egi:

R′ = RAB −RA −RB (1.60)

mozna wyrazic wartosc ca lki dwuelektronowej za pomoc a sferycznie usrednionych momen-

tow multipolowych oraz zdefiniowanych powyzej efektywnych odleg losci mi edzy zasi egami

rozk ladow ladunku. Oszacowanie takie ma t e zalet e, ze za pomoc a sferycznie usrednionego

momentu multipolowego n-tego rz edu mozna przyblizyc sumaryczn a wartosc momentow

multipolowych wszystkich wyzszych rz edow. Przyk ladowo, mozna szacowac wartosc ca lki

Page 17: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 15

za pomoc a momentu multipolowego zerowego rz edu:

(µν|λσ) ≤

∣∣∣∣∣∣M(0)µνM

(0)λσ

R′ − 1

∣∣∣∣∣∣ (1.61)

Takie wyrazenie szacuje sumaryczn a wartosc momentow multipolowych zerowego i wszyst-

kich wyzszych rz edow. Uzywaj ac wyrazenia na dok ladn a wartosc momentu multipolowego

zerowego rz edu, mozna oszacowac wartosc ca lki za pomoc a tej dok ladnej wartosci oraz

sumarycznej wartosci momentow multipolowych rz edow wyzszych od zerowego:

(µν|λσ) ≤

∣∣∣∣∣∣M(0)µνM

(0)λσ

R

∣∣∣∣∣∣+∣∣∣∣∣∣M

(1)µνM

(0)λσ +M(0)

µνM(1)λσ

R′2 −R′

∣∣∣∣∣∣ (1.62)

Analogicznie szacuje si e wartosc ca lki za pomoc a dok ladnej wartosci momentu multipolo-

wego pierwszego rz edu:

(µν|λσ) ≤

∣∣∣∣∣∣M(0)µνM

(0)λσ

R

∣∣∣∣∣∣+∣∣∣∣∣∣M

(1)µνM

(0)λσ +M(0)

µνM(1)λσ

R2

∣∣∣∣∣∣+ (1.63)

+

∣∣∣∣∣∣M(2)µνM

(0)λσ + 2M(1)

µνM(1)λσ +M(0)

µνM(2)λσ

R′3 −R′2

∣∣∣∣∣∣Takie szacowanie wartosci ca lek dwuelektronowych pozwala na uwzgl ednienie oddzia lywan

zanikaj acych jak 1/R wraz ze wzrostem odleg losci mi edzy centrami dystrybucji. W przy-

padku wyrazenia na poprawk e do energii mamy do czynienia z iloczynami ca lek, a wi ec z

iloczynami ich oszacowan za pomoc a rozwini ecia multipolowego [3]. Przyk ladowo, wyraze-

nie na oszacowanie wartosci iloczynu dwukrotnie przetransformowanych ca lek ma postac:

|(µν|λσ)(µν|λσ)| ≤

∣∣∣∣∣∣M(1)A M

(0)B M

(0)A M

(1)B

R2ABR2AB

∣∣∣∣∣∣+ (1.64)

+

∣∣∣∣∣∣(M(2)A M

(0)B + 2M(1)

A M(1)B )M(0)

A M(1)B

(R′3AB−R′2

AB)R2

AB

∣∣∣∣∣∣++

∣∣∣∣∣∣M(1)A M

(0)B (M(0)

A M(2)B + 2M(1)

A M(1)B )

(R2AB

(R′3AB−R′2

AB)

∣∣∣∣∣∣++

∣∣∣∣∣∣(M(2)A M

(0)B + 2M(1)

A M(1)B )(M(0)

A M(2)B + 2M(1)

A )M(1)B

(R′3AB−R′2

AB)(R′3

AB−R′2

AB)

∣∣∣∣∣∣gdzie symbole z tyld a odnosz a si e do iloczynu przetransformowanych orbitali atomowych.

Page 18: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 1. Wprowadzenie 16

Z powodu ortogonalnosci macierzy X i Y wartosci momentow multipolowych zerowego

rz edu w wyrazeniach na oszacowanie przetransformowanych ca lek s a rowne zeru. Uzwgl ed-

niaj ac dodatkowo fakt, ze oddzia lywania dla iloczynow oszacowan ca lek zanikaj a jak 1/R4

wraz ze wzrostem odleg losci, mozna uzyskac asymptotycznie liniowe skalowanie czasowe

uk ladu.

Page 19: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2

Implementacja

Implementacja opisanego formalizmu metod LT-AO MP2 oraz LS-LT-AO MP2 zosta la

wykonana w ramach projektu niedoida [9]. Projekt niedoida, stworzony i rozwijany w Za-

k ladzie Metod Obliczeniowych Chemii Wydzia lu Chemii UJ, jest samodzielnym pakietem

bibliotek u latwiaj acych wykonywanie obliczen kwantowochemicznych [10].

2.1 Kwadratura

Zastosowanie transformacji Laplace’a do wyrazenia na poprawk e do energii (rown. 1.6)

oznacza koniecznosc przeprowadzenia ca lkowania numerycznego. Oznaczajac wyrazenie

podca lkowe z rown. (1.6) jako e, mozna je wyrazic poprzez sum e:

∆E = −∫ ∞0

e(t)dt ≈ −τ∑

α=1

wαe(tα) (2.1)

G lownym problemem metody jest znalezienie odpowiedniej kwadratury, tzn. takiego

zestawu τ punktow i wag, tα, wα, aby b l ad oszacowania, wyrazony jako kwadrat roznicy

mi edzy znan a, analityczn a wartosci a ca lki a jej przyblizeniem:

δ =

[∫ ∞0

e(t)dt−τ∑

α=1

wαe(tα)

]2

(2.2)

by l mozliwie jak najmniejszy dla zadanej, mozliwie ma lej liczby punktow kwadratury. Wy-

maganie mozliwie ma lej liczby punktow kwadratury wynika z faktu, ze zastosowanie ca lko-

17

Page 20: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 18

wania numerycznego wymaga wielokrotnego przeprowadzenia obliczen zaleznych od t. Dla

kazdego punktu kwadratury konieczne jest wygenerowanie macierzy pseudog estosci (rown.

1.17 - 1.18), przeprowadzenie wst epnej selekcji, obliczenie ca lek dwuelektonowych, trans-

formacja funkcji bazy (rown. 1.22 - 1.25) oraz obliczenie cz astkowej poprawki do energii.

Dlatego tez odpowiedni dobor kwadratury jest kwesti a kluczow a dla mozliwie szybkiego

uzyskania wynikow o odpowiedniej dok ladnosci.

2.1.1 Metoda najmniejszych kwadratow

W 1992 roku Haser i Almlof [11] zaproponowali minimalizacj e b l edu kwadratury za

pomoc a metody najmniejszych kwadratow. Dla dodatnich wartosci roznicy energii orbital-

nych z wyrazenia 1.6:

xq = εa + εb − εi − εj (2.3)

gdzie q jest zbiorczym indeksem dla orbitali molekularnych (ijab), mozliwe jest przyblizenie

funkcji 1/xq jako kombinacji liniowej funkcji wyk ladniczych:

1

xq=∫ ∞0

e−xqtdt ≈τ∑

α=1

wαe−xqtα (2.4)

Wyrazenie pozwalaj ace na minimalizacj e b l edu kwadratury metod a najmniejszych kwa-

dratow ma postac: ∑q

fq

(1

xq−

τ∑α=1

wαe−xqtα

)2

= min! (2.5)

gdzie fq jest dyskretn a funkcj a rozk ladu g estosci wspo lczynnika xq. Wad a tego podejscia

jest koniecznosc obliczenia czterokrotnej sumy po orbitalach molekularnych, w powyzszym

rownaniu uj etej w postaci pojedynczej sumy po q. Haser i Almlof [11] zaproponowali przej-

scie z dyskretnego rozk ladu g estosci fq na rozk lad ci ag ly f(x) oraz zast apienie sumowania

ca lkowaniem. Przedzia l ca lkowania mozna dobrac, wyznaczaj ac najmniejsz a i najwi eksz a

wartosc roznic energii orbitali molekularnych (xq)i oznaczaj ac je odpowiednio xmin i xmax.

Wyrazenie (2.5) przybiera postac:

∫ xmax

xminf(x)

[1

x−

τ∑α=1

wαe−xtα

]2

dx = min! (2.6)

Page 21: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 19

Optymaln a kwadratur e otrzymuje si e, szukaj ac ekstremum funkcji b l edu wzgl edem ze-

stawu punktow i wag kwadratury. W praktycznej implementacji do wyznaczenia zestawu

punktow kwadratury uzyto metody simpleksow, zas do wyznaczenia zestwawu wag uzyto

standarodwych metod rozwi azywania uk ladow rownan liniowych. Taka implementacja me-

tody najmniejszych kwadratow ma jednakze istotne ograniczenie. Metoda ta pozwala na

uzyskanie dok ladnosci rz edu µhartree juz dla 5-8 punktow kwadratury. W zastosowaniach

praktycznych jednakze cz esto pojawia si e koniecznosc uzyskania jeszcze wi ekszej dok lad-

nosci, ponadto dla uproszczenia wyznaczenia analitycznych wartosci powyzszych wyrazen

przyjmuje si e funkcj e rozk ladu gestosci f(x) jako sta l a i rown a jednosci, co dodatkowo

obniza dok ladnosc metody. Uzyskanie wyzszej dok ladnosci wymaga jednakze uzycia wi ek-

szej liczby punktow kwadratury, dla ktorych przedstawiony powyzej algorytm staje si e zle

uwarunkowany numerycznie. Dla zastosowan wymagaj acych wi ekszej dok ladnosci obliczen

konieczne by lo zatem wypracowanie innego podejscia do problemu.

2.1.2 Kwadratura Eulera-McLaurina

W 1999 roku Ayala i Scuseria [12] zaproponowali uzycie kwadratury Eulera-McLaurina

do przeprowadzenia ca lkowania numerycznego. Stwierdzili oni, ze ca lkowanie numeryczne

funkcji z rown. 2.1, a wi ec funkcji wyk ladniczej, mozna zamienic na prostsze do wykona-

nia ca lkowanie ma lo zmiennej funkcji. Zamiany takiej dokonuje si e poprzez odpowiedni a

transformacj e uk ladu wspo lrz ednych:

∆E =∫ ∞0

e(t)dt =∫ 1

0e(t)

dt

drdr =

∫ 1

0f(r)dr (2.7)

Transformacja zaproponowana przez Ayal e i Scuseri e [12] ma postac:

t(r) =

∑Kk akr

k

(1− r)m(2.8)

zas wyrazenie na poprawk e do energii:

∆E =∫ 1

0f(r)dr ≈

τ∑α

f(rα)wα ≈1

τ + 1

[τ∑α

f

(k

τ + 1

)+

1

2(f(0) + f(1))

](2.9)

Page 22: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 20

Transformacja uk ladu zmieni la granice ca lkowania z nieskonczonych na skonczone. Do-

datkow a korzysci a jest fakt, ze funkcja f(r) w przetransformowanym uk ladzie wspo lrz ed-

nych jest stosunkowo ma lo zmienna w porownaniu z funkcj a wyk ladnicz a. W rownaniu 2.9

wyrazenie 1/(τ + 1) pe lni rol e wagi, zas wyrazenie k/(τ + 1) punktu kwadratury.

G lownym problemem implementacji kwadratury Eulera-McLaurina jest wi ec dobor war-

tosci wspo lczynnikow k, K, ak oraz m. Dla stabilnosci numerycznej algorytmu w okolicy

punktu r = 0, nalezy dobrac wartosc parametru m jako mozliwie najmniejsz a. Przepro-

wadzono szereg prob dok ladnosci kwadratury dla roznych wartosci powyzszych wspo lczyn-

nikow. Za kazdym razem porownywano wartosc ca lki obliczonej numerycznie dla funkcji

g(t) = e−st z wartosci a ca lki wyznaczon a analitycznie, rown a 1/s. Wartosc parametru s

zawiera la si e w zakresie odpowiadaj acym wartosciom energii dla typowych obliczen kwan-

towochemicznych: od 9 do 55 hartree. Nast epnie dobrano zestaw parametrow, dla ktorego

wzgl edny b l ad ca lkowania funkcji g(t) by l najmniejszy dla m = 2. Ponadto zdecydowano

si e ograniczyc sum e z rownania 2.8 do czterech wyrazow, od k = 3 do k = 6.

Tak dobrany zestaw parametrow zosta l zaimplementowany w algorytmie. Obliczenia

przeprowadzone dla wi ekszej liczby uk ladow wykaza ly, ze zestaw ten okaza l si e bardzo do-

brze przenosny na inne postaci parametru wspo lczynnika x w funkcji podca lkowej z rowna-

nia 2.9. Parametry te s a zatem odpowiednie dla przeprowadzania ca lkowania numerycznego

metod a Eulera-McLaurina dla wyrazen na popawk e do energii (rown. 2.1).

2.2 Struktury do przechowywania ca lek

Waznym aspektem implementacji wszystkich algorytmow obliczeniowych, obok ich ska-

lowania czasowego, jest ich z lozonosc pami eciowa. Duze zapotrzebowanie programu na

pami ec operacyjn a komputera przek lada si e na jego wydajnosc i czas trwania obliczen.

W przypadku ograniczonej ilosci dost epnej pami eci operacyjnej konieczne jest zatem za-

stosowanie odpowiednich struktur danych pozwalaj acych w wydajny i efektywny sposob

dostosowac przebieg algorytmu do ilosci dost epnej pami eci operacyjnej.

Formalizm kanonicznej metody MP2 wymaga obliczenia wartosci ca lek dwuelektrono-

Page 23: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 21

wych w bazie atomowej. Ca lki te nast epnie transformowane s a do bazy orbitali moleku-

larnych. Tensor ca lek dwuelektronowych w tej bazie jest struktur a g est a; struktura taka

umozliwia szybsze wykonywanie operacji algebraicznych, ale takze ma wysokie zapotrzebo-

wanie na pami ec operacyjn a komputera. Fakt ten t lumaczy wysok a z lozonosc pami eciow a

metody MP2. W metodzie LT-AO MP2 procedura wst epnej selekcji eliminuje znacz ac a

liczb e potrzebnych do obliczenia ca lek dwuelektronowych, w dodatku tensory ca lek dwu-

elektronowych w tej bazie s a strukturami rzadkimi. Zastosowanie adekwatnych struktur

danych do przechowywania tych ca lek w ci ag lym obszarze pami eci umozliwia znacz ace

zmniejszenie ilosci wymaganej pami eci operacyjnej oraz efektywniejsze wykonywanie ope-

racji algebraicznych.

Rysunek 2.1: Struktury danych do przechowywania przetransformowanych ca lek

Struktura uzyta do przechowywania wartosci przetransformowanych ca lek dwuelektro-

nowych zosta la schematycznie przedstawiona na rysunku 2.1. W strukturze tej mozna wy-

roznic cztery poziomy, ktore odpowiadaj a czterem indeksom ca lki dwuelektronowej. Pierw-

Page 24: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 22

szy poziom drzewa tworzy pojedynczy wektor zawieraj acy wskazniki na miejsce w pami eci,

w ktorym przechowywane s a wektory kolejnego poziomu. Indeksy elementow tego wektora

s a jednoczesnie indeksami pierwszych funkcji (µ) w ca lkach dwuelektronowych (µν|λσ).

Elementami wektorow drugiego poziomu s a pary wartosci; pierwsz a wartosci a w parze jest

indeks drugiej funkcji w ca lce (ν), zas drug a wartosci a jest odpowiadaj acy temu indeksowi

wskaznik na miejsce w pami eci, w ktorym przechowywany jest wektor trzeciego poziomu,

odpowiadaj acy parze indeksow µν. Wektory trzeciego poziomu maj a struktur e analogiczn a

do struktury wektorow drugiego poziomu: w piewszych elementach w parzach przechowuj a

wartosci trzecich indeksow ca lek (λ), zas w drugich wskazniki na wektory czwartego po-

ziomu, odpowiadaj ace indeksom µνλ. Wektory czwartego poziomu rowniez przechowuj a

pary wartosci. Pierwsza z tych wartosci przechowuje indeksy czwartych funkcji w ca lkach

(σ), zas drugie elementy w parze przechowuj a wartosci ca lek dwuelektronowych.

Takie podejscie do problemu umozliwia wydajne przechowywanie, wyszukiwanie i doda-

wanie nowych wartosci. W drzewie przechowywane s a wy l acznie ca lki o niezerowej wartosci,

co sprawia, ze przechowywanie to wymaga mniejszej ilosci pami eci operacyjnej. Szukaj ac

wartosci ca lki (αβ|γδ) wystarczy odnalezc w wektorze pierwszego poziomu pole o indeksie

α. Wartosc tego pola jest wskaznikiem na wektor drugiego poziomu, w ktorym odnajdywany

jest indeks β i b ed ac a z nim w parze wartosc wskaznika do wektora czwartego poziomu.

W wektorze tym analogicznie odnajdowany jest indeks γ oraz wskaznik do wektora czwar-

tego poziomu, w ktorym po znalezieniu pola odpowiadaj acego indeksowi δ odczytywana

jest wartosc ca lki.

2.3 Opis algorytmu

Obliczenia metod a LT-AO MP2 w zaimplementowanym algorytmie sk ladaj a si e z kilku

podstawowych etapow.

1. Obliczenie wartosci punktow i wag kwadratury Eulera-McLaurina. Wyznaczany jest

zestaw tα, wα, w zaleznosci od podanej przez uzytkownika liczby punktow kwadra-

Page 25: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 23

tury. Wszystkie kolejne etapy algorytmu wykonywane s a wielokrotnie i dla kazdego

punktu kwadratury obliczana jest cz astkowa poprawka do energii; poprawki te s a

nast epnie sumowane celem wyznaczenia ostatecznej wartosci.

2. Przygotowanie danych do transformacji ca lek i wst epnej selekcji. Wyznaczane s a

macierze X i Y oraz macierze A, B, C i D.

3. Obliczenie ca lek w bazie atomowej. Ca lki atomowe przed obliczeniem poddawane s a

procesowi wst epnej selekcji. Dla kazdej ca lki szacowana jest jej wartosc i jesli okaze

si e ona wi eksza od zadanej przez uzytkownika wartosci, ca lka zostaje obliczona.

4. Czterokrotna transformacja ca lek. Obliczone ca lki poddawane s a pierwszemu etapowi

transformacji i wartosci przetransformowanych ca lek dodawane s a do odpowiednich

elementow drzewa. W nast epnych etapach ca lki po transformacji s a przepisywane do

nowych drzew.

5. Obliczenie cz astkowej poprawki do energii od kazdej ca lki oraz obliczenie sumarycznej

wartosci poprawki do energii.

W przypadku metody LS-LT-AO MP2 wst epna selekcja za pomoc a rozwini ecia multi-

polowego wprowadza kilka dodatkowych etapow:

1. Wyznaczenie zasi egow dla pojedynczych funkcji bazy. Dla kazdej funkcji bazy znaj-

dowana jest taka odleg losc od punktu, na ktorym funkcja jest centrowana, dla ktorej

wartosc funkcji jest mniejsza od zadanej wielkosci, tozsamej z parametrem ε.

2. Wyznaczenie wspo lrz ednych srodkow dystrybucji ladunku oraz efektywnych zasi egow

dla tych dystrybucji. Dla kazdej pary funkcji tworz acych dystrybucj e wyznaczany jest

taki punkt pomi edzy atomami na ktorych centrowane s a funkcje tworz ace dystrybu-

cj e, ze promien sfery o srodku w tym punkcie obejmuj acej sfery wyznaczone przez

zasi egi funkcji by l jak najmniejszy.

3. Wyznaczenie dla kazdego punktu kwadratury srodkow oraz efektywnych zasi egow

dystrybucji dla par przetransformowanych funkcji.

Page 26: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 2. Implementacja 24

4. Wyznaczenie dla kazdego punktu kwadratury wartosci sferycznie usrednionych mo-

mentow multipolowych dla dystrybucji ladunkow.

5. Oszacowanie dla kazdego punktu kwadratury oraz dla kazdego etapu transformacji

wartosci ca lek dwuelektronowych za pomoc a wartosci sferycznie usrednionych mo-

mentow multipolowych.

Algorytm zosta l zaprojektowany tak, aby wykorzystywa l dost epn a ilosc pami eci opera-

cyjnej w najbardziej wydajny sposob. W sytuacji, gdy ilosc pami eci operacyjnej jest ograni-

czona, wykonywanie obliczen odbywa si e nie w jednym, a kilku przebiegach. Pozwala to na

zmniejszenie ilosci jednoczesnie transformowanych ca lek, co skutkuje mniejszym kosztem

pami eciowym pojedynczego przebiegu.

Wieloprzebiegowosc zaimplementowanego algorytmu polega na podzieleniu zbioru ca lek

koniecznych do przetransformowania na podzbiory i wykonaniu obliczen dla kazdego z tych

podzbiorow po kolei. Rozmiar kazdego z podzbiorow dobierany jest pod k atem ilosci dost ep-

nej pami eci operacyjnej oraz ilosci ca lek do obliczenia. Podzia l na podzbiory dokonywany

jest w pierwszym indeksie ca lek. Obliczenie wartosci poprawki do energii dla pojedynczego

punktu kwadratury mozna dla algorytmu wieloprzebiegowego wyrazic nast epuj aco:

e = −∑µ

(∑νλσ

(µν|λσ)[2(µν|λσ)− (µσ|λν)]

)(2.10)

Dla kazdego punktu kwadratury zbior pierwszych indeksow ca lek dzielony jest zatem na

podzbiory i dla kazdego z tych podzbiorow wykonywane s a dalsze cz esci algorytmu: przygo-

towanie danych do wst epnej selekcji, selekcja ca lek, obliczenie i transformacja pozosta lych

ca lek oraz obliczenie cz astkowej poprawki do energii.

Page 27: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3

Wyniki

W celu potwierdzenia poprawnosci i zbadania efektywnosci zaimplementowanego algo-

rytmu wykonano za jego pomoc a obliczenia dla kilku wybranych uk ladow. Pierwszymi te-

stowanymi uk ladami modelowymi by ly liniowe lancuchy cz asteczek wody po lozonych w od-

leg losci 2,5 A od siebie. Mimo, ze uk lady takie nie istniej a w rzeczywistosci, zosta ly uzyte

do obliczen, poniewaz najlepiej nadaj a si e do ukazania zysku dotycz acego czasu obliczen i

z lozonosci pami eciowej algorytmu. Wykonano takze obliczenia dla bardziej realistycznych

uk ladow, takich jak liniowe alkany i cz asteczki zasad i par nukleotydowych.

Obliczenia wykonywano w bazach STO-3G i 6-31G**. Baza STO-3G zosta la uzyta

celem przetestowania poprawnosci algorytmu, zas bazy 6-31G** uzyto do wykonania do-

k ladniejszych obliczen dla bardziej realnych uk ladow.

3.1 Dok ladnosc

Wartosci b l edu wzgl ednego metody wyznaczano za pomoc a wzoru:

δwzg =∆Ekan −∆E

∆Ekan(3.1)

gdzie ∆Ekan jest wartosci a poprawki do energii uzyskan a za pomoc a kanonicznej metody

MP2, zas ∆E jest wartosci a poprawki do energii obliczonej za pomoc a testowanego algo-

rytmu.

25

Page 28: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 26

Rysunek 3.1: B l ad wzgl edny metody dla liniowego lancucha cz asteczek wody, baza STO-3G

Wykres 3.1 przedstawia wartosc b l edu wzgl ednego metody w zaleznosci od rozmiaru

uk ladu. Testowanym uk ladem by l liniowy lancuch cz asteczek wody. Obliczenia wykonano

w bazie STO-3G, dla 10 punktow kwadratury oraz dla wspo lczynnika obci ecia (wartosc ε

w rown. 1.39) rownego 10−8. Wykres ukazuje, ze wartosc b l edu wzgl ednego metody LT-AO

MP2 utrzymuje si e na w przyblizeniu sta lym poziomie, wynosz acym oko lo 10−5. Wartosc

b l edu metody LS-LT-AO MP2 systematycznie maleje wraz ze wzrostem rozmiaru uk ladu.

Przyczyn a tego jest niekonsekwencja procedury wst epnej selekcji opartej na nierownosci

Schwarza, polegaj aca na przeszacowywaniu wartosci ca lek dla odleg lych od siebie dystry-

bucji ladunku (rozdzia l 1.3).

Na wykresie 3.2 przedstawiono t e sam a zaleznosc dla bazy 6-31G**. Ze wzgl edu na

koszt czasowy obliczen kanonicznej metody MP2 ograniczono maksymaln a d lugosc lancu-

cha do 20 cz asteczek wody. W tym przypadku b l ad wzgl edny obu metod utrzymuje si e na

w przyblizeniu sta lym poziomie.

Page 29: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 27

Rysunek 3.2: B l ad wzgl edny metody dla liniowego lancucha cz asteczek wody, baza 6-31G**

Na wykresie 3.3 przedstawiono zaleznosc wartosci b l edu wzgl ednego metody od roz-

miaru uk ladu dla cz asteczek liniowych w eglowodorow nasyconych. Obliczenia prowadzono

w bazie 6-31G**, dla 10 punktow kwadratury oraz dla wspo lczynnika obci ecia 10−8. War-

tosci b l edu wzgl ednego zmieniaj a si e wraz ze wzrostem liczby atomow w egla w cz asteczce,

jednakze dla cz asteczek o 20 atomach w egla i d luzszych, wartosc b l edu wydaje si e systema-

tycznie wzrastac. Z powodu rozmiaru bazy oraz dyskutowanej w poprzednich rozdzia lach

z lozonosci czasowej i obliczeniowej kanonicznej metody MP2, nie by lo mozliwe uzyskanie w

rozs adnym czasie wynikow referencyjnych dla alkanow zawieraj acych wi ecej niz 30 atomow

w egla w czasteczce.

Tabela 3.1 przedstawia wartosci b l edu wzgl ednego metody dla cz asteczek zasad nukle-

otydowych. Obliczenia wykonywano w bazie 6-31G**, dla dwoch wartosci wspo lczynnika

obci ecia, 10−8 i 10−10. B l ad wzgl edny dla obu metod jest niewielki i ma wartosc rz edu 10−3

dla wspo lczynnika obci ecia rownego 10−8 oraz wartosc rz edu 10−6 dla ε = 10−10. Wyko-

Page 30: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 28

Rysunek 3.3: B l ad wzgl edny dla liniowych alkanow, baza 6-31G**

nano takze obliczenia dla komplementarnych par zasad, dla ktorych rowniez otrzymano

podobne wartosci b l edu wzgl ednego.

W niniejszej implementacji mozliwa jest zmiana wartosci parametru ε, co stwarza moz-

liwosc kontroli dok ladnosci metody.

3.2 Kontrola dok ladnosci

Mozliwosc prostego i efektywnego kontrolowania dok ladnosci metody daje mozliwosc

uzyskania b adz to jedynie orientacyjnego wyniku w mozliwie najkrotszym czasie, b adz bar-

dzo dok ladnego wyniku, bez wzgl edu na czas obliczen. W zaimplementowanym algorytmie

efekt ten osi agni eto, daj ac uzytkownikowi mozliwosc kontroli wartosci dwoch parametrow

metody: wspo lczynnika obci ecia (ε) oraz liczby punktow kwadratury (τ).

W celu przedstawienia wp lywu tych parametrow na dok ladnosc obliczen, wykonano

Page 31: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 29

Tablica 3.1: B l ad wzgl edny metody dla zasad i par nukleotydowych

zasada b l ad wzgl edny

LT-AO MP2 LS-LT-AO MP2

ε = 10−8 ε = 10−10 ε = 10−8 ε = 10−10

adenina 1, 23 · 10−3 8, 51 · 10−6 1, 23 · 10−3 8, 91 · 10−6

cytozyna 2, 68 · 10−4 9, 60 · 10−6 2, 67 · 10−4 2, 89 · 10−6

guanina 1, 06 · 10−3 5, 58 · 10−6 1, 06 · 10−3 5, 55 · 10−6

tymina 7, 32 · 10−4 7, 12 · 10−6 7, 32 · 10−4 7, 12 · 10−6

a-t 2, 46 · 10−3 7, 16 · 10−6 2, 47 · 10−3 7, 43 · 10−6

c-g 7, 00 · 10−4 7, 90 · 10−6 4, 77 · 10−4 8, 24 · 10−6

obliczenia dla liniowego lancucha cz asteczek wody w bazie 6-31G**. Wykres 3.4 ukazuje

zaleznosc wartosci b l edu wzgl ednego metody w zaleznosci od wartosci wspo lczynnika ob-

ci ecia. Obliczenia wykonywano dla sta lej liczby punktow kwadratury, rownej 10. Wartosc

b l edu wzgl ednego dla ε rownego 0 (co w praktyce oznacza wy l aczony algorytm wst epnej

selekcji, czyli obliczenie i transformacj e wszystkich ca lek dwuelektronowych) przyj eto za

wartosc numerycznego b l edu kwadratury. Zgodnie z oczekiwaniami, zmniejszanie wartosci

wspo lczynnika obci ecia znacz aco zmniejsza wartosc b l edu wzgl ednego obu metod.

Wykres 3.5 przedstawia wartosc b l edu wzgl ednego metody dla tego samego uk ladu

w funkcji liczby punktow kwadratury. Obliczenia wykonano w bazie 6-31G** dla sta lej

wartosci wspo lczynnika obci ecia, rownej 10−8. Zwi ekszenie liczby punktow kwadratury

oznacza zwi ekszenie dok ladnosci ca lkowania numerycznego, co poci aga za sob a zmniej-

szenie b l edu wzgl ednego metody. Z analizy powyzszych wykresow wynika, iz optymalnym

zestawem parametrow, pozwalaj acych na uzyskanie wynikow z b l edem wzgl ednym rz edu

10−5, jest τ = 8 oraz ε = 10−8. Zaleznosc b l edu wzgl ednego od liczby punktow kwadratury

nie jest jednakze monotoniczna; obliczenia wykonane dla wi ekszej grupy uk ladow pokazuj a

jednakze, ze wymagan a dok ladnosc uzyskuje si e dla τ = 10.

Page 32: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 30

Rysunek 3.4: Zaleznosc b l edu wzgl ednego metody od wspo lczynnika obci ecia

3.3 Z lozonosc czasowa

Czas obliczen jest niezwykle waznym parametrem opisuj acym algorytm obliczeniowy

chemii kwantowej. Jak juz wielokrotnie wspomniano w tej pracy, z lozonosc czasowa ka-

nonicznej metody MP2 czyni j a bezuzyteczn a dla duzych uk ladow molekularnych. Prze-

prowadzone obliczenia maj a za zadanie dowiesc, ze zastosowanie opisanego w tej pracy

formalizmu znacz aco redukuje czas obliczen dla duzych uk ladow dzi eki uwzgl ednieniu nie-

zwykle duzej lokalnosci korelacji kulombowskiej.

Obliczenia prowadzono w bazie STO-3G, dla 10 punktow kwadratury oraz dla wspo l-

czynnika obci ecia rownego 10−8.

Wykres 3.6 przedstawia zaleznosc czasu obliczen od rozmiaru uk ladu. Wykres ukazuje

bardzo dobre skalowanie czasowe metody LT-AO MP2 - dla uk ladu zawieraj acego 100

cz asteczek wody, czas obliczen dla tej metody dla obliczen wykonywanych na procesorze

Intel Xeon 2,33 GHz wynosi l 2 godziny i 33 minuty. Dla kontrastu, obliczenia kanoniczn a

Page 33: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 31

Rysunek 3.5: Zaleznosc b l edu wzgl ednego od liczby punktow kwadratury

metod a MP2 dla tego samego uk ladu trwa ly ok. 9 dni. Wykresy dla kanonicznej metody

MP2 i dla metod LS- i LT-AO MP2 przecinaj a si e dla d lugosci lancucha ok. 25 cz asteczek

wody. Dla mniejszych uk ladow metoda MP2 dzia la szybciej. Jest to ilustracj a faktu, ze dla

ma lych uk ladow zysk wynikaj acy z zastosowania wst epnej selekcji jest znikomy, a szybkosc

obliczen limitowana jest przez koszt czasowy operacji algebraicznych na strukturach danych

zastosowanych w metodach LS- i LT-AO MP2.

Dla metody LS-LT-AO MP2 nie uda lo si e uzyskac liniowego skalowania czasowego. Dla

kazdego z testowanych uk ladow czas obliczen by l nieznacznie d luzszy niz czas dla metody

LT-AO MP2. Koszt czasowy algorytmu szacowania ca lek dwuelektronowych za pomoc a

rozwini ecia multipolowego wydaje si e zatem nie byc rekompensowany przez skrocony przez

niego czas obliczania i transformacji ca lek. Szacowanie takie pozwala jednakze na osi agni e-

cie liniowego skalowania pami eciowego, o ktorym b edzie mowa w nast epnym podrozdziale.

Na wykresie 3.7 przedstawiono zaleznosc czasu obliczen od rozmiaru uk ladu dla obliczen

Page 34: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 32

Rysunek 3.6: Czas obliczen dla liniowego lancucha wody, baza STO-3G

wykonanych w bazie 6-31G**. Dla tej bazy przewaga zaimplementowanej metody nad

kanoniczn a metod a MP2 ujawnia si e juz dla lancucha 20 cz asteczek wody.

Na wykresie 3.8 przedstawiono czas obliczen dla liniowych w eglowodorow (baza 6-

31G**, ε = 10−8, τ = 10) w zaleznosci od liczby atomow w egla w cz asteczce. Z analizy wy-

kresu wynika, ze dla testowanych cz asteczek nie uda lo si e osi agn ac zysku czasowego. Mozna

to wyt lumaczyc rozmiarami uk ladu. D lugosc wi azania w egiel-w egiel wynosi ok. 1,45 A, zas

odleg losc mi edzy atomami tlenu w lancuchu cz asteczek wody ok. 2,5 A, tak wi ec najwi ek-

sze cz asteczki w eglowodorow, dla ktorych przeprowadzono obliczenia (30 atomow w egla w

cz asteczce), mia ly rozmiary odpowiadaj ace w przyblizeniu lancuchowi sk ladaj acemu si e z

15 cz asteczek wody. Jednoczesnie cz asteczki w eglowodorow zawieraj a wi ecej atomow na

jednostk e odleg losci, niz liniowe lancuchy wody. Fakt ten t lumaczy takze gorsze skalowanie

czasowe metody LT-AO MP2 dla tych uk ladow. Mniejsze przestrzennie cz asteczki w eglo-

wodorow zawieraj a jednoczesnie wi ecej atomow w porownaniu z lancuchami wody, a to

Page 35: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 33

Rysunek 3.7: Skalowanie czasowe dla liniowego lancucha wody, baza 6-31G**

oznacza wi eksz a ilosc ca lek dwuelektronowych koniecznych do obliczenia. Ze wzgl edu na

duz a liczb e ca lek dwueletronowych koniecznych do wyznaczenia nie by lo mozliwe wyko-

nanie obliczen kanoniczn a metod a MP2 dla w eglowodorow posiadaj acych wi ecej niz 30

atomow w egla w cz asteczce celem uzyskania wynikow referencyjnych. Zysk czasowy moze

jednakze ujawnic si e dla jeszcze wi ekszych uk ladow. Z analizy wykresu wynika, ze zysk

czasowy metod LS- i LT-AO MP2 ujawnia si e dla cz asteczek zawieraj acych wi ecej niz 40

atomow w egla.

Dopasowuj ac lini e trendu dla wykresu zaleznosci logarytmu z czasu obliczen od loga-

rytmu z wielkosci opisuj acej rozmiar uk ladu, mozna wyznaczyc efektywn a wartosc wspo l-

czynnika skalowania czasowego metody m (O(Nm)). W tabeli 3.2 zebrano wartosci tych

wspo lczynnikow dla testowanych uk ladow. Skalowanie czasowe kanonicznej metody MP2

jest zgodne z przewidywaniami; metoda ta skaluje si e w przyblizeniu jakO(N5). Skalowanie

czasowe metody LT-AO MP2 jest o ponad 2 rz edy wielkosci lepsze niz w przypadku stan-

Page 36: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 34

Rysunek 3.8: Czas obliczen metody dla liniowych w eglowodorow

dardowej metody MP2. Metoda LT-AO MP2 nie osi aga teoretycznego limitu skalowania

czasowego. Fakt ten mozna wyt lumaczyc tym, ze kwadratowe skalowanie metody osi agane

jest asymptotycznie, dla nieskonczenie duzych uk ladow oraz dla nieskonczenie duzej pa-

mi eci operacyjnej. Zmniejszenie z lozonosci czasowej o ponad dwa rz edy jest jednakze duz a

popraw a wydajnosci w stosunku do metody MP2.

Dla cz asteczek w eglowodorow do wyznaczenia wspo lczynnika skalowania czasowego

uzyto wynikow dla czterech cz asteczek - zawieraj acych 15, 20, 30 i 40 atomow w egla (wyj at-

kiem jest metoda MP2, dla ktorej nie otrzymano w rozs adnym czasie wyniku dla cz asteczki

zawieraj acej 40 atomow w egla). By lo to spowodowane faktem, ze dla ma lych cz asteczek

istnieje wiele czynnikow, ktore nie uwidaczniaj a si e dla wi ekszych, ale wp lywaj a na czas

obliczen dla ma lych uk ladow. Przyk ladem tego jest wynik dla pentanu na wykresie 3.8,

ktory odbiega od liniowego trendu wyznaczonego przez wyniki dla wi ekszych cz asteczek.

Page 37: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 35

Tablica 3.2: Wartosci wspo lczynnikow skalowania czasowego metody

uk lad wspo lczynnik skalowania czasowego

MP2 LT-AO MP2 LS-LT-AO MP2

liniowe lancuchy wody, baza STO-3G 5,54 2,81 2,85

liniowe lancuchy wody, baza 6-31G** 5,44 2,60 2,73

liniowe w eglowodory, baza 6-31G** 4,88 2,46 2,64

3.4 Z lozonosc pamieciowa

Drugim waznym parametrem kazdej numerycznej metody obliczeniowej jest jej z lo-

zonosc pami eciowa. W przypadku metod obliczeniowych chemii etapem wymagaj acym

najwi ekszej ilosci pami eci operacyjnej jest obliczenie, ewentualna transformacja oraz prze-

chowywanie ca lek dwuelektronowych. Dla duzych uk ladow molekularnych z lozonosc pami e-

ciowa algorytmu, obok jego z lozonosci czasowej, moze uniemozliwiac wykonywanie obliczen

dla wi ekszych uk ladow, co znacz aco ogranicza jego stosowalnosc.

Aby opisac z lozonosc pami eciow a algorytmu, dla kazdej z metod wyznaczono liczb e

koniecznych do obliczenia ca lek dwuelektronowych. W przypadku metod LT- oraz LS-

LT-AO MP2 liczb e ca lek wyznaczano, bior ac liczb e ca lek do policzenia w drugim kroku

transformacji, poniewaz ten krok ma dominuj acy koszt pami eciowy w tej metodzie. Wykres

3.9 przedstawia zaleznosc tej liczby ca lek od rozmiaru uk ladu. Testowanym uk ladem by l

liniowy lancuch 10 cz asteczek wody. Obliczenia wykonywano w bazach STO-3G oraz 6-

31G** dla τ = 10 oraz ε = 10−8. Z analizy wykresu wynika, ze zastosowanie struktur

danych opisywanych w tej pracy redukuje z lozonosc pami eciow a algorytmu do liniowej.

Liczba ca lek dwuelektronowych koniecznych do obliczenia na drugim etapie transformacji

drastycznie spada po zastosowaniu algorytmu LT- i LS-LT-AO MP2, co znacz aco podnosi

wydajnosc algorytmu. Z po lozenia punktu przeci ecia wykresow mozna wnioskowac, ze zysk

dotycz acy z lozonosci pami eciowej uzyskuje si e juz dla lancucha 15 cz asteczek wody.

Wykres 3.10 przedstawia skalowanie pami eciowe metody dla tego samego uk ladu w bazie

6-31G**. Wyniki dla tej bazy s a jakosciowo zgodne z wynikami dla bazy STO-3G.

Page 38: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 36

Rysunek 3.9: Z lozonosc pami eciowa metody, baza STO-3G

Tablica 3.3: Wartosci wspo lczynnikow skalowania pami eciowego metody

baza MP2 LT-AO MP2 LS-LT-AO MP2

STO-3G 4,00 1,96 1,28

6-31G** 4,00 1,99 1,78

Podobnie jak w przypadku opisu z lozonosci czasowej algorytmu, wyznaczono wartosci

wspo lczynnikow skalowania pami eciowego. Tabela 3.3 przedstawia te wartosci dla kano-

nicznej metody MP2 oraz metod LT- i LS-LT-AO MP2. Kanoniczna metoda MP2 skaluje

si e pami eciowo jak O(N4). Zastosowanie metody LT-AO MP2 pozwala zredukowac koszt

pami eciowy metody do kwadratowego, jednakze najwi ekszy zysk na ilosci potrzebnej pa-

mi eci operacyjnej uzyskuje si e po zastosowaniu metody LS-LT-AO MP2. Zastosowanie

algorytmu wst epnej selekcji opartego rozwini eciu multipolowym bardzo znacz aco redukuje

liczb e potrzebnych do obliczenia ca lek dwuelektronowych.

Page 39: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 3. Wyniki 37

Rysunek 3.10: Z lozonosc pami eciowa metody, baza 6-31G**

Page 40: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Rozdzia l 4

Podsumowanie

W ramach niniejszej pracy wykonano implementacj e metody MP2 wykorzystuj acej

transformacj e Laplace’a do pomini ecia etapu transformacji z bazy orbitali atomowych do

bazy orbitali molekularnych. Zaprogramowano algorytm wst epnej selekcji, wykorzystuj acy

nierownosc Schwarza do pomijania ca lek o zaniedbywalnie ma lej wartosci. Zaimplemen-

towano takze struktury danych adekwatne do przechowywania rzadkich tensorow ca lek

dwuelektronowych oraz algorytm wykorzystuj acy rozwini ecie multipolowe do przeprowa-

dzenia procedury wst epnej selekcji. Wykonano takze obliczenia dla modelowych uk ladow:

liniowych lancuchow wody, liniowych alkanow oraz cz asteczek par i zasad nukleotydowych.

Przeprowadzone obliczenia wykazuj a, ze zastosowanie opisanych metod przynosi istotne

zwi ekszenie wydajnosci algorytmu. Dla duzych przestrzennie uk ladow molekularnych moz-

liwa jest redukcja z lozonosci czasowej algorytmu z O(N5) do O(N2). Zysk pami eciowy

zwi azany z zastosowaniem opisywanego formalizmu jest rowniez znacz acy: mozliwe jest

osi agni ecie asymptotycznie liniowego skalowania pami eciowego. Algorytm umozliwia otrzy-

manie chemicznie wystarczaj acej dok ladnosci dla stosunkowo niewielkiej liczby punktow

kwadratury. Dok ladnosc ta moze byc dodatkowo kontrolowana poprzez zmian e wartosci pa-

rametrow algorytmu. Istniej a takze perspektywy udoskonalen technicznych prowadz acych

do otrzymania asymptotycznie liniowego skalowania czasowego. Istnieje takze nadzieja na

zastosowanie algorytmu do obliczen dla duzych uk ladow biologicznych.

38

Page 41: Uniwersytet Jagiello ski - chemia.uj.edu.plzcht/mgrfiles/2009-kowalczyk.pdf · Implementation of the e ective methods of description of the coulombic correlation in large molecular

Bibliografia

1. M. Haser, Theor. Chim. Acta 87, 147-173 (1993)

2. D. Lambrecht and C. Ochsenfeld, J. Chem. Phys. 123, 184101 (2005)

3. D. Lambrecht, B. Doser and C. Ochsenfeld, J. Chem. Phys. 123, 184102 (2005)

4. T. Helgaker, P. Jørgensen, J. Olsen, Molecular Electronic Structure Theory, Wiley

1999

5. M. Haser, J. Almlof and G. Scuseria, Chem. Phys. Lett. 181, 497 (1991)

6. J. Almlof, Chem. Phys. Lett. 181, 319 (1991)

7. M. Haser and R. Ahlrichs, J. Comput. Chem. 10, 104 (1989)

8. V. Dyczmons, Theor. Chim. Acta 28, 307 (1973)

9. G. Mazur, M. Makowski, W. Piskorz, M. Sterzel, M. Radon, W. Kulig, L. Cwiklik,

B. Jagoda-Cwiklik, projekt niedoida (http://www.chemia.uj.edu.pl/~niedoida/)

10. G. Mazur, M. Makowski, Computing and Informatics, 28, 1 (2009)

11. M. Haser and J. Almlof, J. Chem. Phys. 96, 1 (1992)

12. P. Ayala and G. Scuseria, J. Chem. Phys. 110, 8 (1999)

39