Upload
duongxuyen
View
215
Download
0
Embed Size (px)
Citation preview
LUIacuteS FERNANDO MERCIER FRANCO
MODELAGEM TERMODINAcircMICA DO EQUILIacuteBRIO
SOacuteLIDO-LIacuteQUIDO EM SISTEMAS CONTENDO PROTEIacuteNAS EFEITO DO pH
Professor Orientador Doutor Pedro de Alcacircntara Pessocirca Filho
Satildeo Paulo
2010
Trabalho de Conclusatildeo de Curso em Engenharia Quiacutemica Apresentado ao Departamento de Engenharia Quiacutemica da Escola Politeacutecnica da Universidade de Satildeo Paulo
Agradecimentos
Ao Professor Doutor Pedro de Alcacircntara Pessocirca Filho orientador deste trabalho
que aleacutem de ter sido incansaacutevel no intuito de me levar a compreender os
fundamentos baacutesicos para o desenvolvimento deste projeto tem me ensinado o que
eacute ciecircncia e como se daacute a sua aplicaccedilatildeo em Engenharia Quiacutemica
Aos amigos e colegas do Laboratoacuterio de Engenharia Bioquiacutemica da Escola
Politeacutecnica pelo carinho e pela acolhida Em especial a doutoranda Kelly Cristina
Nascimento Alves por toda a gentileza e auxiacutelio na obtenccedilatildeo dos dados
experimentais
E a Fundaccedilatildeo de Amparo agrave Pesquisa do Estado de Satildeo Paulo ndash FAPESP ndash que me
concedeu uma bolsa de iniciaccedilatildeo cientiacutefica sem a qual seria inviaacutevel levar a diante
este trabalho
ii
RESUMO
Neste trabalho eacute apresentado um modelo para a curva de solubilidade de proteiacutenas
em soluccedilatildeo aquosa em funccedilatildeo do pH da soluccedilatildeo baseado em ferramentas da
termodinacircmica claacutessica e considerando os diferentes estados de ionizaccedilatildeo que
moleacuteculas proteacuteicas podem assumir Tambeacutem foi estudada a modelagem descrita
por Groumlnwall em seu artigo publicado no iniacutecio da deacutecada de 1940 e deste estudo
resultou uma extensatildeo agrave sua teoria que se provou ser idecircntica agrave modelagem
proposta inicialmente Para efeito de comparaccedilatildeo foram modeladas curvas de
solubilidade utilizando o modelo de atividade estendido de Debye-Huumlckel para
soluccedilotildees eletroliacuteticas
Foram obtidos dados experimentais da solubilidade da lisozima de clara de ovo de
galinha para alguns valores de pH na regiatildeo do ponto isoeleacutetrico Tanto para a
insulina suiacutena como para lisozima de clara de ovo de galinha o modelo
desenvolvido descreveu com grande precisatildeo o fenocircmeno observado
experimentalmente A aplicaccedilatildeo do modelo permite concluir que a utilizaccedilatildeo de
caacutelculos de estados de ionizaccedilatildeo eacute uma ferramenta eficaz na modelagem
termodinacircmica de soluccedilotildees proteacuteicas
iii
ABSTRACT
In this work it is presented a model for the protein solubility curve in aqueous
solutions as a function of the solution pH based on classical thermodynamic tools
and considering the different ionization states that protein molecules may assume It
was also studied the model described by Groumlnwall in his article published in the early
1940rsquos and from this study it was developed an extension of his theory which as
proved in this work is identical to the initially proposed modeling For comparison
solubility curves were modeled using the Debye-Huumlckel extended activity model for
electrolytic solutions
It was obtained experimental hen egg white lysozyme solubility data for some pH
values in the region of the isoelectric point So much for porcine insulin as for the hen
egg white lysozyme the developed model describes with high accuracy the
phenomenon experimentally observed The model application allows us to conclude
that the utilization of the ionization states calculus is an effective tool in the
thermodynamic modeling of protein solutions
Sumaacuterio
1 Introduccedilatildeo 1
2 Materiais e Meacutetodos 7
21 Meacutetodos computacionais 7
22 Curva de solubilidade da lisozima da clara de ovo de galinha 9
221 Reagentes 9
222 Equipamentos 9
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9
224 Procedimento experimental 10
3 Modelo Estendido de Debye-Huumlckel 11
31 Introduccedilatildeo 11
32 Desenvolvimento teoacuterico 12
4 Modelagem Termodinacircmica Proposta 16
41 Introduccedilatildeo 16
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21
51 Introduccedilatildeo 21
52 Desenvolvimento teoacuterico 21
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28
7 Aplicaccedilatildeo dos Modelos Expostos 31
71 Solubilidade da Insulina Suiacutena 31
72 Solubilidade da Lisozima de clara de ovo de galinha 36
8 Conclusotildees 40
9 Referecircncias Bibliograacuteficas 41
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47
1 Introduccedilatildeo
Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de
bioprodutos tende a ser determinante em geral para o custo do processo seguindo
a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A
produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse
pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de
biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades
terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem
comercializadas para estes fins exigem altos graus de pureza que somente satildeo
obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)
estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um
aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas
Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e
particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo
geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser
alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso
bioprodutos tais como proteiacutenas devem ser recuperados purificados e
concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia
cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar
o fracionamento (Ladisch 2001)
Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores
seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam
concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por
exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
Agradecimentos
Ao Professor Doutor Pedro de Alcacircntara Pessocirca Filho orientador deste trabalho
que aleacutem de ter sido incansaacutevel no intuito de me levar a compreender os
fundamentos baacutesicos para o desenvolvimento deste projeto tem me ensinado o que
eacute ciecircncia e como se daacute a sua aplicaccedilatildeo em Engenharia Quiacutemica
Aos amigos e colegas do Laboratoacuterio de Engenharia Bioquiacutemica da Escola
Politeacutecnica pelo carinho e pela acolhida Em especial a doutoranda Kelly Cristina
Nascimento Alves por toda a gentileza e auxiacutelio na obtenccedilatildeo dos dados
experimentais
E a Fundaccedilatildeo de Amparo agrave Pesquisa do Estado de Satildeo Paulo ndash FAPESP ndash que me
concedeu uma bolsa de iniciaccedilatildeo cientiacutefica sem a qual seria inviaacutevel levar a diante
este trabalho
ii
RESUMO
Neste trabalho eacute apresentado um modelo para a curva de solubilidade de proteiacutenas
em soluccedilatildeo aquosa em funccedilatildeo do pH da soluccedilatildeo baseado em ferramentas da
termodinacircmica claacutessica e considerando os diferentes estados de ionizaccedilatildeo que
moleacuteculas proteacuteicas podem assumir Tambeacutem foi estudada a modelagem descrita
por Groumlnwall em seu artigo publicado no iniacutecio da deacutecada de 1940 e deste estudo
resultou uma extensatildeo agrave sua teoria que se provou ser idecircntica agrave modelagem
proposta inicialmente Para efeito de comparaccedilatildeo foram modeladas curvas de
solubilidade utilizando o modelo de atividade estendido de Debye-Huumlckel para
soluccedilotildees eletroliacuteticas
Foram obtidos dados experimentais da solubilidade da lisozima de clara de ovo de
galinha para alguns valores de pH na regiatildeo do ponto isoeleacutetrico Tanto para a
insulina suiacutena como para lisozima de clara de ovo de galinha o modelo
desenvolvido descreveu com grande precisatildeo o fenocircmeno observado
experimentalmente A aplicaccedilatildeo do modelo permite concluir que a utilizaccedilatildeo de
caacutelculos de estados de ionizaccedilatildeo eacute uma ferramenta eficaz na modelagem
termodinacircmica de soluccedilotildees proteacuteicas
iii
ABSTRACT
In this work it is presented a model for the protein solubility curve in aqueous
solutions as a function of the solution pH based on classical thermodynamic tools
and considering the different ionization states that protein molecules may assume It
was also studied the model described by Groumlnwall in his article published in the early
1940rsquos and from this study it was developed an extension of his theory which as
proved in this work is identical to the initially proposed modeling For comparison
solubility curves were modeled using the Debye-Huumlckel extended activity model for
electrolytic solutions
It was obtained experimental hen egg white lysozyme solubility data for some pH
values in the region of the isoelectric point So much for porcine insulin as for the hen
egg white lysozyme the developed model describes with high accuracy the
phenomenon experimentally observed The model application allows us to conclude
that the utilization of the ionization states calculus is an effective tool in the
thermodynamic modeling of protein solutions
Sumaacuterio
1 Introduccedilatildeo 1
2 Materiais e Meacutetodos 7
21 Meacutetodos computacionais 7
22 Curva de solubilidade da lisozima da clara de ovo de galinha 9
221 Reagentes 9
222 Equipamentos 9
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9
224 Procedimento experimental 10
3 Modelo Estendido de Debye-Huumlckel 11
31 Introduccedilatildeo 11
32 Desenvolvimento teoacuterico 12
4 Modelagem Termodinacircmica Proposta 16
41 Introduccedilatildeo 16
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21
51 Introduccedilatildeo 21
52 Desenvolvimento teoacuterico 21
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28
7 Aplicaccedilatildeo dos Modelos Expostos 31
71 Solubilidade da Insulina Suiacutena 31
72 Solubilidade da Lisozima de clara de ovo de galinha 36
8 Conclusotildees 40
9 Referecircncias Bibliograacuteficas 41
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47
1 Introduccedilatildeo
Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de
bioprodutos tende a ser determinante em geral para o custo do processo seguindo
a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A
produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse
pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de
biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades
terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem
comercializadas para estes fins exigem altos graus de pureza que somente satildeo
obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)
estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um
aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas
Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e
particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo
geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser
alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso
bioprodutos tais como proteiacutenas devem ser recuperados purificados e
concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia
cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar
o fracionamento (Ladisch 2001)
Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores
seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam
concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por
exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
ii
RESUMO
Neste trabalho eacute apresentado um modelo para a curva de solubilidade de proteiacutenas
em soluccedilatildeo aquosa em funccedilatildeo do pH da soluccedilatildeo baseado em ferramentas da
termodinacircmica claacutessica e considerando os diferentes estados de ionizaccedilatildeo que
moleacuteculas proteacuteicas podem assumir Tambeacutem foi estudada a modelagem descrita
por Groumlnwall em seu artigo publicado no iniacutecio da deacutecada de 1940 e deste estudo
resultou uma extensatildeo agrave sua teoria que se provou ser idecircntica agrave modelagem
proposta inicialmente Para efeito de comparaccedilatildeo foram modeladas curvas de
solubilidade utilizando o modelo de atividade estendido de Debye-Huumlckel para
soluccedilotildees eletroliacuteticas
Foram obtidos dados experimentais da solubilidade da lisozima de clara de ovo de
galinha para alguns valores de pH na regiatildeo do ponto isoeleacutetrico Tanto para a
insulina suiacutena como para lisozima de clara de ovo de galinha o modelo
desenvolvido descreveu com grande precisatildeo o fenocircmeno observado
experimentalmente A aplicaccedilatildeo do modelo permite concluir que a utilizaccedilatildeo de
caacutelculos de estados de ionizaccedilatildeo eacute uma ferramenta eficaz na modelagem
termodinacircmica de soluccedilotildees proteacuteicas
iii
ABSTRACT
In this work it is presented a model for the protein solubility curve in aqueous
solutions as a function of the solution pH based on classical thermodynamic tools
and considering the different ionization states that protein molecules may assume It
was also studied the model described by Groumlnwall in his article published in the early
1940rsquos and from this study it was developed an extension of his theory which as
proved in this work is identical to the initially proposed modeling For comparison
solubility curves were modeled using the Debye-Huumlckel extended activity model for
electrolytic solutions
It was obtained experimental hen egg white lysozyme solubility data for some pH
values in the region of the isoelectric point So much for porcine insulin as for the hen
egg white lysozyme the developed model describes with high accuracy the
phenomenon experimentally observed The model application allows us to conclude
that the utilization of the ionization states calculus is an effective tool in the
thermodynamic modeling of protein solutions
Sumaacuterio
1 Introduccedilatildeo 1
2 Materiais e Meacutetodos 7
21 Meacutetodos computacionais 7
22 Curva de solubilidade da lisozima da clara de ovo de galinha 9
221 Reagentes 9
222 Equipamentos 9
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9
224 Procedimento experimental 10
3 Modelo Estendido de Debye-Huumlckel 11
31 Introduccedilatildeo 11
32 Desenvolvimento teoacuterico 12
4 Modelagem Termodinacircmica Proposta 16
41 Introduccedilatildeo 16
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21
51 Introduccedilatildeo 21
52 Desenvolvimento teoacuterico 21
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28
7 Aplicaccedilatildeo dos Modelos Expostos 31
71 Solubilidade da Insulina Suiacutena 31
72 Solubilidade da Lisozima de clara de ovo de galinha 36
8 Conclusotildees 40
9 Referecircncias Bibliograacuteficas 41
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47
1 Introduccedilatildeo
Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de
bioprodutos tende a ser determinante em geral para o custo do processo seguindo
a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A
produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse
pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de
biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades
terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem
comercializadas para estes fins exigem altos graus de pureza que somente satildeo
obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)
estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um
aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas
Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e
particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo
geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser
alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso
bioprodutos tais como proteiacutenas devem ser recuperados purificados e
concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia
cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar
o fracionamento (Ladisch 2001)
Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores
seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam
concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por
exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
iii
ABSTRACT
In this work it is presented a model for the protein solubility curve in aqueous
solutions as a function of the solution pH based on classical thermodynamic tools
and considering the different ionization states that protein molecules may assume It
was also studied the model described by Groumlnwall in his article published in the early
1940rsquos and from this study it was developed an extension of his theory which as
proved in this work is identical to the initially proposed modeling For comparison
solubility curves were modeled using the Debye-Huumlckel extended activity model for
electrolytic solutions
It was obtained experimental hen egg white lysozyme solubility data for some pH
values in the region of the isoelectric point So much for porcine insulin as for the hen
egg white lysozyme the developed model describes with high accuracy the
phenomenon experimentally observed The model application allows us to conclude
that the utilization of the ionization states calculus is an effective tool in the
thermodynamic modeling of protein solutions
Sumaacuterio
1 Introduccedilatildeo 1
2 Materiais e Meacutetodos 7
21 Meacutetodos computacionais 7
22 Curva de solubilidade da lisozima da clara de ovo de galinha 9
221 Reagentes 9
222 Equipamentos 9
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9
224 Procedimento experimental 10
3 Modelo Estendido de Debye-Huumlckel 11
31 Introduccedilatildeo 11
32 Desenvolvimento teoacuterico 12
4 Modelagem Termodinacircmica Proposta 16
41 Introduccedilatildeo 16
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21
51 Introduccedilatildeo 21
52 Desenvolvimento teoacuterico 21
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28
7 Aplicaccedilatildeo dos Modelos Expostos 31
71 Solubilidade da Insulina Suiacutena 31
72 Solubilidade da Lisozima de clara de ovo de galinha 36
8 Conclusotildees 40
9 Referecircncias Bibliograacuteficas 41
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47
1 Introduccedilatildeo
Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de
bioprodutos tende a ser determinante em geral para o custo do processo seguindo
a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A
produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse
pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de
biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades
terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem
comercializadas para estes fins exigem altos graus de pureza que somente satildeo
obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)
estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um
aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas
Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e
particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo
geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser
alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso
bioprodutos tais como proteiacutenas devem ser recuperados purificados e
concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia
cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar
o fracionamento (Ladisch 2001)
Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores
seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam
concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por
exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
Sumaacuterio
1 Introduccedilatildeo 1
2 Materiais e Meacutetodos 7
21 Meacutetodos computacionais 7
22 Curva de solubilidade da lisozima da clara de ovo de galinha 9
221 Reagentes 9
222 Equipamentos 9
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9
224 Procedimento experimental 10
3 Modelo Estendido de Debye-Huumlckel 11
31 Introduccedilatildeo 11
32 Desenvolvimento teoacuterico 12
4 Modelagem Termodinacircmica Proposta 16
41 Introduccedilatildeo 16
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21
51 Introduccedilatildeo 21
52 Desenvolvimento teoacuterico 21
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28
7 Aplicaccedilatildeo dos Modelos Expostos 31
71 Solubilidade da Insulina Suiacutena 31
72 Solubilidade da Lisozima de clara de ovo de galinha 36
8 Conclusotildees 40
9 Referecircncias Bibliograacuteficas 41
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47
1 Introduccedilatildeo
Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de
bioprodutos tende a ser determinante em geral para o custo do processo seguindo
a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A
produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse
pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de
biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades
terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem
comercializadas para estes fins exigem altos graus de pureza que somente satildeo
obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)
estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um
aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas
Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e
particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo
geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser
alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso
bioprodutos tais como proteiacutenas devem ser recuperados purificados e
concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia
cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar
o fracionamento (Ladisch 2001)
Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores
seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam
concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por
exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
1 Introduccedilatildeo
Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de
bioprodutos tende a ser determinante em geral para o custo do processo seguindo
a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A
produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse
pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de
biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades
terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem
comercializadas para estes fins exigem altos graus de pureza que somente satildeo
obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)
estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um
aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas
Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e
particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo
geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser
alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso
bioprodutos tais como proteiacutenas devem ser recuperados purificados e
concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia
cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar
o fracionamento (Ladisch 2001)
Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores
seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam
concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por
exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
2 1 Introduccedilatildeo
interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo
seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em
sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a
concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo
Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada
por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de
cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso
Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais
eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo
menos custosa seraacute a etapa posterior
O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas
cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes
sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos
princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem
o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas
devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas
operaccedilotildees
Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas
cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo
ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)
lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e
aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma
caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de
polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
3 1 Introduccedilatildeo
poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso
aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados
Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de
equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem
satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se
trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz
et al 1999)
Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o
ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a
forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica
eletroliacutetica das proteiacutenas
Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente
os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a
forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os
equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia
proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor
da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer
espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que
influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo
O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do
pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes
Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera
o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por
sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no
qual a carga liacutequida da proteiacutena eacute nula
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
4 1 Introduccedilatildeo
Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de
proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um
modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando
que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base
bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um
modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de
carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de
extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e
aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das
ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui
tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do
fenocircmeno estudado
Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de
equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de
insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do
efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo
haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se
que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma
hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear
na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas
Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma
correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-
empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um
desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-
Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
5 1 Introduccedilatildeo
um conjunto de dados experimentais Vale observar que resultados expressivos
foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do
acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a
desloca em direccedilatildeo a menores valores de pH e de solubilidade
Contudo os trabalhos mais recentes se concentraram na modelagem da curva de
solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos
termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado
como de modelos de energia livre de Gibbs excedente
Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo
UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-
alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)
no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para
calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a
curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto
por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et
al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de
solubilidade da DL-metionina
Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da
curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado
por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da
energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo
deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees
uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas
advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza
natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
6 1 Introduccedilatildeo
esforccedilo computacional requerido pelo modelo por eles proposto para calcular
apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem
deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica
para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o
modelo de Pitzer truncado apoacutes o segundo coeficiente do virial
No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de
ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave
teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este
novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo
para o fenocircmeno apesar das distintas abordagens
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
2 Materiais e Meacutetodos
21 Meacutetodos computacionais
O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os
meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de
Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute
o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de
miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea
As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena
considerada bem como os seus valores de pKA que foram obtidos a partir da
literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos
Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena
Valores extraiacutedos de Kaarsholm et al (1990)
Aminoaacutecido Grupo Ionizaacutevel pKA
A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345
B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437
B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020
B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
8 2 Materiais e Meacutetodos
Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima
de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)
Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79
Lys1 ε-NH2 108
Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26
Lys13 ε-NH2 105
Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103
Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98
Lys33 ε-NH2 106 Glu35 -COOH 61
Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121
Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16
Arg68 Guaniacutedio-NH2 120
Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21
Lys96 ε-NH2 108
Lys97 ε-NH2 103 Asp101 -COOH 45
Arg112 Guaniacutedio-NH2 120
Arg114 Guaniacutedio-NH2 120
Lys116 ε-NH2 104 Asp119 -COOH 25
Arg125 Guaniacutedio-NH2 120
Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
9 2 Materiais e Meacutetodos
22 Curva de solubilidade da lisozima da clara de ovo de galinha
221 Reagentes
Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de
ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)
bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen
P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de
galinha (Sigma min 99)
222 Equipamentos
Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel
(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador
de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)
223 Preparaccedilatildeo das soluccedilotildees-tampatildeo
Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100
pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =
116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma
de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio
005 M e outra de Na2HPO4 005 M
A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma
das soluccedilotildees-tampatildeo
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
10 2 Materiais e Meacutetodos
Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das
soluccedilotildees-tampatildeo
Tampatildeo pH V NaOH mL
NaHCO3 96 100 005 M 98 152
(para cada soluccedilatildeo-tampatildeo 100 mL 100 214
desta soluccedilatildeo foram adicionados) 102 276
104 330 106 382
108 424
110 454
112 530 114 583
Na2HPO4 110 82
005 M 112 126
(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270
118 388
224 Procedimento experimental
Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha
a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se
entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24
horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo
houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento
repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a
13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua
concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada
sistema foi feito ao menos em duplicata
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
3 Modelo Estendido de Debye-Huumlckel
31 Introduccedilatildeo
De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo
deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas
moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas
pontuais como suposto por Debye-Huumlckel
Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto
isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da
equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de
miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo
Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo
da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser
desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar
baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto
alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo
alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo
estendida de Debye-Huumlckel
Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave
modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com
um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto
sempre como abordagem claacutessica
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
12 3 Modelo Estendido de Debye-Huumlckel
32 Desenvolvimento teoacuterico
Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o
coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)
푎 = 훾푠
(32 - 1)
Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida
de Debye-Huumlckel (Pitzer 1973)
ln 훾 = minus퐴 푍radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 2)
Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os
eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute
dado por
퐴 =13
(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇
frasl
(32 - 3)
Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute
a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =
885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de
Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode
ser calculada como
푍 = 훼 minus 훼
(32 - 4)
Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
13 3 Modelo Estendido de Debye-Huumlckel
E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo
퐼 = 12
푚 푍
(32 - 5)
Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de
Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio
ln푎 (푝퐼) = ln 푠 (푝퐼)
(32 - 6)
Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto
implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e
portanto vale que
ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)
(32 - 7)
Assim
ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼
+2푏
ln 1 + 푏radic퐼
(32 - 8)
Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da
atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para
resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica
depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de
Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32
ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como
푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+
2푏
ln 1 + 푏radic퐼
(32 - 9)
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
14 3 Modelo Estendido de Debye-Huumlckel
Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria
solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson
basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo
푠 = 푠 minus푓(푠 )푓 (푠 )
(32 - 10)
Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade
Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo
somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui
cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela
devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis
presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante
com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas
moleacuteculas da proteiacutena (IP)
퐼 = 퐼 + 퐼 = 퐼 +12푍 푠
(32 - 11)
Considerando a funccedilatildeo w tal que
푤 = radic퐼 = 퐼 +12푍 푠
(32 - 12)
Sendo
푤 =14푍 퐼
(32 - 13)
Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
15 3 Modelo Estendido de Debye-Huumlckel
푓 (푠 ) = minus1푠 + 퐴 푍
3푤 + 2푤 푏푤(1 + 푏푤)
(32 - 14)
Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que
푓 (푠 ) = minus1푠 + 퐴 푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)
(32 - 15)
Entatildeo o algoritmo deve ser
푠 = 푠 minus
⎝
⎜⎛ln 푠 (푝퐼)
푠 + 퐴휙푍푝퐻2 radic퐼
1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼
minus 1푠 + 퐴휙푍
15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠
⎟⎞
(32 - 16)
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
4 Modelagem Termodinacircmica Proposta
41 Introduccedilatildeo
A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por
(Prausnitz et al 1999)
푝 = 푝
(41 ndash 1)
푇 = 푇
(41 ndash 2)
휇 = 휇⋮
휇 = 휇
(41 ndash 3)
Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas
sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas
duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a
proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por
휇 (푇푥) = 휇 (푇)
(41 ndash 4)
Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de
soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de
proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por
휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥
(41 ndash 5)
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
17 4 Modelagem Termodinacircmica Proposta
Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que
resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico
da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de
referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo
poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o
contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase
soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio
de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e
as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas
eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende
exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute
estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash
5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em
soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a
concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute
constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de
moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a
proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida
quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma
proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de
solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras
A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da
solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo
휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒
(41 ndash 6)
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
18 4 Modelagem Termodinacircmica Proposta
Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a
um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou
ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de
moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a
seguinte equaccedilatildeo
푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)
(41 ndash 7)
Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica
dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
(휙(푝퐻))
42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras
Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute
aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e
aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios
quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo
estes equiliacutebrios satildeo alterados
Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos
ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute
importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra
todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em
moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as
configuraccedilotildees participam de equiliacutebrios entre si
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
19 4 Modelagem Termodinacircmica Proposta
Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja
soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de
fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute
predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos
Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via
equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)
훼 (푝퐻) =
⎩⎪⎨
⎪⎧ 10
1 + 10 푠푒 휈 = minus1
11 + 10
푠푒 휈 = +1
(42 ndash 1)
Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do
resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1
para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo
estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal
que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor
unitaacuterio
Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo
ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena
com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo
pode ser escrita como
휙 (푝퐻) = 훼 (푝퐻)
(42 ndash 2)
Na qual a fraccedilatildeo jrsquo(pH) eacute dada por
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
20 4 Modelagem Termodinacircmica Proposta
훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0
(42 ndash 3)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo
(42 ndash 2) pode-se escrever que
휙 (푝퐻) =1
1 + 10
1 + 휈2 minus 휈 휀 10
minus휈 minus 1
2 minus 휈 휀 푐표푚 휀 = 0
(42 ndash 4)
A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico
capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena
em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila
iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a
curva de solubilidade
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
푐표푚 휀 = 0
(42 ndash 8)
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
51 Introduccedilatildeo
Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas
configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas
configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras
Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que
elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo
princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a
atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute
proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra
Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma
teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do
ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um
modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento
sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais
pormenorizada do problema
52 Desenvolvimento teoacuterico
A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang
reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula
participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푃 + 푖퐻 푃 lowast
(52 ndash 1)
Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico
descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como
퐾 =푎
lowast
푎 푎
(52 ndash 2)
Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada
pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que
푥lowast
= 푎 푎퐾훾
lowast
(52 ndash 3)
Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as
moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das
concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser
escrita como
푠 (푝퐻) = 푎 푎퐾훾
lowast
(52 ndash 4)
Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando
que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda
que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon
H+ tem-se que
푑푠푑푎 = 푖 ∙ 푎 푎
퐾훾
lowast
(52 ndash 5)
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
Sendo
푑 log 푠 (푝퐻)푑(푝퐻) = minus
푎푠 (푝퐻)
푑푠푑푎
(52 ndash 6)
Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e
reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-
se que
푑 log 푠푑(푝퐻) = minus
sum (푖 ∙ 푥 )sum 푥
(52 ndash 7)
Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito
de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)
횤 =sum (푖 ∙ 푥 )sum 푥
(52 ndash 8)
Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de
solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o
perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se
da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto
hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que
pode ser escrita como
푍(푝퐻) = 휈 훼
(52 ndash 9)
Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo
(52 ndash 7) tem-se que
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
푑 log 푠푑(푝퐻) = minus
12
11 + 10
1 + 휈 + 휈 1 minus 휈 10
(52 ndash 10)
Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto
isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo
푑 log 푠
( )
( )
= minus12
1
1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)
(52 ndash 11)
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈
11 + 10
푑(푝퐻)
+ 휈 1 minus 휈10
1 + 10푑(푝퐻)
(52 ndash 12)
Fazendo a seguinte substituiccedilatildeo
푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)
(52 ndash 13)
Tem-se que
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢(1 + 푢) 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 14)
log푠 (푝퐻)푠 (푝퐼) = minus
12
1 + 휈ln 10
1푢 푑푢 minus
11 + 푢 푑푢 +
휈 1 minus 휈ln 10
1(1 + 푢) 푑푢
(52 ndash 15)
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = minus
12 1 + 휈 log
1010
minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10
(52 ndash 16)
Sendo
휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2
(52 ndash 17)
Resultando em
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
minus1 + 휈
2 (푝퐻 minus 푝퐼)
(52 ndash 18)
Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(52 ndash 19)
Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada
apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a
partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer
a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto
isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema
Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova
disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens
a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no
desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41
ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a
primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de
proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida
a lei de Henry
53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade
Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de
que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os
outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante
plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram
desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo
dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta
de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso
do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil
de carga liacutequida linear eacute notaacutevel
Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como
푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0
(53 ndash 1)
Substituindo (53 ndash 1) em (52 ndash 6)
푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)
(53 ndash 2)
Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =
퐴2
(53 ndash 3)
Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)
reduz-se agrave
log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)
(53 ndash 4)
Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de
Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados
das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a
definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de
aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a
partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
6 Identidade entre o Modelo Proposto e a Equaccedilatildeo
Estendida de Linderstroslashm-Lang e Groumlnwall
A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a
equaccedilatildeo (42 ndash 8) dada por
푠 (푝퐻)푠 (푝퐼) =
1 + 101 + 10
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 1)
Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que
log푠 (푝퐻)푠 (푝퐼) = log
1 + 101 + 10
+ log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 2)
Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees
휂 (푝퐻) = log
(6 ndash 3)
휃 (푝퐻) = log
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
1 + 휈2 minus 휈 휀 10 minus
휈 minus 12 minus 휈 휀
(6 ndash 4)
Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)
(6 ndash 5)
Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de
ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta
funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61
Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel
j jk jk Quantidade de resiacuteduos neste estado
-1 -1 푝퐼 minus 푝퐻 na
0 0 nb
+1 +1 0 nc
0 푝퐼 minus 푝퐻 nd
Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com
grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 6)
Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees
neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio
com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja
neutra vale a seguinte restriccedilatildeo
휀 = 0 hArr 푛 = 푛
(6 ndash 7)
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall
Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que
log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)
(6 ndash 8)
Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de
resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim
substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)
tem-se que
log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log
1 + 101 + 10
(6 ndash 9)
Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida
de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso
tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui
proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na
mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute
extremamente simples e depende apenas de um ponto de referecircncia e dos dados da
estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
7 Aplicaccedilatildeo dos Modelos Expostos
Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-
Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos
experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)
퐹푂 =1푁
푠 minus 푠푠
(7 ndash 1)
Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso
pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do
ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal
resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel
seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado
da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse
necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo
estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO
definida na equaccedilatildeo (7 ndash 1)
71 Solubilidade da Insulina Suiacutena
As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade
dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e
tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e
Groumlnwall em trecircs temperaturas distintas
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
32 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
00
40
80
120
160
200
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
00
50
100
150
200
250
300
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
33 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)
Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI
podem ser explicados por ao menos trecircs importantes motivos dois devidos a
hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que
no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter
solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada
na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior
a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da
concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever
solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a
zero
limrarr푠 = lim
rarr
Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin
(711 ndash 1)
00
50
100
150
200
250
300
350
40 43 45 48 50 53 55 58 60
Solu
bilid
ade
(10-5
mol
kg-1
)
pH
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
34 7 Aplicaccedilatildeo dos Modelos Expostos
Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para
valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno
pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos
acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI
alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade
A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash
1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs
diferentes temperaturas
Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina
suiacutena
T ordmC Abordagem FO
25 P 01857 C 02535
15 P 01981 C 05056
5 P 03595 C 03064
Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados
do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a
minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC
Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a
diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de
obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o
desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo
objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
35 7 Aplicaccedilatildeo dos Modelos Expostos
funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura
especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas
diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura
Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a
abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em
relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de
45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1
enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela
abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo
objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo
A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos
neste trabalho para a insulina suiacutena comparados ao encontrado na literatura
Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena
Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145
Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os
valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por
isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre
procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do
paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)
haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis
da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
36 7 Aplicaccedilatildeo dos Modelos Expostos
proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva
que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante
observar a proximidade dos valores encontrados neste trabalho com o obtido por
Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do
paracircmetro em questatildeo
72 Solubilidade da Lisozima de clara de ovo de galinha
Um modelo para ser validado necessita correlacionar dados experimentais de modo
satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico
observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados
na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de
galinha que apesar de ter muitos estudos de solubilidade nenhum deles se
encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados
experimentais para poder validar o modelo proposto A escolha da lisozima de clara
de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por
ter os valores de pKA conhecidos
A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste
trabalho estaacute apresentada na Figura 721
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
37 7 Aplicaccedilatildeo dos Modelos Expostos
Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em
soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e
dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()
Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento
esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH
isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de
soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se
comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto
isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da
soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos
ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente
neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a
solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e
00
10
20
30
40
50
60
70
80
90
100
95 100 105 110 115 120
Solu
bilid
ade
(mg
mL)
pH
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
38 7 Aplicaccedilatildeo dos Modelos Expostos
alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado
em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo
Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo
a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo
Por conta de falta de dados a este respeito modelou-se apenas a curva de
solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura
722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de
galinha em funccedilatildeo do pH da soluccedilatildeo
Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)
00
10
20
30
40
50
60
70
80
90
96 99 102 105 108 111 114 117 120
Solu
bilid
ade
(mg
mL)
pH
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
39 7 Aplicaccedilatildeo dos Modelos Expostos
O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721
Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada
abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima
de clara de ovo de galinha
T ordmC Abordagem FO
25 P 4650 C gt7919a
a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado
Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta
aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a
abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca
de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos
anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao
efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de
clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a
variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A
proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de
cargas pontuais de Debye-Huumlckel
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
8 Conclusotildees
A modelagem termodinacircmica proposta neste trabalho apresentou expressivos
resultados quando comparada a abordagem claacutessica de Debye-Huumlckel
Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o
modelo aproximou melhor os pontos experimentais do que a referida abordagem
comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima
ao ponto isoeleacutetrico
Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica
para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua
construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo
lugar por sua aplicabilidade
Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis
da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva
em regiotildees distantes do ponto isoeleacutetrico
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
9 Referecircncias Bibliograacuteficas
BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene
Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects
Biophys J 95 1285-1294 2008
FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and
other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72
2684 - 26911950
GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v
93 p 517-542 1931
GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab
Carlsberg v 24 p 185-200 1941
KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native
and mutant insulins pK perturbation of B13-Glu in aggregated species Arch
Biochem Biophys v 283 p 496-502 1990
KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for
the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng
Chem Res v 35 p 4319-4327 1996
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
42 9 Referecircncias Bibliograacuteficas
KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen
lysozyme J Biochem v 87 p 1215-1219 1980
LADISCH M R Bioseparations Engineering principles practice and
economics John Wiley amp Sons 2001 pp1 116 ndash 117 133
LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab
Carlsberg v 15 p 1-29 1924
PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da
particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas
2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP
PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the
excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte
solutions Fluid Phase Equilib v 269 p 25ndash35 2008
PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-
contribution model involving phase and chemical equilibrium Ind Eng Chem Res
v 33 p 1341-1347 1994
PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277
1973
PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino
acids Fluid Phase Equilib v 152 p 121-132 1998
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
43 9 Referecircncias Bibliograacuteficas
PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular
Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999
SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of
equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte
solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009
TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J
R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with
carbon dioxide Biotech Bioeng v103 p 909-919 2009
TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer
free energy Biophys J v 95 p 2601-2609 2008
TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in
water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95
2009
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na
cadeia proteacuteica
Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo
de ionizaccedilatildeo
퐻퐴 퐴 + 퐻
(A ndash 1)
Assim considerando que a constante de equiliacutebrio
퐾 = 푎
(A ndash 2)
Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que
퐾 =[퐴 ][퐻 ]
[퐻퐴]
(A ndash 3)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que
log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]
(A ndash 4)
Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado
por
minus log[휑] = 푝휑
(A ndash 5)
Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
푝퐾 = log[퐻퐴][퐴 ] + 푝퐻
(A ndash 6)
Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por
훼 =[퐴 ]
[퐻퐴] + [퐴 ]
(A ndash 7)
Reescrevendo (A ndash 7) tem-se que
훼 =[퐴 ] [퐻퐴frasl ]
1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =
훼1 minus 훼
(A ndash 8)
Substituindo (A ndash 8) em (A ndash 6) tem-se que
푝퐾 = log훼
1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10
(A ndash 9)
Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos
훼 =1
1 + 10
(A ndash 10)
Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio
퐴 + 퐻 퐻퐴
(A ndash 11)
Pode se escrever a constante de equiliacutebrio como
퐾 =[퐻퐴 ]
[퐴][퐻 ]
(A ndash 12)
Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach
log퐾 = minus log[퐴]
[퐻퐴 ] minus log[퐻 ]
(A -13)
Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por
훼 =[퐻퐴 ]
[퐴] + [퐻퐴 ]
(A ndash 14)
Assim a equaccedilatildeo (A ndash 13) fica
훼1 minus 훼 = 10
(A ndash 15)
Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo
훼 =10
1 + 10
(A ndash 16)
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos
modelos expostos
Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO
55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos
double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO