37
PROTEÓMICA INTRODUCCIÓN. ALGUNOS CONCEPTOS BÁSICOS Una vez concluida la secuenciación del genoma humano, es necesario disponer de técnicas que permitan comprender la relación entre la expresión de los genes y los problemas biológicos. Este es precisamente el campo de la proteómica, ciencia dedicada al estudio de la expresión de las proteínas y de sus cambios en dependencia del contexto biológico. A diferencia de las técnicas clásicas utilizadas en la bioquímica, la proteómica se basa en la separación y la identificación de muchas proteínas (en el orden de mil o más) simultáneamente. Muchos de los métodos utilizados en proteómica permiten obtener un despliegue (u ordenamiento o arreglo) físico de mezclas muy complejas de proteínas, separadas mediante la combinación hábil de dos (o más) técnicas de separación. El proteoma [1] es el conjunto de proteínas expresadas por un organismo (o por una parte de él, por ejemplo un tipo de tejido) en un momento dado. La proteómica comprende tanto las técnicas para el estudio en gran escala de las proteínas expresadas (proteoma) como las aplicaciones de estas técnicas al análisis de problemas biológicos. Mientras que el genoma de un organismo es esencialmente constante a lo largo de la vida, el proteoma tiene un carácter dinámico: la expresión de proteínas cambia en diferentes etapas del ciclo celular pero también en respuesta a acciones externas. En particular, las diferencias entre un estado ¨normal¨ y uno patológico se traducen también a nivel molecular en cambios en los patrones de expresión de proteínas. Es precisamente esta variabilidad del proteoma lo que lo hace tan atractivo para la investigación biomédica. Recientemente, la proteómica ha comenzado a dar una contribución importante a nuestra comprensión de la biología y de la medicina. Los avances logrados en genómica no se traducen directamente en nuestro conocimiento de los respectivos proteomas: muchos genes carecen de función LILA CASTELLANOS 1 , LUIS JAVIER GONZÁLEZ 1 Y GABRIEL PADRÓN 1 CAPÍTULO 20 1 Centro de Ingienería Genética y Biotecnología. Ave. 31 e/ 158 y 190, Playa. AP 6162, CP 10600, Ciudad de La Habana, Cuba.

Proteomica Cap 20

Embed Size (px)

Citation preview

Page 1: Proteomica Cap 20

PROTEÓMICA 367

PROTEÓMICA

INTRODUCCIÓN.ALGUNOS CONCEPTOS BÁSICOSUna vez concluida la secuenciación del genoma humano, es necesario disponerde técnicas que permitan comprender la relación entre la expresión de los genesy los problemas biológicos. Este es precisamente el campo de la proteómica,ciencia dedicada al estudio de la expresión de las proteínas y de sus cambios endependencia del contexto biológico. A diferencia de las técnicas clásicas utilizadasen la bioquímica, la proteómica se basa en la separación y la identificación demuchas proteínas (en el orden de mil o más) simultáneamente. Muchos de losmétodos utilizados en proteómica permiten obtener un despliegue (u ordenamientoo arreglo) físico de mezclas muy complejas de proteínas, separadas mediante lacombinación hábil de dos (o más) técnicas de separación.

El proteoma [1] es el conjunto de proteínas expresadas por un organismo (opor una parte de él, por ejemplo un tipo de tejido) en un momento dado. Laproteómica comprende tanto las técnicas para el estudio en gran escala de lasproteínas expresadas (proteoma) como las aplicaciones de estas técnicas alanálisis de problemas biológicos. Mientras que el genoma de un organismo esesencialmente constante a lo largo de la vida, el proteoma tiene un carácterdinámico: la expresión de proteínas cambia en diferentes etapas del ciclo celularpero también en respuesta a acciones externas. En particular, las diferenciasentre un estado ̈ normal¨ y uno patológico se traducen también a nivel molecularen cambios en los patrones de expresión de proteínas. Es precisamente estavariabilidad del proteoma lo que lo hace tan atractivo para la investigaciónbiomédica. Recientemente, la proteómica ha comenzado a dar una contribuciónimportante a nuestra comprensión de la biología y de la medicina.

Los avances logrados en genómica no se traducen directamente en nuestroconocimiento de los respectivos proteomas: muchos genes carecen de función

LILA CASTELLANOS1, LUIS JAVIER GONZÁLEZ1 Y GABRIEL PADRÓN1

CAPÍTULO 20

1 Centro de Ingienería Genética y Biotecnología. Ave. 31 e/ 158 y 190, Playa. AP 6162,CP 10600, Ciudad de La Habana, Cuba.

Page 2: Proteomica Cap 20

368 CAPÍTULO 20

conocida, a muchos otros se les adjudica una función por analogía con otrosgenomas estudiados previamente. Si se extrapola la situación encontrada con lalevadura, más de la mitad del genoma humano no tiene una función conocida enestos momentos.

La proteómica incluye diversos campos de investigación:

• La identificación de las proteínas expresadas por un organismo en unacondición dada (proteómica descriptiva o estructural, todas las proteínasexpresadas en un momento y en un contexto)

• La identificación de los cambios en el nivel de expresión de proteínasasociados a cambios en las condiciones del organismo (proteómicacomparativa, cuáles proteínas cambian cuando un organismo se somete acondiciones diferentes)

• La identificación de conjuntos funcionales de proteínas, es decir, grupos deproteínas que se localizan en un mismo sitio celular y que operan en mutuainteracción (interacciones proteína-proteína, proteómica funcional)

• La identificación de las proteínas que forman un organelo (este enfoqueconduce a la elaboración de un mapa molecular de la célula)

¿POR QUE LA PROTEÓMICA?El dogma central de la genética:

ADN → ARN → PROTEÍNA

dió lugar a uno de los paradigmas esenciales de la biología que prevaleció durantela segunda mitad del siglo pasado:

un gen → una proteína

Esta relación aparentemente simple, no refleja sin embargo la realidad [2].

Aunque es cierto que un gen codifica una secuencia de aminoácidos existendos eventos que incrementan considerablemente el número de proteínas quepueden ser originadas por un gen y estar presentes en una célula en un momentodado y por tanto hace más complejo el proteoma de una célula.

Uno de esos eventos es el fenómeno conocido como empalme alternativo(splicing). En los mamíferos y otros organismos superiores el gen que codificauna proteína no está constituido por una secuencia continua de nucleótidos.Una parte de la secuencia del gen está formada por regiones no codificantesque interrumpen la secuencia codificante del gen y son llamados intrones. Las

Page 3: Proteomica Cap 20

PROTEÓMICA 369

regiones codificantes (y que por tanto dan lugar al ARN y posteriormente a laproteína) son conocidas como exones. Cuando se forma el ARN mensajero,mARN, los intrones son eliminados quedando así la secuencia que codifica unaproteína. El fenómeno de splicing consiste en que los exones pueden reordenarsede varias formas y dar lugar a mas de una proteína a partir de un solo gen.

El otro evento, es el hecho de que una proteína puede ser modificada durante o despuésde la traducción o síntesis de la proteína con la introducción de grupos sustituyentes,en un proceso que se conoce como modificación post traduccional (MPT).

Se calcula que alrededor del 10 % de los genes de mamíferos codificanproteínas cuya función es modificar otras proteínas, y que generan más de200 tipos de modificaciones post traduccionales tales como: glicosilación,fosforilación, incorporación de lípidos, etc. En adición, muchas proteínasparticipan en las rutas metabólicas que conllevan a la degradación y finalmentela eliminación de proteínas. Asi, en el sistema de ubiquitinacion participan 134genes, mientras las fosfatasas son codificadas por unos 300 genes y lasproteínas kinasas se estiman codificadas por más de 1100 genes [3]. La funciónde todas estas proteínas es la modificación de otras para modular su funciónbiológica. El cuadro se completa con el conjunto de proteínas que intervieneen la proteólisis y la degradación. En el proteosoma participan los productosde expresión de unos 130 genes, mientras que las proteínas con funciónproteolítica están codificadas por unos 1000 genes.

Por ello, una secuencia única de aminoácidos puede generar muchas especiesquímicas diferentes. De esta forma se estima que los aproximadamente 40 000genes del genoma humano pueden dar lugar a mas de un millón de proteínas.

Las diferencias que existen entre las poblaciones de mARN y de proteínasestán dadas, por una parte, por la amplia población de especies que portanmodificaciones químicas pero además, intervienen otras causas importantes: eltiempo de residencia de las moléculas de proteínas en el interior de una célula ode un compartimiento celular es variable debido a la degradación por proteasas,a la traslocación intra y extracelular y a la modificación de las proteínas durantesu intervención en procesos biológicos. Por ello la medición de la expresión demARN no suministra valores confiables de los cuales se pudiera deducir laabundancia y la presencia de las proteínas traducidas.

Las diferencias que existen entre las poblaciones de mRNA y de proteínasestán dadas por una parte por la amplia población de especies que portanmodificaciones químicas pero además, intervienen otras causas importantes: eltiempo de vida media de las moléculas de proteínas en el interior de una célulao de un compartimiento celular es variable debido a la acción de proteasas, a la

Page 4: Proteomica Cap 20

370 CAPÍTULO 20

traslocación intra- y extracelular y a la modificación de las proteínas durante suintervención en procesos biológicos. Por ello la medición de la expresión demRNA no suministra valores confiables de los cuales se pudiera deducir laabundancia y la presencia de las proteínas traducidas. Solo el estudio directo delas proteínas, lo que es campo de la Proteómica, puede dar respuesta a estascuestiones. Adicionalmente, una molécula de mRNA puede originar variassecuencias de proteínas, por el simple cambio del codón de iniciación o determinación, lo que origina moléculas de secuencias más cortas o más extensas.

En resumen, al concluir el siglo XX la idea de considerar las proteínas comomacromoleculas definibles por una secuencia de residuos de aminoácidoscompletamente determinadas por la secuencia de una molécula de ADN habíacambiado sustancialmente: entre genes y proteínas existen diferencias de complejidadque definen la existencia de un campo de conocimiento singular, irreducible a formasrelativamente menos complejas del conocimiento: al concluir el siglo las razonespara el surgimiento de la proteómica estaban solidamente establecidas.

¿COMO INVESTIGAR EL PROTEOMA?Mientras que las moléculas de ADN y de ARN se construyen mediante unordenamiento variable de solo cuatro componentes estructuralmente invariables(desoxinucleótidos y nucleótidos respectivamente), las moléculas de proteínaspresentan una diversidad estructural extraordinaria que se manifiesta en variosniveles de complejidad: a nivel de la estructura primaria por los posiblesordenamientos esencialmente de 20 residuos de aminoácidos a los que se sumantodas las variantes de modificaciones post traducción posibles. Y a nivel deestructura espacial, esta diversidad se manifiesta en muy diversas estructurasde las que depende esencialmente la actividad biológica. Los estudios de ladiversidad estructural tridimensional de las proteínas también están en curso,mediante ensayos masivos de cristalización y determinación de estructuratridimensional haciendo uso de técnicas de difracción de rayos X y de resonanciamagnética nuclear, pero este tema no será objeto de este capitulo. Noscentraremos, por tanto en los métodos encaminados a la investigación de ladiversidad molecular de las proteínas asociada a la existencia de diferentesestructuras primarias (término que será utilizado en nuestro texto para incluirtambién las modificaciones post traducción).

Podríamos adelantar una formulación del dogma central de la proteómicacomparativa en los siguientes términos:

“Los cambios en un nivel superior del fenotipo de un organismo o de uno de suscomponentes está relacionado con cambios en el fenotipo molecular de laexpresión de proteínas”.

Page 5: Proteomica Cap 20

PROTEÓMICA 371

Por tanto, la idea es relacionar las características biológicas de un sistema conla expresión de las proteínas y más específicamente, relacionar los cambios enlas propiedades biológicas con los cambios en la expresión de proteínas.

Para ello es necesario disponer de técnicas que permitan a) separar miles deespecies; b) identificar las especies de interés y c) cuantificar la magnitud delos cambios en la expresión de proteínas. La proteómica aborda este complejoproblema técnico con variadas herramientas.

Estas técnicas se agrupan en dos grandes campos: las que se basan en laresolución de proteínas intactas y que utilizan principalmente técnicas deelectroforesis o de cromatografía de proteínas y las que se basan en la conversión,en una primera etapa, de las mezclas de proteínas en mezclas complejas de suspéptidos de degradación proteolítica. En el primer grupo están las técnicas queutilizan la electroforesis bidimensional (2DE) atendiendo a una primera separaciónpor carga eléctrica y una segunda separación por talla. También comprende lacombinación de dos o tres métodos ortogonales de cromatografía oisoelectroenfoque en solución seguido de cromatografía (por ejemplo, separaciónpor talla seguida de separación por hidrofobicidad; separación por carga, portalla y finalmente por hidrofobicidad; separación por IEF de flujo libre seguidode separación por masa o por hidrofobicidad). Las fracciones obtenidas enestas separaciones, tras múltiples etapas, pueden ser resueltas a continuaciónpor 2DE o por electroforesis en geles de SDS (SDS PAGE), o alternativamente,ser digeridas y analizadas por espectrometría de masas.

En el segundo grupo (técnicas basadas en un primer paso de conversión de lasmezclas de proteínas en mezclas de péptidos obtenidos por proteólisis específica) sesustituye la resolución de proteínas por la resolución cromatográfica de las mezclasde sus péptidos obtenidos por proteólisis específica generalmente con tripsina.Alternativamente, se hace la selección de un conjunto de péptidos representativosde la presencia de las proteínas parentales atendiendo a alguna propiedad.

Si bien la electroforesis en geles de SDS es una técnica de rutina en loslaboratorios biológicos, la electroforesis bidimensional de alta resolución requierede un laboratorio dedicado, tanto por los requisitos de reproducibilidad como porla variedad y complejidad de los pasos del proceso. La electroforesisbidimensional es hasta el presente, la única técnica que permite resolver conalta eficiencia las isoformas que difieren en punto isoeléctrico y por ello, sesigue utilizando ampliamente. A continuación discutiremos los aspectos esencialesde la técnica así como las características que deben tener las muestras para suanálisis con estos métodos. Los detalles experimentales están disponibles enexcelentes manuales y artículos de revisión [4-9].

Page 6: Proteomica Cap 20

372 CAPÍTULO 20

ELECTROFORESIS BIDIMENSIONAL (2DE)Los geles bidimensionales fueron introducidos en 1975 simultáneamente por J.Klose [10] en Berlin y O’ Farrell [11], en los Estados Unidos. Estos geles [12]permiten obtener un arreglo o despliegue físico en dos dimensiones de mezclascomplejas de proteínas (Figura 20.1). Se basan en la combinación de dos técnicasortogonales (es decir, que no comparten principios físicos comunes): 1) laseparación por carga eléctrica (focalización isoeléctrica, IEF) en la que lasproteínas migran en un gradiente de pH hasta alcanzar el sitio donde carecende carga, es decir su punto isoeléctrico y 2) la separación por tamaño molecularque se efectúa en un gel de poliacrilamida en presencia de un detergente aniónicomuy potente, el docecil sulfato de sodio (SDS-PAGE) .

Para los organismos cuyos genomas han sido ya secuenciados es posible calcularel proteoma teórico. Estos abarcan aproximadamente desde pI 3 hasta pI 12-13y desde 1,000- 2,000 Da hasta aproximadamente 500 kDa. Pero la mayor parte(posiblemente alrededor del 70 %-80 %) de las proteínas están concentradasen una zona mas estrecha que va aproximadamente entre pI 3.5 y pI 10 y masaentre 10 y 100 kDa. Esta es la zona que generalmente se estudia con las técnicasde electroforesis bidimensional.

En adición, un tercer elemento tiene que ser considerado: el grado dehidrofobicidad de las proteínas. Este es muy variable y va desde estructurashidrofílicas hasta estructuras muy hidrofóbicas. Las proteínas hidrofóbicasabundan en las membranas, y tienen regiones o dominios cuyas propiedades desolubilidad son más cercanas a las de los polímeros orgánicos convencionales

Figura 20.1. Electroforesis bidimensional de proteínas de la fracción nuclear de células de cáncerde pulmón humano (small cell lung cancer). Las proteínas de la fracción nuclear seextrajeron con una solución de agentes caotrópicos y detergentes. La primeradimensión se efectuó en un gel de poliacrilamida tubular con anfolinas portadorasde rango 2 a 11. La segunda dimensión se efectuó en un gel vertical de 16.5 %poliacrilamida en presencia de SDS. Las proteínas se detectaron mediante tincióncon plata (Gel confeccionado en el laboratorio de los autores).

Page 7: Proteomica Cap 20

PROTEÓMICA 373

que a las de las proteínas globulares hidrosolubles. Las técnicas basadas en2DE no son especialmente buenas en el análisis de proteínas muy hidrofóbicasaunque continuamente se hacen avances técnicos para superar esta limitación[13]. Por ello, generalmente las poblaciones estudiadas por 2DE están sesgadashacia las moléculas mas hidrofílicas, mientras que las proteínas hidrofóbicas seanalizan preferentemente mediante combinaciones de técnicas cromatográficasy de SDS-PAGE o mediante su previa conversión a mezclas de péptidos.

La Tabla 20.1 resume las etapas principales de un análisis por 2DE seguido deidentificación de las proteínas de interés.

Tabla 20.1. Etapas en el análisis de la expresión de proteínas por 2DE eidentificación de los cambios por espectrometría de masas

Page 8: Proteomica Cap 20

374 CAPÍTULO 20

Tabla 20.1 (continuación).

Page 9: Proteomica Cap 20

PROTEÓMICA 375

PREPARACIÓN DE MUESTRAS

Cualquiera sea su origen (proteínas totales o procedentes de un fraccionamientosubcelular), las muestras biológicas sometidas a electroforesis bidimensionalrequieren de un tratamiento previo cuya función es liberarlas de todos loscomponentes no proteicos presentes. Estos son esencialmente: lípidos, ácidosnucleicos, componentes de naturaleza orgánica e inorgánica de baja masamolecular como vitaminas y cofactores, las sales y los iones inorgánicos. Laeliminación de estos componentes es un arte del cual depende la calidad de lapreparación y por ello el éxito o el fracaso del experimento. Las técnicas utilizadaspara eliminar estos componentes tienen que cumplir ciertas condiciones: a) nopueden alterar el perfil de proteínas (es decir, no es posible una técnica quecause la pérdida irrecuperable de ciertas proteínas); b) no pueden introducirmodificaciones sobre las proteínas (por ejemplo, no puede trabajarse encondiciones en que las proteasas endógenas sean activas y causen la proteólisisde componentes de la muestra [14] y c) el número de pasos debe ser mínimo ysu diseño concebido para que al final, la preparación esté en condiciones de serincorporada al gel de la primera dimensión (focalización) o a cualquierprocedimiento de análisis alternativo a la 2DE. Un aspecto crítico es la presenciade sales provenientes de tampones utilizados en la obtención de una preparación.Por ejemplo, el Tris, el fosfato salino (PBS) y el HEPES que son de uso frecuenteen bioquímica, focalizan en una región del gel si se encuentran presentes en lapreparación final, como consecuencia esa región aparece ¨vacía¨ de proteínas.El límite de la concentración total de iones que puede tener la muestra es de 40 mM.Por encima de ese valor la conductividad de la muestra es elevada, lo queprovoca el sobrecalentamiento del gel y su daño.

La preparación de muestras generalmente incluye los siguientes pasos:

1. Extracción o solubilización de proteínas.

2. Eliminación de lípidos mediante extracción con solvente orgánico.

3. Eliminación de ácidos nucleicos mediante digestión con nucleasas, co-precipitación con compuestos básicos o ultracentrifugación.

En algunos protocolos se eliminan las sales mediante el cambio del tampón dela muestra por la solución de focalización o mediante precipitación total deproteínas con ácido tricloroacético en acetona y posterior redisolución en lasolución de muestra.

Otro aspecto importante es la calidad del material biológico. Las líneas celularestienen que ser controladas para verificar la ausencia de micoplasmas. Lasmuestras provenientes de pacientes necesitan condiciones especiales de

Page 10: Proteomica Cap 20

376 CAPÍTULO 20

conservación que deben quedar instrumentadas antes del inicio de la manipulaciónmédica. Las muestras provenientes de órganos o de tejidos deben ser liberadasde materiales colaterales como tejidos de sostén y epitelio vascular. Los materialesprovenientes de biopsias tumorales deben además liberarse de células normalesque hayan sido removidas conjuntamente con el tumor durante la biopsia.

Solubilización de proteínas. Un procedimiento ideal de solubilización debecumplir varios requisitos: extraer totalmente las proteínas que se desean estudiar,de modo que su abundancia en la solución de extracción refleje su abundanciarelativa en la célula o el organelo, no modificar químicamente ningún grupofuncional presente en las proteínas (por ejemplo, evitando oxidaciones demetioninas, intercambios de puentes disulfuro, reacciones de desamidación, deisomerización entre ácido aspártico y ácido isoaspártico) e impedir las reaccionesde degradación provocadas por la liberación de proteasas al medio [14]. Para lasolubilización de proteínas se utilizan mezclas de agentes caotrópicos, ydetergentes, a los que se adicionan otros componentes: inhibidores de proteasas,un agente reductor y anfolinas del rango adecuado. La electroforesisbidimensional impone requisitos rígidos en cuanto a los agentes solubilizantesque pueden ser utilizados. Lamentablemente, el SDS, a pesar de su alta capacidadde solubilización de proteínas, es incompatible con la focalización isoeléctricadebido a su carácter iónico, no obstante, se utiliza para la disolución de los residuosinsolubles en todos los otros agentes pero estos extractos deben diluirse notablementecon soluciones que contengan detergentes no iónicos antes de aplicar a la primeradimensión. Por igual razón se excluye el cloruro de guanidinio. Los reactivos másusados para la preparación de las soluciones de solubilización son [8]:

Agentes caotrópicos: urea 8-9 M, mezclas de urea 5 M + tiourea 2 M

Detergentes: CHAPS 1-4 %, Triton X 100 1-2 %, NP 40 1-2 %, SB 3-10 0.5-1 %,ASB 14 0.5-1 %

Reductores: DTT 1 %, DTE 1 %, TBP 1 %

Anfolinas del rango adecuado: 1-2 %

Inhibidores de proteasas: Mezcla comercial de inhibidores de proteasas serínicas,aspárticas y metalo-proteasas.

Adicionalmente puede incorporarse glicerol o propanol en una concentraciónde hasta unos 15 %, especialmente recomendados para el análisis de proteínasbásicas. Recientemente se ha reportado una sustancial mejora en las separaciones2DE de proteínas hidrofóbicas (integrales de membrana) mediante laincorporación de trifluoroetanol al 50% en la solución de extracción y derehidratación [13].

Page 11: Proteomica Cap 20

PROTEÓMICA 377

La selección de la primera dimensión. El método original propuesto de modoindependiente por O’ Farrell [11] y por Klose [10]en 1975 se basa en la separaciónde las proteínas por su carga utilizando un gel cilíndrico de poliacrilamida al cualse le incorporan mezclas de anfolitos solubles (compuestos de bajo peso molecularque poseen carga eléctrica), presentes en una mezcla compleja de modo que suscomponentes cubran con sus pK un amplio rango de valores). Con este método yhaciendo uso de la focalización en condiciones de no-equilibrio de pH (NEPHGE)[15] es posible separar en un mismo gel proteínas ácidas y proteínas básicas(Figura 20.1). A principios de los años 80 se introdujo una modificación en laprimera dimensión, que consistió en la co-polimerización de los anfolitos con lamatriz de acrilamida, creando en el gel un gradiente estable de carga [7]. Estosgeles están disponibles en el mercado (IPG: Immobilized pH Gel).

Selección del rango de análisis. Hay variadas opciones en cuanto al rango depI de separación y la longitud de la separación (están disponibles comercialmenteIPG desde 7 cm hasta 24 cm). En una primera etapa frecuentemente se prefiererealizar un gel bidimensional exploratorio de rango amplio, entre pI 3 y 10 ,seguido de separación por tamaño en el rango de 14 a 150 kDa utilizando gelesde 12.5 % en la segunda dimensión. Esta primera etapa permite ajustar lapreparación de la muestra y la cantidad de muestra a aplicar al gel. A continuaciónse selecciona un rango de pI mas estrecho, por ejemplo entre 4 y 7 unidades yentre 6 y 10 unidades. De esta forma, se obtiene mucha mayor información, sibien el número de geles (y el costo en muestra, tiempo y dinero) se duplica.Cuando se desea incrementar la información sobre una región especifica, seutilizan separaciones en geles llamados de rango estrecho o zoom. En estosgeles es posible expandir una unidad de punto isoeléctrico a lo largo de unadistancia de 18 cm.

Evidentemente, un estudio abarcador del proteoma llevaría a realizar una seriede geles que cubran con una alta resolución desde pI 3 hasta pI 11, y desdemasas de 2 kDa hasta masas de 500 kDa. Si bien técnicamente esto es posible,en la práctica tal estudio resulta excesivamente costoso en muestra, tiempo yrecursos. Generalmente los extractos celulares totales (o las subfraccionesobtenidas) se analizan mediante electroforesis en geles de focalización isoeléctricade rango 3 a 10 o de rango 4 a 7 y 6 a 11. Esta separación se sigue con unasegunda separación por tamaño en un gel convencional de SDS. El mapa obtenidotiene físicamente dos dimensiones. Un gel de alta resolución en el rango de pIde 2.5 a 10 y de masas de 15 a 120 kDa permite la resolución de 5,000 –8,000especies [16] si la detección es radiactiva, pero rutinariamente en este sistemael número de especies detectables con tinción con plata es de unas 1500 a 2,000(Figura 20.1). Es importante recordar que, debido a las características de la

Page 12: Proteomica Cap 20

378 CAPÍTULO 20

técnica, las determinaciones de cambios en la expresión de proteínas requierenla realización de varias réplicas de geles (para cada muestra tres como mínimo,pero preferiblemente un número mayor de geles). Por todo ello, la estrategiamás utilizada comprende:

1. La selección de uno o de varios compartimientos celulares de interés.

2. La realización de subfraccionamiento celular.

3. El análisis de la expresión diferencial de proteínas mediante geles de rangointermedio (generalmente de tres unidades de pI en 18 cm) seguidas deseparaciones por tamaños entre 14 y 150 kDa.

4. Análisis de imágenes y análisis estadístico de los cambios en la expresión.

Muchos de los aspectos que acabamos de discutir no sólo son importantes paralas muestras destinadas a electroforesis bidimensional sino también para muestrasque se analizan mediante técnicas no electroforéticas, como las basadas en lacromatografía líquida bidimensional seguida de espectrometría de masas.

EL RANGO DINÁMICO DE EXPRESIÓN: U N RETO A LA TECNOLOGÍA

Se estima que una célula de un organismo superior contiene en un instante detiempo unas 5 000 especies diferentes de mARN [3]. De estas 5 000 especies,unas 4 000 existen en un número muy bajo de copias (una o dos moléculas porcélula) y dan lugar a proteínas poco abundantes o muy escasas. No obstante, sedebe recordar que la abundancia de una proteína no sólo depende del númerode copias de mARN sino también, del tiempo de vida de la proteína sintetizadaen la célula. Se estima que una célula en un instante contiene en el orden demil millones de moléculas de proteínas, correspondientes a 5 000 secuencias demARN presentes. Sin embargo, el 90 % de la masa de proteínas esta formadopor unas 100 especies diferentes, mientras que el 10 % restante esta formadopor una enorme diversidad de moléculas. Si estimamos que una secuencia deaminoácidos puede dar lugar a unas 20 variantes moleculares o especies,entonces concluimos que 5 000 mARN diferentes son responsables por unas100 000 especies moleculares diversas a nivel de proteínas [3]. Ese esprecisamente el campo de análisis de la proteómica y por ello han sido necesariasherramientas muy poderosas para la separación de especies moleculares quedifieren ligeramente y para su identificación.

Aquí estamos ante dos problemas: primero, un gran número de especies aresolver, cuantificar e identificar; segundo, un número muy pequeño de especieses responsable de la mayor parte del contenido total de proteínas, con lo queexiste un rango dinámico de expresión muy amplio.

Page 13: Proteomica Cap 20

PROTEÓMICA 379

El rango dinámico de expresión representa los órdenes de magnitud (número decopias por célula o por ml de fluido) en los que se mueve la expresión de lasproteínas en una célula o fluido fisiológico [17]. El rango dinámico de expresiónen las proteínas celulares es de unos 5-7 órdenes, mientras que en el plasma esde 10-11 órdenes. Por ejemplo, la concentración de albúmina y la de glucagónen plasma difieren en 9 órdenes de magnitud. La concentración de la hemoglobinaes del orden de 1011 pg/ml, mientras que las interleucinas están enconcentraciones del orden de 1 a 10 pg/ml [18]. Ciertamente, no existe ningúnmétodo físico o químico de análisis que pueda dar una respuesta lineal a lo largode un rango tan amplio de magnitudes. Por tanto, el análisis de las proteínas conbajo número de copias es un reto tecnológico de la proteómica.

Los límites experimentales del método basado en 2DE están dados por dosfactores: los limites de lo que podemos detectar en el gel y de lo que podemosmedir por espectrometría de masas. Aproximadamente, ambos coinciden: latinción con plata de alta sensibilidad permite ver proteínas presentes en el ordende 1 000 copias por célula, si en el gel se ha aplicado la masa correspondiente a10 8 a 10 9 células [17]. Pero no podemos ver ni identificar proteínas expresadasen un número inferior de copias, a menos que primero se lleven a cabo pasos deprefraccionamiento, encargados de incrementar la concentración de un grupode componentes en la muestra a expensas de la supresión de otros.

PRINCIPALES FORMAS DE ABORDAR LOS PROBLEMAS QUE PLANTEA EL AMPLIO RANGO DINÁMICO

Este problema, que es esencial para un análisis abarcador del proteoma celular,se ha abordado con los siguientes enfoques:

a) Eliminación selectiva de componentes mayoritarios. Para ello es necesarioque los métodos sean altamente específicos y no eliminen simultáneamentelos componentes minoritarios. Este enfoque está dirigido al estudio de unsubproteoma enriquecido en las especies menos abundantes, tras laeliminación de las más abundantes. Se basa principalmente en seriessucesivas de cromatografías de inmunoafinidad con anticuerpos policlonalesinmovilizados en columnas que retienen las especies mayoritarias.Recientemente [19] se utilizó una sucesión de 9 pasos de inmunoafinidadpara la preparación de una muestra de plasma humano. Ello permitióidentificar 3 800 especies moleculares correspondientes a 325 genes diferentes(es decir, que aproximadamente cada proteína aparece como promedio con 11variantes moleculares resueltas). Algunos de estos sistemas consisten enuna única columna portadora de 6 tipos de anticuerpos policlonales dirigidoscontra las 6 proteínas más abundantes en el plasma y están disponiblescomercialmente.

Page 14: Proteomica Cap 20

380 CAPÍTULO 20

b) Fraccionamiento de las proteínas totales. Un fraccionamiento celular típicoconsiste en la obtención de fracciones citosólica, microsomal, mitocondrial ynuclear [20] (ver Figura 20.2).

El fraccionamiento subcelular por organelos permite concentrar el estudio enun compartimiento celular de interés para investigar allí la expresión de proteínasmucho más a fondo. Alternativamente puede realizarse un subfraccionamientopor solubilización diferencial (Figura 20.3), que consiste en la extracción de lamasa celular mediante el uso de agentes solubilizantes cada vez más enérgicos[20] . Tras cada incubación, el material no disuelto se separa por centrifugación,y el sobrenadante (fracción soluble) se colecta por separado. El precipitadoresidual se extrae con una solución de mayor poder solubilizante. Un esquematípico consiste en: a) extracción en TRIS 40 mM pH 11, b) extracción en urea,c) extracción del residuo final en SDS. Recientemente han ganado popularidadlos métodos de fraccionamiento basados en propiedades físico-químicas utilizandotécnicas múltiples o en serie (por ejemplo, fraccionar por carga eléctrica medianteisoelectroenfoque en solución, seguido de separación por hidrofobicidad encolumnas de fase reversa o por tamaño en columnas de exclusión molecular).Estos sistemas generan una gran cantidad de fracciones, cada una de ellas seconvierte en un subproteoma y de hecho en un subproyecto de estudio.

Figura 20.2. Fraccionamiento de células en organelos subcelulares.

Page 15: Proteomica Cap 20

PROTEÓMICA 381

c) Utilización de técnicas de muy alta resolución en electroforesis bidimensional.Una alternativa es utilizar geles de tipo zoom en la primera dimensión(separación por carga). Actualmente existen en el mercado geles comercialesque expanden una unidad de punto isoeléctrico a lo largo de 18 cm. En elloses posible aplicar una alta carga de proteínas con lo que las especies pocoabundantes se hacen visibles. Ciertamente estos geles permiten ver en tododetalle una región del proteoma pero excluyen el resto. Por ello se utilizansolo cuando se desea estudiar algún aspecto particular que ha sido previamenteexplorado con un sistema más abarcador aunque con menor profundidad.

Por su costo en tiempo, en material biológico y en recursos, seria irrealizableintentar estudiar un proteoma utilizando todas las técnicas de enriquecimientomencionadas. Pero las diversas combinaciones de ellas son de gran utilidadcuando se desea centrar el estudio en una fracción. Por ejemplo, es posibleestudiar el subproteoma nuclear de una línea celular, mediante el uso de geleszoom para analizar el rango de pI 8.0 a 9.0 seguido de separaciones en geles detris tricina [22] de segunda dimensión que resuelven específicamente lasproteínas de baja talla. Con ello veremos en detalle una parte del proteomacelular correspondiente a las proteínas básicas de baja talla presentes en lafracción nuclear.

Figura 20.3. Fraccionamiento de proteínas celulares según su solubilidad en diferentes solucionesde extracción.

Page 16: Proteomica Cap 20

382 CAPÍTULO 20

CROMATOGRAFIA LIQUIDA

Como ya se mencionó la electroforesis bidimensional posee algunas limitacionespara analizar proteínas hidrofóbicas ya que por su escasa solubilidad estánsubrepresentadas en los mapas electroforéticos bidimensionales obtenidos hastael momento. Por otra parte, aquellas proteínas que poseen puntos isoeléctricosmuy ácidos o básicos son difíciles de focalizar en la mayoría de los geles deisoelectroenfoque disponibles en el mercado. El amplio rango dinámico es otroproblema no resuelto.

Por tales motivos, en los últimos años ha existido la tendencia a trabajar con lospéptidos en vez de las proteínas tratando de solucionar las limitaciones señaladas.La idea consiste en marcar diferencialmente con isótopos estables los péptidosgenerados por la proteólisis de todas las proteínas sintetizadas por una célula otejido en dos condiciones que se desean estudiar o comparar. Posteriormente,mediante el análisis por cromatografía líquida de fase reversa (o combinadacon otro método cromatográfico) acoplada a la espectrometría de masas sepuede realizar la identificación de las proteínas en las bases de datos desecuencias. La cuantificación se logra mediante un análisis detallado de lasdistribuciones isotópicas de los péptidos analizados y así se infiere la expresióndiferencial de las proteínas que los contienen.

Aunque la idea parece sencilla, no deja de tener asociada una gran complejidadpues si bien el trabajo con péptidos puede ser más fácil en comparación con lasproteínas, no es menos cierto que ya la mezcla de proteínas que se deriva deuna célula o tejido de por sí es muy compleja por lo que una vez realizada la proteólisisla mezcla de péptidos que se genera debe ser mucho más compleja aún.

Por tales motivos se han empleado propiedades ortogonales para lograr laseparación de la mezcla de péptidos obtenida. Entre estas propiedades tenemosla talla, carga, hidrofobicidad, e interacción biológica o afinidad. Por lo tanto esde esperar un sinnúmero de posibles combinaciones en la cromatografíamultidimensional pero lo común entre todas radica en que persiguen un mismoobjetivo: obtener la mejor resolución posible para posteriormente identificar unamayor cantidad de proteínas en el análisis por espectrometría de masas.

Entre las combinaciones más empleadas se encuentra la cromatografía deintercambio iónico con la cromatografía de fase reversa (RP). Particularmenteen esta combinación la utilización de columnas de RP en el segundo paso permiteque la mezcla a su vez sea desalada y pueda ser analizada medianteespectrometría de masas empleando electronebulización (ESI). También se hanreportado otras combinaciones que emplean cromatografías de exclusión portamaño molecular (SEC) y RP [23]. Raida y colaboradores combinaron la

Page 17: Proteomica Cap 20

PROTEÓMICA 383

cromatografía de intercambio catiónico (SCX) con RP-HPLC acoplada alespectrómetro de masas para medir las masas de alrededor de 3000 péptidosde un hemofiltrado humano [24]. Aunque los dos pasos cromatográficos fuerondesarrollados en experimentos diferentes, este estudio demostró el elevado poderresolutivo de la cromatografía multidimensional y la espectrometría de masaspara el fraccionamiento y análisis de un gran número de péptidos.

Mediante la combinación de intercambio catiónico y RP-HPLC se ha publicadoquizás el más eficiente método de identificación de proteínas a partir de mezclascomplejas de péptidos. Esta tecnología se conoce como MudPIT(Multimensional Protein Identification Technology) [25,26]. En estametodología se emplean sales volátiles para eluir por pasos los péptidos retenidosen una matriz de intercambio catiónico y separarlos posteriormente en unacolumna de RP-HPLC acoplado a un espectrómetro de masas. Con la aplicaciónde esta metodología se logró identificar proteínas muy hidrofóbicas con múltiplesregiones transmembranarias, proteínas de pI superiores a 12 e inferiores a 4 yproteínas que el uso de codones (Codon adaptation index) de su gen debenser muy minoritarias.

Otros grupos han desarrollado procedimientos SCX-RP para una gran variedadde aplicaciones [27,28]. También se ha empleado la electroforesis capilar (CE)acoplada a la cromatografía de fase reversa para separar péptidos originadospor la digestión de una proteína [29] y existen reportes de cromatografíastridimensionales

La inclusión de una cromatografía de afinidad en uno de los pasos de separaciónmultidimensional de péptidos ha sido muy útil pues permite retener selectivamentepéptidos o proteínas basándose en interacciones específicas lo que simplificaconsiderablemente la mezcla compleja de péptidos proteolíticos. Así por ejemplo,en la identificación de la fosforilación, que es una de las modificacionespostraduccionales más importantes por estar involucrada prácticamente en todoslos mecanismos de transducción de señales, las columnas de IMAC-Fe3+ hanpermitido el aislamiento de los fosfopéptidos y el estudio del fosfoproteoma devarios organismos [30-32].

La utilización de columnas con lectinas inmovilizadas ha permitido la capturaselectiva de glicopéptidos que facilita el estudio del glicoma de los organismos[33]. También se han empleado otras variantes que incluye la derivatizaciónquímica de aminoácidos para que, mediante el empleo de una cromatografía deafinidad, sea posible el aislamiento selectivo de los péptidos modificados dentrode todos los péptidos proteolíticos generados.

Uno de los ejemplos más creativos dirigidos a realizar proteómica sin emplearla electroforesis bidimensional es la metodología conocida como ICAT (isotope-

Page 18: Proteomica Cap 20

384 CAPÍTULO 20

coded affinity tags) [34]. En esta metodología se procede a la derivatizaciónquímica de los péptidos con un reactivo conocido también como ICAT que poseeun extremo que reacciona específicamente con los residuos de cisteínas libresy en el otro extremo posee biotina. Los péptidos marcados (que contienencisteína) se aislan selectivamente, mediante una cromatografía de afinidad conavidina, los péptidos que contienen residuos de cisteínas modificadas. Este pasode cromatografía de afinidad es esencial para simplificar las mezclas complejasde péptidos e identificar proteínas minoritarias, que de analizarse la mezcla depéptidos cruda no pudieran ser identificadas. Adicionalmente el reactivo poseeuna región intermedia que contiene 4 grupos metilenos, con un total de 8hidrógenos, que pueden estar sustituidos por deuterio. De esta forma se tienenrealmente dos reactivos, el ligero (con H) y el pesado (con D). La cuantificaciónde la expresión diferencial de proteínas se logra al marcar una condición con elreactivo ligero y la segunda condición con el reactivo pesado

Ambos extremos del reactivo ICAT se encuentran enlazados por un brazoespaciador que en una de las variantes el ICAT ligero posee los isótopos naturalesen cambio el ICAT pesado posee 8 átomos de deuterio. Cada una de lascondiciones se marcan de manera independiente isotópicamente con cada unode reactivos ICATy Ligeros y después los eluatos de afinidad se mezclan encantidades equivalentes y la cuantificación se realiza al determinar la intensidadrelativa de las especies ligera y pesada de los péptidos analizados porespectrometría de masas.

A esta metodología se le señalan las siguientes limitaciones:

1. Las proteínas que no contienen residuos de cisteínas quedan excluidas delanálisis.

2. La masa molecular del reactivo ICAT, en ocasiones comparable con la masamolecular del péptido a identificar puede causar interferencias durante laionización de los péptidos y en la interpretación de los espectros de masas.

3. La cuantificación puede aportar resultados erróneos pues durante laseparación por fase reversa los péptidos marcados con ICAT ligero puedeneluir significativamente separados de los marcados con la versión pesada.

Recientemente se han introducido nuevas versiones del reactivos ICAT paratratar de solucionar estos problemas. Por ejemplo el reactivo en fase sólidapara disminuir las pérdidas en la cromatografía de afinidad y se ha sustituido elmarcaje con deuterio por 13C para evitar las diferencias en el tiempo de retenciónen RP-HPLC de los péptidos derivatizados con el ICAT ligero y pesado con loque se minimizan los posibles errores en la cuantificación. Esta metodologíatiene el gran mérito de haber sido la pionera en proponer una estrategia bien

Page 19: Proteomica Cap 20

PROTEÓMICA 385

estructurada y concebida para explotar las potencialidades de la espectrometríade masas y realizar los estudios de proteómica sin la necesidad del empleo de laelectroforesis bidimensional.

Gevaert y colaboradores desarrollaron un método diagonal que emplea dos pasosconsecutivos de cromatografía de fase reversa, denominado COFRADIC(combined fractional diagonal chromatography) [35]. Después de obtenermúltiples fracciones de una mezcla compleja de péptidos mediante cromatografíade fase reversa, a cada una de las fracciones se le realiza un tratamiento oxidativoque transforma selectivamente a los péptidos que contienen metioninas enmetioninas sulfóxido, que los convierten en especies más hidrofílicas que lospéptidos originales. Se repite la separación por RP-HPLC con las fraccionesdespués de oxidadas. Solo las fracciones que redujeron el tiempo de retención(y por tanto contienen las metioninas oxidadas) son colectadas y analizadas porespectrometría de masas. De esta manera, de la mezcla compleja inicial depéptidos solo se analizan por espectrometría de masas aquellos que contienenresiduos de metionina en su secuencia. Aunque en este reporte no se refierentérminos cuantitativos, se sugiere que el empleo del marcaje isotópico establecon 18O pudiera ser utilizado para que esta metodología suministre informacióncuantitativa sobre la expresión diferencial de proteínas. En este trabajo fueronseleccionados e identificados péptidos (que contienen metionina) provenientesde 800 proteínas diferentes.

Espectrometria de masas (MS)La espectrometría de masas es la herramienta empleada en los estudios deproteómica para la identificación de las proteínas. Su principio se asemeja a loque ocurre cuando un haz luminoso incide sobre un prisma: la radiaciónelectromagnética es descompuesta o separada de acuerdo a las diferenteslongitudes de onda. En un espectrómetro de masas un haz de iones es separadode acuerdo a la relación masa/carga: m/z.

En un espectrómetro de masas hay dos elementos esenciales: la fuente deionización, donde son producidos los iones al suministrarle energía a la muestraque se estudia y el analizador (un campo eléctrico, un campo magnético, detiempo de vuelo o una combinación de ellos), donde los iones son separados deacuerdo a la relación masa/carga (m/z). La energía suministrada puede sersuficiente no solamente para ionizar la molécula y obtener el llamado ión molecular(la molécula intacta pero con una carga positiva o negativa) sino también paraprovocar la fragmentación de la molécula dando lugar a iones fragmentos. Losiones producidos son característicos de un determinado compuesto químico y portanto es posible su identificación a partir del espectro de masas.

Page 20: Proteomica Cap 20

386 CAPÍTULO 20

Aunque la espectrometría de masas ya era una técnica establecida para lacaracterización de los compuestos orgánicos desde finales de la década de losaños 50, los métodos de ionización disponibles hasta 1981 no eran aplicables alas llamadas biomoléculas (péptidos, proteínas, carbohidratos y ácidos nucleicos)por cuanto exigían la evaporación previa de la muestra. Por esta razón, paraestudiar los compuestos con elevados puntos de fusión o que se descomponencon la temperatura había que obtener derivados volátiles y en el caso de queesto no fuera posible, simplemente no podían ser estudiados.

En 1981, Michael Barber y Richard Bordoli, de la Universidad de Manchesterpublican la aplicación de un método de ionización suave, el FAB (fast atombombardment) al estudio de proteínas [36]. El método, aunque ya no se empleadebido a su baja eficiencia de ionización, fue un resultado de gran importanciapues permitió por primera vez la medición de la masa molecular de los péptidosy la determinación de la secuencia sin necesidad de obtener un derivado volátil.

En 1989, John Fenn publica [37] la aplicación de la ionización por electronebulización(electrospray ionization, ESI) al estudio de péptidos, proteínas y otrasbiomoléculas. Un año antes Koichi Tanaka había publicado un nuevo método deionización conocido como MALDI (Matrix Assisted Laser DesorptionIonization) [38]. Poco después Michael Karas y Franz Hillenkamp publican variasaplicaciones del MALDI en el campo de las proteínas [39]. Fenn y Tanakarecibieron el premio Nobel de Química en el 2002 por estos descubrimientos.

Estos dos métodos revolucionaron completamente la aplicación de laespectrometría de masas a las biomoléculas y en apenas diez años laespectrometría de masas se convirtió en el método más poderoso para el análisisy la caracterización de péptidos y proteínas.

El MALDI emplea un láser ultravioleta para suministrar la energía capaz deionizar el compuesto. Previamente la muestra es mezclada íntimamente con lamatriz. La matriz es un elemento muy importante y está constituida porcompuestos insaturados (ácido sinapínico, ácido 2,5 dihidroxibenzoico (DHB),ácido 4-hidroxi-α-cianocinámico, etc.) capaces de absorber energía a la longitudde onda del láser. De esta forma la matriz absorbe la mayor parte de la energíasuministrada que de otra forma destruiría la muestra totalmente y facilita laionización del compuesto que se desea analizar.

El ESI se había desarrollado como un procedimiento para la interfase entre lacromatografía líquida y la espectrometría de masas [40]. Así la muestra estransportada en solución (puede ser desde un cromatógrafo líquido) a través deun capilar en cuyo extremo se encuentra un alto voltaje (entre 3-4 kV). De estaforma se produce una nebulización de pequeñas gotas formadas por el solvente

Page 21: Proteomica Cap 20

PROTEÓMICA 387

y la muestra y que portan un número considerable de cargas eléctricas. Elsolvente es eliminado con la ayuda de una corriente de gas (usualmente nitrógeno)y finalmente queda la muestra ionizada con varias cargas.

Tanto el MALDI como el ESI son métodos de ionización suave, esto es, laenergía suministrada a la muestra es relativamente baja, y los compuestos sonionizados pero no ocurre la fragmentación de las moléculas como en el caso dede la ionización por impacto electrónico, el método de ionización más usadopara el estudio de moléculas orgánicas.

En ambos métodos de ionización, MALDI y ESI, un péptido adquiere una cargapositiva o negativa por adición o eliminación de protones respectivamente, dandolugar a los iones pseudomoleculares que corresponden a la masa molecular delpéptido más (o menos en el caso de iones negativos) la masa de uno o variosprotones. Si se adiciona un protón la carga del péptido será unitaria, y si se adicionanvarios protones se obtendrán iones multicargados. En el MALDI los iones sonfundamentalmente monocargados mientras que en el ESI los iones son usualmentemulticargados. En principio es posible estudiar los iones positivos o negativosaunque es mucho más frecuente la espectrometría de masas de iones positivos.

Al introducir una mezcla de péptidos en el espectrómetro de masas usandoMALDI o ESI como método de ionización se obtiene un grupo de señales quecorresponden a los iones moleculares de cada uno de los péptidos, por cuantono se producen fragmentaciones de las moléculas.

SECUENCIACIÓN DE PÉPTIDOS POR ESPECTROMETRÍA DE MASAS

Al no producirse fragmentaciones durante la ionización por MALDI o ESI seobtiene solamente información sobre la masa molecular de un péptido pero noes posible obtener información de su secuencia. Para lograr este propósito seemplea un proceso llamado Disociación Inducida por Colisiones (DIC) oDisociación Activada por Colisiones (DAC). Este consiste en introducir el hazde iones de la muestra en una región que contiene un gas químicamente inerte(usualmente argón), para que por las colisiones generadas entre ambos, unaparte de la energía cinética que poseen las moléculas se transforme en energíavibracional de sus enlaces y ocasione la disociación en dependencia de sufortaleza 41]. Aunque la eficiencia de la fragmentación de un péptido está muyinfluenciada por las características de su secuencia, se ha observado que tambiéndepende del gas de colisión que se emplee [42].

La nomenclatura aceptada por los especialistas en este campo para clasificar losiones fragmentos de un péptido es la que propusieron Roepstorff y Fohlmann [43].Se plantea que la ruptura del esqueleto carbonado de un péptido puede originarseis tipos diferentes de fragmentaciones (an, bn, c¨n, xn, y¨n, zn) que se clasifican

Page 22: Proteomica Cap 20

388 CAPÍTULO 20

en series del extremo N-terminal (an, bn, cn) o series del extremo C-terminal (xn,y¨n, zn) en dependencia de cuál de los dos extremos del péptido original seconservan en sus estructuras. El subíndice que acompaña cada tipo defragmentación se corresponde con la cantidad de residuos aminoacídicos queposee el ión fragmento (ver Figura 20.4).

Aunque las fragmentaciones de las cadenas laterales son de gran importanciapara la diferenciación de aminoácidos que poseen igual masa (aminoácidosisobáricos) y suministran más información estructural, es necesario destacarque en proteómica esta fragmentaciones no resultan de utilidad para laidentificación de las proteínas pues la mayoría de los espectrómetros que seemplean actualmente realizan la disociación inducida por colisiones de los péptidosen un régimen de baja energía y las fragmentaciones de las cadenas laterales estánausentes del espectro de masas. Sin embargo, el desarrollo reciente de los

Figura 20.4. Nomenclatura de las fragmentaciones que se obtienen por Disociación Activadapor Colisiones en experimentos MS/MS. Los fragmentos a, b y c contienen elextremo N-terminal y los fragmentos x, y y z conservan el extremo C-terminal. Lossubíndices que acompaña cada tipo de fragmentación se corresponden con lacantidad de residuos aminoacídicos en el ión fragmento. Nótese que los fragmentosb y y se obtienen por ruptura del enlace peptídico y por tanto son complementariosen la información sobre la secuencia. Son además, en general, los iones mas intensosen el espectro MS/MS.

Page 23: Proteomica Cap 20

PROTEÓMICA 389

espectrómetros de masas MALDI-TOF/TOF [44,45] pudiera vislumbrar unaaplicación en el campo de la proteómica al observarse fragmentaciones de las cadenaslaterales que suministran mayor cantidad de información estructural. Además seobtienen espectros de masas con muy buena calidad en el rango de los femtomoles.

La abundancia relativa de estas series N y C-terminales en el espectro estádeterminada generalmente por la posición del residuo básico en la secuencia. Asípor ejemplo, cuando residuos de Arginina están ubicados en el extremo N o en elextremo C del péptido, abundan en el espectro las series N o C-terminalrespectivamente. Este fenómeno es conocido en la literatura inglesa como chargeremote fragmentation [46] y plantea que la fragmentación ocurre a lo largo de lacadena peptídica inducida por la carga a pesar de que ésta se mantiene en unlugar fijo (alejado en muchos casos), presumiblemente en la posición en que estáubicado el residuo básico. Por este motivo es usual observar que los espectros demasas de los péptidos trípticos son abundantes en iones C-terminales (series y¨n).

Para secuenciar un péptido, cada uno de los iones fragmentos observados en elespectro se debe clasificar de acuerdo a la nomenclatura antes mencionada,pues de esta manera las diferencias en masas de series consecutivas de unmismo tipo (b5, b4, b3, b2…) pueden ser asignadas a uno de los veinte aminoácidosmás comunes y así obtener la secuencia peptídica. Por otra parte, un péptido sepuede secuenciar simultáneamente a partir de sus dos extremos con un soloespectro pues la información suministrada por las series N y C-terminales soncomplementarias. Se obtienen secuencias parciales desde ambos extremos y alsuperponerlas se determina una secuencia altamente confiable (ver Figura 20.5).

Figura 20.5. Esquema de un experimento MS/MS. La mezcla de péptidos proteolíticos esionizada y se introduce en el primer analizador, donde se selecciona uno de lospéptidos que pasa a la cámara de colisiones. Aquí ocurre la interacción con el gasneutro (Argón) y se producen las fragmentaciones que son medidas en el segundoanalizador para obtener el espectro MS/MS y deducir la secuencia del péptido.

Page 24: Proteomica Cap 20

390 CAPÍTULO 20

SECUENCIACIÓN DE UNA MEZCLA DE PÉPTIDOS. E SPECTROS MS/MS

Lo referido en el epígrafe anterior implica que debemos tener un péptido puro,pues si tuviéramos una mezcla de péptidos se producirían fragmentos de todosellos y sería imposible la interpretación de los espectros. Por esta razón serequiere aislar o seleccionar un péptido determinado para proceder a susecuenciación.

Esto es posible mediante la espectrometría de masas en tándem o MS/MS queconsiste en dos analizadores separados por la cámara de colisiones donde elgas neutro provoca las fragmentaciones (ver Figura 20.6).

Cuando se introduce una mezcla de péptidos en la fuente de ionización, seproduce la ionización de todos y al penetrar en el primer analizador es posibleseleccionar solo uno de ellos, los restantes simplemente chocan con las paredesdel analizador. El péptido seleccionado pasa a la cámara de colisiones donde se

Figura 20.6. Espectro MS/MS del péptido VLFSSDGGVVK. Puede observarse que la mayoría delos iones presentes corresponden a los fragmentos y, algo frecuente en los espectros depéptidos trípticos que poseen un aminoácido básico en el extremo C-terminal y portanto conservan la carga en ese residuo. En este ejemplo es posible deducir con relativafacilidad la secuencia completa del péptido, algo que no siempre ocurre.

Page 25: Proteomica Cap 20

PROTEÓMICA 391

producen los fragmentos que son posteriormente analizados en el segundoanalizador con lo que se obtiene la secuencia del péptido de forma similar a ladescrita en el epígrafe anterior.

Una vez concluida esta operación para un péptido, se selecciona otro péptido y seprocede de forma similar. Este procedimiento es rápido y automático por lo quese pueden medir los espectros MS/MS de varios péptidos presentes en una mezclaen un tiempo relativamente breve y obtener sus secuencias. Esta posibilidad técnicatambién tiene otra repercusión importante en proteómica y es que las proteínasque se van a identificar no tienen que estar totalmente puras. Es posible identificarvarias proteínas en una mezcla como ocurre en ocasiones en una banda deelectroforesis donde puede existir más de una proteína.

MODIFICACIONES POST-TRADUCCIONALES

Como hemos la espectrometría de masas permite identificar una proteína, ysecuenciarla lo que resulta de gran importancia aunque hay otro aspecto muyrelevante de esta técnica que es su capacidad para identificar y localizar lasmodificaciones post-traduccionales. Se conocen más de 200 tipos demodificaciones. La espectrometría de masas es prácticamente el único métodocapaz de detectarlas y determinar su ubicación en la cadena de aminoácidos.

De la descripción del procedimiento de secuenciación por espectrometría demasas resulta evidente que es posible detectar cualquier posible modificaciónpor el corrimiento de masa que provoca en el aminoácido donde se encuentralocalizada. Cuando al analizar un espectro MS/MS para secuenciar un péptido,el valor de masa obtenido para alguna de las fragmentaciones no se correspondecon ninguno de los valores de masas de los veinte aminoácidos más comunes,es muy probable que sea debido a la presencia de una modificación posttraduccional. Con el auxilio de tablas que reportan los corrimientos de masaprovocados por las diferentes modificaciones se puede identificar el aminoácidoy la modificación correspondiente. En la Tabla 20.2 se muestran los corrimientosesperados para algunas de las modificaciones mas comunes. Pueden encontrarsetablas muy completas en: http://www.abrf.org/index.cfm/dm.home o http://www.unimod.org/

Tabla 20.2. Modificaciones post traduccionales más comunes

mm

Page 26: Proteomica Cap 20

392 CAPÍTULO 20

Es conocida la repercusión de estas modificaciones en las funciones biológicasde las proteínas, de ahí la importancia de contar con un método capaz deidentificarlas. Sin embargo, aún es difícil poder cuantificar la fracción de moléculasde una proteína que se encuentra modificada en un sitio dado y establecer siesa modificación es transitoria.

ESTRATEGIAS PARA LA IDENTIFICACIÓN DE LAS PROTEÍNAS

Como ya fue mencionado anteriormente (Tabla 20.1), las proteínas separadaspor electroforesis bidimensional son digeridas con una enzima, usualmente tripsina,con lo que se obtiene una mezcla de péptidos. Los péptidos son extraídos del gele introducidos directamente en el espectrómetro de masas para su identificación.

En la actualidad existen tres estrategias fundamentales para la identificación de proteínasbasadas en la información primaria suministrada por la espectrometría de masas:

La primera de las estrategias para la identificación de proteínas en las bases dedatos se basa en que la digestión proteolítica de una proteína con una proteasaaltamente específica, origina de manera reproducible un conjunto de péptidosque es característico para cada una de las proteínas.

Por esta razón, es posible predecir mediante una digestión in silico el conjuntode péptidos que se debe generar mediante el tratamiento proteolítico específicode cada una de las proteínas almacenadas en las bases de datos de secuenciasy por lo tanto se puede calcular teóricamente las masas moleculares de cadauno de los péptidos esperados.

Tabla 20.2 (continuación).

Page 27: Proteomica Cap 20

PROTEÓMICA 393

La masa molecular de cada uno de los péptidos proteolíticos se puede determinarexperimentalmente mediante ESI-MS o MALDI-MS. Esta información seconoce como huella de masas de los péptidos de una proteína o peptide massfingerprint (PMF). Por tanto, la proteína analizada puede ser identificadaexitosamente cuando se produce una correspondencia entre los valoresexperimentales de las masas moleculares de cada uno de sus péptidos con losvalores de masas teóricas esperadas para una de las proteínas existentes en lasbases de datos.

Con la instrumentación disponible en la actualidad la medición de las masasmoleculares puede realizarse de manera rutinaria con un error inferior a los50 ppm por lo que las identificaciones por esta metodología son muy confiablesy es previsible que con la introducción masiva de espectrómetros más acuciososla calidad de las identificaciones sea aún superior pues está directamenterelacionada con la exactitud de la medición de las masas moleculares de lospéptidos proteolíticos [47,48].

Hoy en día existen varios programas accesibles vía Internet que brindan elservicio de identificación de proteínas en línea utilizando la estrategia del PMFy entre los más empleados se encuentra el MASCOT, (http://www.matrixscience.com/cgi/search_ form.pl?FORMVER=2&SEARCH=PMF)[49], el ProFound (http://129.85.19.192/profound_bin/WebProFound.exe) [50]y el MS-Fit (http://prospector.ucsf.edu/ucsfhtml4.0/msfit.htm). De todas lasestrategias para la identificación de proteínas en las bases de datos de secuenciaésta fue la que inicialmente ganó más popularidad, debido a su gran sencillezpor ello, numerosos grupos de trabajo la implementaron en sus laboratorios ydesarrollaron los programas de cómputo apropiados para este propósito [51,52](ver Figura 20.7).

Sin embargo, cuando se digieren proteínas poco abundantes en la banda de gel,incluso empleando los protocolos optimizados, con frecuencia se obtienen bajosrecobrados de los péptidos proteolíticos y es frecuente encontrar que soloaparezcan las señales de masas correspondientes a uno, dos o tres péptidosproteolíticos. En estos casos la estrategia de PMF puede brindar resultadosambiguos o identificaciones erróneas. En tales situaciones es necesario obtenerinformación de la secuencia de los péptidos analizados.

Esta limitante fue resuelta con el surgimiento de otra estrategia conocida comoetiqueta de secuencia (sequence tag) para la identificación de proteínas. Ellaplantea que para lograr la identificación solo es necesario extraer una pequeñasecuencia parcial (3 a 4 aminoácidos) del espectro ESI-MS/MS de un péptido[53]. Este método revolucionó la identificación de las proteínas a partir de lasecuencia deducida de los espectros de masas por cuanto se requería una

Page 28: Proteomica Cap 20

394 CAPÍTULO 20

interpretación exhaustiva del espectro MS/MS para obtener la secuenciaaminoacídica lo más completa posible de algunos de los péptidos proteolíticospara poder identificar la proteína correspondiente. El procedimiento del sequencetag es particularmente útil en los espectros ESI-MSMS de los péptidos trípticospues esa pequeña secuencia parcial es muy fácil de extraer pues la región demayor masa es muy limpia en cuanto a la relación señal/ruido y es rica en losfragmentos y¨n (el aminoácido básico se conserva en el C-terminal).

Aunque el método es muy confiable y hay programas que extraen de maneraautomática la secuencia parcial a partir de los espectros ESI-MSMS, en algunoscasos se requiere de la intervención del especialista, pues el éxito de laidentificación se basa en una correcta interpretación de espectros para extraerla secuencia parcial.

Figura 20.7. Pasos principales en la identificación de proteínas mediante la huella de masas delos péptidos de una proteína (peptide mass fingerprint). 1: las proteínas se separanen un gel bidimensional. Las proteínas de interés se seccionan del gel y se digierencon tripsina. 2. Los péptidos procedentes de la digestión tríptica se analizan porespectrometría de masas, en este caso usando la técnica de ionización conocidacomo MALDI. 3. Se obtienen las masas moleculares de los péptidos trípticosobtenidos en la digestión. 4. Los valores de masas obtenidos experimentalmente secomparan con las digestiones teóricas existentes en las bases de datos de proteínasy que son accesibles vía Internet. Se obtiene el resultado con la identificación de laproteína y una evaluación de la confiabilidad de la identificación.

Page 29: Proteomica Cap 20

PROTEÓMICA 395

La última de las estrategias pretende minimizar la intervención del especialistaen la identificación de las proteínas en las bases de datos de secuencias [54,55].Esta estrategia se conoce como huella de masas del espectro MS/MS y se basaen que cada péptido que se fragmenta mediante un proceso de disociacióninducida por colisiones produce un espectro de iones fragmentos (MS/MS), quees muy característico de su secuencia y que lo diferencia del resto de los péptidosalmacenados en las bases de datos.

El espectro MS/MS de un péptido está mayoritariamente representado porfragmentos originados por la ruptura del enlace peptídico (y¨n o bn ). Si lasecuencia de la proteína que contiene al péptido se conoce, es posible predecirlas masas de los fragmentos iónicos que se originarán. Por ello, el programabasa su identificación en buscar primeramente el conjunto de todos los péptidos(dentro de las proteínas en las bases de datos) que, originados por un corteespecífico de la proteasa empleada, coincidan con la masa molecular del péptidoque se analiza. Posteriormente, a cada uno de los péptidos que posean esacaracterística se le calculan las masas moleculares de los iones fragmentosposibles y se comparan con las masas moleculares de los fragmentos obtenidosexperimentalmente en el espectro MS/MS. Se selecciona el péptido con mejorcoincidencia y así queda identificada la proteína (ver Figura 20.8).

Figura 20.8. Resumen de las Estrategias de Identificación de Proteínas. Las 3 principales estrategiasson: 1. Huella de masas de la proteína. Se obtiene el espectro de masas de la mezclade péptidos proteolíticos. Los valores de las masas obtenidos se comparan con lasdigestiones teóricas de las proteínas en las bases de datos para la identificación. 2.Etiqueta de secuencia. Requiere de espectros MS/MS. Se seleccionan uno o variospéptidos, se obtiene el espectro MS/MS y se determina una secuencia parcial. Essuficiente 3-4 residuos para identificar la proteína en las bases de datos. 3. Huella demasas MS/MS. Igualmente requiere del uso de MS/MS pero a diferencia del anteriorno es necesaria la determinación de una secuencia parcial. Se basa en que los ionesfragmentos de un péptido son característicos y por tanto basta para encontrar unpéptido idéntico en las bases de datos e identificar la proteína correspondiente.

Page 30: Proteomica Cap 20

396 CAPÍTULO 20

Resulta evidente que para todos estos programas mencionados es indispensabledisponer de la secuencia de las proteínas en las bases de datos para una correctaidentificación.

Particularmente para la identificación de proteínas que pertenezcan a unorganismo de genoma desconocido solo se podrá obtener un resultado exitoso,mediante la estrategia de PMF, si la proteína de interés comparte una identidadde secuencia elevada con respecto a alguna de las proteínas reportadas en lasbases de datos. Mientras menor sea la identidad de secuencia, menos confiableserá la identificación realizada.

Si la similitud de secuencia es muy baja o si la secuencia del gen no es conocidaentonces los péptidos trípticos tienen que ser secuenciados completamente apartir de la interpretación manual o automática de los espectros MS/MS decada péptido. La identificación se realiza mediante el alineamiento de lassecuencias determinadas experimentalmente contra bases de datos de secuenciasconocidas, para encontrar secuencias similares. No obstante, si la secuencia dela proteína en cuestión no es muy similar a las reportadas en las bases de datosesta estrategia puede fallar. Esto es debido a que es poco probable que lasecuencia de genes de una especie sea idéntica a la otra y las sustituciones denucleótidos pueden provocar sustituciones de aminoácidos que implican cambiosen las masas de los péptidos analizados y por tanto, repercute negativamente enla identificación.

Los programas de alineamiento de secuencias de proteínas y genes másempleados son el BLAST www.ncbi.nlm.nih.gov/blast y el FASTAwww.ebi.ac.uk/searches/fasta.html. La identificación a través de estosprogramas resulta difícil, ya que ambos algoritmos se han optimizado paracomparar secuencias de proteínas y nucleótidos de mayor longitud que lospéptidos secuenciados por espectrometría de masas. Por otro lado, laespectrometría de masas no permite diferenciar aminoácidos isobáricos ya quepresentan masas muy similares (Lys y Gln) o idénticas (Leu e Ile) y la calidaddel alineamiento puede estar determinada por cuál aminoácido de los antesmencionados se introduzca en la secuencia a alinear ya que estos programascontienen una matriz diferente para cada uno.

El auge alcanzado en la aplicación de la espectrometría de masas a lasecuenciación de proteínas ha motivado que los programas de alineamientoshayan sido recientemente modificados para adaptarlos al alineamiento óptimode secuencias cortas de péptidos. Particularmente, el FASTA modificado (FASTS)[56] posee aún una limitante pues las búsquedas son lentas y la puntuación finalde los envíos depende no sólo del número de péptidos sino que disminuye con elnúmero de secuencias de péptidos en cada solicitud enviada.

Page 31: Proteomica Cap 20

PROTEÓMICA 397

Shevchenko et al., [57,58] propusieron el programa BLAST optimizado paraanálisis de péptidos secuenciados por espectrometría de masas (MS BLAST).Éste se encuentra disponible mediante un servicio web http://dove.embl-heidelberg.de/Blast2. A diferencia del BLAST y el FASTA, el MS BLASTpermite introducir algunas modificaciones a los péptidos secuenciados queaumentan la confiabilidad de la identificación, como por ejemplo las puntuacionesindividuales para los aminoácidos isobáricos (Leu/Ile y Gln/Lys) son sustituidaspor sus valores promedios y así la puntuación del péptido T-S-L-V-K-M esigual a la del péptido T-S-I-V-G-M).

En marzo del 2003 surgió una nueva alternativa para la identificación eficientede péptidos provenientes de organismos de genoma desconocido. Estaherramienta es la secuenciación mediante MultiTag [59] que constituye unaversión modificada de la estrategia de identificación mediante etiqueta desecuencia (sequence tag). Ésta permite identificar proteínas de muy bajaabundancia y de las que sólo se pueden secuenciar de tres a cuatro aminoácidos,cuya identificación no sería confiable por MS BLAST.

APLICACIONES DE LA PROTEÓMICA

Las múltiples aplicaciones de estas técnicas pueden agruparse en dos categoríasprincipales:

1. Caracterización del proteoma de un organismo. El propósito de este estudioes la identificación del mayor número de proteínas expresadas por unorganismo en una condición biológica particular. En el caso de organismosunicelulares o de células en cultivo, muchos trabajos se han propuesto laseparación y la identificación de proteínas en preparaciones de proteínastotales y ya existen mapas en bases de datos para numerosos organismos.Sin embargo, para lograr un nivel superior de información se prefieredescomponer el estudio del proteoma en el estudio de subproteomascorrespondientes a organelos subcelulares (Figura 20.9). Actualmente laOrganización del Proteoma Humano (HUPO) tiene en curso 3 proyectosinternacionales destinados a la construcción de los primeros mapasproteómicos de órganos o tejidos. Estos son: cerebro, hígado y plasma.

2. Proteómica Comparativa (Figura 20.10): consiste en evaluar los cambios enla expresión de proteínas de un organismo sometido a dos o varias condicionesbiológicas diferentes, generalmente una de ellas es una condición controlque se utiliza como referencia de la expresión de proteínas en condiciones“normales”. Este tipo de trabajo suministra información a nivel molecular delos cambios causados por la acción de un agente externo (por ejemplo unmedicamento), por cambios en las condiciones de cultivo, las diferencias

Page 32: Proteomica Cap 20

398 CAPÍTULO 20

entre una línea celular normal y una tumoral, la evaluación de los cambiosproducidos por un agente infeccioso, el desarrollo de los mecanismos de resistenciaa quimioterapéuticos o antimicrobianos. Este tipo de investigación es de altovalor en ciencias biomédicas. Para los trabajos de proteómica comparativa esnecesario disponer de un diseño experimental cuidadosamente planificado. Aquíresulta de gran utilidad la existencia de una hipótesis previa que oriente la búsquedahacia determinado tipo de proteínas que pueden ser seguidas por inmunodeteccióncon anticuerpos específicos o que se suponen localizadas esencialmente en unorganelo subcelular . Por ejemplo, algunos proyectos se orientan específicamentehacia la identificación de cambios en los patrones de fosforilación de proteínas.En este caso, la detección del subconjunto de proteínas fosforiladas puedefacilitarse mediante el uso de anticuerpos específicos.

Figura 20.9. Confección de un mapa bidimensional anotado. Como resultado de las identificacionesefectuadas por espectrometría de masas, el mapa bidimensional de proteínas seenriquece con abundante información que incluye la identificación de la naturalezade las proteínas, el punto isoeléctrico y la masa experimental y teórica, y laspropiedades reportadas anteriormente en la literatura.

Page 33: Proteomica Cap 20

PROTEÓMICA 399

3. Interacción de Proteínas. En los últimos años ha quedado evidenciada laimportancia de identificar las interacciones entre proteínas y de proteínascon otras moléculas. En varias publicaciones se han reportado los resultadosde aislamiento de complejos de proteínas y la posterior identificación de lasproteínas componentes. Estos resultados contribuyen significativamente alestablecimiento de mapas de interacciones y al esclarecimiento del mecanismode determinadas funciones biológicas.

Es posible predecir que las herramientas que se emplean en proteómica se iránperfeccionando e incluso aparecerán nuevos procedimientos y equipos quesolucionarán las principales limitaciones actuales. Sin lugar a dudas la proteómicafortalecerá su posición actual en las investigaciones médicas, farmacéuticas,agrícolas y en otros campos y se multiplicarán sus aplicaciones.

Figura 20.10. Proteómica comparativa. El esquema resume los pasos principales que permitenla comparación de la expresión de proteínas en dos condiciones biológicas y laconsecuente identificación de los cambios.

Page 34: Proteomica Cap 20

400 CAPÍTULO 20

REFERENCIAS

1. Wasinger VC, Cordwell SJ, Cerpa-Poljak A, Yan JX, Gooley AA, Wilkins MR, DuncanMW, Harris R, Williams KL, Humphery-Smith I. Progress with gene-product mapping ofMycoplasma genitalium. Electrophoresis. 1995, 16:1090-1094.

2. Humphery-Smith I, Cordwell SJ, Blackstock WP. Proteome research: Complementarity andlimitations with respect to the RNA and DNA worlds. Electrophoresis I, 1997, 18, 1217-1242.

3. Kettman JR, Coleclough C, Frey JR, Lefkovits I. Clonal proteomics: One gene-family ofproteins. Proteomics 2002, 2, 624-631.

4. 2D Gel electrophoresis tutorial. http://www.aber.ac.uk/~mpgwww/Proteome/Tut_2D.html

5. Protocols for sample preparation and 2D-PAGE. http://www.abdn.ac.uk/~mmb023/protocol.htm

6. Technical information on 2D-PAGE. http://expasy.hcuge.ch/ch2d/technical-info.html

7. Gorg A, Obermaier GB, Boguth G, Harder A, Scheibe B, Wildgruber R, Weiss W. The currentstate of two-dimensional electrophoresis with immobilized pH gradients. Electrophoresis2000, 21, 1037-1053.

8. Westermeier R, Naven T (Editors). Proteomics in practice. Willey-VCH Verlag, Weinheim2002.

9. Link AJ (Editor). Methods in Molecular Biology, Vol 112: 2D proteomics analysis protocols.Humana Press, New Jersey, 1999.

10. Klose J. Protein mapping by combined isolectric focusing and electrophoresis of mousetissues. A novel approach to testing for induced point mutations in mammals. Humangenetik1975, 26, 211-234.

11. O’Farrell, P H. High resolution two-dimensional electrophoresis of proteins. J. Biol. Chem.1975, 250, 4007-4021.

12. Gonzalez LJ, Castellanos-Serra L, Badock V, Diaz M, Moro A, Perea S, Santos A, Paz-LagoD, Otto A, Muller EC, Kostka S, Wittman-Liebold B, Padron G. Identification of nuclearproteins of small cell lung cancer cell line H82: An improved procedure for the analysis ofsilver-stained proteins. Electrophoresis 2003, 24, 237-252.

13. Corthals GL. Exploitation of specific properties of trifluoroethanol for extraction andseparation of membrane proteins. Presented at the Proteomics forum 2003, September2003, Munich, Germany.

14. Castellanos-Serra L and Paz-Lago D. The inhibition of unwanted proteolysis during samplepreparation. Its evaluation in challenge experiments. Electrophoresis 2002, 23, 1745, 1753.

15. Klose J, Kobalz U. Two-dimensional electrophoresis of proteins: An update protocols andimplications for functional analysis of the genome. Electrophoresis 1995, 16, 1034-1059.

16. Gauss C, Kalkum M, Lowe M, Lehrach H, Klose J. Analysis of the mouse proteome. (I)Brain proteins: Separation by two-dimensional electrophoresis and identification by massspectrometry and genetic variation. Electrophoresis 1999, 20, 575-600.

Page 35: Proteomica Cap 20

PROTEÓMICA 401

17. Corthals GL, Wasinger VC, Hochstrasser DF, Sanchez JC. The dynamic range of proteinsexpression: A challenge for proteomic research. Electrophoresis 2000, 21, 1104-1115.

18. Anderson NL and Anderson NG. The human plasma proteome. Molecular and CellularProteomics 2002, 1, 845-867.

19. Pieper R, Gatlin CL, Makusky AJ, Russo PS, Schatz CR, Miller SS, Su Q, McGrath AM,Estock MA, Parmar PP, Zhao M, Huang ST, Zhou J, Wang F, Esquer-Blasco R, AndersonNL, Taylor J, Steiner S. The human serum proteomic display of nearly 3700chromathographically separated protein spots on two-dimensional electrophoresis gel andidentification of 325 distinct proteins. Proteomics 2003, 7, 1345-1364.

20. Graham JM and Rickwood D (Editors). Subcellular fractionation: A practical Approach.Oxford University Press 1997, New York.

21. Molloy MP, Herbert BR, Walsh BJ, Tyler MI, Traini M, Sanchez JC, Hochstrasser, DF,Willians KL, Gooley AA. Extraction of membrane proteins by differential solubilization forseparating using two-dimensional gel electrophoresis. Electrophoresis 1998, 19, 837-844.

22. Schagger H and Von Jagow G. Tricine-Sodium Dodecyl Sulphate gel electrophoresis for theseparation of proteins in the range from 1 to 100 kDa. Analytical Biochemistry 1987:166,368-379.

23. Opiteck, G, J and Jorgenson, J, W Two-dimensional SEC/RPLC coupled to mass spectrometryfor the analysis of peptides, Anal.Chem., 1997,69(13), 2283-2291

24. Raida M, Schulz-Knappe P, Heine G, Forssmann WG. Liquid chromatography andelectrospray mass spectrometric mapping of peptides from human plasma filtrate, J Am SocMass Spectrom. 1999, 10(1), 45-54.

25. Washburn MP, Wolters D, Yates JR 3rd. Large-scale analysis of the yeast proteome bymultidimensional protein identification technology, Nat Biotechnol. 2001, 19(3), 242-247.

26. Wolters DA, Washburn MP, Yates JR 3rd. An automated multidimensional proteinidentification technology for shotgun proteomics, Anal. Chem. 2001, 73(23), 5683-5690.

27. Davis MT, Beierle J, Bures ET, McGinley MD, Mort J, Robinson JH, Spahr CS, Yu W,Luethy R and Patterson SD. Automated LC–LC–MS–MS platform using binary ion-exchangeand gradient reversed-phase chromatography for improved proteomic analyses,J.Choromatogr.B Biomed .Sci. Appl. 2001, 752(2), 281-291.

28. Pang JX, Ginanni N, Dongre AR, Hefta SA, Opitek GJ. Biomarker discovery in urine byproteomics, J.Proteome Res. 2002, 1(2), 161-169.

29. Bushey,M,M and Jorgenson,J,W. Automated instrumentation for comprehensive two-dimensional high-performance liquid chromatography of proteins, Anal Chem. 1990, 62(2),161-167.

30. Anderson, L, and Porath J. Isolation of phosphoproteins by immobilized metal (Fe3+)affinity chromatography, Anal. Biochem. 1986, 154(1), 250-254

31. Li, S and Dass, C. Iron(III)-immobilized metal ion affinity chromatography and massspectrometry for the purification and characterization of synthetic phosphopeptides, Anal.Biochem. 1999, 270(1), 9-14

32. Ficarro SB, McCleland ML, Stukenberg PT, Burke DJ, Ross MM, Shabanowitz J, Hunt DF,White FM. Phosphoproteome analysis by mass spectrometry and its application toSaccharomyces cerevisiae, Nat. Biotechnol. 2002, 20(3), 301-305

Page 36: Proteomica Cap 20

402 CAPÍTULO 20

33. JiJ, A. Chakraborty, M. Geng, X, Zhang, A. Amini, M.Bina and F.Regnier. Strategy forqualitative and quantitative analysis in proteomics based on signature peptides, J. Chromatogr.2000, 745(1), 197-210.

34. Gygi, S. P., Rist, B., Gerber, S. A., Turecek, F., Gelb, M. H., and Aebersold, R Quantitativeanalysis of complex protein mixtures using isotope-coded affinity tags., Nat. Biotechnol.1999, 17(10), 994–999.

35. Gevaert K, Van Damme J, Goethals M, Thomas GR, Hoorelbeke B, Demol H, Martens L,Puype M, Staes A, Vandekerckhove J. Chromatographic Isolation of Methionine-containingPeptides for Gel-free Proteome Analysis: Identification Of More Than 800 Escherichia ColiProteins. Mol .Cell Proteomics. 2002,1(11), 896-903.

36 .M. Barber, R. S. Bordoli, R. D. Sedgwick and A. N. Tyler. Fast Atom Bombardment: A NewIon Source for Mass Spectrometry, J. Chem. Soc., Chem. Commun. 1981, 325.

37. Fenn JB, Mann M, Meng CK, Wong SF, Whitehouse CM, Electrospray ionization for massspectrometry of large biomoléculas, Science. 1989, 246(4926), 64-71.

38. Tanaka K, Waki H, Ido Y, Akita S, Yoshida Y and Yoshida T. Protein and polymer analysisof up to m/z 100,000 by laser ionization time-of-flight mass spectrometry, Rapid Commun.Mass Spectrom., 1988, 2, 151–153.

39. Karas M, Hillenkamp F. Laser desorption ionization of proteins with molecular massesexceeding 10,000 daltons, Anal Chem. 1988, 60(20):2299-301.

40. Whitehouse CM, Dreyer RN, Yamashita M, Fenn JB., Electrospray interface for liquidchromatographs and mass spectrometers. Anal Chem. 1985, 57(3), 675-9

41. Hayes, R. N.; Gross, M. L. Collision-induced dissociation, Methods Enzymol. 1990,193,237.

42. Biemann, K. Contributions of mass spectrometry to peptide and protein structure, BiomedEnvironm. Mass Spectrom. 1988, 16, 99-111.

43. Roepstorff, P.; Fohlman, J. Proposal for a common nomenclature for sequence ions in massspectra of peptides, Biomed. Mass Spectrom. 1984,11(11), 601.

44. Medzihradszky KF, Campbell JM, Baldwin MA, Falick AM, Juhasz P, Vestal ML, BurlingameAL. The characteristics of peptide collision-induced dissociation using a high-performanceMALDI-TOF/TOF tandem mass spectrometer, Anal Chem., 2000, 72(3), 552-8.

45. Yergey AL, Coorssen JR, Backlund PS Jr, Blank PS, Humphrey GA, Zimmerberg J, CampbellJM, Vestal ML. De novo sequencing of peptides using MALDI/TOF-TOF., J Am Soc MassSpectrom. 2002, 13(7):784-91.

46. Adams, J.; Gross, M. L. Energy requirement for remote charge site ion decompositions andstructural information from collisional activation of alkali metal cationized fatty alcohols, J.Am. Chem. Soc. 1986, 108(22), 6915.

47. Clauser KR, Baker P, Burlingame AL. Role of accurate mass measurement (+/- 10 ppm) inprotein identification strategies employing MS or MS/MS and database searching. AnalChem. 1999, 71(14):2871-82.

48. Wool A, Smilansky Z. Precalibration of matrix-assisted laser desorption/ionization-time offlight spectra for peptide mass fingerprinting. Proteomics. 2002, 2(10):1365-73.

Page 37: Proteomica Cap 20

PROTEÓMICA 403

49. Perkins, D. N., Pappin, D. J., Creasy, D. M., Cottrell, J. S. Probability-based proteinidentification by searching sequence databases using mass spectrometry data, Electrophoresis,1999, 20(18), 3551-3567.

50. Zhang, W., Chait, B.T. ProFound: an expert system for protein identification using massspectrometric peptide mapping information, Anal. Chem., 2000, 72(11), 2482-2489.

51. Mann, M.; Hojrup, P.; Roepstorff, P. Use of mass spectrometric molecular weight informationto identify proteins in sequence databases, Biol. Mass Spectrom. 1993, 22(6), 338.

52. Gevaert, K.; Verschelde, J.; Puype, M.; Van Damme, J.; Goethals, M.; De Boeck, S.;Vandekerhove, J. Structural analysis and identification of gel-purified proteins, available inthe femtomole range, using a novel computer program for peptide sequence assignment, bymatrix-assisted laser desorption ionization-reflectron time-of-flight-mass spectrometry,Electrophoresis. 1996, 17(5), 918.

53. Mann, M and Wilm, M. Error-tolerant identification of peptides in sequence databases bypeptide sequence tags. Anal Chem. 1994, 66(24), 4390-4399.

54. Ducret A, Van Oostveen I, Eng JK, Yates JR 3rd, Aebersold R. High throughput proteincharacterization by automated reverse-phase chromatography/electrospray tandem massspectrometry. Protein Sci. 1998, 7(3):706-19.

55. Gatlin CL, Eng JK, Cross ST, Detter JC, Yates JR 3rd. Automated identification of aminoacid sequence variations in proteins by HPLC/microspray tandem mass spectrometry. AnalChem. 2000, 72(4):757-63.

56. Mackey AJ, Haystead TA, Pearson WR., Getting more from less: algorithms for rapidprotein identification with multiple short peptide sequences. Mol Cell Proteomics. 2002,1(2):139-47.

57. Schevchenko, A., Sunyaev, S., Loboda, A., Schevchenko, A., Bork, P., Ens W., Standing K. G.Charting the proteomes of organisms with unsequenced genomes by MALDI-quadrupoletime-of-flight mass spectrometry and BLAST homology searching, Anal. Chem. 2001, 73(9),11917-1926.

58. Liska, A. J., Schevchenko, A. Expanding the organismal scope of proteomics: cross-speciesprotein identification by mass spectrometry and its implications. Proteomics. 2003, 3(1),19-28.

59. Sunyaev, S., Liska, A. J., Golod, A., Schevchenko, A., Schevchenko, A. MultiTag: multipleerror-tolerant sequence tag search for the sequence-similarity identification of proteins bymass spectrometry, Anal. Chem. 2003, 75(6), 1307-1315.