28
한국생물물리학회 Korean Biophysical Society Newsletter 11 2 2006 2 한국생물물리학회 Newsletter 11220062발행 361-763 충북 청주시 흥덕구 개신동 12번지 충북대학교 자연대학 화학과 발행인: 강영기 (Tel: 043-261-2285 Fax: 043-273-8328 e-mail: [email protected]) 편집기획: 허원기 (Tel: 02-880-9243 Fax: 02-873-4740 e-mail: [email protected]) 학회소식 [국외 생물물리학연구실 소개] Kunihirio Kuwajima Laboratory (The University of Tokyo) [총설] 분자 한 개의 화학 김지환 (고려대학교 화학과) 키네신 분자의 다리구조 모델 (p. 7) 시스템 생물학(Systems Biology)오믹스 기술(-omics Technology) z 회 장 단 강영기 (충북대) 총무간사 이주련 (숭실대) 학술간사 오한빈 (서강대) 재무간사 구용숙 (충북대) 편집간사 허원기 (서울대) 회원간사 정성권 (성균관대) 정의섭, 이진원 (서강대학교 공과대학 화공생명공학과) 시스템 생물학: 모듈 네트웍의 동적기능 분석 Cuong Nguyen, 한승기 z 운 영 위 원 강사욱 (서울대) 김경태 (포항공대) 김도한 (광주과학기술원) 김양미 (건국대) 김영기 (충북대) 김혜원 (울산대) 박철승 (광주과학기술원) 엄융의 (서울대) 유명희 (한국과학기술연구원) 유연규 (국민대) 채수완 (전북대) (충북대학교 물리학과) Structural Genomics of Membrane Protein 전영호, 유연규 (한국기초과학지원연구원, 국민대학교 생명나노화학과) [국내 생물물리학연구실 소개] 고등과학원 단백질접힘 연구실 z 감 사 엄대용 (성균관대) 이주영 교수 연구실

한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

한국생물물리학회 Korean Biophysical Society

Newsletter 제 11 권 제 2 호 2006 년 2 월

한국생물물리학회 Newsletter 제11권 제2호 2006년 2월 발행 361-763 충북 청주시 흥덕구 개신동 12번지 충북대학교 자연대학 화학과

발행인 강영기 (Tel 043-261-2285 Fax 043-273-8328 e-mail ykkangchungbukackr) 편집기획 허원기 (Tel 02-880-9243 Fax 02-873-4740 e-mail wkhsnuackr)

학회소식

[국외 생물물리학연구실 소개] Kunihirio Kuwajima Laboratory (The University of Tokyo)

[총설] 분자 한 개의 화학 김지환 (고려대학교 화학과)

키네신 분자의 다리구조 모델 (p 7) 시스템 생물학(Systems Biology)과

오믹스 기술(-omics Technology)

회 장 단

회 장 강영기 (충북대)

총무간사 이주련 (숭실대)

학술간사 오한빈 (서강대)

재무간사 구용숙 (충북대)

편집간사 허원기 (서울대)

회원간사 정성권 (성균관대)

정의섭 이진원 (서강대학교 공과대학 화공생명공학과)

시스템 생물학

모듈 네트웍의 동적기능 분석

Cuong Nguyen 한승기 운 영 위 원

강사욱 (서울대)

김경태 (포항공대)

김도한 (광주과학기술원)

김양미 (건국대)

김영기 (충북대)

김혜원 (울산대)

박철승 (광주과학기술원)

엄융의 (서울대)

유명희 (한국과학기술연구원)

유연규 (국민대)

채수완 (전북대)

(충북대학교 물리학과) Structural Genomics of Membrane Protein 전영호 유연규 (한국기초과학지원연구원 국민대학교 생명나노화학과)

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실 감 사

엄대용 (성균관대) 이주영 교수 연구실

Page 2 Biophysical Society Newsletter

학 회 소 식

(1) IUPAB 소식

IUPAB의 15th International Congress가 지난 8월21일부

터 9월1일까지 프랑스의 Montpellier에서 개최되었다 한국

측 대표로 강사욱 교수(서울대)가 참석하였다 이번 총회

에서 IUPAB의 새 임원(Officers)과 운영위원(Council

members)이 다음과 같이 선출되었다

회장(President) Ian C P Smith (캐나다) 전임 회

장 Jean Garneier (프랑스)

부회장단(Vice Presidents) Kunaki Nagayama (일

본) Wilma K Olson (미국)

총무간사(Secretary-General) Fritz G Parak (독일)

운영위원 Robers Brasseur (벨기에) Peter Brzezinski

(스웨덴) Franco Conti (이탈리아) Peter Laggner (오스

트리아) Greta Pifat-Mrzljak (크로아티아) J E Ponce-

Hornos (아르헨티나) Manuel Priero (포르투갈) Zihe

Rao (중국) Cris G dos Remedios (호주) Gordon C K

Roberts (영국) A B Rubin (러시아) Tej P Singh (인도)

그리고 16th International Biophysics Congress가 미국의

Long Beach에서 2008년 2월 2일부터 6일까지 열린다 프로

그램 위원회의 IUPAB 대표는 J Garnier I Pecht와 DAD

Parry이며 Garnier는 IUPAB 여비 지원 선발 위원회 (travel

grant selection committee)의IUPAB 대표이기도 하다 미국

Biophysical Society 대표는 Ligia Toro이다

2011년에 열리는 17th International Biophysics Congress

의 장소로 베이징 (중국) 카이로 (이집트) 그라츠 (오스트

리아)의 세 도시가 후보로 올랐다 Zihe Rao 박사가 베이징

MI El-Gohari 박사가 카이로의 장점을 주장하였으며

Peter Laggner 박사는 삼년후의 재응모를 기약하며 그라츠

시의 응모를 철회했다 총회에서 압도적 지지로 베이징이

선정되었다

(2) 제5회 East Asian Biophysics Symposium

제5회 East Asian Biophysics Symposium (EABS2006)가

올해 11월12일부터 16일까지 일본의 오키나와에서 개최된

다 보다 자세한 학회 참가에 대한 안내는 전회원들에게 다

시 전달할 예정이다

(웹 페이지 wwwics-inccojpeabs2006)

(3) e-journal Biophysics

EABS committee에서 주관하는 e-journal인 Biophysics

가 2005년부터 운영되고 있다(웹 페이지 wwwbiophysjp

index-ehtml) 한국 측 편집위원은 강사욱 교수(서울대)이

다 한국측 회원들의 지지와 적극적인 참여를 기대한다

(4) 미국 Biophysical Society와 Link

현재 생물물리학회 웹 페이지 (httpwwwbiophysicsor

kr)에 미국 Biophysical Society에서 활동하는 재미 과학자

들을 위한 게시판을 만들고 있다 한국 생물물리학회 회원

들과 미국 Biophysical Society의 한국인 회원들과의 교류에

도움이 될 것으로 기대된다

Biophysical Society Newsletter Page 3

Introduction

Our laboratory is studying mechanisms of in vitro protein

folding and mechanisms of molecular chaperone function The

question of how a polypeptide chain can fold into a specific

native structure in vitro as well as in vivo is of fundamental

importance in biophysics biochemistry molecular biology and

biotechnology The specific native structure of proteins is

determined by their amino acid sequences In addition the

native conformation is assumed to be the conformation with

the minimum free energy However much remains to be

understood despite the efforts for more than thirty years The

long-term goals of our research are thus to elucidate the

physicochemical principles by which a protein organizes its

specific native structure from the fully unfolded state and to

elucidate how these principles are utilized or qualified by the

molecular chaperones in the biological cell

(1) Mechanisms of protein folding in vitro

Many small globular proteins with more than 100 amino

acid residues often accumulate partially folded intermediate

states with significant amount of the secondary structure

during the kinetics of the folding reaction These intermediates

are identical to the molten globule state which can accumulate

under moderately denaturing conditions and assumed to be

essential for the structure formation of the native state

Detailed characterization of the folding intermediates as well

as the transition state of the folding is very important to

elucidate the mechanisms of protein folding For this purpose

our laboratory investigates the thermodynamic stability and the

foldingunfolding kinetics of several well-characterized small

proteins which includes α-lactalbumin lysozyme

staphylococcal nuclease and green fluorescent protein as well

as the natural and engineered variants of these proteins In

particular the effects of site-directed mutations on the stability

and the foldingunfolding kinetics give us the detailed

information on the structure of the folding intermediates and

the transition state

A representative example is the characterization of the

transition state structure of a 123-residue Ca2+-binding protein

goat α-lactalbumin (α-LA) (1) This protein consists of two

domains an α-domain and a β-domain and forms the molten

globule state in early stages of the folding Based on the

extensive studies on bovine and human α-LA it has been

shown that the α-LA molten globule has a bipartite structure in

which the α-domain is weakly formed and the β-domain is

disordered To investigate whether the structure partially

formed in the molten globule folding intermediate of goat α-

LA is further organized in the transition state of folding we

constructed a number of variants of this protein and performed

Φ-value analysis on them

[국외 생물물리학연구실 소개]

Kunihirio Kuwajima Laboratory (The University of Tokyo)

Kunihiro Kuwajima

Page 4 Biophysical Society Newsletter

We studied the equilibrium unfolding transitions and kinetic

refolding and unfolding reactions of the variants using

equilibrium and stopped-flow kinetic circular dichroism

techniques The results have indicated that the folding nucleus

in transition state of goat α-LA is not extensively distributed

over the α-domain of the protein but very localized in a

region that contains the Ca2+-binding site and the interface

between the C-helix and the β-domain (Figure) It is concluded

that the specific docking of the α- and β-domains at a domain

interface is necessary for this protein to organize its native

structure form the molten globule intermediate

(2) Mechanisms of molecular chaperone function

Various molecular chaperones assist protein folding in the

cell Molecular chaperones are associated not only with the

structure formation and the assembly of proteins but also with

a wide range of events occurring in the cell such as

intracellular transport of proteins DNA replication and stress

response Our laboratory studies the mechanisms of chaperone

function using one of the best-characterized chaperone

chaperonin GroELGroES from Escherichia coli We focus on

the effects of the chaperonin on the folding kinetics of proteins

and on the allosteric transition of the chaperonin induced by

various nucleotides such as ATP by means of in vitro model

systems

Experimental techniques

In much of these studies we rely on various

spectroscopic techniques including absorbance (UV - IR)

circular dichroism intrinsic and extrinsic fluorescence small

angle X-ray scattering and nuclear magnetic resonance which

serve as probes to monitor the structural properties of proteins

These probes are often combined with mixing techniques such

as stopped-flow to monitor the kinetics of the folding and

unfolding reactions In addition to those experimental

techniques shown above we also use computational

techniques such as molecular dynamics simulations

Kuwajima laboratory members

Figure A schematic representation of goat α-LA (PDB code 1HMK) The side-chains of the residues where mutations have been introduced are shown by space filling

Biophysical Society Newsletter Page 5

1 M and Kuwajima K

2 and Kuwajima K J Mol Biol

3 M Saeki K Kamagata K Sawano

Y Tanokura M Kidera A and Kuwajima K J Mol Biol

354 164-172 (2005)

대한민국 국민의 수면형태를 연구할 때 평균수면시간

만을

씩 다른 행

동을

용하는 방법과 (2) 화학결합이 분해되는데 필요한 힘을 측

(1) 분자의 형광측정

(single molecule detection)의 기본

원칙

References

Saeki K Arai M Yoda T Nakao

J Mol Biol 341 589-604 (2004)

Kamagata K Arai M

339 951-965 (2004)

Oroguchi T Ikeguchi

[총설] 분자 한 개의 화학

고려대학교 화학과

김지환

이야기 하는 것은 불충분 하다 연령별로 수면시간이

다르고 도시거주자와 농촌저주자의 수면형태가 다르고 또

한 각 개인의 생활패턴이 다르기 때문이다 아마도 개인의

수면패턴은 개인의 생활방식에 의거해서 개별적으로 이해

하는 것이 가장 효과적인 이해방법일 것이다

화학반응에 있어서도 각각의 분자들은 조금

보일 것으로 생각된다 하지만 이때까지의 화학은

1023 개 정도의 분자 간의 화학반응의 평균치만을 측정하여

왔다 위에서 든 예와 마찬가지로 평균치 하나만 으로는 화

학반응의 미묘함을 완전히 설명하기 힘들다 이러한 평균화

를 피하기 위해서 분자 하나하나의 구조와 화학반응을 연구

하는 단 분자측정기술 (Single-Molecule Spectroscopy SMS)

이 최근 들어 개발되고 있으며 종래의 화학 및 생화학반응

에서 밝혀질 수 없었던 흥미 있는 현상들이 속속들이 관측

되고 있다 특히 화학적으로는 동일한 분자들이지만 실제

의 화학반응에 있어서는 분자 각각이 lsquo개성rsquo을 가지는 것이

증명되고 있다 단 분자 측정방법은 (1) 단 분자의 형광을 이

정하는 원자 힘 현미경 혹은 광학 집게 (optical tweezer) 방법

으로 분류될 수 있다

단 분자 분광측정기술

은 다음과 같다 (1) 용매의 자체형광이나 산란을 취소

화 하기위하여 레이져의 조사 (illumination) 부피를 줄이고

(2) 조사되는 영역에 통계적으로 한 개의 분자가 위치하도

록 하며 단분자에서 나오는 형광광자를 높은 양자효율로 측

정한다 최근의 반도체기술의 발달로 인하여 단일광자

를 양자효율 70 이상으로 측정이 가능하게 되었으며 이

기술의 발달은 형광태그가 된 단일 단백질분자의 측정이 가

능하게 되었다 특히 이 기술과 형광공명에너지전이를 접목

시킨 단일쌍 형광공명에너지전이 (single pair fluorescence

resonance energy transfer sp-FRET)를 이용하면 단일단백질

분자의 시간에 따른 콘포메이션 (conformation)의 변화를 관

찰할 수 있다

Page 6 Biophysical Society Newsletter

그림 1 (a) spFRET 의 에너지 diagram (b) spectral overlap (c) 거리에 따른 spFRET의 변화

그림 2 (A) 콜레스테롤산화효소(cholesterol oxidase) 분자들의 공간상 분포 이미지 밝은 점 한 개는 시료

상의 한 개의 효소분자의 위치를 나타낸다 (B) 한 개의 효소분자가 콜레스테롤분자들과 반응하는 것을 시간에 따라 기록한 그래프 x-축은 측정시간을 의미

하고 y-축은 효소의 화학적 상태를 나타낸다

일례로 하버드 대학 화학과 서니 지 (X Sunney Xie)교

수연구팀은 한 개의 콜레스테롤산화효소 (cholesterol

oxidase)분자가 콜레스테롤분자들을 산화시키는 반응을 직

접 관찰하였다 (그림 2) 이 실험으로 부터 개별적인 효소분

자들의 산화반응속도는 조금씩 다르다는 것을 시사했다

(참조문헌 1)

다른 분자 B (그림 2(b)의 Biotin) 를 시료 표면에 흡착 시켰

을 때 A-B 분자간 힘은 cantilever의 휘는정도(deflection)에

반영이 되며 이 deflection 은 레이져와 광다이오드로 구성된

광학지렛대 (optical lever)에 의하여 증폭되어 기록된다 그

림 1(c)는 가웁(Gaub) 연구단이 탐침표면에 있는 avidin과 시

료표면에 있는 biotin간의 인력을 거리에 따라 측정한 결과

를 보여준다[Science 264 415 (1994)] 이러한 단일분자의 힘을

측정하여 생체분자의 상호작용 및 생체분자간의 상호작용

을 상세히 연구할 수 있다

(2) 단일분자의 힘 (force) 측정

spFRET과 연계된 생체분자의 측정기술로써 단일분자

힘 탐침기술(molecular force probe) 이 최근 들어 각광을 받

고 있다 원자힘 현미경(atomic force microscopy)탐침 끝에

결합된 분자와 시료표면에 고정되어 있는 다른 분자간의 결

합력을 탐침에 작용되는 기계적인 힘을 측정함으로서 알아

내는 기술이다 그림 3a에서는 분자힘 측정장비의 개략도를

나타내었다 용수철 상수값 (k)를 알고 있는 AFM cantilever

probe의 끝을 분자 A (그림 3(b)에서는 Avidin) 로 코팅하고

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 2: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 2 Biophysical Society Newsletter

학 회 소 식

(1) IUPAB 소식

IUPAB의 15th International Congress가 지난 8월21일부

터 9월1일까지 프랑스의 Montpellier에서 개최되었다 한국

측 대표로 강사욱 교수(서울대)가 참석하였다 이번 총회

에서 IUPAB의 새 임원(Officers)과 운영위원(Council

members)이 다음과 같이 선출되었다

회장(President) Ian C P Smith (캐나다) 전임 회

장 Jean Garneier (프랑스)

부회장단(Vice Presidents) Kunaki Nagayama (일

본) Wilma K Olson (미국)

총무간사(Secretary-General) Fritz G Parak (독일)

운영위원 Robers Brasseur (벨기에) Peter Brzezinski

(스웨덴) Franco Conti (이탈리아) Peter Laggner (오스

트리아) Greta Pifat-Mrzljak (크로아티아) J E Ponce-

Hornos (아르헨티나) Manuel Priero (포르투갈) Zihe

Rao (중국) Cris G dos Remedios (호주) Gordon C K

Roberts (영국) A B Rubin (러시아) Tej P Singh (인도)

그리고 16th International Biophysics Congress가 미국의

Long Beach에서 2008년 2월 2일부터 6일까지 열린다 프로

그램 위원회의 IUPAB 대표는 J Garnier I Pecht와 DAD

Parry이며 Garnier는 IUPAB 여비 지원 선발 위원회 (travel

grant selection committee)의IUPAB 대표이기도 하다 미국

Biophysical Society 대표는 Ligia Toro이다

2011년에 열리는 17th International Biophysics Congress

의 장소로 베이징 (중국) 카이로 (이집트) 그라츠 (오스트

리아)의 세 도시가 후보로 올랐다 Zihe Rao 박사가 베이징

MI El-Gohari 박사가 카이로의 장점을 주장하였으며

Peter Laggner 박사는 삼년후의 재응모를 기약하며 그라츠

시의 응모를 철회했다 총회에서 압도적 지지로 베이징이

선정되었다

(2) 제5회 East Asian Biophysics Symposium

제5회 East Asian Biophysics Symposium (EABS2006)가

올해 11월12일부터 16일까지 일본의 오키나와에서 개최된

다 보다 자세한 학회 참가에 대한 안내는 전회원들에게 다

시 전달할 예정이다

(웹 페이지 wwwics-inccojpeabs2006)

(3) e-journal Biophysics

EABS committee에서 주관하는 e-journal인 Biophysics

가 2005년부터 운영되고 있다(웹 페이지 wwwbiophysjp

index-ehtml) 한국 측 편집위원은 강사욱 교수(서울대)이

다 한국측 회원들의 지지와 적극적인 참여를 기대한다

(4) 미국 Biophysical Society와 Link

현재 생물물리학회 웹 페이지 (httpwwwbiophysicsor

kr)에 미국 Biophysical Society에서 활동하는 재미 과학자

들을 위한 게시판을 만들고 있다 한국 생물물리학회 회원

들과 미국 Biophysical Society의 한국인 회원들과의 교류에

도움이 될 것으로 기대된다

Biophysical Society Newsletter Page 3

Introduction

Our laboratory is studying mechanisms of in vitro protein

folding and mechanisms of molecular chaperone function The

question of how a polypeptide chain can fold into a specific

native structure in vitro as well as in vivo is of fundamental

importance in biophysics biochemistry molecular biology and

biotechnology The specific native structure of proteins is

determined by their amino acid sequences In addition the

native conformation is assumed to be the conformation with

the minimum free energy However much remains to be

understood despite the efforts for more than thirty years The

long-term goals of our research are thus to elucidate the

physicochemical principles by which a protein organizes its

specific native structure from the fully unfolded state and to

elucidate how these principles are utilized or qualified by the

molecular chaperones in the biological cell

(1) Mechanisms of protein folding in vitro

Many small globular proteins with more than 100 amino

acid residues often accumulate partially folded intermediate

states with significant amount of the secondary structure

during the kinetics of the folding reaction These intermediates

are identical to the molten globule state which can accumulate

under moderately denaturing conditions and assumed to be

essential for the structure formation of the native state

Detailed characterization of the folding intermediates as well

as the transition state of the folding is very important to

elucidate the mechanisms of protein folding For this purpose

our laboratory investigates the thermodynamic stability and the

foldingunfolding kinetics of several well-characterized small

proteins which includes α-lactalbumin lysozyme

staphylococcal nuclease and green fluorescent protein as well

as the natural and engineered variants of these proteins In

particular the effects of site-directed mutations on the stability

and the foldingunfolding kinetics give us the detailed

information on the structure of the folding intermediates and

the transition state

A representative example is the characterization of the

transition state structure of a 123-residue Ca2+-binding protein

goat α-lactalbumin (α-LA) (1) This protein consists of two

domains an α-domain and a β-domain and forms the molten

globule state in early stages of the folding Based on the

extensive studies on bovine and human α-LA it has been

shown that the α-LA molten globule has a bipartite structure in

which the α-domain is weakly formed and the β-domain is

disordered To investigate whether the structure partially

formed in the molten globule folding intermediate of goat α-

LA is further organized in the transition state of folding we

constructed a number of variants of this protein and performed

Φ-value analysis on them

[국외 생물물리학연구실 소개]

Kunihirio Kuwajima Laboratory (The University of Tokyo)

Kunihiro Kuwajima

Page 4 Biophysical Society Newsletter

We studied the equilibrium unfolding transitions and kinetic

refolding and unfolding reactions of the variants using

equilibrium and stopped-flow kinetic circular dichroism

techniques The results have indicated that the folding nucleus

in transition state of goat α-LA is not extensively distributed

over the α-domain of the protein but very localized in a

region that contains the Ca2+-binding site and the interface

between the C-helix and the β-domain (Figure) It is concluded

that the specific docking of the α- and β-domains at a domain

interface is necessary for this protein to organize its native

structure form the molten globule intermediate

(2) Mechanisms of molecular chaperone function

Various molecular chaperones assist protein folding in the

cell Molecular chaperones are associated not only with the

structure formation and the assembly of proteins but also with

a wide range of events occurring in the cell such as

intracellular transport of proteins DNA replication and stress

response Our laboratory studies the mechanisms of chaperone

function using one of the best-characterized chaperone

chaperonin GroELGroES from Escherichia coli We focus on

the effects of the chaperonin on the folding kinetics of proteins

and on the allosteric transition of the chaperonin induced by

various nucleotides such as ATP by means of in vitro model

systems

Experimental techniques

In much of these studies we rely on various

spectroscopic techniques including absorbance (UV - IR)

circular dichroism intrinsic and extrinsic fluorescence small

angle X-ray scattering and nuclear magnetic resonance which

serve as probes to monitor the structural properties of proteins

These probes are often combined with mixing techniques such

as stopped-flow to monitor the kinetics of the folding and

unfolding reactions In addition to those experimental

techniques shown above we also use computational

techniques such as molecular dynamics simulations

Kuwajima laboratory members

Figure A schematic representation of goat α-LA (PDB code 1HMK) The side-chains of the residues where mutations have been introduced are shown by space filling

Biophysical Society Newsletter Page 5

1 M and Kuwajima K

2 and Kuwajima K J Mol Biol

3 M Saeki K Kamagata K Sawano

Y Tanokura M Kidera A and Kuwajima K J Mol Biol

354 164-172 (2005)

대한민국 국민의 수면형태를 연구할 때 평균수면시간

만을

씩 다른 행

동을

용하는 방법과 (2) 화학결합이 분해되는데 필요한 힘을 측

(1) 분자의 형광측정

(single molecule detection)의 기본

원칙

References

Saeki K Arai M Yoda T Nakao

J Mol Biol 341 589-604 (2004)

Kamagata K Arai M

339 951-965 (2004)

Oroguchi T Ikeguchi

[총설] 분자 한 개의 화학

고려대학교 화학과

김지환

이야기 하는 것은 불충분 하다 연령별로 수면시간이

다르고 도시거주자와 농촌저주자의 수면형태가 다르고 또

한 각 개인의 생활패턴이 다르기 때문이다 아마도 개인의

수면패턴은 개인의 생활방식에 의거해서 개별적으로 이해

하는 것이 가장 효과적인 이해방법일 것이다

화학반응에 있어서도 각각의 분자들은 조금

보일 것으로 생각된다 하지만 이때까지의 화학은

1023 개 정도의 분자 간의 화학반응의 평균치만을 측정하여

왔다 위에서 든 예와 마찬가지로 평균치 하나만 으로는 화

학반응의 미묘함을 완전히 설명하기 힘들다 이러한 평균화

를 피하기 위해서 분자 하나하나의 구조와 화학반응을 연구

하는 단 분자측정기술 (Single-Molecule Spectroscopy SMS)

이 최근 들어 개발되고 있으며 종래의 화학 및 생화학반응

에서 밝혀질 수 없었던 흥미 있는 현상들이 속속들이 관측

되고 있다 특히 화학적으로는 동일한 분자들이지만 실제

의 화학반응에 있어서는 분자 각각이 lsquo개성rsquo을 가지는 것이

증명되고 있다 단 분자 측정방법은 (1) 단 분자의 형광을 이

정하는 원자 힘 현미경 혹은 광학 집게 (optical tweezer) 방법

으로 분류될 수 있다

단 분자 분광측정기술

은 다음과 같다 (1) 용매의 자체형광이나 산란을 취소

화 하기위하여 레이져의 조사 (illumination) 부피를 줄이고

(2) 조사되는 영역에 통계적으로 한 개의 분자가 위치하도

록 하며 단분자에서 나오는 형광광자를 높은 양자효율로 측

정한다 최근의 반도체기술의 발달로 인하여 단일광자

를 양자효율 70 이상으로 측정이 가능하게 되었으며 이

기술의 발달은 형광태그가 된 단일 단백질분자의 측정이 가

능하게 되었다 특히 이 기술과 형광공명에너지전이를 접목

시킨 단일쌍 형광공명에너지전이 (single pair fluorescence

resonance energy transfer sp-FRET)를 이용하면 단일단백질

분자의 시간에 따른 콘포메이션 (conformation)의 변화를 관

찰할 수 있다

Page 6 Biophysical Society Newsletter

그림 1 (a) spFRET 의 에너지 diagram (b) spectral overlap (c) 거리에 따른 spFRET의 변화

그림 2 (A) 콜레스테롤산화효소(cholesterol oxidase) 분자들의 공간상 분포 이미지 밝은 점 한 개는 시료

상의 한 개의 효소분자의 위치를 나타낸다 (B) 한 개의 효소분자가 콜레스테롤분자들과 반응하는 것을 시간에 따라 기록한 그래프 x-축은 측정시간을 의미

하고 y-축은 효소의 화학적 상태를 나타낸다

일례로 하버드 대학 화학과 서니 지 (X Sunney Xie)교

수연구팀은 한 개의 콜레스테롤산화효소 (cholesterol

oxidase)분자가 콜레스테롤분자들을 산화시키는 반응을 직

접 관찰하였다 (그림 2) 이 실험으로 부터 개별적인 효소분

자들의 산화반응속도는 조금씩 다르다는 것을 시사했다

(참조문헌 1)

다른 분자 B (그림 2(b)의 Biotin) 를 시료 표면에 흡착 시켰

을 때 A-B 분자간 힘은 cantilever의 휘는정도(deflection)에

반영이 되며 이 deflection 은 레이져와 광다이오드로 구성된

광학지렛대 (optical lever)에 의하여 증폭되어 기록된다 그

림 1(c)는 가웁(Gaub) 연구단이 탐침표면에 있는 avidin과 시

료표면에 있는 biotin간의 인력을 거리에 따라 측정한 결과

를 보여준다[Science 264 415 (1994)] 이러한 단일분자의 힘을

측정하여 생체분자의 상호작용 및 생체분자간의 상호작용

을 상세히 연구할 수 있다

(2) 단일분자의 힘 (force) 측정

spFRET과 연계된 생체분자의 측정기술로써 단일분자

힘 탐침기술(molecular force probe) 이 최근 들어 각광을 받

고 있다 원자힘 현미경(atomic force microscopy)탐침 끝에

결합된 분자와 시료표면에 고정되어 있는 다른 분자간의 결

합력을 탐침에 작용되는 기계적인 힘을 측정함으로서 알아

내는 기술이다 그림 3a에서는 분자힘 측정장비의 개략도를

나타내었다 용수철 상수값 (k)를 알고 있는 AFM cantilever

probe의 끝을 분자 A (그림 3(b)에서는 Avidin) 로 코팅하고

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 3: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 3

Introduction

Our laboratory is studying mechanisms of in vitro protein

folding and mechanisms of molecular chaperone function The

question of how a polypeptide chain can fold into a specific

native structure in vitro as well as in vivo is of fundamental

importance in biophysics biochemistry molecular biology and

biotechnology The specific native structure of proteins is

determined by their amino acid sequences In addition the

native conformation is assumed to be the conformation with

the minimum free energy However much remains to be

understood despite the efforts for more than thirty years The

long-term goals of our research are thus to elucidate the

physicochemical principles by which a protein organizes its

specific native structure from the fully unfolded state and to

elucidate how these principles are utilized or qualified by the

molecular chaperones in the biological cell

(1) Mechanisms of protein folding in vitro

Many small globular proteins with more than 100 amino

acid residues often accumulate partially folded intermediate

states with significant amount of the secondary structure

during the kinetics of the folding reaction These intermediates

are identical to the molten globule state which can accumulate

under moderately denaturing conditions and assumed to be

essential for the structure formation of the native state

Detailed characterization of the folding intermediates as well

as the transition state of the folding is very important to

elucidate the mechanisms of protein folding For this purpose

our laboratory investigates the thermodynamic stability and the

foldingunfolding kinetics of several well-characterized small

proteins which includes α-lactalbumin lysozyme

staphylococcal nuclease and green fluorescent protein as well

as the natural and engineered variants of these proteins In

particular the effects of site-directed mutations on the stability

and the foldingunfolding kinetics give us the detailed

information on the structure of the folding intermediates and

the transition state

A representative example is the characterization of the

transition state structure of a 123-residue Ca2+-binding protein

goat α-lactalbumin (α-LA) (1) This protein consists of two

domains an α-domain and a β-domain and forms the molten

globule state in early stages of the folding Based on the

extensive studies on bovine and human α-LA it has been

shown that the α-LA molten globule has a bipartite structure in

which the α-domain is weakly formed and the β-domain is

disordered To investigate whether the structure partially

formed in the molten globule folding intermediate of goat α-

LA is further organized in the transition state of folding we

constructed a number of variants of this protein and performed

Φ-value analysis on them

[국외 생물물리학연구실 소개]

Kunihirio Kuwajima Laboratory (The University of Tokyo)

Kunihiro Kuwajima

Page 4 Biophysical Society Newsletter

We studied the equilibrium unfolding transitions and kinetic

refolding and unfolding reactions of the variants using

equilibrium and stopped-flow kinetic circular dichroism

techniques The results have indicated that the folding nucleus

in transition state of goat α-LA is not extensively distributed

over the α-domain of the protein but very localized in a

region that contains the Ca2+-binding site and the interface

between the C-helix and the β-domain (Figure) It is concluded

that the specific docking of the α- and β-domains at a domain

interface is necessary for this protein to organize its native

structure form the molten globule intermediate

(2) Mechanisms of molecular chaperone function

Various molecular chaperones assist protein folding in the

cell Molecular chaperones are associated not only with the

structure formation and the assembly of proteins but also with

a wide range of events occurring in the cell such as

intracellular transport of proteins DNA replication and stress

response Our laboratory studies the mechanisms of chaperone

function using one of the best-characterized chaperone

chaperonin GroELGroES from Escherichia coli We focus on

the effects of the chaperonin on the folding kinetics of proteins

and on the allosteric transition of the chaperonin induced by

various nucleotides such as ATP by means of in vitro model

systems

Experimental techniques

In much of these studies we rely on various

spectroscopic techniques including absorbance (UV - IR)

circular dichroism intrinsic and extrinsic fluorescence small

angle X-ray scattering and nuclear magnetic resonance which

serve as probes to monitor the structural properties of proteins

These probes are often combined with mixing techniques such

as stopped-flow to monitor the kinetics of the folding and

unfolding reactions In addition to those experimental

techniques shown above we also use computational

techniques such as molecular dynamics simulations

Kuwajima laboratory members

Figure A schematic representation of goat α-LA (PDB code 1HMK) The side-chains of the residues where mutations have been introduced are shown by space filling

Biophysical Society Newsletter Page 5

1 M and Kuwajima K

2 and Kuwajima K J Mol Biol

3 M Saeki K Kamagata K Sawano

Y Tanokura M Kidera A and Kuwajima K J Mol Biol

354 164-172 (2005)

대한민국 국민의 수면형태를 연구할 때 평균수면시간

만을

씩 다른 행

동을

용하는 방법과 (2) 화학결합이 분해되는데 필요한 힘을 측

(1) 분자의 형광측정

(single molecule detection)의 기본

원칙

References

Saeki K Arai M Yoda T Nakao

J Mol Biol 341 589-604 (2004)

Kamagata K Arai M

339 951-965 (2004)

Oroguchi T Ikeguchi

[총설] 분자 한 개의 화학

고려대학교 화학과

김지환

이야기 하는 것은 불충분 하다 연령별로 수면시간이

다르고 도시거주자와 농촌저주자의 수면형태가 다르고 또

한 각 개인의 생활패턴이 다르기 때문이다 아마도 개인의

수면패턴은 개인의 생활방식에 의거해서 개별적으로 이해

하는 것이 가장 효과적인 이해방법일 것이다

화학반응에 있어서도 각각의 분자들은 조금

보일 것으로 생각된다 하지만 이때까지의 화학은

1023 개 정도의 분자 간의 화학반응의 평균치만을 측정하여

왔다 위에서 든 예와 마찬가지로 평균치 하나만 으로는 화

학반응의 미묘함을 완전히 설명하기 힘들다 이러한 평균화

를 피하기 위해서 분자 하나하나의 구조와 화학반응을 연구

하는 단 분자측정기술 (Single-Molecule Spectroscopy SMS)

이 최근 들어 개발되고 있으며 종래의 화학 및 생화학반응

에서 밝혀질 수 없었던 흥미 있는 현상들이 속속들이 관측

되고 있다 특히 화학적으로는 동일한 분자들이지만 실제

의 화학반응에 있어서는 분자 각각이 lsquo개성rsquo을 가지는 것이

증명되고 있다 단 분자 측정방법은 (1) 단 분자의 형광을 이

정하는 원자 힘 현미경 혹은 광학 집게 (optical tweezer) 방법

으로 분류될 수 있다

단 분자 분광측정기술

은 다음과 같다 (1) 용매의 자체형광이나 산란을 취소

화 하기위하여 레이져의 조사 (illumination) 부피를 줄이고

(2) 조사되는 영역에 통계적으로 한 개의 분자가 위치하도

록 하며 단분자에서 나오는 형광광자를 높은 양자효율로 측

정한다 최근의 반도체기술의 발달로 인하여 단일광자

를 양자효율 70 이상으로 측정이 가능하게 되었으며 이

기술의 발달은 형광태그가 된 단일 단백질분자의 측정이 가

능하게 되었다 특히 이 기술과 형광공명에너지전이를 접목

시킨 단일쌍 형광공명에너지전이 (single pair fluorescence

resonance energy transfer sp-FRET)를 이용하면 단일단백질

분자의 시간에 따른 콘포메이션 (conformation)의 변화를 관

찰할 수 있다

Page 6 Biophysical Society Newsletter

그림 1 (a) spFRET 의 에너지 diagram (b) spectral overlap (c) 거리에 따른 spFRET의 변화

그림 2 (A) 콜레스테롤산화효소(cholesterol oxidase) 분자들의 공간상 분포 이미지 밝은 점 한 개는 시료

상의 한 개의 효소분자의 위치를 나타낸다 (B) 한 개의 효소분자가 콜레스테롤분자들과 반응하는 것을 시간에 따라 기록한 그래프 x-축은 측정시간을 의미

하고 y-축은 효소의 화학적 상태를 나타낸다

일례로 하버드 대학 화학과 서니 지 (X Sunney Xie)교

수연구팀은 한 개의 콜레스테롤산화효소 (cholesterol

oxidase)분자가 콜레스테롤분자들을 산화시키는 반응을 직

접 관찰하였다 (그림 2) 이 실험으로 부터 개별적인 효소분

자들의 산화반응속도는 조금씩 다르다는 것을 시사했다

(참조문헌 1)

다른 분자 B (그림 2(b)의 Biotin) 를 시료 표면에 흡착 시켰

을 때 A-B 분자간 힘은 cantilever의 휘는정도(deflection)에

반영이 되며 이 deflection 은 레이져와 광다이오드로 구성된

광학지렛대 (optical lever)에 의하여 증폭되어 기록된다 그

림 1(c)는 가웁(Gaub) 연구단이 탐침표면에 있는 avidin과 시

료표면에 있는 biotin간의 인력을 거리에 따라 측정한 결과

를 보여준다[Science 264 415 (1994)] 이러한 단일분자의 힘을

측정하여 생체분자의 상호작용 및 생체분자간의 상호작용

을 상세히 연구할 수 있다

(2) 단일분자의 힘 (force) 측정

spFRET과 연계된 생체분자의 측정기술로써 단일분자

힘 탐침기술(molecular force probe) 이 최근 들어 각광을 받

고 있다 원자힘 현미경(atomic force microscopy)탐침 끝에

결합된 분자와 시료표면에 고정되어 있는 다른 분자간의 결

합력을 탐침에 작용되는 기계적인 힘을 측정함으로서 알아

내는 기술이다 그림 3a에서는 분자힘 측정장비의 개략도를

나타내었다 용수철 상수값 (k)를 알고 있는 AFM cantilever

probe의 끝을 분자 A (그림 3(b)에서는 Avidin) 로 코팅하고

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 4: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 4 Biophysical Society Newsletter

We studied the equilibrium unfolding transitions and kinetic

refolding and unfolding reactions of the variants using

equilibrium and stopped-flow kinetic circular dichroism

techniques The results have indicated that the folding nucleus

in transition state of goat α-LA is not extensively distributed

over the α-domain of the protein but very localized in a

region that contains the Ca2+-binding site and the interface

between the C-helix and the β-domain (Figure) It is concluded

that the specific docking of the α- and β-domains at a domain

interface is necessary for this protein to organize its native

structure form the molten globule intermediate

(2) Mechanisms of molecular chaperone function

Various molecular chaperones assist protein folding in the

cell Molecular chaperones are associated not only with the

structure formation and the assembly of proteins but also with

a wide range of events occurring in the cell such as

intracellular transport of proteins DNA replication and stress

response Our laboratory studies the mechanisms of chaperone

function using one of the best-characterized chaperone

chaperonin GroELGroES from Escherichia coli We focus on

the effects of the chaperonin on the folding kinetics of proteins

and on the allosteric transition of the chaperonin induced by

various nucleotides such as ATP by means of in vitro model

systems

Experimental techniques

In much of these studies we rely on various

spectroscopic techniques including absorbance (UV - IR)

circular dichroism intrinsic and extrinsic fluorescence small

angle X-ray scattering and nuclear magnetic resonance which

serve as probes to monitor the structural properties of proteins

These probes are often combined with mixing techniques such

as stopped-flow to monitor the kinetics of the folding and

unfolding reactions In addition to those experimental

techniques shown above we also use computational

techniques such as molecular dynamics simulations

Kuwajima laboratory members

Figure A schematic representation of goat α-LA (PDB code 1HMK) The side-chains of the residues where mutations have been introduced are shown by space filling

Biophysical Society Newsletter Page 5

1 M and Kuwajima K

2 and Kuwajima K J Mol Biol

3 M Saeki K Kamagata K Sawano

Y Tanokura M Kidera A and Kuwajima K J Mol Biol

354 164-172 (2005)

대한민국 국민의 수면형태를 연구할 때 평균수면시간

만을

씩 다른 행

동을

용하는 방법과 (2) 화학결합이 분해되는데 필요한 힘을 측

(1) 분자의 형광측정

(single molecule detection)의 기본

원칙

References

Saeki K Arai M Yoda T Nakao

J Mol Biol 341 589-604 (2004)

Kamagata K Arai M

339 951-965 (2004)

Oroguchi T Ikeguchi

[총설] 분자 한 개의 화학

고려대학교 화학과

김지환

이야기 하는 것은 불충분 하다 연령별로 수면시간이

다르고 도시거주자와 농촌저주자의 수면형태가 다르고 또

한 각 개인의 생활패턴이 다르기 때문이다 아마도 개인의

수면패턴은 개인의 생활방식에 의거해서 개별적으로 이해

하는 것이 가장 효과적인 이해방법일 것이다

화학반응에 있어서도 각각의 분자들은 조금

보일 것으로 생각된다 하지만 이때까지의 화학은

1023 개 정도의 분자 간의 화학반응의 평균치만을 측정하여

왔다 위에서 든 예와 마찬가지로 평균치 하나만 으로는 화

학반응의 미묘함을 완전히 설명하기 힘들다 이러한 평균화

를 피하기 위해서 분자 하나하나의 구조와 화학반응을 연구

하는 단 분자측정기술 (Single-Molecule Spectroscopy SMS)

이 최근 들어 개발되고 있으며 종래의 화학 및 생화학반응

에서 밝혀질 수 없었던 흥미 있는 현상들이 속속들이 관측

되고 있다 특히 화학적으로는 동일한 분자들이지만 실제

의 화학반응에 있어서는 분자 각각이 lsquo개성rsquo을 가지는 것이

증명되고 있다 단 분자 측정방법은 (1) 단 분자의 형광을 이

정하는 원자 힘 현미경 혹은 광학 집게 (optical tweezer) 방법

으로 분류될 수 있다

단 분자 분광측정기술

은 다음과 같다 (1) 용매의 자체형광이나 산란을 취소

화 하기위하여 레이져의 조사 (illumination) 부피를 줄이고

(2) 조사되는 영역에 통계적으로 한 개의 분자가 위치하도

록 하며 단분자에서 나오는 형광광자를 높은 양자효율로 측

정한다 최근의 반도체기술의 발달로 인하여 단일광자

를 양자효율 70 이상으로 측정이 가능하게 되었으며 이

기술의 발달은 형광태그가 된 단일 단백질분자의 측정이 가

능하게 되었다 특히 이 기술과 형광공명에너지전이를 접목

시킨 단일쌍 형광공명에너지전이 (single pair fluorescence

resonance energy transfer sp-FRET)를 이용하면 단일단백질

분자의 시간에 따른 콘포메이션 (conformation)의 변화를 관

찰할 수 있다

Page 6 Biophysical Society Newsletter

그림 1 (a) spFRET 의 에너지 diagram (b) spectral overlap (c) 거리에 따른 spFRET의 변화

그림 2 (A) 콜레스테롤산화효소(cholesterol oxidase) 분자들의 공간상 분포 이미지 밝은 점 한 개는 시료

상의 한 개의 효소분자의 위치를 나타낸다 (B) 한 개의 효소분자가 콜레스테롤분자들과 반응하는 것을 시간에 따라 기록한 그래프 x-축은 측정시간을 의미

하고 y-축은 효소의 화학적 상태를 나타낸다

일례로 하버드 대학 화학과 서니 지 (X Sunney Xie)교

수연구팀은 한 개의 콜레스테롤산화효소 (cholesterol

oxidase)분자가 콜레스테롤분자들을 산화시키는 반응을 직

접 관찰하였다 (그림 2) 이 실험으로 부터 개별적인 효소분

자들의 산화반응속도는 조금씩 다르다는 것을 시사했다

(참조문헌 1)

다른 분자 B (그림 2(b)의 Biotin) 를 시료 표면에 흡착 시켰

을 때 A-B 분자간 힘은 cantilever의 휘는정도(deflection)에

반영이 되며 이 deflection 은 레이져와 광다이오드로 구성된

광학지렛대 (optical lever)에 의하여 증폭되어 기록된다 그

림 1(c)는 가웁(Gaub) 연구단이 탐침표면에 있는 avidin과 시

료표면에 있는 biotin간의 인력을 거리에 따라 측정한 결과

를 보여준다[Science 264 415 (1994)] 이러한 단일분자의 힘을

측정하여 생체분자의 상호작용 및 생체분자간의 상호작용

을 상세히 연구할 수 있다

(2) 단일분자의 힘 (force) 측정

spFRET과 연계된 생체분자의 측정기술로써 단일분자

힘 탐침기술(molecular force probe) 이 최근 들어 각광을 받

고 있다 원자힘 현미경(atomic force microscopy)탐침 끝에

결합된 분자와 시료표면에 고정되어 있는 다른 분자간의 결

합력을 탐침에 작용되는 기계적인 힘을 측정함으로서 알아

내는 기술이다 그림 3a에서는 분자힘 측정장비의 개략도를

나타내었다 용수철 상수값 (k)를 알고 있는 AFM cantilever

probe의 끝을 분자 A (그림 3(b)에서는 Avidin) 로 코팅하고

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 5: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 5

1 M and Kuwajima K

2 and Kuwajima K J Mol Biol

3 M Saeki K Kamagata K Sawano

Y Tanokura M Kidera A and Kuwajima K J Mol Biol

354 164-172 (2005)

대한민국 국민의 수면형태를 연구할 때 평균수면시간

만을

씩 다른 행

동을

용하는 방법과 (2) 화학결합이 분해되는데 필요한 힘을 측

(1) 분자의 형광측정

(single molecule detection)의 기본

원칙

References

Saeki K Arai M Yoda T Nakao

J Mol Biol 341 589-604 (2004)

Kamagata K Arai M

339 951-965 (2004)

Oroguchi T Ikeguchi

[총설] 분자 한 개의 화학

고려대학교 화학과

김지환

이야기 하는 것은 불충분 하다 연령별로 수면시간이

다르고 도시거주자와 농촌저주자의 수면형태가 다르고 또

한 각 개인의 생활패턴이 다르기 때문이다 아마도 개인의

수면패턴은 개인의 생활방식에 의거해서 개별적으로 이해

하는 것이 가장 효과적인 이해방법일 것이다

화학반응에 있어서도 각각의 분자들은 조금

보일 것으로 생각된다 하지만 이때까지의 화학은

1023 개 정도의 분자 간의 화학반응의 평균치만을 측정하여

왔다 위에서 든 예와 마찬가지로 평균치 하나만 으로는 화

학반응의 미묘함을 완전히 설명하기 힘들다 이러한 평균화

를 피하기 위해서 분자 하나하나의 구조와 화학반응을 연구

하는 단 분자측정기술 (Single-Molecule Spectroscopy SMS)

이 최근 들어 개발되고 있으며 종래의 화학 및 생화학반응

에서 밝혀질 수 없었던 흥미 있는 현상들이 속속들이 관측

되고 있다 특히 화학적으로는 동일한 분자들이지만 실제

의 화학반응에 있어서는 분자 각각이 lsquo개성rsquo을 가지는 것이

증명되고 있다 단 분자 측정방법은 (1) 단 분자의 형광을 이

정하는 원자 힘 현미경 혹은 광학 집게 (optical tweezer) 방법

으로 분류될 수 있다

단 분자 분광측정기술

은 다음과 같다 (1) 용매의 자체형광이나 산란을 취소

화 하기위하여 레이져의 조사 (illumination) 부피를 줄이고

(2) 조사되는 영역에 통계적으로 한 개의 분자가 위치하도

록 하며 단분자에서 나오는 형광광자를 높은 양자효율로 측

정한다 최근의 반도체기술의 발달로 인하여 단일광자

를 양자효율 70 이상으로 측정이 가능하게 되었으며 이

기술의 발달은 형광태그가 된 단일 단백질분자의 측정이 가

능하게 되었다 특히 이 기술과 형광공명에너지전이를 접목

시킨 단일쌍 형광공명에너지전이 (single pair fluorescence

resonance energy transfer sp-FRET)를 이용하면 단일단백질

분자의 시간에 따른 콘포메이션 (conformation)의 변화를 관

찰할 수 있다

Page 6 Biophysical Society Newsletter

그림 1 (a) spFRET 의 에너지 diagram (b) spectral overlap (c) 거리에 따른 spFRET의 변화

그림 2 (A) 콜레스테롤산화효소(cholesterol oxidase) 분자들의 공간상 분포 이미지 밝은 점 한 개는 시료

상의 한 개의 효소분자의 위치를 나타낸다 (B) 한 개의 효소분자가 콜레스테롤분자들과 반응하는 것을 시간에 따라 기록한 그래프 x-축은 측정시간을 의미

하고 y-축은 효소의 화학적 상태를 나타낸다

일례로 하버드 대학 화학과 서니 지 (X Sunney Xie)교

수연구팀은 한 개의 콜레스테롤산화효소 (cholesterol

oxidase)분자가 콜레스테롤분자들을 산화시키는 반응을 직

접 관찰하였다 (그림 2) 이 실험으로 부터 개별적인 효소분

자들의 산화반응속도는 조금씩 다르다는 것을 시사했다

(참조문헌 1)

다른 분자 B (그림 2(b)의 Biotin) 를 시료 표면에 흡착 시켰

을 때 A-B 분자간 힘은 cantilever의 휘는정도(deflection)에

반영이 되며 이 deflection 은 레이져와 광다이오드로 구성된

광학지렛대 (optical lever)에 의하여 증폭되어 기록된다 그

림 1(c)는 가웁(Gaub) 연구단이 탐침표면에 있는 avidin과 시

료표면에 있는 biotin간의 인력을 거리에 따라 측정한 결과

를 보여준다[Science 264 415 (1994)] 이러한 단일분자의 힘을

측정하여 생체분자의 상호작용 및 생체분자간의 상호작용

을 상세히 연구할 수 있다

(2) 단일분자의 힘 (force) 측정

spFRET과 연계된 생체분자의 측정기술로써 단일분자

힘 탐침기술(molecular force probe) 이 최근 들어 각광을 받

고 있다 원자힘 현미경(atomic force microscopy)탐침 끝에

결합된 분자와 시료표면에 고정되어 있는 다른 분자간의 결

합력을 탐침에 작용되는 기계적인 힘을 측정함으로서 알아

내는 기술이다 그림 3a에서는 분자힘 측정장비의 개략도를

나타내었다 용수철 상수값 (k)를 알고 있는 AFM cantilever

probe의 끝을 분자 A (그림 3(b)에서는 Avidin) 로 코팅하고

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 6: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 6 Biophysical Society Newsletter

그림 1 (a) spFRET 의 에너지 diagram (b) spectral overlap (c) 거리에 따른 spFRET의 변화

그림 2 (A) 콜레스테롤산화효소(cholesterol oxidase) 분자들의 공간상 분포 이미지 밝은 점 한 개는 시료

상의 한 개의 효소분자의 위치를 나타낸다 (B) 한 개의 효소분자가 콜레스테롤분자들과 반응하는 것을 시간에 따라 기록한 그래프 x-축은 측정시간을 의미

하고 y-축은 효소의 화학적 상태를 나타낸다

일례로 하버드 대학 화학과 서니 지 (X Sunney Xie)교

수연구팀은 한 개의 콜레스테롤산화효소 (cholesterol

oxidase)분자가 콜레스테롤분자들을 산화시키는 반응을 직

접 관찰하였다 (그림 2) 이 실험으로 부터 개별적인 효소분

자들의 산화반응속도는 조금씩 다르다는 것을 시사했다

(참조문헌 1)

다른 분자 B (그림 2(b)의 Biotin) 를 시료 표면에 흡착 시켰

을 때 A-B 분자간 힘은 cantilever의 휘는정도(deflection)에

반영이 되며 이 deflection 은 레이져와 광다이오드로 구성된

광학지렛대 (optical lever)에 의하여 증폭되어 기록된다 그

림 1(c)는 가웁(Gaub) 연구단이 탐침표면에 있는 avidin과 시

료표면에 있는 biotin간의 인력을 거리에 따라 측정한 결과

를 보여준다[Science 264 415 (1994)] 이러한 단일분자의 힘을

측정하여 생체분자의 상호작용 및 생체분자간의 상호작용

을 상세히 연구할 수 있다

(2) 단일분자의 힘 (force) 측정

spFRET과 연계된 생체분자의 측정기술로써 단일분자

힘 탐침기술(molecular force probe) 이 최근 들어 각광을 받

고 있다 원자힘 현미경(atomic force microscopy)탐침 끝에

결합된 분자와 시료표면에 고정되어 있는 다른 분자간의 결

합력을 탐침에 작용되는 기계적인 힘을 측정함으로서 알아

내는 기술이다 그림 3a에서는 분자힘 측정장비의 개략도를

나타내었다 용수철 상수값 (k)를 알고 있는 AFM cantilever

probe의 끝을 분자 A (그림 3(b)에서는 Avidin) 로 코팅하고

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 7: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 7

그림 3 (a) MFP 장치의 개념도 (b) 탐침과 시료표면과의 인력 (c) biotin 과 avidin 분자들간의 인력을 힘

측정 장치로 측정한 결과의 예

스탠포드 대학의 스티븐 블락 (Steven M Block) 교수 연

구팀은 광학집게 (optical tweezer)방법을 이용하여 최근에

키네신(kinesin)분자하나가 마이크로튜블(microtubule)위를

어떠한 형태로 걸어 다니는가에 대한 연구결과를 발표하였

다 키네신 분자는 사람과 흡사하게 두 개의 lsquo다리rsquo로 보행

할 것으로 생각 되어 왔지만 이때까지는 실험적으로 입증

할 수 없었다 블락교수연는 키네신분자 하나의 움직임을

측정함으로 써 처음으로 키네신분자의 걸음걸이가 8 나노

미터인 것을 보였으며 또한 대부분의 키네신분자의 걸음걸

이는 lsquo절름발이형태rsquo에 가깝다는 놀라운 결과를 보여주었

다 (그림 4)

그림 4 (좌) 키네신 분자의 다리구조모델 (우) 키네신 분자 하나의 걸음걸이 x-축은 시간을 나타내고 y-축은 키네신분자의 위치를 나타낸다 시간에 따라 분자의 위치가 계단 형태로 변화하는 것은 키네신 분자의 한 걸음마에 해당한다

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 8: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 8 Biophysical Society Newsletter

참고문헌 단 분자의 화학적 생물학적 연구는 전통적인 화학연

구에서 얻어진 결과에 더욱더 미시적이고 구체적인 모델

을 제시한다 단분자 측정기술은 아직 태동기에 있으며 급

속도로 발전하고 있다 이 기술은 나노물질 및 복잡한 단

백질분자의 미시적 분석 및 나노물질과 생체분자와의 반

응을 자세히 연구할 수 있는 도구를 제공할 것이다

1 Lu H P Xun L and Xie X S Science 282 1877-1882

(1998)

2 Asbury C L Fehr A N and Block S M Science 302

2130-2134 (2003)

[총설] 시스템 생물학(Systems Biology)과

오믹스 기술(-omics technology)

서강대학교 공과대학 화공생명공학과 정의섭 이진원

20세기 중반부터 생물학자들과 공학자들은 분자생물

학 연구방법을 통하여 모든 생명체에서 중요한 역할을 하는

특정인자가 유전자와 단백질 그리고 대사산물이고 이들의

구조와 기능을 분석하고 규명하는 데에 힘써 왔다 이를 통

해 얻은 각각의 생물정보를 이용하여 과학자들은 생명체 전

체에 대한 생체조절 기작을 설명하려고 하였으나 생명체에

있어서 그 구성성분들이 각각 따로 존재하며 작용하는 것이

아니라 서로 간에 유기적인 상호작용을 하고 있어 한 구성

성분의 기능이 바뀌거나 양적인 변화가 있을 때 이는 그 생

명체를 이루고 있는 다른 많은 구성성분에 영향을 미치고

세포내의 전체적인 효과로 나타난다 그래서 생명체의 단위

구성성분의 변화가 아니라 생명체를 구성하고 있는 전체 시

스템의 총체적인 연구를 통해 생명현상을 정확하게 이해하

고자 시스템생물학(systems biology)라는 학문 분야가 생기

게 되었다(1-3)

생명체를 구성하는 세포 내에서 유전자와 단백질 사이

의 상호조절 작용은 매우 복잡하게 얽혀있기 때문에 이들

사이의 상호 기작과 조절 관계를 정확하게 규명하는 것은

매우 어렵다고 할 수 있다 예를 들면 무수히 많은 부품들이

복잡하게 연결되어있는 자동차를 들여다보면 이들 부품들

이 여러 형태로 묶여져 있는 다양한 모듈(module)로 구성되

어 있음을 알 수 있다 따라서 자동차가 달리는데 사용되는

각 부품 하나마다의 기능을 연구하는 것이 아니라 여러 부

품들이 묶여져 있는 모듈의 기능을 연구하는 것이 더 적절

할 것이다 즉 세포 내에서 생체조절에 관여하는 유전자와

단백질을 자동차의 부품처럼 그 기능을 연구하기 보다는 유

전자나 단백질로 묶여있는 모듈 네트워크(module network)

를 찾아내고 이들의 역할과 조절 기능을 밝히는 것이 생명

체의 전체 상호작용을 이해하는 데 더 많은 도움이 될 것이

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 9: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 9

시스템생물학 연구의 대표적인 예로서 세포 내에 특정

변화를 주어 그에 따른 세포 내 구성성분들의 변화를 연구

하여 이를 수학적 모델로 만드는 접근방법인 시스템시뮬레

이션(systems simulation)을 들 수 있는데 이를 통하여 외부자

극에 의한 세포 내 변화를 실험하지 않아도 컴퓨터상에서

전체적으로 연구할 수 있다

그러나 시스템생물학 연구의 궁극적인 목표는 한 자극

에 의한 세포의 변화 뿐만 아니라 세포기능 전체 및 생명체

전체의 종합적인 이해라고 할 수 있다 시스템생물학은 최

근까지 본격적인 연구가 시작되지 못하였는데 그 이유는 세

포 내의 모든 구성성분을 전체적으로 분석할 수 있는 기술

의 부재 때문이었는데 최근 인간 유전체의 전체염 기서열

해독을 시작으로 해서 여러 정밀 분석기술의 발전으로 보다

많은 생물 정보가 축적되어 세포 내의 시스템을 체계적으로

분석하는 연구가 가능하게 되었다(4)

이와 같이 시스템생물학의 발전을 가져다준 분야로서

유전체학(genomics) 전사체학(transcriptiomics) 단백체학

(proteomics) 그리고 대사체학(metabolomics)을 들 수 있는

데 (그림 1 참조) 최근 이들 분야의 급진적인 발전으로 인해

방대한 양의 관련 정보가 축적되면서 오믹스(-omics) 형태

의 어미가 붙는 새로운 학문 분야가 태동하게 되었다 이러

한 생물 관련 정보(bioinformation)를 이용해 시스템생물학

연구에 적용함으로서 단순한 기술적 지식의 활용보다는 세

포 내의 다양한 특정변화를 통해 구성성분들의 상호관계 및

동역학 특성 등을 밝혀내고 이를 바탕으로 인위적 조작을

통해 원하는 결과를 획득하고 세포 내의 변화를 예측할 수

있는 모델을 세우는 것이 가능하게 되었다(5)

이에 여기에서는 시스템생물학 분야에 빠른 발전을 가

져다준 4가지의 오믹스 기술(-omics technology)에 대하여

간략하게 설명하고 시스템생물학의 향후 발전방향에 대해

논의하고자 한다

그림 1 시스템생물학과 여러 오믹스 기술(-omics technology)의 상관 관계

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 10: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 10 Biophysical Society Newsletter

유전체학(genomics) 이러한 유전체에 대한 정보는 생명체를 시스템적으로

모델링하고 해석하는 가장 근본적인 정보를 제공하는 시

작점이 될 뿐 아니라 생명체의 거동을 조절하고 예측할

수 있는 조작 시점이 되기도 한다

유전체학이란 생물의 유전정보를 내포하고 있는 최소

단위인 DNA RNA를 다루는 학문으로 이 최소 단위를 통해

유전 정보를 수집하고 분석하며 해석하는 모든 연구 분야를

모두 포함한다 유전체학은 염기서열 판독(sequencing)에서

부터 출발한다고 할 수 있다 이 분야를 서열 유전체학

(sequencing genomics)이라 하며 주로 알려진 서열을 통해

염색체 지도와 유전자 지도의 비교 작성 DNA구조 결정 등

을 연구한다(67)

전사체학(transcriptomics)

전사체학은 세포 내 유전자나 단백질 자체를 연구하는

대신에 유전자의 정보가 단백질로 전달되는 중간 과정인

전사(transcription)단계에서 mRNA(messenger RNA)의 발현

(transcription) 정도를 연구하는 학문이며 이 분야에서 가장

많이 이용하는 기법이라면 DNA chip을 이용하여 유전자 발

현 패턴을 연구하는 방법이다 다시 말해 유전자를 담고 있

는 DNA는 단백질로 정보가 전달되는 엑손(exon)뿐만 아니

라 기능이 명확하지 않은 인트론(intron) 부분도 포함하고

있는데 이들은 함께 RNA로 전달되었다가 성숙과정을 거

치면서 인트론(intron) 부분이 빠지고 엑손(exon) 부분끼리

만 이어져(splicing) mRNA(messenger RNA) 을 만들게 된다

따라서 mRNA 서열을 밝히면 실제 만들어지는 단백질의 서

열을 알 수 있을 뿐만 아니라 mRNA의 발현 정도를 추적하

여 단백질 생성 속도를 추정할 수도 있다 이에 전사체학

(transcriptomics)에서 사용하는 DNA chip은 바로 이 mRNA

에 상보적으로 결합하는 cDNA(complementary DNA)를 chip

위에 붙여서 사용하는 것으로 궁극적으로는 세포 내의

mRNA 양 변화를 추적하는 도구이다 이러한 전사체학

(transcriptomics)에서 중요하게 사용되는 DNA chip의 원리

와 응용은 다음과 같다(10-12)

그러나 DNA나 RNA의 염기서열 정보만을 가지고 유전

자의 구체적인 정보를 예측하는 것은 불가능하기 때문에 염

기서열 결정 후 크게 세 가지로 연구 방향이 나누어지게 된

다 첫 번째는 구조 유전체학(structural genomics)으로 유전

자 정보로부터 그 구조를 예측하고 서열과의 상호관계를 통

해 유전자의 3차원 구조를 완성하여 이들을 NMR(nuclear

magnetic resonance)이나 X-ray로 규명하는 연구이다

두 번째는 기능 유전체학(functional genomics)으로 새

로운 유전자의 발굴과 기능을 연구하는 것으로 현재까지 인

간의 전체 유전자 서열은 밝혀졌으나 기능이 알려진 유전

자는 전체의 10 정도에 불과하다 유전자 기능을 연구하

는 방법에는 이미 기능이 규명된 유전자와 새로운 유전자간

의 서열 유사성으로부터 각 유전자의 기능을 유추하는 것인

데 이는 각종 데이터베이스를 이용한 작업을 통해 활발하

게 진행 중에 있다(8)

마지막은 비교 유전체학(comparitive genomics)으로 표

준 염기서열을 바탕으로 개체 간 유전적 특성을 밝히는 것

이다 이런 연구 방법을 통해 얻은 결과를 이용해 단순한 서

열정보에서 유전자의 구조와 기능을 밝히고 개체간의 유전

적 특성을 예측해 세포 내 수용체(receptor)의 공간적 관계를

예측하기도 한다 또한 이러한 방법을 통해 유전자 질환의

진단과 신약 개발 연구에 직접 응용할 수 있다(9)

1) DNA 칩의 원리

DNA chip은 기존의 분자 생물학적 지식과 기계 및 전

자공학의 기술을 접목하여 만들어진 것으로 기계 자동화와

전자 제어 기술 등을 이용하여 수백 개 내지 수십만 개의

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 11: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 11

DNA를 아주 작은 공간에 집어넣을 수 있게 만든 것이다 즉

DNA chip이란 유전자 검색용으로서 엄청나게 많은 종류의

DNA를 고밀도로 붙여 놓은 것을 말한다 DNA chip은 붙이

는 유전물질의 크기에 따라 cDNA chip과 oligonucleotide

chip으로 나눌 수 있으며 사용목적에 따라 단백질을 붙여서

protein chip으로 응용할 수 있다 cDNA chip에는 최소한 500

bp 이상의 유전자가 붙여져 있고 올리고뉴클레오티드 칩

(oligonucleotide chip)에는 약 15 25sim 개의 염기들로 이루어

진 올리고뉴클레오티드(oligonucleotide)가 붙여져 있다

cDNA microarray chip은 두 가지 다른 환경에서 발현되

는 독특한 유전자들을 분석하는데 큰 도움이 되는데 수천

개 이상의 유전자 발현변이를 단 한 번의 실험으로 검색할

수 있기 때문이다 실험과정을 살펴보면 먼저 두 개의 다른

환경에서 얻은 세포들로부터 mRNA를 추출하여 mRNA를

역전사(reverse transcription) 시킬 때 두 가지의 형광 물질을

띤 염기(dUTP)를 집어넣어 빨간색(Cy5)이나 녹색(Cy3)을

띤 cDNA를 합성하고 합성된 두 개의 cDNA를 똑 같은 양으

로 섞어서 하나의 cDNA microarray chip에 결합시키게 된다

결합 반응 후 DNA chip은 laser fluorescence scanner에 의하

여 읽혀지게 됨으로 각각 유전자의 형광 정도에 따라 선택

된 유전자의 발현정도를 computer에 의하여 분석하게 된다

(그림 2) 분석된 결과는 세포의 특성을 규명할 수 있는 자료

가 되며 한 마디로 요약해서 생명체의 유전자발현 청사진

을 얻는 것이다 이 청사진을 이용하면 이때까지 볼 수 없었

던 유전자들 간의 복잡한 연결 고리들을 한결 쉽게 풀 수 있

을 것이다

올리고뉴클레오티드 칩(oligonucleotide chip)은 하나의

염기서열만 틀려도 결합을 하지 않는 성질을 이용하여 한

염기에 생긴 돌연 변이(point mutation)까지도 찾아낸다 많

은 암이나 유전병들이 특정 유전자에 생긴 작은 돌연변이에

의해서 유발되기 때문에 이것을 이용하여 지금까지 밝혀진

암 관련 유전자를 가진 DNA chip을 만든다면 한 번의 실험

으로 아주 쉽게 돌연변이를 찾을 수 있다

그림 2 DNA chip의 원리와 상용화된 DNA chip의 예

2) DNA chip의 응용

DNA chip은 신약 개발이나 유전자 치료제 개발과 같은

과학 기술적인 측면에 매우 중요하다 다시 말해서 우리나

라뿐만 아니라 다른 나라에서 많이 발병하며 또한 항생제

의 남용으로 내성을 가진 종이 많아지게 된 결핵균의 경우

이러한 내성 균주를 빠른 시간 안에 환자로부터 찾아내고

어떠한 항생제에 내성을 가졌는가를 밝히는 일은 매우 중요

하다 이러한 일은 수없이 많이 존재하는 여러 병원균들의

발견과 치료에도 적용되는 매우 중요한 과정이나 현존의 병

원성 세균동정검사는 많은 시간과 경비가 소요된다 따라서

빠르고 정확한 새로운 검색방법의 개발은 임상 의사가 적절

한 판단과 치료를 하는데 결정적인 기여를 할 수 있을 것이

다 이에 병원성 미생물 검색용 DNA chip의 시장성은 아주

높다고 할 수 있다 또한 이러한 DNA chip은 병원뿐만 아니

라 동middot식물 및 식품 검역소 환경오염 등에도 쓰여 질 수 있

다 이와 같이 가까운 미래에 DNA chip은 우리의 생활 구석

구석에 파고들어 우리의 삶을 보다 윤택하게 만들 것이다

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 12: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 12 Biophysical Society Newsletter

이렇게 DNA chip을 이용하여 얻게 되는 전사체에 대한

정보는 유전자와 유전자 유전자와 단백질 합성 유전자 발

현 신호 전달 메커니즘 등의 상관관계를 밝히는데 주요한

정보를 제공할 것이며 이를 시스템적으로 종합하여 모델링

확립하게 된다면 생명체의 복잡한 변화와 조절 현상에 대한

이해가 더욱 넓어질 것이다

단백체학(proteomics)

생명체 내에서 특정 조건 및 시간에 발현되는 단백질

양의 전체적 변화 패턴 분석 및 정량ㆍ정성적 분석을 통해

세포의 거동 및 유전자의 발현을 이해하는 학문을

단백체학이라고 한다(13) 이와 같은 단백체학 연구를 통해

세포의 대사 이해 조절 신호 전달 면역 반응의 메커니즘

등을 이해하는 것이 가능해진다 오늘날

단백체학(proteomics)이 대두된 이유는 mRNA(messenger

RNA)에 대한 정보만으로는 모든 단백질의 발현을 예측할

수 없기 때문이다 그리고 또 다른 이유는 단백질이

변형(methylation phosphorylation 등)된 것을 유전자

서열(gene sequence)로는 설명할 수 없기 때문이다

그럼에도 불구하고 상보적인 서열을 인지하여 이중나선을

형성할 수 있는 DNA 에 비해 단백질은 서열만으로

선택적인 결합을 이룰 수 없고 PCR(polymerase chain

reaction)을 이용하여 DNA 를 증폭시키는 방법과 같이

단백질을 증폭시키는 방법이 마땅치 않은데다가 주위

조건(열 pH 등)에 따라 변성되기도 하는 등 다루기가

까다로워 유전체학(genomics)에 비하면 아직도 걸음마

단계에 불과하다 현재 수준은 2-D gel 을 이용하여 단백질

자체의 발현 여부를 관찰하거나(그림 3 참조) 컴퓨터를

이용하여 단백질의 3 차원 모델을 예측(prediction)하는

방법을 연구하는 정도이다(14)

단백체학(proteomics)의 장점으로는 기능을 갖는

단백질의 발현을 종합적이고 정량적으로 측정하는 가장

직접적인 수단이 되고 생물학적 동요(perturbation 질병

약물 shock 등)에 의하여 변하는 단백질들의 발현 양상의

변화를 정확하게 관찰할 수 있으며 세포내(in vivo)에서

그림 3 단백체학(proteomics)에서 사용하는 2-Dimensional Gel Electrophoresis (2-DE) 기법

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 13: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 13

유전자 발현의 궁극적인 양상을 규명할 수 있고 유전자

단백질 및 질병간의 연결고리를 제공한다

단백체학(proteomics)이 풀어야 할 문제로는 단백질 역할

규명 번역 후 변형의 분석 단백질 활성의 조절 단백질 간

상호작용 및 복합체 형성 세포내 소기관 사이에서의

단백질 이동 및 분포 단백질 발현 분석 신호 전달 및

대사 경로 규명 약물의 작용 기작 약물독성의 연구 등이

있겠다(15)

단백체에 대한 연구의 어려움에도 불구하는 이러한

연구 노력은 세포내 대사 메커니즘에 직접적으로 관여하는

효소(enzyme)에 대한 정보를 제공하므로 세포의 모델링과

시스템적인 해석에 매우 긴요한 도구가 되고 있다 즉

효소는 대사물질의 변화에 직접적으로 관여하므로 이에

대한 정량적인 정보를 얻게 된다면 보다 정밀하고(robust)

효과적인 생물 시스템 모델을 구성하는 것이 가능해진다

대사체학(metabolomics)

대사체학이란 세포 내 다양한 유전적 환경적 조건에서

단백질 효소(enzyme)에 의해 만들어지는 수많은

대사산물(metabolite)의 종류와 농도를 MS(mass

spectrometer)나 NMR(nuclear magnetic resonance)과 같은

다양한 분석기기를 사용하여 포괄적으로 해석함으로서

생명현상을 총체적으로 연구하기 위한 새로운 학문으로

정의되어진다(1617) 다시 말해 전사체학(transcriptomic)

단백체학(proteomics)과 함께 포스트 게노믹시대(post-

genomic era)에 기능 유전체학(functional genomics)의 한

방편으로 유전형질과 표현형질의 관계를 규명해줄

궁극적인 수단으로 이용되고 있으며 대사체학 연구를 통해

알려져 있지 않던 유전자와 단백질의 기능 규명도 가능하게

된다 또한 대사산물 데이터베이스(database) 확보 및

네트워크(network) 구축에 의해 얻어진 정보(information)를

이용한 세포의 생리학적 상태를 판단함으로서 유전자 발현

및 단백질 발현 여부를 확인하는 것이 가능해졌다 이에

최근 바이오관련 연구소에서는 생명현상을 총체적으로

이해하기 위해서는 무엇보다도 대사체에 관한 연구가

필수적임을 인지되기 시작했으며 선진국에서는 이미

대사체학에 대한 많은 연구가 이루어지고 있다(1819)

지금까지 시스템생물학과 오믹스(-omics)로 분류되는

분야의 관련성에 대하여 논의하였다 요약하면

시스템생물학이란 앞서 말한 오믹스 기술(-omics

technology)을 기반으로 얻어진 정보를 유기적으로

이용하여 생명체를 총괄적이고 체계적으로 이해하는 것을

목적으로 하고 있는 생물학의 새로운 분야이다 즉 단위

생물 개체 또는 단위 세포를 총체적으로 접근하고 해석할

수 있는 시스템적 연구를 말하며 연구 방법 또한 다량의

실험을 동시에 수행할 수 있는 새로운 공학적 접근을

필요로 하고 있다

시스템생물학 연구를 위해서는 생물학적 시스템들을

전체적인 관점에서 이해하기 위한 방법론과 기술의 도움이

필요하고 이러한 생명현상의 구성성분에 대한 방대한 분석

데이터를 만들어 내는 생화학자 및 분석화학자 뿐만 아니라

분석 데이터를 사용하여 시스템을 모델링하고

모사(simulation)하고 검증실험을 할 수 있는 공학자 이를

통하여 얻어지는 가설들을 다시 세포내에서 재구성할 수

있는 세포생물학자 등 여러 분야 과학자들의 긴밀한 협력이

필수적이며 이를 통해야만 생명현상의 시스템적인 이해가

가능해 질 것이다 즉 효율적인 시스템 생물학 연구를

위해서는 지금까지 각 분야의 과학자들이 독자적으로 자기

분야를 연구하는 방식을 탈피하여 각각의 연구대상에 관한

다양한 기술들의 집합과 여러 연구 분야들에서의 공통적

노력을 필요로 하겠다

시스템생물학적 접근 방법을 통해 신약 후보물질이나

신약개발 표적 단백질의 발굴 및 검증에 획기적인 발전을

가져올 수 있으며 제약분야 이외에 산업 미생물을

이용하여 목적으로 하는 대사물질(metabolite) 또는

생물자원의 대량생산도 가능하다고 보고 있다(20) 따라서

본 학문에 대한 관심과 발전은 앞으로 계속 커져갈 것이며

인류사회에 대한 기여가 매우 클 것으로 예상된다

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 14: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 14 Biophysical Society Newsletter

참고문헌 13 de Hoog C L and Mann M ldquoProteomicsrdquo Annu Rev

Genomics Hum Genet 5 267-293 (2004) 1 Kumar A ldquoTeaching systems biology an active-learning

approachrdquo Cell Biol Educ 4 323-329 (2005) 14 Aggarwal K and Lee K H ldquoFunctional genomics and

proteomics as a foundation for systems biologyrdquo Brief

Funct Genomic Proteomic 2 175-184 (2003)

2 OMalley M A and Dupre J ldquoFundamental issues in

systems biologyrdquo Bioessays 27 1270-1276 (2005)

3 Egelhofer M ldquoPost-genome science highlights systems

biologyrdquo Drug Discov Today 9 1000-1002 (2004)

15 Walgren J L and Thompson D C ldquoApplication of

proteomic technologies in the drug development processrdquo

Toxicol Lett 149 377-385 (2004) 4 Ellis D I OHagan S Dunn W B Brown M and

Vaidyanathan S ldquoFrom genomes to systemsrdquo Genome Biol

5 354 (2004)

16 Rochfort S ldquoMetabolomics reviewed a new omics

platform technology for systems biology and implications

for natural products researchrdquo J Nat Prod 68 1813-1820

(2005)

5 Auffray C Imbeaud S Roux-Rouquie M and Hood L

ldquoFrom functional genomics to systems biology concepts

and practicesrdquo Crit Rev Biol 326 879-892 (2003) 17 Lindon J C Holmes E and Nicholson J K

ldquoMetabonomics systems biology in pharmaceutical

research and developmentrdquo Curr Opin Mol Ther 6 265-

272 (2004)

6 Hocquette J F ldquoWhere are we in genomicsrdquo J Physiol

Pharmacol 56 37-70 (2005)

7 Oksman-Caldentey K M and Saito K ldquoIntegrating

genomics and metabolomics for engineering plant

metabolic pathwaysrdquo Curr Opin Biotechnol 16 174-179

(2005)

18 Lindon J C Holmes E Bollard ME Stanley E G

and Nicholson J K ldquoMetabonomics technologies and their

applications in physiological monitoring drug safety

assessment and disease diagnosisrdquo Biomarkers 9 1-31

(2004)

8 Thongboonkerd V ldquoGenomics proteomics and integrative

omics in hypertension researchrdquo Curr Opin Nephrol

Hypertens 14 133-139 (2005) 19 Kell D B ldquoMetabolomics and systems biology making

sense of the souprdquo Curr Opin Microbiol 7 296-307

(2004)

9 Glaser P and Boone C ldquoBeyond the genome from

genomics to systems biologyrdquo Curr Opin Microbiol 7

489-491 (2004) 20 Butcher E C Berg E L and Kunkel E J ldquoSystems

biology in drug discoveryrdquo Nat Biotechnol 22 1253-1259

(2004)

10 Coleman J O Haslam R P and Downie A L

ldquoTranscriptomics and proteomics tools for optimising

phytoremediation activitiesrdquo Z Naturforsch 60 544-548

(2005)

11 Viguerie N Poitou C Cancello R Stich V Clement

K and Langin D ldquoTranscriptomics applied to obesity and

caloric restrictionrdquo Biochimie 87 117-123 (2005)

12 Schaechter M and Ingraham J L ldquoWhat limits genomics

proteomics transcriptomicsrdquo Int Microbiol 5 51-52

(2002)

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 15: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 15

충북대학교 물리학과 Cuong Nguyen 한승기

시스템 생물학 모듈 네트웍의 동적 기능 분석 [총설]

인간 유전체 사업을 통하여 인간유전체의 염기서열이

밝혀짐에 따라서 유전자와 단백질의 기능에 대해서 엄청난

정보를 얻게 되었다 그러나 유전체의 서열을 밝히는 것만

으로는 유전자의 기능을 완전히 밝히는 데는 충분하지 않다

는 결론에 도달하였다

이것은 lsquo유전자-단백질-기능이 단선적으로 이어진다

는rsquo 생명과학의 central-dogma가 너무 이상적인 것이며 실

제로는 하나의 기능에 무수히 많은 유전자단백질이 관여한

다는 것이 밝혀지고 있기 때문이다 따라서 Post-Genome

Project 사업에서는 대규모 micro-array을 이용한 유전 발현

데이터 yeast two hybrid 방식 등을 이용한 단백질-단백질 상

호작용 데이터 그리고 유전자와 발현 인자(TF transcription

factor) 사이의 유전자-TF 상호 작용 데이터를 체계적으로

구축하고 이들 대규모 데이터를 체계적으로 분석함으로써

유전자의 조절 메커니즘과 기능을 이해하고자 한다

세포 내에서 무수히 많은 유전자가 특정한 기능을 발휘

하기 위하여 어떻게 서로 협력하고 있을 까 이것은 그 동안

유전자-단백질 하나 하나의 기능에 집중하였든 전통적인

생명과학의 접근 방법과는 달리 대규모 유전자-단백질-대

사물질과의 상호작용 데이터를 이용하여 이들이 전체적으

로 서로 얽혀져 있는 네트워크 상에서 각 유전자단백질의

역할과 기능을 밝히고자 전체주의적 접근방법(wholistic

approach)이라고 할 수 있다 (1) 문제는 무수히 많은 유전자

와 단백질이 서로 얽혀 있는 네트웍으로부터 생명 현상의

조절 메커니즘을 어떻게 알아내는 가 하는 것이다 최근에

생명과학의 새로운 조류라고 할 수 있는 시스템생물학에서

는 생명 현상도 라디오나 텔레비전과 같은 기계장치의 작동

원리처럼 공학적인 아이디어로 이해할 수 있다는 일념으로

수 많은 생명과학자공학자들에 의해서 시도되고 있다 (2)

공학적 접근 방법이라고 하는 것은 생명체는 하나의 거대한

기계 장치와 같으며 전체의 기능은 각기 다른 기능을 하는

부품의 연결에 의해서 생긴다는 것이다 따라서 생명 현상

을 이해하기 위해서는 먼저 다른 기능을 하는 기능 모듈들

이 어떤 것이 있는 지를 알아내야 하고 다음에는 그런 기능

모듈들이 어떻게 연결되어 전체 장치를 구성하는 가를 밝히

면 된다 (3)

최근에 미국 Cold Spring Harbor 연구소의 Lazebnik 박사

는 어떤 기사에서 ldquo생물학자가 고장이 난 라디오를 고칠 수

있을 까rdquo라는 질문을 제기하였다 (4) 대부분의 생명과학

자가 수행하는 연구 방법을 라디오의 기능을 알아내는 과정

에 비유하면 먼저 많은 라디오를 구입하여 각 부품을 하나

씩 손상시켜갈 때 치명적 기능 장애가 발생시키는 부품을

찾아낸다 이런 부품들은 중요하므로 모조리 찾아내어 어떻

게 연결되는 지 그 연결도를 구한다 이것이 전통적인 생명

과학에서 수행하는 작업으로 그림1(a)와 같은 개략적 라디

오 회로도를 얻게 된다 그러나 이 회로도 만으로는 라디오

가 고장났을 때 고칠 수 있다고 보기는 어려울 것이다 왜냐

하면 라디오가 작동하기 위해서는 그림1(b)과 같이 부품의

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 16: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 16 Biophysical Society Newsletter

그림 1 라디오 회로도 그림 a는 생물학자들이 각 부품을 하나씩 제거하는 방법으로 찾아낸 라디오의 필수적

인 연결도라고 하면 그림 b는 공학자들이 라디오를 수선하기 위해서 사용하는 회로도의 일종이다 (4)

저항 용량과 같은 특성값들을 잘 튜닝시켜야만 각 부품들

의 기능이 제대로 연결될 수 있기 때문이다 전기공학자는

이런 회로도를 통해서 신호가 처리되는 원리를 이해하고 또

한 이를 기반으로 수리도 할 수 있다 그런데 이렇게 복잡한

회로도를 어떻게 이해를 할 까 그림1(b)의 라디오 회로도

에는 미약한 신호를 증폭시키는 회로 특정 주파수를 선택

하는 회로 잡음을 제거하는 회로 등 다양한 기능모듈이 모

여져 있는 복잡한 회로도이다 그러나 각각의 기본적인 기

능 모듈은 비교적 간단하므로 먼저 이런 기능 모듈을 분석

하고 다음에 각 기능 모듈이 어떻게 연결되는 지를 분석함

으로써 복잡한 전기회로도를 쉽게 이해할 수 있다

세포주기 조절 네트웍에 나타나는 모듈 feedback loops

세포주기는 세포가 일정한 시간 간격을 두고 복제되는

과정으로써 먼저 유전자가 복제되는 S phase 유전자세포

가 둘로 나누어지는 M phase 그리고 이 둘 사이의 중간 과

정 G1 G2 phase로 구성된 주기적 활동(G1 S G2 M

G1)으로 구성되어 있다 (5) 세포 내에서 이 네 가지 과정

이 순차적으로 발생하도록 조절되는 가 하는 것은 생명 현

상을 이해하는 중요한 핵심 고리가 된다 세포주기의 각

phase는 각각의 phase에 해당하는 cyclin dependent

kinese(CDK)의 양에 따라서 switch-on 되었다가 이어서

inhibitor의 억제에 의해서 CDK가 감소하면 switch-off 되는

몇 개의 스위치에 의해서 조절된다 세포가 성장함에 따라

서 S phase에 해당하는 스위치가 켜져서 DNA 복제가 일어

나고 이어서 스위치가 꺼지며 잠시 동안의 공백기 이후에

M phase 스위치가 작동되어 유전자와 세포의 분리가 시작

된다 그런데 이 스위치들을 하나씩 순차적으로 작동하도

록 조절하는 세포주기 조절기가 세포 내부에 있는 것인가

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 17: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 17

크리스마스트리 조명등이 규칙적으로 켜지고 꺼지는

것은 내부에 그림1과 같은 전기회로도가 있어서 이것이 조

명등의 점멸을 자동으로 조절한다 세포 주기도 마찬가지로

여러 가지 스위치를 자동적으로 조절하는 유전자-단백질-

대사물질 회로도에 의해서 조정되는 것으로 밝혀졌으며 그

림2와 같이 세포의 종류에 따라서 약간씩 다른 회로도를 가

지고 있다 이것은 크리스마스트리마다 전등의 점멸 패턴이

다르므로 내부 전기회로도가 달라야 하듯이 세포 주기 패턴

이 다른 세포들마다 각각 다른 세포주기 조절 회로도가 있

게 된다 그렇지만 그림1과 같이 복잡한 전기회로도의 기능

도 몇 가지 기본적인 기능을 하는 기능 모듈의 연결 특성으

로 이해할 수 있듯이 그림2의 여러 가지 세포 주기 조절 회

로도도 기본적인 기능 모듈의 기능을 이해하면 쉽게 이해할

수 있을 것이다 이것이 세포 주기에 대한 시스템생물학의

접근 방법이다 (12)

세포주기는 주로 CDK의 생성과 소멸에 의해서 조절되

는 데 그림2의 세포주기 네트웍에는 몇 가지 공통적인 기능

모듈이 있다 그림3과 같이 이들은 대개 feedback loop으로

구성된 소규모 네트웍으로 구성되어 있다 (a) 유전자 발현

의 결과인 단백질이 자기 자신의 TF로 작용하는 auto-

regulation 회로 (b) CDK와 inhibitor가 서로 inhibition으로 작

용하는 mutual-inhibition회로로써 positive feedback loop을

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n ce

ll

Budd

ing

yeas

tXe

nopu

sem

bryo

Fiss

ion

yeas

tM

amm

alia

n c

lle

그림 2 Budding yeast fission yeast frog egg 그리고 mammalian cell에 대한 세포주기 조절 회로도

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 18: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 18 Biophysical Society Newsletter

그림 3 Feedback loop in cell cycle 처음 두 가지 회로도는

는 (a) auto-regulation과 (b) mutual inhibition 회

로도이며 positive feedback loop을 가지고 세 번 째 (c) negative feedback loop 이다

구성 그리고 (c) 의 소멸을 자기자신이 촉진하는

다른 여러가지 신호절달 네트웍에도 다양하게 활용되는 특

별한 회로도 기능을 가지고 있다(6)

Feedback loop에 대한 bifurcation diagram 을 이용한 동력

학 분석

그림3의 feedback loop에 대한 기능을 어떻게 이해할 것

인가 일반적으로 이런 네트웍의 기능을 이해하기 사용하

는 방법은 입력 신호에 따른 출력 신호의 특성의 변화를 보

여주는 것이다 (8) 그림4는 그림3의 두 가지 positive

feedback loop에 대한 출력 특성을 그린 것이다 그 결과 입

력 신호 mass 가 작으면 가능한 출력 CLB5의 양은 낮은 값

이 되

그런

력에

신호에 대해서 두 가지 가능한 값을 가지는 것을 이중안정

성(bistability)이라고 한다 이중안정성의 기능은 그림4의 두

번째 그림에서 입력 신호가 이중안정성이 끝나는 지점에서

출력이 급격하게 증가하는 현상을 이용하여 스위치로써 작

동할 수 있다는 것이다 더 중요한 것은 입력 신호가 다시 감

소할 때의 출력 특성이 감소할 때와 다른 출력 특성을 가짐

을 세번째 그림에서 보여준다 이런 특성을 가지는 것을 이

력현상(hysterisis)이라고 하며 잡음에 무관하게 안정적으로

switch-on switch-off 기능을 수행하는 toggle-switch 의 중요

한 작동 원리로 사용된다(6) 한편 그림3의 negative

feedback loop의 기능은 그림5에서 보여주는 바와같이 입력

이 어느 값 이상이 될 때 주기적인 신호를 발생하는 역할을

함을 보여준다 이런 특성은 feedback loop에 기술하는 여러

CDK

negative feedback loop 이 들 모듈은 세포주기뿐만 아니라

지만 입력이 아주 크면 출력도 큰 값을 가지게 된다

데 feedback loop의 비선형성에 의해서 중간 크기의 입

대해서 출력이 두 가지 값을 가지게 된다 한 가지 입력

가지 kinetic 상수에 크게 의존하지 않는 것이 일반적인 특성

이다(9)

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 19: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 19

그림 4 그림3(a-b)의 positive feedback loop에 대한 bifurcation diagram 세포의 크기 mass가 아주 작을 때는 한 개의 안정된 고정점을 가지지만 mass가 03-07 사이에서는 세 개의 고정점이 생긴다 중간 상태는 불안정한 상태로써 시작하는 상태에 따라서 CLB5의 값이 낮은 값 혹은 높은 값으로 접근하는 이중안정성(bistyability)을 보여준다 중간 그림은 시간에 따라서 mass 가 점차 증가할 때 CLB5의 크기를 그린 것으로 왼편의 bifurcation diagram이 지도상에 나타나는 끌개 즉 도로와 같은 역할을 한다 오른쪽 그림은 mass가 큰 값에서부터 시작하여 다시 감소할 때 경로가 중가할 때의 경로와 달라지는 이력현상(hystertisis)을 보여준다

그림 5 그림3의 negative feedback loop에 대한 bifurcation diagram 세포의 크기가 055보다 작을 때는 고정점이 안정

된 끌개이지만 이보다 크면 끌개가 주기적 진동 상태가 됨을 보여준다 Mass가 055보다 클 때 상하의 점선은 주기

적 상태의 최대 최소값을 나타낸다 두 가지 경우에 대한 CLB2의 시간에 따른 변화를 그란 그림에서 mass가 작을 때는 고정적으로 접근하고 mass가 클때는 주기적인 상태가 되는 것을 보여준다

Mass=04 Mass=08Mass=04 Mass=08

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 20: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 20 Biophysical Society Newsletter

그림 6 정상 세포와 CLN3 mutant에 대한 bifurcation diagram

세포주기 네트웍의 기능을 이해하기 위하여 비슷한 방

법을 적용하여 세포의 크기에 따른 bifurcation diagram을 그

림6처럼 구할 수 있다 붉은 선은 세포 주기 동안 중요한

cyclin CLB5와 CLB2의 양을 시시각각 변화하는 세포의 크

기 축을 따라서 그린 경로도이다 이 그림에는 먼저 세포 크

기에 따른 안정적인 상태와 불안정 상태를 푸른색과 초록색

으로 표시하고 있는 데 푸른색은 mass 가 작을 때 고정점을

나타내고 초록색은 mass 가 클 때 고리로 표시된 주기 상태

를 나타낸다 이 그림을 지도에 비유하면 푸른색과 초록색

선은 지도의 도로에 해당하고 붉은 색으로 표시된 선은 실

제 이동한 경로를 나타낸다 여행을 할 때 실제 경로가 도로

를 따라서 이어지듯이 세포 주기 동안 상태 변화가 위상 공

간 상에서 주어진 안정된 끌개를 따라서 변화하는 것을 알

수 있다 즉 지도 상에 도로가 표시되어 있으면 실제 이동을

하지 않고서도 손쉽게 이동 경로를 추정할 수 있듯이 위상

공간에서 세포주기 네트웍의 안정된 해를 표시한

bifurcation diagram은 세포 주기 동안에 단백질대사물질의

변화가 어떻게 일어날 수 있는 지를 쉽게 이해할 수 있는 좋

은 방법이 된다(10)

그림6에서 정상세포(왼쪽)와 CLN3 mutant(오른쪽)에

대한 bifurcation diagram을 비교하면 정상세포인 경우에 세

포의 크기가 작을 때는 CLB5와 CLB2가 거의 0인 모서리(골

짜기) 도로를 따라서 경로가 이동하지만 세포의 크기가 어

느 정도되면 lsquoSTARTrsquo로 표시된 부분에서 갑자기 도로가 고

속도로의 lsquo인터체인지rsquo에 해당하는 환상고리로 전환되는

것을 알 수 있다 이것은 그림5의 negative feedback loop에

의한 것으로 그림2의 cell cycle network에서 negative

feedback loop이 어떤 기능을 하는 지를 보여주는 좋은 예가

된다 한편 CLN3 mutant(오른쪽)에 대한 bifurcation diagram

은 정상세포에 대한 bifurcation diagram과 거의 유사하지만

환상고리의 위치가 정상세포에 비해서 오른쪽으로 이동하

여 정상 세포보가 더 큰 mass 에서 세포 분리가 일어남을 알

수 있다 이것은 그림2의 budding yeast에 대한 네트웍에서

DNA 복제를 유발하는 두 가지 신호인 CLN3와 BCK2 중에

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 21: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 21

서 CLN3의 기능이 제거되고 BCK2 만으로 DNA 복제를 위

한 CLB5을 활성화시켜야 하므로 정상 세포일 때 보다는 더

큰 BCK2의 활동도가 요구되는 것으로 해석할 수 있다 이

것이 CLN3 mutant에서 환상고리가 나중에 일어나는 이유가

된다(710)

이와 같은 방법으로 각각의 유전자단백질이 제거되거

나 과활성화 되었을 때 bifurcation diagram 을 그려봄으로써

이들의 역할을 이해를 할 수 있다 이런 bifurcation analysis

는 많은 경우에 세부적인 kinectic 상수에 의존하지 않고 네

트웍의 전체적인 구조에만 의존하는 것이 보편적이다 (9)

즉 실험에서 얻게 되는 kinectic 상수의 불확실성에도 불구

하고 네트웍이 가지는 robustness을 추론할 수 있는 좋은 방

법론이 될 수 있다 이런 방법은 세포 주기뿐만 아니라

MAPK signaling pathway 등 다른 생화학 네트웍의 분석에도

적용하고자 하는 것이 최근의 systems biology 의 주요 접근

방법 중의 하나가 된다(1112)

참고문헌

1 Kitano H ldquoSystems biology a brief overviewrdquo Science

295 1662-1664 (2002)

2 Kitano H Foundations of Systems Biology MIT

Cambridge MA 2001

3 Hartwell L H Hopfield J J Leibler S and Murray

AW ldquoFrom molecular to modular cell biologyrdquo Nature

402 C47-52 (1999)

4 Lazebnik L ldquoCan a biologist fix a radio - Or what I

learned while studying apoptosisrdquo Cancer Cell 2 179-182

(2002)

5 Lodish L H Berk A Zipursky S L Matsudaira P

Baltimore D and Darnell J Molecular Cell Biology 4th

ed Freeman New York 1999

6 Tyson J J Chen K C and Novak B ldquoSniffers buzzers

toggles and blinkers dynamics of regulatory and signaling

pathways in the cellrdquo Curr Opin Cell Biol 15 221-231

(2003)

7 Chen K C et al ldquoKinetic analysis of a molecular model

of the budding yeast cell cyclerdquo Mol Biol Cell 11 369-

391 (2000)

8 Strogatz S H Nonlinear Dynamics and Chaos Addison-

Wesley Cambridge 1994

9 Bakai N and Leibler S ldquoRobustness in simple

biochemical networksrdquo Nature 387 913-916 (1997)

10 Tyson J J Csikasz-Nagy A and Novak B ldquoThe

dynamics of cell cycle regulationrdquo Bioessays 24 1095-

1109 (2002)

11 Sauro H M and Kholodenko B N ldquoQuantitative analysis

of signaling networksrdquo Prog Biophy Mol Bio 86 5-43

(2004)

12 Nguyen C and Han S K ldquoDynamics of interlocked

feedback loopsrdquo in press (2006)

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 22: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 22 Biophysical Society Newsletter

[총설]

Structural Genomics of Membrane Protein

한국기초과학지원연구원 국민대학교 생명나노학과 전영호 유연규

세포막 단백질의 기능

인간을 포함한 다양한 생명체의 유전체 서열 분석을

통하여 수많은 유전자 들이 확인되고 있다 이들 유전자의

기능을 규명하여 생명 현상의 원리를 밝히고 나아가 질병

극복과 인간복지를 위하여 활용하는 것이 21 세기

생명과학의 핵심 목표가 되고 있다 한편 유전자의 기능을

규명하기 위하여 유전자의 산물인 단백질의 구조와 기능을

이해하는 것이 필수적이며 유전체 서열 분석 연구에 뒤이어

프로테오믹스 연구를 통한 단백질의 종류 기능 그리고

구보에 대한 연구 대한 분석이 추진되고 있다 한편

생명체가 갖고 있는 단백질을 존재 위치에 따라 구분한다면

수용성 단백질과 막 단백질로 나눌 수 있으며 막 단백질은

전체 단백질 종류의 약 30 내외에 이를 것으로 추정되고

있다 일반적으로 막 단백질은 세포가 성장하는데 필요한

에너지 생산 물질의 섭취 및 배출 그리고 환경 변화의 감지

및 신호의 전달 등 생명 현상의 중요한 기능을 담당하며

생체 신호 전달 기능과 관련된 receptor 이온 채널 그리고

물질 수송 기능의 transporter 들은 현재 사용되는

치료제들의 표적 단백질중 50 이상을 차지하며 향후

예상되는 신약 개발의 주요 표적 단백질이 될 것이다

한편 막 단백질의 구조 연구는 1985 년 최초로 막

단백질의 입체구조가 발표된 수 점차 구조가 밝혀진

단백질의 수가 늘어나고 있다 1960 년도에서부터 축척되기

시작한 수용성 단백질의 구조 규명의 추세와 비교해 보면

비록 그 수는 약간 적지만 매년 구조가 밝혀지고 있는 막

단백질의 수가 꾸준히 증가하는 것을 알수 있다 (그림 1)

그림 1 막 단백질의 구조 규명 연구 치료제 표적 단백질의 분포

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 23: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 23

본 총설에서는 이러한 막 단백질을 대상으로 structural

genomics 연구의 현황을 소개하고 막 단백질의 하나로서

신약 개발에서 가장 중요한 위치를 차지하고 있는 수용체인

GPCR 을 대상으로한 구조 생물학적 연구의 현황 및

문제점을 소개하고자 한다

1 막 단백질의 구조 연구의 현황과 문제점

구조 유전체학(Structural Genomics)은 미국을

중심으로 유전체 서열 규명을 목표로한 유전체 연구의 후속

연구로 기획되어 단백질 folding unit 의 발굴을 통하여 전체

단백질의 구조 형성을 분석하고 질병 치료를 목적으로 질환

관련 단백질의 구조를 분석하였다 이러한 연구를 통하여

단백질 구조 정보가 기하 급수적으로 늘어났으며 구조를

통한 단백질의 기능 분석 그리고 구조 정보를 이용한 신약

개발이 가능해질 것이다 그러나 주요 생명 현상을

수행하며 질환과 밀접한 관계가 있는 막 단백질은 수용성

단백질의 구조 정보에 비해 1정도만 얻어지고 있다 현재

Protein Data Base (PDB)에 축척되어 있는 27000 여개의

단백질 구조 정보 중에서 200 여개만이 막 단백질의

구조이며 이중 unique structure 는 겨우 90 여개에 불과하다

그리고 구조가 규명된 Mammalin membrane protein 의

구조는 10 개 미만이다 (그림 2) 따라서 막 단백질에 대한

구조 유전체 연구는 초기 단계이며 향 후 비약적이 발전이

기대된다

막 단백질 연구의 구조 및 기능 연구가 수용성

단백질에 비하여 미약한 이유는 첫째 세포에 발현되는 막

단백질의 양이 매우 적은데 비하여 대량 발현 방법이

개발되어 있지 못하기 때문이다 초기의 막 단백질의 구조

연구는 발현도가 특정 세포나 조직에서 매우 높은

단백질만이 연구 대상이 되었다 (Bacterirhodopsin reaction

center cytochrom bc complex) 수용성 단백질의 경우 대장균

효모 insect cell 등을 발현 숙주로 이용한 대량 발현 기술이

그림 2 구조 규명된 단백질중 막 단백질의 비중

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 24: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 24 Biophysical Society Newsletter

개발되어 발현도가 극히 낮은 단백질도 대량으로 제조하여

구조 분석 연구에 사용할 수 있었지만 막 단백질은 수용성

단백질에 비하여 대장균 등에서 발현도가 극히 낮아 구조

분석에 필요한 충분한 단백질을 확보하기가 쉽지 않다 두

번째 원인은 막 단백질의 정제 과정의 난점을 들 수 있다 막

단백질의 정제를 위하여 막 단백질을 활성 구조로

유지시키면서 세포막을 적절한 detergent 를 이용하여

용해해야 된다 이러한 과정은 다양한 detergent 을

무작위적으로 시도하여 최적의 조건을 찾아야 하는 과정이

필요하다 마지막으로 막 단백질의 구조 분석 특히 X-선

결정학을 이용한 구조 분석방법에 필수적으로

선행되어야할 단백질 결정화의 문제이다 수용성 단백질과

달리 막 단백질의 경우 정제가 된 이후에도 결정화 과정이

수용성 단백질에 비하여 극히 까다롭다

2 Structural genomics of membrane protein 의 연구 현황

(미국 일본 유럽 영국)

수용체 등 막 단백질들이 제약산업에서의 비중이 매우

크기 때문에 선진국에서 번 정부적으로 막 단백질의

구조연구에 대한 지원이 활발하게 모색되고 있다

미국에서는 1999 년부터 2005 년까지 12 개의 center 를

지정하여 약 5 천억원을 들여 pilot 연구를 수행 하였고

2005 년부터 다시 10 개의 기관을 선정하여 5 년간 연구수행

중이다 일본에서는 RIKEN 을 중심으로 단백질 3000

프로젝트를 수행하고 있고 2006 년부터 새로운 단계의

프로젝트를 연간 7 천억원 규모로 수행할 예정이다 이러한

연구중에 막 단백질에 대한 구조 연구가 포한되어 있다

특히 영국에서는 BBSRC 에서 연간 약 230 억원을 들여 막

단백질 연구를 지원하고 있다 (표 1)

3 막 단백질 구조 규명 연구의 가능성

막 단백질의 구조 분석의 어려운 점들 중에서 가장 큰

문제점은 막 단백질의 발현을 들 수 있다 단백질 정제와

단백질 결정화 단계는 다양한 affinity selection 방법과

detergent 의 개발을 통하여 극복될 수 있다 현재

유전공학적 방법으로 대량 발현되는 대부분의 단백질들이

His-6 tag GST-tag MBP-tag 등을 이용하여 1-2 step 의

간단한 affinity selection 의 방법으로 손쉽게 분리되고 있다

이러한 affinity tag 들은 막 단백질의 정제에도 적용되어

발현도가 낮은 경우에도 효과적으로 단백질을 정제할 수

표 1 각 정부의 단백질 (막 단백질) 구조 연구 프로그램 현황

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 25: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 25

있을 것이다

또한 sugar based detergent 등 새로운 개념의 detergent 가

개발되고 있으며 막 단백질의 구조 정보가 축척 될수록

구조를 안정화시킬 수 있는 효과적인 detergent 가 고안될 수

있을 것이다 또한 X-선 구조 결정을 위한 단백질의 결정화

자동화 장비가 개발되면서 기존에 사용되었던 단백질의

양보다 5-10의 양을 필요로 하며 보다 power 가 큰 X-선

source 가 이용되면서 작은 단백질 결정으로도 구조 분석이

가능해지고 있다 즉 단백질 정제 및 결정화의 난점이

해결되면서 향 후 막 단백질의 구조 분석의 난점들이

극복될 것이다 앞으로 남은 가장 큰 난점은 막 단백질의

대량 발현이 될 것이다

한편 막 단백질의 발현은 대장균 Rhodobactor Pichia

Insect cell Cell free system Mammalian cell 등 다양한 발현

숙주가 시도되고 있지만 아직까지는 발현도가 높고

경제적이며 다양한 막 단백질에 대하여 범용적인 발현

방법은 보고 되지 않고 있으며 특정 막 단백질의 경우 일부

발현 시스템이 성공적으로 적용되는 예가 일부 보고 되고

있다 (표 2)

현재 모색되고 있는 막 단백질의 발현 방법은 일부

경우에 성공적인 사례가 보고 되고 있으나 아직 범용적으로

사용되기에는 난점이 있다 향후 GPCR 과 같은 학문적 및

경제적 중요성이 높은 막 단백질을 대상으로한 발현 방법의

기술 개발과 이를 토대로한 구조 및 분자 기능 분석 그리고

조절물질 개발의 연구에 국가적 지원이 요구된다

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesConsProsSuccess rateHost

BLT1(IB)

OR(IB)

Easy to handle low cost

MBP Mistic fusion

(case by case)

E coli

5HT5 b-AR16 μgmg protein

(case by case)

Pichia (Yeast)

5HT12 b-AR a-AR

High cost004-96 μgmg

(case by case)

Insect cell Baculovirus

lowCell free

DR IL8A CKR

High Cost16-8 μgmg

(case by case)

Mammalian cell

(Semliki forest virus)

Not enough dataRhodobactor

ExamplesHost Success rate ConsPros

표 2 GPCR 의 발현 방법의 현황 및 장단점

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 26: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 26 Biophysical Society Newsletter

[국내 생물물리학연구실 소개]

고등과학원 단백질접힘 연구실

이주영 교수 연구실

연구실 개요

바이오기술의 발전으로 엄청난 양의 생물현상에 관한

실험결과가 쏟아지고 있지만 정작 그 생명현상의 이해를

위한 직접적인 정보를 얻기는 쉽지 않다 본 연구실은 생명

현상 이해의 근본이 되는 단백질의 3차원적 구조가 어떠한

동역학 및 열역학적 과정을 통해 결정되는지 또한 그 구조

는 무엇이며 그 구조에 따라 어떠한 기능이 결정되는지에

대한 연구를 수행하고 있다 이 같은 연구는 크게는 물리학

화학 그리고 생물정보학에 기반을 둔 방법들을 채택하여

이루어 지고 있다 즉 물리학에 기반을 둔 분자동력학 컴퓨

터 시뮬레이션 화학에서 비롯된 화학구조와 생화학현상

그리고 생물정보학의 단백질정보에 관한 이용이 그것들이

다 무엇보다도 가장 우선되어야 할 문제는 단백질접힘 문

제를 이해하는 것이며 이를 위해서 학제간 개발된 여러 방

법들을 적절히 이용하고 대규모의 병렬 계산을 통해 문제

해결에 접근하는 것이다

현재 고등과학원 단백질접힘 연구실은 이주영교수 외

에 박사 후 연구원 3명(이경림 이진우 주기형) 및 연구조원

3명(강신덕 이선중 서주현)으로 구성되어있다 이들은 다

양한 분야의 연구 경력을 지닌 연구실 구성원들로서 학제간

교류와 원활한 아이디어의 접목에 노력을 기울이고 있다

단백질접힘에 관한 이론적 연구를 하기 위해서는 천문학적

인 컴퓨터 계산자원이 필요한데 이를 위해서 고등과학원에

서는 2001년부터 일반 PC 컴퓨터를 이용한 대규모 리눅스

클러스터를 제작하여 사용하고 있다 현재 세 개의 리눅스

클러스터(총 696 CPUs)가 본 연구실의 연구를 위해 사용되

고 있다 또한 리눅스와 윈도우 시스템기반으로 손쉽게 복

잡한 단백질의 입체구조를 볼 수 있는 visualization

workstation도 사용되고 있다

그림 1 고등과학원 리눅스 클러스터

연구 내용

단백질접힘과 관련된 구체적인 연구 활동들을 아래에

간략하게 소개하고자 한다

1 단백질 3차원 구조 예측

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 27: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Biophysical Society Newsletter Page 27

주어진 단백질의 1차원적인 구조 즉 아미노산 서열만

으로 단백질의 3차원 구조예측은 단백질이 주어진 생리학

적 조건에서 전체 계의 자유에너지가 가장 낮은 구조를 갖

는다는 Anfinsen의 열역학적 원리를 따른다 이 원리에 따

라 단백질의 3차원 구조를 실험을 통하지 않고 컴퓨터 계산

방법으로 밝히기 위해서는 두 가지 요소가 반드시 필요하게

된다 하나는 단백질의 에너지를 3차원 구조에 따라 정확하

게 기술할 수 있는 에너지 함수이고 나머지 하나는 수 없이

많은 가능한 구조 중에서 가장 낮은 에너지를 갖는 구조를

찾을 수 있는 conformational search algorithm이다 다시 말

해 이는 주어진 에너지 함수를 이용하여 에너지가 가장 낮

은 구조를 찾아내는 최적화 (global optimization)의 문제라고

도 볼 수 있다 여기에 사용되는 에너지 함수는 물리학에 기

반을 둔 열역학적 에너지 함수일수도 있고 생물정보학에

기반을 둔 통계적 함수일수도 있으며 경우에 따라서는 앞

의 두 가지를 적절히 조합한 것이 될 수도 있다 또한 최적화

를 위해서는 효율적이고 강력한 광역최적화 알고리듬이 필

요하게 된다 따라서 단백질 구조 예측에 필요한 각 요소의

개발이 하나의 연구분야를 이루기도 한다 본 연구실에서는

자체적으로 개발한 방법을 이용하여

CASP(Critical Assessment of Techniques for Protein Structure

Prediction)대회에 두 차례(2002년과 2004년)에 걸쳐 참석하

여 우수한 결과를 내기도 했다 또한 단백질 구조 예측의 한

분야인 도메인 경계 예측(domain boundary prediction)도 함

께 연구되고 있다 이는 때때로 하나의 단백질이 도메인 경

계를 사이에 두고 두 개 이상의 덩어리를 구조로 갖게 되는

경우가 있는데 이러한 경계를 이루는 아미노산 레지듀

(residue)을 찾아내는 것이다 뉴럴네트웍(neural network)과

단백질 데이타베이스를 이용하여 도메인 경계 예측 방법을

개발하였는데 마찬가지로 CASP6대회에서 우수한 결과를

보여 주기도 하였다

2 광역최적화

주어진 아미노산 서열에 의해서 단백질이 가질 수 있는

conformations의 수는 천문학적인 수에 가깝다 이중에서 에

너지 함수를 이용하여 가장 안정한 구조를 찾는 것은 최적

화의 문제와 일치하게 된다 따라서 최적화 방법을 개발하

는 것은 매우 중요한 연구 과제로 본 연구실에서는 단백질

구조 예측 뿐만 아니라 molecular cluster traveling salesman

problem spin glass 등의 문제에도 적용시킬 수 있는 방법들

을 연구 개발하고 있다 그 중에 하나가 CSA

(Conformational Space Annealing)인데 이는 genetic

algorithm과 유사하지만 구조의 다양성과 space annealing 개

념을 강조한 방법이다

3 에너지 함수 개발

단백질접힘 연구에 가장 핵심이 되는 요소로서 단백질

의 에너지를 합리적으로 구현할 수 있는 에너지 함수를 구

해야 한다 현재 진행되고 있는 접근은 기존의 에너지 함수

들을 더욱 정확한 에너지 함수로 개선하는 일과 이미 데이

터베이스화된 생물정보를 이용하여 자체내의 통계적 에너

지 함수를 새로이 개발하는 것이다 이를 위해서는 수 많은

그림 2 CASP6 대회에서 target 198번의 결과 (검정

색으로 나타낸 것이 본 연구실의 결과)

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있

Page 28: 한국생물물리학회 Korean Biophysical Society · circular dichroism, intrinsic and extrinsic fluorescence, small angle X-ray scattering and nuclear magnetic resonance, which

Page 28 Biophysical Society Newsletter

그림 3 CAPS6 대회에서 예측한 본 연구팀이 예측한 도메인 경계(실험결과와 일치)

5 단백질 독킹

단백질은 작은 유기분자들이나 혹은 제 2의 단백질과

결합하여 세포 내에서 대사작용이나 생화학적 과정에 참여

하게 된다 이러한 단백질 결합체들은 독특한 결합양식을

갖고 있으며 이러한 양식을 규명하는 것도 본 연구실의 과

제의 일부이다 결합양식은 결합친화도의 측정에 기본이 되

며 더 나아가 리간드(ligand)가 되는 유기 분자들이나 제 2

의 단백질을 설계할 수 있는 근간을 마련한다 즉 단백질 독

킹은 생체 내 여러 작용을 조절할 수 있는 신약개발의 기본

을 이룬다 나아가 세포 내 여러 가지 대사작용을 연구함으

로써 질병의 진단 치유에도 쓰여질 수 있는 중요한 문제이

다 본 연구실에서는 결합양식을 효율적으로 찾을 수 있는

최적화 방법을 이용하여 연구를 진행하고 있다 시행착오와 벤치마크의 연구가 수반되어야 한다 지난

CASP6대회에서 자체적으로 개발한 에너지 함수를 이용하

여 단백질구조를 예측하기도 하였다

맺음말

본 연구실은 위에서 소개된 연구들뿐만 아니라 단백질

구조와 관련된 다른 연구들도 진행되고 있다 Secondary

structure prediction Contact prediction Multiple sequence

alignment와 같은 연구가 바로 그 예들이다 진행되고 있는

모든 연구들은 결국 단백질접힘에 관한 연구들이며 궁극적

으로는 생명현상을 이해하려는 노력들이다 자연과학의 이

론을 바탕으로 대규모 컴퓨터 계산을 통해 이루어지는 단백

질접힘 연구는 전산과학과 생물정보학을 비롯한 이론과 실

험을 넘나드는 학제간의 연구수행이 수반되어야 한다 앞으

로 우수한 젊은 과학자들이 이러한 생명현상을 이해하는 문

제에 많은 관심을 갖기를 바라며 본 연구실의 소개를 마친

다 (이경림 krlee2kiasrekr)

4 단백질접힘 메카니즘

실제로 단백질이 어떠한 경로를 거쳐 기능을 갖는 3차

원 구조를 갖게 되는지는 아직도 풀지 못한 과제이다 허나

이러한 단백질접힘 메카니즘을 규명한다면 단백질의 기능

및 생물현상이해에 큰 도움이 될 것이다 단백질의 접힘 경

로를 기존하는 원자레벨의 에너지 함수와 컴퓨터 시뮬레이

션과 같은 방법들을 이용하여 밝히기는 현실적으로 어려운

일이다 컴퓨터 시뮬레이션이 단백질접힘 환경을 흉내내기

어려울 뿐만 아니라 접힘 시간에 대한 정보 부재와 에너지

함수의 부정확성 때문이다 이를 위해서 수백만 개의 CPU

로 이루어진 슈퍼컴퓨터를 제작하여 직접 접힘시뮬레이션

을 수행하는 Blue gene project도 등장했다 본 연구실에서는

현실적이고 합리적인 방법으로 단백질 접힐 수 있는 에너

지 함수 개발해 접힘 경로를 볼 수 있는 연구를 수행하고 있