10
1 FUNCTIONAL GENOMICS IN C. ELEGANS FOR STUDYING HUMAN DEVELOPMENT AND DISEASE

Functional Genomics of C elegans

Embed Size (px)

Citation preview

Page 1: Functional Genomics of C elegans

1

FUNCTIONALGENOMICS IN C. ELEGANS FOR STUDYING HUMAN DEVELOPMENTAND DISEASE

Page 2: Functional Genomics of C elegans

2

Page 3: Functional Genomics of C elegans

3

Open Reading FrameAn open reading frame or ORF is a portion of an organism's genome which contains a sequence of bases that could potentially encode a protein. The start and stop ends of the ORF are not equivalent to the ends of the mRNA  but they are usually the ends of the mRNA, but they are usually contained within the mRNA. In a gene, ORFs are located between the start‐code sequence (initiation codon) and the stop‐code sequence (termination codon). ORFs are usually encountered when sifting through pieces of DNA while trying to locate a gene. Since there exist variations in the start‐code sequence of organisms with altered genetic code, the ORF will be identified differently. A typical ORF the ORF will be identified differently. A typical ORF finder will employ algorithms based on existing genetic codes (including the altered ones) and all possible reading frames.

Page 4: Functional Genomics of C elegans

4

Open Reading FrameIn fact, the existence of an ORF, especially a long one, is usually a good indication of the presence of a gene in the surrounding sequence. In this case, the ORF is part of the sequence that will be translated by the ribosomes  it will be long  and if the DNA is by the ribosomes, it will be long, and if the DNA is eukaryotic, the ORF may continue over gaps called introns. However, short ORFs can also occur by chance outside of genes. Usually ORFs outside genes are not very long and terminate after a few codons.Once a gene has been sequenced it is important to determine the correct open reading frame (ORF). Theoretically, the DNA sequence can be read in six Theoretically, the DNA sequence can be read in six reading frames in organisms with double‐stranded DNA; three in the forward and three in the reverse direction. The longest sequence without a stop codon usually determines the open reading frame. 

Open Reading FrameThe region of the nucleotide sequences from the start codon (ATG) to the stop codon is called the Open Reading frame. Gene finding in organism starts form Gene finding in organism starts form searching for an open reading frames (ORF). An ORF is a sequence of DNA that starts with start codon “ATG” (not always) and ends with any of the three termination codons (TAA, TAG, TGA). Depending on the starting point, there are six possible ways (three on forward strand and three on complementary strand and three on complementary strand) of translating any nucleotide sequence into amino acid sequence according to the genetic code .These are called reading frames.

Page 5: Functional Genomics of C elegans

5

Open Reading FrameThe Coding Sequence (CDS) is the actual region of DNA that is translated to form proteins. While the ORF may contain introns as well, the CDS refers to those nucleotides (concatenated exons) that nucleotides (concatenated exons) that can be divided into codons which are actually translated into amino acids by the ribosomal translation machinery. In Prokaryotes the ORF and the CDS are the same. 

Open Reading Frame

Page 6: Functional Genomics of C elegans

6

Page 7: Functional Genomics of C elegans

7

Page 8: Functional Genomics of C elegans

8

Page 9: Functional Genomics of C elegans

9

Page 10: Functional Genomics of C elegans

10

Article Discussion

A principal challenge currently facing biologists is how to connect the complete DNA sequence of an organism to its d l   d b h i  development and behaviour. Large‐scale targeted‐deletions have been successful in defining gene functions in the single‐celled yeastSaccharomyces cerevisiae, but comparable analyses have yet to be performed in an animal. 

H    d ib  th     f RNA i t f  t  i hibit th  f ti   f  86%  f th  Here we describe the use of RNA interference to inhibit the function of ~86% of the 19,427 predicted genes of C. elegans. We identified mutant phenotypes for 1,722genes, about two‐thirds of which were not previously associated with a phenotype. We find that genes of similar functions are clustered in distinct, multi‐megabase regions of individual chromosomes; genes in these regions tend to share transcriptionalprofiles. Our resulting data set and reusable RNAi library of 16,757 bacterial clones will facilitate systematic analyses of the connections among gene sequence, chromosomal location and gene function in C. elegans.

Article Discussion

Kamath RS, Fraser AG, Dong Y, PoulinG, Durbin R, Gotta M, KanapinA, Le Bot N, Moreno S, Sohrmann M, Welchman DP, Zi l P  Ah i J  Zipperlen P, Ahringer J. Systematic functional analysis of the Caenorhabditis elegansgenome using RNAi.Nature. 2003; 421: 231‐7.