28
Biotecnología Molecular IIQ2693 Tarea 4

Biotecnologia molecular

Embed Size (px)

DESCRIPTION

Tarea sobre biotecnologia molecular

Citation preview

Biotecnologa Molecular IIQ2693

Tarea 4

Integrantes:

Mauricio Gonzales

Rodrigo Martnez

Rodrigo Dedes

Pregunta 1

A) En el cromatograma los pulsos deben estar bien definidos, para que sea una zona de buena calidad de secuenciacin. En la Fig 1, la regin seleccionada es una zona poco confiable, mientras que la regin no seleccionada muestras pulsos ms definidos, zona de mejor calidad de secuenciacin. En la figura 2 se muestran regiones de mala calidad de secuenciacin, mientras que la figura 3, los pulsos estn perfectamente definidos una regin de muy buena calidad de secuenciacin.

Figura 1

Figura 2

Figura. 3

B) Utilizamos el Plsmido PET101, cuyo sitio de insercin del gen se puede apreciar en la Figura. 4 y Figura.5

Figura. 4

Figura.5

c) Usando la herramienta Nucleotide Blast, vemos que genoma alinea con nuestro gen secuenciado (sacando las regiones poco confiables del gen).

Usando P12+T7 Prom

Figura.6

El Blast muestra un 98% de identidad con Bifidobacterium longum subsp. infantis JCM 1222 DNA, complete genome y Bifidobacterium longum subsp. infantis ATCC 15697, complete genome

Usando P12+T7term.

Figura.7

Figura.8

Vemos que T7 term se alinea con muchos genomas pero el gen P12 se alinea con las mismas especies obtenidas anteriormente (Figura.8), Bifidobacterium longum subsp. infantis ATCC 15697 con un 97% . (Quevery Cover 88%) (Figura.7)

d) Buscando en la base de datos del NCBI para Bifidobacterium longum subsp. infantis ATCC 15697

Figura.9

Vemos que el nombre de Gen es Blon_2255 (Figura.9, Figura.10)

El Genoma completo del cromosoma Bifidobacterium longum subsp. infantis ATCC 15697 es el siguiente: (Fasta)

CGGCGACTACTGGACGAACGATATCGCTCCGGTGCGTGCCGCCGGTGGGCTTACCGCGTTCATCCACGAG

CCTGATCCATCCTTGCCCGCGACCATCACCGCCCCGACCTTGCGGCAGATGGTCGATGACATTGTGGATG

TATGCGCCGCCGCGACGGCGGATGCCGGTGGGGCCGAGGCCGCTTTCCGGGACTGACCGCAACCGTGTCC

GTTGACCCCGTTGACGGCTATCATGTCCTGAGGGCCAGAAGGCTCTATCTCGATGCAGAGGTCGAAAGGA

TATGTGGCTGCTATGGTGCAGGAACCAACATTGGAATGGCATGTCATACCGGAGCCGACGAATGTCGAGC

CGCTGGTGGGAACATGCTCGTTGCCGTTGTCGGGAACGGTTGTGGAGCAACGAGGTGCGGATGATGCGGA

GGCCGTGTTTGCGCGTCAGCTTGTCGACGACATTAAGCGCGTGTGCGGAGGCCGCTGGCAGGTGGCCTCC

GGAGAGGTTCAGCGGGAGGTGACTTTGCGGACCAGTCCTTCGCTCGATGACTGGTCGTACGTGCTTGAGG

TCTCGCCGGACGGCGTTGTGATCACTGGTTCGGGGTTCGAAGGCGTTCGCGATGGCGTGCAGACATTGCG

TCAGATTATTCGCCAGATTGGTTTGACGATACCGTGCATGGTCATCAGGGATCGGCCGGCGTTCTCGACC

CGCGGTTACTATCTGGACGTGACTCGTGGCCGTGTGCCCTCTATGGCTTGGCTGAAATCGTGGGTGGATC

GCCTGTGCTTCTACAAGTACAACCAATTCCAGTTGTACATCGAGCATACGTTCCAGTTCAATGGTCTTAG

CGAAGTGTGGCGTGGCGCCGATCCGTTGACTTCGTCCGACATTCTCGAGCTTGATTCCTATTGCGCGGCG

CGTGGCATAGAGCTCGTGCCCTCCGTGTCGACGTTCGGACATCATTACACCGCGCTGCGGACGCGGCAAC

TACGTGATCTGGGAGAGTTTCCGGAGGACGCGGATCGTCCTTTCAGCCTGATCGAGCGAATGACGCACCA

TACGCTCAACATCACCGATGAGCGGTCCTATGAGTTTTCGACATCATTGATCGATGAGCTGATGCCGTTG

TTCCGTTCGCGGAAGTTCAATATCTGCGCCGATGAGACGTTTGATCTCGGCAAGGGGAGGTCGAAGCAGG

AATCGGCGAAACGTGGCGTTGGCGCGATGTATGCCGATTTCGTCGAGCGACTGTGCCGCCATGTTGATGA

TCGTGGGCATGATGTCATGGTGTGGGCCGATGTCGCGCTCGAGCACCCTGAGATCATCGATACGCTTCCC

AAGAACATCACCTGGCTGAATTGGCAGTATGAGCCCAACGTGGATGATGGCACAACGGCAGCTCTCGCCG

ATGCCGGCGCGACGCAGATGGTGTGCCCGGCGGTGTGGTGCTGGAATGCGCTGATTCCGCGGATCGACGA

TGCGTGGAATAACATCACCAGGATGGCGCGCCATGGCCGCGCCCATGATGTTTCGGGGATGCTGGTCACT

GATTGGGGGGATTTCGGACACGTCAACGATCCCCGCATGTCGGTTCCGGGCATGATCTTCGGTGCGCAGC

AATCCTGGAATCCGGATGCCGAGCTCAGCGAAGTCGATATGCTGTCGCGCATATCCACCATCGAATACGG

CGACCATACTGGTAGCGTGGTCGGTGCGCTCAGGGGCGCTTCTGCCAAAGGCGGATTCTCGTGGAGCGAT

CTCGTCACCTATCTGGAACTGGACGACGGCCGTGGCGGATGCAATACGGAGATCGTGCGGGTCATGGGCT

GTCTGGAAGCGTATCGGAATGATTTGCCGCAGTCCGGTCAGGCAAGGTTGGCGGATGCTCGCGTTTCGAT

GCTGCGGACGTTGCGTGACTCCATTCTCGCGGGCCGGGAATTGAACGGCAAGCTTGACGATGCAGCCAAG

GATATCACCCAGCTGCTCCGCGTGGCCGGTGATCCCTCCTCCGCTGCGGTCTGGTCGTTGGCCATCGACG

GTCAGCGTCTGCTGAACCGTGTCGGGTTGGCGTTGTTGGCCGCGCATGGCGTGGTGCGGCAGGATGAGGC

CGGAATCGATGCGGCGAAGCTGGCCGATGAACTGGAATGCTGGACCGAACAGTATTCGAGGCTCTGGCAT

GAGGTCAGTCGGCAGTCGGAACTGGCCCGCATCCAACACGTGGTATGGCGCGCGGCGGACGTGCTGCGTT

CCATTTAGCCGGTTGCGTGGTGACGGGAGCGGCGGTGCGAGCGGGCCTGATGCAAATATGTTAAGGCTGT

TGACAGTGCTGGCTCCCGTACCTATCATGGTTGCGTCCATCTCATAGGTGTGATGGATGCAACCGAAGTC

ATCATCGACTCAAAGGAGAGACAATGAGGAATGTCGCGATGAAGGTGGGTGCTGCGGTATGCGCCGTGGC

CTTGCTGGGTTCGCTGTCTGCGTGTGGCAATAAGAAGTCGACCACGACGGCTGACGGCAAGCCGATTGTG

ACGGTTCTGGTCAAGAAGAACG

Buscamos en GeneBank, lo que nos entrega todo los datos del gen de inters y publicaciones relacionadas. Resulta ser una enzima que codifica para una protena Hidrolasa de la especie Bifidobacterium, Es parte de la microbiota intestinal. El gen Blon_2355 estara relacionado con la degradacin de oligosacridos complejos en la leche humana, que tiene relacin directa con la nutricin esencial en infantes.ProteinaMVQEPTLEWHVIPEPTNVEPLVGTCSLPLSGTVVEQRGADDAEAVFARQLVDDIKRVCGGRWQVASGEVQREVTLRTSPSLDDWSYVLEVSPDGVVITGSGFEGVRDGVQTLRQIIRQIGLTIPCMVIRDRPAFSTRGYYLDVTRGRVPSMAWLKSWVDRLCFYKYNQFQLYIEHTFQFNGLSEVWRGADPLTSSDILELDSYCAARGIELVPSVSTFGHHYTALRTRQLRDLGEFPEDADRPFSLIERMTHHTLNITDERSYEFSTSLIDELMPLFRSRKFNICADETFDLGKGRSKQESAKRGVGAMYADFVERLCRHVDDRGHDVMVWADVALEHPEIIDTLPKNITWLNWQYEPNVDDGTTAALADAGATQMVCPAVWCWNALIPRIDDAWNNITRMARHGRAHDVSGMLVTDWGDFGHVNDPRMSVPGMIFGAQQSWNPDAELSEVDMLSRISTIEYGDHTGSVVGALRGASAKGGFSWSDLVTYLELDDGRGGCNTEIVRVMGCLEAYRNDLPQSGQARLADARVSMLRTLRDSILAGRELNGKLDDAAKDITQLLRVAGDPSSAAVWSLAIDGQRLLNRVGLALLAAHGVVRQDEAGIDAAKLADELECWTEQYSRLWHEVSRQSELARIQHVVWRAADVLRSIFigura.10

Informacin Genebank: Glycoside hydrolase family protein [Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222]

LOCUS NC_011593 1956 bp DNA linear CON 10-JUN-2013DEFINITION Bifidobacterium longum subsp. infantis ATCC 15697 chromosome, complete genome.ACCESSION NC_011593 REGION: complement(2628314..2630269)VERSION NC_011593.1 GI:213690928DBLINK Project: 58677 BioProject: PRJNA58677KEYWORDS RefSeq.SOURCE Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM 20088 ORGANISM Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM 20088 Bacteria; Actinobacteria; Actinobacteridae; Bifidobacteriales; Bifidobacteriaceae; Bifidobacterium.REFERENCE 1 (bases 1 to 1956) AUTHORS Sela,D.A., Chapman,J., Adeuya,A., Kim,J.H., Chen,F., Whitehead,T.R., Lapidus,A., Rokhsar,D.S., Lebrilla,C.B., German,J.B., Price,N.P., Richardson,P.M. and Mills,D.A. TITLE The genome sequence of Bifidobacterium longum subsp. infantis reveals adaptations for milk utilization within the infant microbiome JOURNAL Proc. Natl. Acad. Sci. U.S.A. 105 (48), 18964-18969 (2008) PUBMED 19033196REFERENCE 2 (bases 1 to 1956) CONSRTM NCBI Genome Project TITLE Direct Submission JOURNAL Submitted (21-NOV-2008) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USAREFERENCE 3 (bases 1 to 1956) AUTHORS Lucas,S., Copeland,A., Lapidus,A., Barry,K., Detter,J.C., Glavina del Rio,T., Dalin,E., Tice,H., Goltsman,E., Pitluck,S., Schmutz,J., Larimer,F., Land,M., Hauser,L., Kyrpides,N., Mikhailova,N., Sela,D.A., Chapman,J., Adeuya,A., Kim,J.H., Chen,F., Whitehead,T.R., Rokhsar,D.S., Lebrilla,C.B., German,J.B., Price,N.P., Mills,D.A. and Richardson,P.M. CONSRTM US DOE Joint Genome Institute TITLE Direct Submission JOURNAL Submitted (28-MAY-2008) US DOE Joint Genome Institute, 2800 Mitchell Drive B100, Walnut Creek, CA 94598-1698, USACOMMENT PROVISIONAL REFSEQ: This record has not yet been subject to final NCBI review. The reference sequence was derived from CP001095. URL -- http://www.jgi.doe.gov JGI Project ID: 40002686 Source DNA available from David Mills ([email protected]) Bacteria available from ATCC: ATCC 15697 Contacts: David Mills ([email protected]) David Bruce ([email protected]) Quality assurance done by JGI-Stanford Annotation done by JGI-ORNL and JGI-PGF Finishing done by JGI-PGF Finished microbial genomes have been curated to close all gaps with greater than 98% coverage of at least two independent clones. Each base pair has a minimum q (quality) value of 30 and the total error rate is less than one per 50000. The JGI and collaborators endorse the principles for the distribution and use of large scale sequencing data adopted by the larger genome sequencing community and urge users of this data to follow them. it is our intention to publish the work of this project in a timely fashion and we welcome collaborative interaction on the project and analysis. (http://www.genome.gov/page.cfm?pageID=10506376). COMPLETENESS: full length.FEATURES Location/Qualifiers source 1..1956 /organism="Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM 20088" /mol_type="genomic DNA" /strain="ATCC 15697" /sub_species="infantis" /culture_collection="ATCC:15697" /db_xref="taxon:391904" gene 1..1956 /locus_tag="Blon_2355" /db_xref="GeneID:7054955" CDS 1..1956 /locus_tag="Blon_2355" /note="PFAM: glycoside hydrolase, family 20; KEGG: blo:BL0056 possible beta-hexosaminidase A" /codon_start=1 /transl_table=11 /product="glycoside hydrolase family protein" /protein_id="YP_002323791.1" /db_xref="GI:213693205" /db_xref="InterPro:IPR001540" /db_xref="GeneID:7054955" /translation="MVQEPTLEWHVIPEPTNVEPLVGTCSLPLSGTVVEQRGADDAEA VFARQLVDDIKRVCGGRWQVASGEVQREVTLRTSPSLDDWSYVLEVSPDGVVITGSGF EGVRDGVQTLRQIIRQIGLTIPCMVIRDRPAFSTRGYYLDVTRGRVPSMAWLKSWVDR LCFYKYNQFQLYIEHTFQFNGLSEVWRGADPLTSSDILELDSYCAARGIELVPSVSTF GHHYTALRTRQLRDLGEFPEDADRPFSLIERMTHHTLNITDERSYEFSTSLIDELMPL FRSRKFNICADETFDLGKGRSKQESAKRGVGAMYADFVERLCRHVDDRGHDVMVWADV ALEHPEIIDTLPKNITWLNWQYEPNVDDGTTAALADAGATQMVCPAVWCWNALIPRID DAWNNITRMARHGRAHDVSGMLVTDWGDFGHVNDPRMSVPGMIFGAQQSWNPDAELSE VDMLSRISTIEYGDHTGSVVGALRGASAKGGFSWSDLVTYLELDDGRGGCNTEIVRVM GCLEAYRNDLPQSGQARLADARVSMLRTLRDSILAGRELNGKLDDAAKDITQLLRVAG DPSSAAVWSLAIDGQRLLNRVGLALLAAHGVVRQDEAGIDAAKLADELECWTEQYSRL WHEVSRQSELARIQHVVWRAADVLRSI"ORIGIN 1 atggtgcagg aaccaacatt ggaatggcat gtcataccgg agccgacgaa tgtcgagccg 61 ctggtgggaa catgctcgtt gccgttgtcg ggaacggttg tggagcaacg aggtgcggat 121 gatgcggagg ccgtgtttgc gcgtcagctt gtcgacgaca ttaagcgcgt gtgcggaggc 181 cgctggcagg tggcctccgg agaggttcag cgggaggtga ctttgcggac cagtccttcg 241 ctcgatgact ggtcgtacgt gcttgaggtc tcgccggacg gcgttgtgat cactggttcg 301 gggttcgaag gcgttcgcga tggcgtgcag acattgcgtc agattattcg ccagattggt 361 ttgacgatac cgtgcatggt catcagggat cggccggcgt tctcgacccg cggttactat 421 ctggacgtga ctcgtggccg tgtgccctct atggcttggc tgaaatcgtg ggtggatcgc 481 ctgtgcttct acaagtacaa ccaattccag ttgtacatcg agcatacgtt ccagttcaat 541 ggtcttagcg aagtgtggcg tggcgccgat ccgttgactt cgtccgacat tctcgagctt 601 gattcctatt gcgcggcgcg tggcatagag ctcgtgccct ccgtgtcgac gttcggacat 661 cattacaccg cgctgcggac gcggcaacta cgtgatctgg gagagtttcc ggaggacgcg 721 gatcgtcctt tcagcctgat cgagcgaatg acgcaccata cgctcaacat caccgatgag 781 cggtcctatg agttttcgac atcattgatc gatgagctga tgccgttgtt ccgttcgcgg 841 aagttcaata tctgcgccga tgagacgttt gatctcggca aggggaggtc gaagcaggaa 901 tcggcgaaac gtggcgttgg cgcgatgtat gccgatttcg tcgagcgact gtgccgccat 961 gttgatgatc gtgggcatga tgtcatggtg tgggccgatg tcgcgctcga gcaccctgag 1021 atcatcgata cgcttcccaa gaacatcacc tggctgaatt ggcagtatga gcccaacgtg 1081 gatgatggca caacggcagc tctcgccgat gccggcgcga cgcagatggt gtgcccggcg 1141 gtgtggtgct ggaatgcgct gattccgcgg atcgacgatg cgtggaataa catcaccagg 1201 atggcgcgcc atggccgcgc ccatgatgtt tcggggatgc tggtcactga ttggggggat 1261 ttcggacacg tcaacgatcc ccgcatgtcg gttccgggca tgatcttcgg tgcgcagcaa 1321 tcctggaatc cggatgccga gctcagcgaa gtcgatatgc tgtcgcgcat atccaccatc 1381 gaatacggcg accatactgg tagcgtggtc ggtgcgctca ggggcgcttc tgccaaaggc 1441 ggattctcgt ggagcgatct cgtcacctat ctggaactgg acgacggccg tggcggatgc 1501 aatacggaga tcgtgcgggt catgggctgt ctggaagcgt atcggaatga tttgccgcag 1561 tccggtcagg caaggttggc ggatgctcgc gtttcgatgc tgcggacgtt gcgtgactcc 1621 attctcgcgg gccgggaatt gaacggcaag cttgacgatg cagccaagga tatcacccag 1681 ctgctccgcg tggccggtga tccctcctcc gctgcggtct ggtcgttggc catcgacggt 1741 cagcgtctgc tgaaccgtgt cgggttggcg ttgttggccg cgcatggcgt ggtgcggcag 1801 gatgaggccg gaatcgatgc ggcgaagctg gccgatgaac tggaatgctg gaccgaacag 1861 tattcgaggc tctggcatga ggtcagtcgg cagtcggaac tggcccgcat ccaacacgtg 1921 gtatggcgcg cggcggacgt gctgcgttcc atttag

d) Usando Bioedit alineamos las secuencias encontrada usando la base de datos de NCBI (Importando el archivo Fasta de la secuencia del Gen completo), con la que obtuvimos secuenciando con los primers.

Viendo el alineamiento notamos que no es exacto para cada base por lo que no podemos asegurar que el gen este perfectamente secuenciado.

Pregunta 2

a) En la siguiente tabla se muestran los valores RPKM calculados segn la siguiente formula:

Donde se toma el nmero total de secuencias como la suma de todas las secuencias que alinean en el genoma completo de 58 genes. Con lo que se obtiene la siguiente tabla:

Genoma

RPKM medio rico

RPKM pH3.0

RPKM sal 0.5 M

RPKM Redox -300mV

Gen1

1024,60

339,65

423,99

3892,25

Gen2

3232,79

3016,88

3174,89

3177,28

Gen3

1328,83

1898,65

1271,03

18142,39

Gen4

951,49

1467,03

778,33

14641,01

Gen5

460,45

1593,80

925,15

12883,60

Gen6

160,30

1222,37

1301,01

3467,74

Gen7

925,28

737,77

1161,22

8407,49

Gen8

3188,26

1396,67

1525,45

8360,17

Gen9

8329,26

1929,68

2008,95

1911,88

Gen10

965,37

347,18

457,70

3965,38

Gen11

1496,17

710,50

749,85

6796,32

Gen12

2183,18

1051,39

1452,25

642,26

Gen13

3722,84

1911,63

2708,29

1260,37

Gen14

2344,52

930,13

1381,42

472,84

Gen15

1734,43

6319,77

9969,17

468,61

Gen16

9329,66

5046,36

5008,70

1521,87

Gen17

21924,89

82755,41

133694,92

6412,46

Gen18

16944,22

91720,78

142307,82

6329,62

Gen19

878,79

5186,00

7094,86

5565,26

Gen20

61554,77

41614,86

30201,55

63398,65

Gen21

61174,78

17823,52

12512,87

20931,98

Gen22

41304,08

8670,38

4554,72

19238,74

Gen23

34767,30

6848,76

9057,16

17732,60

Gen24

43556,93

14962,64

16038,03

17410,62

Gen25

1977,32

2070,93

1919,81

8084,35

Gen26

824,12

1406,16

662,31

10531,46

Gen27

737,59

1434,23

849,38

14603,96

Gen28

1146,91

1921,27

1153,27

18140,73

Gen29

1242,62

2622,67

710,14

99926,90

Gen30

1756,45

905,74

452,39

28438,43

Gen31

966,32

517,65

199,25

37081,73

Gen32

446,30

1828,93

221,34

82758,57

Gen33

769,68

2409,76

466,15

81700,68

Gen34

7241,89

3635,27

3909,51

1954,95

Gen35

3239,76

825,68

1225,21

722,61

Gen36

47071,91

16301,41

12674,67

31794,19

Gen37

28826,98

33971,87

19745,09

7548,98

Gen38

23578,66

34706,19

16604,73

6511,98

Gen39

17787,09

19473,71

14620,75

3691,76

Gen40

31532,59

21576,76

17660,57

5594,83

Gen41

42425,76

41418,57

37828,40

7407,91

Gen42

36881,08

37239,68

32540,36

6405,41

Gen43

4011,23

8731,98

10803,56

1075,16

Gen44

11693,16

24942,49

37037,93

3552,65

Gen45

10457,53

27498,58

40201,54

4720,88

Gen46

13127,67

46490,01

41070,61

5527,39

Gen47

11341,09

24562,88

36244,20

3642,01

Gen48

10026,53

27514,19

40314,10

4417,02

Gen49

6101,78

41461,86

24111,38

3570,16

Gen50

2228,01

4018,16

3207,82

1860,17

Gen51

2050,28

4807,82

4269,11

2315,97

Gen52

3156,26

3439,36

3448,99

3436,61

Gen53

1177,56

1627,93

2901,70

2919,88

Gen54

1939,88

2560,70

3786,66

3131,95

Gen55

1935,37

726,72

680,49

1252,03

Gen56

4578,59

1595,46

2029,48

5677,82

Gen57

4119,45

1307,68

2139,59

6757,81

Gen58

34693,33

26050,59

24659,10

56221,17

b) Tomando intervalos de a 1000 obtenemos los siguientes cuatro histogramas para cada condicin y sus respectivos valores RPKM:

c) Luego hacemos el Heat map de los RPKM para cada medio, donde la escala de rojos representa los valores ms pequeos y la de verdes los ms grandes:

Genoma

RPKM medio rico

RPKM pH3.0

RPKM sal 0.5 M

RPKM Redox -300mV

Gen1

1024,60

339,65

423,99

3892,25

Gen2

3232,79

3016,88

3174,89

3177,28

Gen3

1328,83

1898,65

1271,03

18142,39

Gen4

951,49

1467,03

778,33

14641,01

Gen5

460,45

1593,80

925,15

12883,60

Gen6

160,30

1222,37

1301,01

3467,74

Gen7

925,28

737,77

1161,22

8407,49

Gen8

3188,26

1396,67

1525,45

8360,17

Gen9

8329,26

1929,68

2008,95

1911,88

Gen10

965,37

347,18

457,70

3965,38

Gen11

1496,17

710,50

749,85

6796,32

Gen12

2183,18

1051,39

1452,25

642,26

Gen13

3722,84

1911,63

2708,29

1260,37

Gen14

2344,52

930,13

1381,42

472,84

Gen15

1734,43

6319,77

9969,17

468,61

Gen16

9329,66

5046,36

5008,70

1521,87

Gen17

21924,89

82755,41

133694,92

6412,46

Gen18

16944,22

91720,78

142307,82

6329,62

Gen19

878,79

5186,00

7094,86

5565,26

Gen20

61554,77

41614,86

30201,55

63398,65

Gen21

61174,78

17823,52

12512,87

20931,98

Gen22

41304,08

8670,38

4554,72

19238,74

Gen23

34767,30

6848,76

9057,16

17732,60

Gen24

43556,93

14962,64

16038,03

17410,62

Gen25

1977,32

2070,93

1919,81

8084,35

Gen26

824,12

1406,16

662,31

10531,46

Gen27

737,59

1434,23

849,38

14603,96

Gen28

1146,91

1921,27

1153,27

18140,73

Gen29

1242,62

2622,67

710,14

99926,90

Gen30

1756,45

905,74

452,39

28438,43

Gen31

966,32

517,65

199,25

37081,73

Gen32

446,30

1828,93

221,34

82758,57

Gen33

769,68

2409,76

466,15

81700,68

Gen34

7241,89

3635,27

3909,51

1954,95

Gen35

3239,76

825,68

1225,21

722,61

Gen36

47071,91

16301,41

12674,67

31794,19

Gen37

28826,98

33971,87

19745,09

7548,98

Gen38

23578,66

34706,19

16604,73

6511,98

Gen39

17787,09

19473,71

14620,75

3691,76

Gen40

31532,59

21576,76

17660,57

5594,83

Gen41

42425,76

41418,57

37828,40

7407,91

Gen42

36881,08

37239,68

32540,36

6405,41

Gen43

4011,23

8731,98

10803,56

1075,16

Gen44

11693,16

24942,49

37037,93

3552,65

Gen45

10457,53

27498,58

40201,54

4720,88

Gen46

13127,67

46490,01

41070,61

5527,39

Gen47

11341,09

24562,88

36244,20

3642,01

Gen48

10026,53

27514,19

40314,10

4417,02

Gen49

6101,78

41461,86

24111,38

3570,16

Gen50

2228,01

4018,16

3207,82

1860,17

Gen51

2050,28

4807,82

4269,11

2315,97

Gen52

3156,26

3439,36

3448,99

3436,61

Gen53

1177,56

1627,93

2901,70

2919,88

Gen54

1939,88

2560,70

3786,66

3131,95

Gen55

1935,37

726,72

680,49

1252,03

Gen56

4578,59

1595,46

2029,48

5677,82

Gen57

4119,45

1307,68

2139,59

6757,81

Gen58

34693,33

26050,59

24659,10

56221,17

d) Gracias al heat map es fcil ver cuales genes son candidatos a ser genes constitutivos, ya que veremos los valores de sus respectivos RPKM en cada medio y estos debieran estar en una misma tonalidad de color. Con esto vemos que hay solo2 genes constitutivos y son el gen 2 y el 52:

Gen2

3232,79

3016,88

3174,89

3177,28

Gen52

3156,26

3439,36

3448,99

3436,61

Luego para saber que genes estn fuertemente inducidos o reprimidos (ms de 4 veces la condicin basal), o sin cambio, programamos una macros en Excel y obtenemos la siguiente tabla.:

Genoma

RPKM pH3.0

RPKM sal 0.5 M

RPKM Redox -300mV

Gen1

Reprimido

Reprimido

Inducido

Gen2

Constitutivo

Constitutivo

Constitutivo

Gen3

Inducido

Sin cambio

Fuertemente Inducido

Gen4

Inducido

Reprimido

Fuertemente Inducido

Gen5

Inducido

Inducido

Fuertemente Inducido

Gen6

Fuertemente Inducido

Fuertemente Inducido

Fuertemente Inducido

Gen7

Reprimido

Inducido

Fuertemente Inducido

Gen8

Reprimido

Reprimido

Inducido

Gen9

Reprimido

Reprimido

Reprimido

Gen10

Reprimido

Reprimido

Inducido

Gen11

Reprimido

Reprimido

Fuertemente Inducido

Gen12

Reprimido

Reprimido

Reprimido

Gen13

Reprimido

Reprimido

Reprimido

Gen14

Reprimido

Reprimido

Reprimido

Gen15

Inducido

Fuertemente Inducido

Reprimido

Gen16

Reprimido

Reprimido

Reprimido

Gen17

Inducido

Fuertemente Inducido

Reprimido

Gen18

Fuertemente Inducido

Fuertemente Inducido

Reprimido

Gen19

Fuertemente Inducido

Fuertemente Inducido

Fuertemente Inducido

Gen20

Reprimido

Reprimido

Sin cambio

Gen21

Reprimido

Reprimido

Reprimido

Gen22

Reprimido

Reprimido

Reprimido

Gen23

Reprimido

Reprimido

Reprimido

Gen24

Reprimido

Reprimido

Reprimido

Gen25

Sin cambio

Sin cambio

Inducido

Gen26

Inducido

Reprimido

Fuertemente Inducido

Gen27

Inducido

Inducido

Fuertemente Inducido

Gen28

Inducido

Sin cambio

Fuertemente Inducido

Gen29

Inducido

Reprimido

Fuertemente Inducido

Gen30

Reprimido

Reprimido

Fuertemente Inducido

Gen31

Reprimido

Reprimido

Fuertemente Inducido

Gen32

Inducido

Reprimido

Fuertemente Inducido

Gen33

Inducido

Reprimido

Fuertemente Inducido

Gen34

Reprimido

Reprimido

Reprimido

Gen35

Reprimido

Reprimido

Reprimido

Gen36

Reprimido

Reprimido

Reprimido

Gen37

Inducido

Reprimido

Reprimido

Gen38

Inducido

Reprimido

Reprimido

Gen39

Sin cambio

Reprimido

Reprimido

Gen40

Reprimido

Reprimido

Reprimido

Gen41

Sin cambio

Reprimido

Reprimido

Gen42

Sin cambio

Reprimido

Reprimido

Gen43

Inducido

Inducido

Reprimido

Gen44

Inducido

Inducido

Reprimido

Gen45

Inducido

Inducido

Reprimido

Gen46

Inducido

Inducido

Reprimido

Gen47

Inducido

Inducido

Reprimido

Gen48

Inducido

Inducido

Reprimido

Gen49

Fuertemente Inducido

Inducido

Reprimido

Gen50

Inducido

Inducido

Reprimido

Gen51

Inducido

Inducido

Inducido

Gen52

Constitutivo

Constitutivo

Constitutivo

Gen53

Inducido

Inducido

Inducido

Gen54

Inducido

Inducido

Inducido

Gen55

Reprimido

Reprimido

Reprimido

Gen56

Reprimido

Reprimido

Inducido

Gen57

Reprimido

Reprimido

Inducido

Gen58

Reprimido

Reprimido

Inducido

Pregunta 3

Figura 1: rbol filogentico.

A partir de la informacin entregada por el rbol podemos ver que s existe una relacin entre la distancia filogentica y la tincin gram del set de bacterias entregado. Esto se ve claramente ya que el rbol filogentico agrupa en nodos diferentes, dejando a las bacterias gram negativas en el grupo de arriba, mientras que a las gram positivas en el grupo del medio (hay un outlier) como se puede ver en la figura 2. Dems est decir que que las bacterias en un mismo grupo estn ms cercanas respecto a las bacterias en los otros grupos.

Figura 2: rbol filogentico indicando la separacin en grupos de las bacterias gram positivas y gram negativas.

Finalmente, se adjunta los clculos de la matriz de distancias, que corrobora la informacin entregada por el rbol.

Ralstonia_ 0.0000 0.2810 0.2832 0.3293 0.3879 0.3328 0.3107 0.2238

0.3013 0.2245 0.3081 0.2999 0.2109 0.2217 0.3420 0.3112 0.2548

0.2912 0.2347 0.2018 0.3123 0.2832

Clostridiu 0.2810 0.0000 0.2655 0.2938 0.3226 0.2183 0.1990 0.2732

0.2017 0.2804 0.2098 0.1909 0.2642 0.2864 0.2357 0.3028 0.2591

0.2606 0.2954 0.2460 0.2577 0.2655

Prochloroc 0.2832 0.2655 0.0000 0.3000 0.3542 0.2667 0.2572 0.2821

0.2530 0.2793 0.2595 0.2427 0.2701 0.2727 0.2808 0.2741 0.2820

0.3043 0.2955 0.2598 0.2887 0.0000

Bifidobact 0.3293 0.2938 0.3000 0.0000 0.3613 0.3207 0.3084 0.3068

0.3017 0.3147 0.2898 0.2633 0.2969 0.3262 0.3138 0.3418 0.3266

0.3346 0.3313 0.3089 0.1775 0.3000

Bacteroide 0.3879 0.3226 0.3542 0.3613 0.0000 0.3731 0.3605 0.3696

0.3889 0.3944 0.4034 0.3801 0.3815 0.3568 0.3962 0.3862 0.3684

0.3586 0.3853 0.3526 0.3568 0.3542

Lactococcu 0.3328 0.2183 0.2667 0.3207 0.3731 0.0000 0.1172 0.3007

0.1803 0.3137 0.1960 0.1817 0.2898 0.2945 0.1661 0.3078 0.2826

0.2917 0.3356 0.2634 0.2796 0.2667

Streptococ 0.3107 0.1990 0.2572 0.3084 0.3605 0.1172 0.0000 0.2897

0.1605 0.2961 0.1857 0.1707 0.3091 0.3081 0.1748 0.3157 0.2745

0.2989 0.3351 0.2773 0.2739 0.2572

Salmonella 0.2238 0.2732 0.2821 0.3068 0.3696 0.3007 0.2897 0.0000

0.2864 0.0358 0.2920 0.2953 0.1883 0.0995 0.3135 0.2976 0.2812

0.3067 0.1431 0.1572 0.2837 0.2821

Listeria_m 0.3013 0.2017 0.2530 0.3017 0.3889 0.1803 0.1605 0.2864

0.0000 0.2918 0.1041 0.0915 0.2837 0.2884 0.1539 0.2994 0.2964

0.2870 0.3167 0.2560 0.2662 0.2530

Enterobact 0.2245 0.2804 0.2793 0.3147 0.3944 0.3137 0.2961 0.0358

0.2918 0.0000 0.2871 0.2976 0.2038 0.0974 0.3064 0.2955 0.2790

0.3017 0.1395 0.1725 0.2819 0.2793

Staphyloco 0.3081 0.2098 0.2595 0.2898 0.4034 0.1960 0.1857 0.2920

0.1041 0.2871 0.0000 0.0861 0.3059 0.2913 0.1598 0.2914 0.2811

0.2897 0.3214 0.2609 0.2548 0.2595

Bacillus_s 0.2999 0.1909 0.2427 0.2633 0.3801 0.1817 0.1707 0.2953

0.0915 0.2976 0.0861 0.0000 0.2801 0.2949 0.1499 0.3134 0.2753

0.2889 0.3165 0.2492 0.2342 0.2427

Acidithiob 0.2109 0.2642 0.2701 0.2969 0.3815 0.2898 0.3091 0.1883

0.2837 0.2038 0.3059 0.2801 0.0000 0.2076 0.3176 0.3003 0.2740

0.2797 0.2196 0.1795 0.2717 0.2701

Vibrio_vul 0.2217 0.2864 0.2727 0.3262 0.3568 0.2945 0.3081 0.0995

0.2884 0.0974 0.2913 0.2949 0.2076 0.0000 0.3100 0.3191 0.2695

0.2968 0.1615 0.1579 0.2812 0.2727

Lactobacil 0.3420 0.2357 0.2808 0.3138 0.3962 0.1661 0.1748 0.3135

0.1539 0.3064 0.1598 0.1499 0.3176 0.3100 0.0000 0.3293 0.2972

0.3193 0.3517 0.2878 0.2677 0.2808

Campylobac 0.3112 0.3028 0.2741 0.3418 0.3862 0.3078 0.3157 0.2976

0.2994 0.2955 0.2914 0.3134 0.3003 0.3191 0.3293 0.0000 0.2917

0.1566 0.3257 0.2765 0.3112 0.2741

Bdellovibr 0.2548 0.2591 0.2820 0.3266 0.3684 0.2826 0.2745 0.2812

0.2964 0.2790 0.2811 0.2753 0.2740 0.2695 0.2972 0.2917 0.0000

0.2962 0.3019 0.2697 0.2935 0.2820

Helicobact 0.2912 0.2606 0.3043 0.3346 0.3586 0.2917 0.2989 0.3067

0.2870 0.3017 0.2897 0.2889 0.2797 0.2968 0.3193 0.1566 0.2962

0.0000 0.3105 0.2714 0.3046 0.3043

Pasteurell 0.2347 0.2954 0.2955 0.3313 0.3853 0.3356 0.3351 0.1431

0.3167 0.1395 0.3214 0.3165 0.2196 0.1615 0.3517 0.3257 0.3019

0.3105 0.0000 0.2119 0.3109 0.2955

Pseudomona 0.2018 0.2460 0.2598 0.3089 0.3526 0.2634 0.2773 0.1572

0.2560 0.1725 0.2609 0.2492 0.1795 0.1579 0.2878 0.2765 0.2697

0.2714 0.2119 0.0000 0.2798 0.2598

Streptomyc 0.3123 0.2577 0.2887 0.1775 0.3568 0.2796 0.2739 0.2837

0.2662 0.2819 0.2548 0.2342 0.2717 0.2812 0.2677 0.3112 0.2935

0.3046 0.3109 0.2798 0.0000 0.2887

Prochloro2 0.2832 0.2655 0.0000 0.3000 0.3542 0.2667 0.2572 0.2821

0.2530 0.2793 0.2595 0.2427 0.2701 0.2727 0.2808 0.2741 0.2820

0.3043 0.2955 0.2598 0.2887 0.0000

Medio Rico

Frecuencia50015002500350045005500650075008500950010500115001250013500145001550016500175001850019500205002150022500235002450025500265002750028500295003050031500325003350034500355003650037500385003950040500415004250043500445004550046500475004850049500505005150052500535005450055500565005750058500595006050061500More3149431111121110001100010100001001002010001101001000000000000011

Rango

Frecuencia

RPKM pH3.0

Frecuencia50015002500350045005500650075008500950010500115001250013500145001550016500175001850019500205002150022500235002450025500265002750028500295003050031500325003350034500355003650037500385003950040500415004250043500445004550046500475004850049500505005150052500535005450055500565005750058500595006050061500625006350064500655006650067500685006950070500715007250073500745007550076500775007850079500805008150082500835008450085500865008750088500895009050091500More21410423110200000110110010021110000011010002100010000000000000000000000000000000000001000000001

Rango

Frecuencia

RPKM sal 0.5 M

Frecuencia500150025003500450055006500750085009500105001150012500135001450015500165001750018500195002050021500225002350024500255002650027500285002950030500315003250033500345003550036500375003850039500405004150042500435004450045500465004750048500495005050051500525005350054500555005650057500585005950060500615006250063500645006550066500675006850069500705007150072500735007450075500765007750078500795008050081500825008350084500855008650087500885008950090500915009250093500945009550096500975009850099500100500101500102500103500104500105500106500107500108500109500110500111500112500113500114500115500116500117500118500119500120500121500122500123500124500125500126500127500128500129500130500131500132500133500134500135500136500137500138500139500140500141500142500More6145532010111020111101000110000100100111021000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001000000010

Rango

Frecuencia

RPKM Redox -300mV

Frecuencia500150025003500450055006500750085009500105001150012500135001450015500165001750018500195002050021500225002350024500255002650027500285002950030500315003250033500345003550036500375003850039500405004150042500435004450045500465004750048500495005050051500525005350054500555005650057500585005950060500615006250063500645006550066500675006850069500705007150072500735007450075500765007750078500795008050081500825008350084500855008650087500885008950090500915009250093500945009550096500975009850099500More25557174400101020131010000001000100001000000000000000000100000010000000000000000001100000000000000001

Rango

Frecuencia