106
i

ESCHERICHIA - Université de Sherbrooke

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ESCHERICHIA - Université de Sherbrooke

i

Page 2: ESCHERICHIA - Université de Sherbrooke

ii

ÉTUDE DE GÉNOMIQUE COMPARATIVE D’ISOLATS ESCHERICHIA SPP. PROVENANT D’ANIMAUX DE

FERME

par

Catherine Lefebvre García

mémoire présenté au Département de biologie en vue

de l’obtention du grade de maître ès sciences (M.Sc.)

FACULTÉ DES SCIENCES

UNIVERSITÉ DE SHERBROOKE

Sherbrooke, Québec, Canada, 19 janvier 2016

Page 3: ESCHERICHIA - Université de Sherbrooke

iii

Le 19 janvier 2016

le jury a accepté le mémoire de Madame Catherine Lefebvre García

dans sa version finale.

Membres du jury

Professeur François Malouin

Directeur de recherche

Département de biologie

Professeur Sébastien Rodrigue

Évaluateur interne

Département de biologie

Professeur Pierre-Étienne Jacques

Président-rapporteur

Département de biologie

Page 4: ESCHERICHIA - Université de Sherbrooke

iv

SOMMAIRE

Escherichia coli possède une grande plasticité génomique comme en témoigne la diversité des

souches à l’intérieur de cette espèce bactérienne. Bien que la majorité des souches soient

inoffensives ou à tout le moins opportunistes, plusieurs ont acquis des facteurs de virulence

spécifiques leur procurant un pouvoir pathogénique. Les souches pathogènes comme E. coli

O157 :H7 sont responsables de cas de morbidité, mortalité et pertes économiques importantes

dans l’industrie agro-alimentaire dans le monde entier. L’évolution bactérienne est un

mécanisme continuel qui se fait via l’échange d’éléments génétiques mobiles, de mutations

ponctuelles et autres réarrangements génétiques. Ces changements génétiques peuvent

procurer des avantages sélectifs permettant une adaptation bactérienne rapide face aux stress et

changements environnementaux et favorisant le développement de pathogènes émergents.

Dans la première partie de ce projet, nous avons étudié la région intergénique mutS-rpoS, qui

est une des plus grandes sources de polymorphisme chromosomique chez les entérobactéries.

Notre analyse génomique comparative a permis de confirmer le polymorphisme à l’intérieur

même d’un ensemble de souches Escherichia spp., Salmonella spp. et Shigella spp. De plus,

nous avons pu confirmer que certains types de polymorphismes dans la région mutS-rpoS

étaient fortement associés à certains types de pathogènes chez E. coli. Dans notre analyse,

nous avons ressorti un groupe de gènes à l’intérieur de la région mutS-rpoS qui pourraient

sevir comme marqueur chromosomique intéressant pour les E. coli extra-intestinaux (ExPEC),

un groupe comprennant des souches hautement pathogènes et difficiles à définir par les tests

actuelllement disponibles. Dans notre analyse bio-informatique, nous avons isolé ce groupe de

gènes associé aux ExPEC et nous l’avons caractérisé in sillico. Nous avons également inclus

dans l’analyse deux souches hypermutables du genre Escherichia spp. de notre collection,

isolées d’animaux de ferme. L’hypermutabilité ou la capacité d’acquérir des mutations plus

rapidement que la normale accélère le processus d’évolution et la capacité d’adaptation de ces

souches. La région mutS-rpoS est reliée au système de réparation de l’ADN bactérien

(MMRS) et pourrait être impliquée dans l’apparition du phénotype d’hypermutabilité. Durant

Page 5: ESCHERICHIA - Université de Sherbrooke

v

les dernières années, de plus en plus d’espèces du genre Escherichia ont été isolées de cas

cliniques d’animaux et d’humains. Ces souches atypiques ont un potentiel de virulence très

élevé, des combinaisons de gènes de virulence et des variants génétiques différents des

souches typiques, et certaines souches ont même évolué en tant que pathogènes. Les souches

de l’espèce E. albertii ont été isolées récemment et ont un grand potentiel de virulence autant

chez les humains que chez les oiseaux. Ces souches sont souvent confondues avec d’autres

organismes pathogènes comme E. coli dans les tests biochimiques, et le manque de

connaissances sur E. albertii rend son identification difficile. Dans la deuxième partie de ce

projet, nous avons identifié des gènes spécifiques aux souches d’E. albertii ainsi que des gènes

de virulence présents chez E. albertii par comparaisons génomiques, ce qui a permis de

développer et optimiser un test PCR (réaction en chaîne par polymérase) visant l’identification

génomique rapide et fiable d’E. albertii.

Mots clés : Enterobacteriaceae/Escherichia albertii/Methyl-directed mismatch repair system

(MMRS)/mutS-rpoS/organisme pathogène émergent

Page 6: ESCHERICHIA - Université de Sherbrooke

vi

REMERCIEMENTS

La réalisation de ce mémoire a été possible grâce au concours de plusieurs personnes à qui je

voudrais témoigner ma gratitude.

Tout d’abord, un merci spécial à mon directeur de recherche, Pr François Malouin de m’avoir

permis d’effectuer mon projet de maîtrise dans son laboratoire et de son grand dévouement

tout au long de mes études graduées. Merci aux organismes qui ont permis de soutenir le

projet: l’Université de Sherbrooke, le NSERC/CRSNG et Agriculture et Agroalimentaire

Canada (AAFC-AAC). Un gros merci à tous les membres du laboratoire que j’ai côtoyés. Un

merci particulier à mon collègue Rolland Jr. Vaillancourt; à Céline Ster, assistante de

recherche au laboratoire et au Pr Moussa S. Diarra (Guelph Food Research Center, AAFC-

AAC) pour leur soutien technique dans mes projets de recherche et les corrections du

mémoire. Merci également à mes deux conseillers de recherche : Pr Pierre-Étienne Jacques et

Pr Sébastien Rodrigue ainsi que Pr Vincent Burrus et les membres de leurs laboratoires qui

m’ont apporté de l’aide au niveau des analyses bio-informatiques et de mutagénèse. Je

remercie plus particulièrement mes parents Hélène Lefebvre et Luis Angel García Herrero

ainsi que mon frère Samuel Lefebvre García pour le amour inestimable, leur encouragement et

leur soutien tout au long de mes études.

Page 7: ESCHERICHIA - Université de Sherbrooke

vii

TABLE DES MATIERES

SOMMAIRE ........................................................................................................................... IV

REMERCIEMENTS .............................................................................................................. VI

TABLE DES MATIERES .................................................................................................... VII

LISTE DES ABREVIATIONS ................................................................................................ X

LISTE DES FIGURES ......................................................................................................... XIII

CHAPITRE 1 ............................................................................................................................. 1

INTRODUCTION ..................................................................................................................... 1

1.1. Escherichia coli .......................................................................................................... 1

1.1.1. Les virotypes intestinaux ........................................................................ 1

1.1.2. Les virotypes extra-intestinaux .............................................................. 6

1.2. Le mécanismes évolutifs ........................................................................................... 8

1.3. Les mutations ........................................................................................................... 15

1.3.1. L’hypermutabilité ................................................................................. 15

1.3.2. Les gènes mutateurs .............................................................................. 16

1.4. Le système de réparation de l’ADN: le MMRS .................................................... 17

1.4.1. La région mutS-rpoS ............................................................................. 19

1.5. Souches atypiques et l’émergence de souches pathogènes .................................. 20

1.5.1. E. albertii ................................................................................................ 23

1.6. Objectifs et hypothèses ........................................................................................... 24

1.6.1. Objetif 1 : Projet MMRS ...................................................................... 24

1.6.2. Objectif 2 : E. albertii ............................................................................ 25

CHAPITRE 2 ........................................................................................................................... 26

Page 8: ESCHERICHIA - Université de Sherbrooke

viii

CHARACTERIZATION OF THE MUTS-RPOS REGIONS IN ESCHERICHIA,

SHIGELLA AND SALMONELLA AND IDENTIFICATION OF MOLECULAR

MARKERS FOR EXTRA-INTESTINAL E. COLI (EXPEC) ............................................ 26

2.1. Introduction du premier article ............................................................................. 26

2.2. Résumé du premier article ..................................................................................... 27

2.3. Premier article ......................................................................................................... 28

ABSTRACT ..................................................................................................... 29

MATERIALS AND METHODS ................................................................... 32

RESULTS ........................................................................................................ 34

DISCUSSION .................................................................................................. 42

CONCLUSION ............................................................................................... 48

ACKNOWLEDGEMENTS ........................................................................... 48

REFERENCES ................................................................................................ 48

CHAPITRE 3 ........................................................................................................................... 54

MULTIPLEX PCR METHODS FOR SPECIFIC DETECTION OF ESCHERICHIA

ALBERTII STRAINS .............................................................................................................. 54

3.1. Introduction du deuxième article .......................................................................... 54

3.2. Résumé du deuxième article ................................................................................... 55

3.3. Deuxième article ...................................................................................................... 56

ABSTRACT ..................................................................................................... 57

INTRODUCTION ........................................................................................... 58

MATERIALS AND METHODS ................................................................... 61

RESULTS ........................................................................................................ 65

DISCUSSION .................................................................................................. 71

Page 9: ESCHERICHIA - Université de Sherbrooke

ix

CONCLUSION ............................................................................................... 73

ACKNOWLEDGEMENTS ........................................................................... 74

REFERENCES ................................................................................................ 74

CHAPITRE 4 ........................................................................................................................... 78

DISCUSSION ET CONCLUSION ........................................................................................ 78

4.1. Le MMRS et la région mutS-rpoS .......................................................................... 78

4.2. E. albertii, une souche pathogène émergente ........................................................ 82

4.3. Conclusion générale ................................................................................................ 83

BIBLIOGRAPHIE .................................................................................................................. 84

Page 10: ESCHERICHIA - Université de Sherbrooke

x

LISTE DES ABREVIATIONS

AAF Fimbriae d’adhérence aggrégative

aEPEC EPEC atypique

ADN Acide désoxyribonucléique

APEC E. coli pathogénique aviaire

AEEC E. coli de type attachant et effaçant

A/E Attachement/Effacement

Aggr Activateur de trascription du fimbriae d’adhérence I d’EAEC

AIEC E. coli adhérent invasif

AMP Adénosine monophosphate

ARN Acide ribonuléique

ARNt ARN de transfert

ATP Adénosine triphosphate

BFP Bundle forming pili

cGMP Guanosine monophosphate cyclique

CTDB Toxine cytholéthale B (Cytolethal distending toxin B)

Ctx Toxine cholérique

DAEC E. coli à adhérence diffuse

EAEC E. coli entéroaggrégatif

EAST1 Entérotoxine 1 stable à la chaleur d’EAEC

Eae Intimine

EAF E. coli adherence factor (plasmide)

EHEC E. coli entérohémorragique

EIEC E. coli entéroinvasif

EPEC E. coli entéropathogène

Esp Protéines sécrétées chez E. coli

ETEC E. coli entérotoxigénique

Page 11: ESCHERICHIA - Université de Sherbrooke

xi

ExPEC E. coli pathogène extra-intestinal

FMN Flavine mononucléotide

Hly Hémolysine

Inv Invasion

IS Séquence d’insertion

LEE Locus d’effacement des entérocytes

LT Entérotoxine thermolabile (heat-labile)

MAEC E. coli causant des méningites

MLST Multilocus sequence typing

MMRS Système de réparation des mésappariements dans l’ADN

(Méthyl-directed mismatch Repair System)

NMEC E. coli causant des méningites néonatales

ORF Phase ouverte de lecture (Open reading frames)

PAI Îlot de pathogénicité

PCR Réaction en chaîne par polymérase

ShET1 Entérotoxine 1 de Shigella

SHU/HUS Syndrome hémolytique urémique

SNP Polymorphisme d’un seul nucléotide

SSB Protéine de liaison à l’ADN simple brin

ST Entérotoxine stable à la chaleur (heat-stable)

STEC E. coli producteur de toxines shiga-like

SST3 Système de sécrétion de type III

Stx Toxine shiga

tEPEC EPEC typique

tir Translocated intimin receptor

Tn Transposon

Tsh Hémagglutinine thermosensible

ufc/cfu Unités formatrices de colonies

UPEC E. coli pathogénique causant infections urinaires (uropathogène)

Page 12: ESCHERICHIA - Université de Sherbrooke

xii

UTI Infections du tractus urinaire

Vtx Vérocytotoxine

Page 13: ESCHERICHIA - Université de Sherbrooke

xiii

LISTE DES FIGURES

1. Les relations entre les virotypes humains chez E. coli ..................................................... 8

2. Les mécanismes d’évolution des souches E. coli pathogènes ........................................ 14

3. Le système de réparation de l’ADN (MMRS)................................................................ 15

4. L’évolution des souches atypiques ................................................................................. 20

Page 14: ESCHERICHIA - Université de Sherbrooke

1

CHAPITRE 1

INTRODUCTION

1.1. Escherichia coli

Escherichia coli fait partie de la flore bactérienne intestinale normale des humains et des

animaux. E. coli est un organisme très diversifié. Bien que la majorité des souches soient

inoffensives, il existe une variété de souches pathogènes pouvant causer des infections autant

intestinales qu’extra-intestinales (Croxen et Finlay, 2010). Il est estimé qu’E. coli est

responsable de la mort de plus de deux millions de personnes par année (Tenaillon et al., 2010

; Russo et Johnson, 2003). Les souches pathogéniques sont groupées en virotypes (décrits ci-

dessous) selon leur capacité à causer certains types de maladies et syndromes et selon leur

facteurs de virulence (Croxen et Finlay, 2010).

1.1.1. Les virotypes intestinaux

1. Escherichia coli entérohémorragique (EHEC): Les souches EHEC colonisent l’iléon

distal et le colon des humains et causent des des colites hémorragiques (diarrhée sanglante)

(Croxen et Finlay, 2010). Les EHEC peuvent coloniser les ruminants de façon

asymptomatique (Croxen et Finlay, 2010). Les bovins constituent le principal réservoir et

source de transmission aux humains (Croxen et Finlay, 2010). En plus de la viande

contaminée, les légumes, les fruits et l’eau de consommation contaminés sont des vecteurs

proprices à la transmission chez l’humain (Croxen et Finlay, 2010).

Page 15: ESCHERICHIA - Université de Sherbrooke

2

Les EHEC sont des producteurs de la toxine Shiga-like (Stx), aussi appelée vérocytoxine

(Vtx). Toutes les souches productrices de cette toxine, en incluant les EHEC, se nomment

les STEC (E. coli producteurs de toxine Shiga-like). Les souches peuvent avoir soit les

formes Stx1 ou Stx2 de la toxine ou les deux en même temps (Croxen et Finlay, 2010). La

toxine Stx est activée par des dommages à l’ADN et par la réponse SOS qui sont induits

par des stress environnementaux comme l’ajout d’antibiotiques au milieu de croissance

(Croxen et Finlay, 2010). Il s’agit d’une toxine AB5 semblable à celle produite par Shigella

dysenteriae ayant des récepteurs spécifiques à la surface de certaines cellules intestinales

(cellules de Paneth) et sur les cellules épithéliales rénales (Beddoe et al., 2010; Croxen et

Finlay). Ces récepteurs ne sont pas présents chez les bovins, ce qui explique l’absence

d’infections des bovins par les EHEC (Croxen et Finlay, 2010 ; Pruimboom-Brees et al.,

2000). Dans 6-25 % des cas d’infections chez l’humain, cette toxine peut traverser la

barrière intestinale, atteindre les reins et mener au syndrome hémolytique urémique (SHU)

(Bryan et McAdam, 2015). Le SHU est caractérisé par une insuffisance rénale aigüe

mortelle dans 3-5 % des cas (Bryan et McAdam, 2015 ; OMS, 2015). La forme Stx2 de la

toxine est plus souvent associée avec le SHU que le type Stx1 (Croxen et Finlay, 2010). Le

traitement antibiotique des infections causés par les EHEC n’est pas utilisé, car il pourrait

favoriser la libération de la toxine Stx dans l’hôte (Croxen et Finlay, 2010).

Les EHEC possèdent également le système de sécrétion de type III (SST3) (Croxen et

Finlay, 2010 ; Kaper et al., 2004). Chez E. coli, ce type sécrétion est retrouvé seulement

chez les EHEC et chez les EPEC (E. coli entéropathogène) et est essentiel pour la

colonisation et la pathogénicité des souches. Le SST3 permet l’injection de son propre

récepteur (Tir) dans les entérocytes du gros intestin principalement puis, la liaison

irréversible d’une adhésine (intimine; EaeA) à Tir permettant l’adhérence irréversible de la

bactérie à l’hôte. L’injection de EspF et autres effecteurs dans la cellule hôte provoque la

destruction des jonctions serrées des cellules et mène éventuellement à la diarrhée (Roe, et

al. 2003 ; Smith, et al. 2002). Pour certains gènes (eaeA, tir, espA, espB, espD) associés au

SST3, des variants ont été détectés dans plusieurs souches d’E. coli pathogènes (Lefebvre

Page 16: ESCHERICHIA - Université de Sherbrooke

3

et al., 2008). L’intimine, codée par le gène eaeA, est considérée comme un facteur de

pathogénicité crucial et plus de 10 variants ont été décrits (Frankel et al., 1998; Torres et

al., 2005; Zhang et al., 2002). Le locus d’effacement des entérocytes (LEE), un îlot de

pathogénicité, code pour la majorité des protéines et effecteurs associés au SST3 (Croxen

et Finlay, 2010).

La souche la plus connue parmi les EHEC est E. coli O157 :H7, qui possède en plus

d’autres facteurs importants pour la colonisation codés par le plasmide pO157 (Croxen et

Finlay, 2010). La dose infectieuse de cette souche est très faible, de l’ordre de 10-100

unités formatrices de colonies (ufc) ou moins (Gordon et al., 2013). Cette souche est

hautement virulente et elle est responsable de nombreuses éclosions à travers le monde, en

particulier dans les pays développés (Japon, Amérique du Nord et certaines parties de

l’Europe). E. coli O157: H7 a été entre autres responsable de la tragédie de Walkerton

(ON, 2000) ayant causé la mort de sept personnes et plus de la moitié des résidents ont été

malades via l’ingestion de l’eau du robinet contaminée (Salvadori et al., 2009). Bien que

moins connus, il ne faut pas négliger l’importance sur la santé humaine d’autres sérotypes

non O157 comme O26, O45, O103, O111, O121 et O145 qui sont testés de routine dans le

bœuf (Gordon et al., 2013; Kalchayanand et al., 2012).

2. E.coli entéropathogène (EPEC) : Les EPEC typiques (tEPEC) peuvent causer la

dysenterie (diarrhée liquide aigüe, parfois sanglante) chez les mammifères. Chez les

humains, les tEPEC sont une des premières causes de diarrhée chez les jeunes enfants (< 2

ans) dans les pays en développement. Les humains sont d’ailleurs le seul réservoir connu.

Les tEPEC, de façon similaire aux EHEC, possèdent le locus LEE qui code pour le

système de sécrétion de type III et peuvent causer des lésions d’attachement et effacement

(A/E) dans l’intestin grêle. En plus de l’intimine et autres facteurs impliqués, le bundle-

forming pili (BFP) qui est codé par le plasmide E. coli adherence factor (EAF) va

permettre un attachement localisé sur les entérocytes (Gordon et al., 2013). Dans les

Page 17: ESCHERICHIA - Université de Sherbrooke

4

études phylogénétiques par multilocus sequence typing (MLST), deux lignées principales

tEPEC sont décrites (EPEC1 et EPEC2) (Gordon et al., 2013).

Un groupe d’EPEC atypiques (aEPEC) est bien reconnu. Les aEPEC possèdent le système

de sécrétion codé par le LEE comme chez les EPEC typiques. Contrairement aux souches

types, les aEPEC ne possèdent pas le plasmide EAF (absence du BFP), ne produisent pas

de toxine Shiga-like et une adhérence diffuse a été observée chez certaines souches

(Gordon et al., 2013). Il semble que le groupe atypique est une cause plus importante de

maladie chez les adultes et les enfants que les EPEC typiques et sont prévalents autant

dans les pays développés que ceux en développement (Gordon et al., 2013). Les réservoirs

des aEPEC sont les humains, mais aussi des animaux comme les chiens, chats, bovins,

mouton, souris et singes (Moura et al., 2009; Trabulsi et al., 2002).

3. E. coli entéroinvasif (EIEC) : Les EIEC ont la capacité d’invasion et de destruction des

entérocytes du côlon en se multipliant dans le cytoplasme et en se déplaçant de cellule en

cellule (Gordon et al., 2013). Les EIEC ont des mécanismes de pathogénicité similaires

aux espèces du genre Shigella spp. et produisent un syndrome très similaire à la

Shigellose, incluant une diarrhée semblable à la dysenterie avec fièvre (Gordon et al.,

2013). De plus, les EIEC possèdent un plasmide d’inavsion (inv) similaire à celui chez

Shigella et les deux genres sont souvent confondus (Gordon et al., 2013). Diverses

éclosions EIEC chez l’humain ont eu lieu et sont associées avec les hamburgers et le lait

non pasteurisé contaminés. Aucun réservoir animal n’est connu (Gordon et al., 2013).

4. E. coli entéroaggrégatif (EAEC) : Les EAEC colonisent le petit et le gros intestin de

façon exclusive chez les humains (Gordon et al., 2013). Les EAEC possèdent les

facteurs d’ahérence agrégative AAF (sur le plasmide pAA) ainsi que l’activateur de

transcription aggr (Gordon et al., 2013). Les EAEC ont la capacité de s’aggéger entre

eux et de coloniser la muqueuse intestinale à la manière d’un biofilm, favorisant la

persistance de l’infection et la libération de facteurs de virulence associés à la

Page 18: ESCHERICHIA - Université de Sherbrooke

5

destruction cellulaire comme des enterotoxines (EAST1) et des cytotoxines (ShET1 :

Shigella enterotoxin 1) (Gordon et al., 2013). Les souches enteroaggrégatives causent

des diarrhées aigües et persistantes (Gordon et al., 2013). En plus des dommages

intestinaux, une souche EAEC (E. coli O78 :H10) est à l’origine d’une élosion

d’infections urinaires (UTI) communautaires (Olesen et al., 2012). La souche

O104 :H4 est une souche EAEC atypique, mais hautement virulente puisqu’elle

possède les caractéristiques des EAEC, mais possède aussi la toxine shiga-like (Stx),

normalement associée avec les STEC (EHEC) (Brzuszkiewickz et al., 2011). Elle est

la cause d’une des plus grandes éclosions à E. coli (Europe, 2011) qui a eu lieu via la

transmisision des germes de fenugrecs contaminés menant à l’infection de plus de

3000 personnes et 53 morts (Jandhyala et al., 2013).

5. E. coli entérotoxigénique (ETEC) : Les ETEC colonisent les tissus de l’intestin grêle

des humains et des animaux et causent des diarrhées abondantes liquides et des

crampes abdominales (Fleckenstein et al., 2010). Les ETEC sont la cause principale de

la maladie chez les enfants et les voyageurs dans les pays sous-développés, transmise

par la nourriture ou l’eau contaminée (Fleckenstein et al., 2010). Les ETEC sont

caractérisés par la présence d’une ou plusieurs toxines. La toxine heat-labile (LT) a

une fonction similaire à la toxine cholérique (ctx) (Fleckenstein et al., 2010). La heat

stable (variants : ST1a ou St1b) résiste 30 minutes à 100 °C (Todar, 2008-2012, online

review : http://textbookofbacteriology.net/e.coli_4.html). Le variant ST1a est isolé des

humains et des animaux tandis que la ST1b est retrouvée seulement chez les humains

(Fleckenstein et al., 2010). Les ETEC induisent la diarhée via les toxines ST1a et ST1b

par l’activation de la guanylate cyclase-c sur les membranes de la bordure en brosse

intestinales, causant une augmentation d’AMP cyclique (adénosine monophosphate),

de cGMP (guanosine monophosphate cyclique) et une sécrétion hydroélectrolytique

(Field et al, 1978 ; Giannella, 1983). Les ETEC peuvent aussi coder pour la toxine

EAST1, associée à la destruction cellulaire chez les EAEC (Gordon et al., 2013).

Page 19: ESCHERICHIA - Université de Sherbrooke

6

1.1.2. Les virotypes extra-intestinaux

Les infections extra-intestinales à E. coli se retrouvent chez les humains, le porc et la

volaille.

6. E. coli pathogène extra-intestinal (ExPEC) : Chez l’humain, les souches ExPEC

peuvent coloniser l’intestin (habituellement asymptomatique), mais vont aussi

coloniser des organes extra-intestinaux. Ils possèdent une grande variété de facteurs de

virulence : adhésines de type fimbriae et non fimbriae, invasine, sidérophores,

hémolysine (hlyA) leur permettant de s’adapter à des environnements diversifiés. Les

infections extra-intestinales les plus connues sont les infections urinaires (E. coli

uropathogénique : UPEC) et les méningites surtout néonatales (NMEC). Les UPEC

sont responsables de 80 % des infections urinaires et les NMEC de 30 % des cas de

méningites néonatales (Redford et Welch, 2002). Presque tous les ExPEC qui peuvent

causer la méningite néonatale peuvent aussi causer des infections urinaires (Gordon et

al., 2013; Russo et Johnson, 2000), mais l’inverse n’est pas nécessairement vrai. Un

des groupes les plus répandues parmi les ExPEC est le groupe ST131. Plusieurs

souches de ce groupe sont résistantes aux β-lactamases (CTX-M ou TEM) (Gordon et

al., 2013). Certaines souches ExPEC ont été isolées de patients avec diverses

infections comme la pneumonie, la cholécystite et la péritonite (Gordon et al., 2013).

Des souches du type STEC ont également été isolées dans des cas d’infection extra-

intestinales (Tarr et al., 1996). Diverses études ont démontré que les ExPEC et les

souches commensales, habituellement non-pathogéniques, partagent de larges fractions

génomiques et sont souvent difficiles à différencier par les méthodes

phylogénétiques/moléculaires (Khöler et Dobrindt, 2011). Un nombre limité d’ExPEC

peuvent être identifiés par MLST (Khöler et Dobrindt, 2011).

Page 20: ESCHERICHIA - Université de Sherbrooke

7

E. coli pathogénique aviaire (APEC) : Les APEC se retrouvent dans la flore intestinale

normale de la volaille (poulet, dinde, canard), mais certaines souches peuvent induire des

infections invasives extra-intestinales chez la volaille (Mellata et al., 2003). Les éclosions sont

férquentes dans les élevages aviaires entraînant d’énormes pertes économiques. Les APEC

peuvent causer des : colibacilloses, septicémies, péritonites, périhépatites, aérosacculites,

infections respiratoires chroniques, ostéomyélites, etc (Mellata et al., 2003). Ces souches

possèdent différents gènes de virulence leur permettant de survivre en dehors du système

digestif comme : le plasmide pAPEC, des sidérophores (aérobactine), des hémolysines (hlyE)

et des hémagglutinines thermosensible (tsh) (Mellata et al., 2003). L’aérobactine est un

sidérophore permettant à la batérie de se multipler dans des conditions pauvres en fer comme

c’est le cas dans le tractus urinaire. Les fimbirae 1 et P quant à eux favorisent l’adhérence de

la bactérie au tractus respiratoire et la tsh est un autotransporteur retrouvé dans la majorité des

souches APEC hautement virulentes (Dozois et al., 2000). Lses sérotypes O1, O2, O35 et O78

sont les plus prévalents (Mellata et al., 2003). Il a été démontré que les souches UPEC

(ExPEC) humaines, les AIEC (E. coli adhérent invasif), les APEC (ExPEC) se ressemblent

beaucoup phylogénétiquement et partagent quelques gènes de virulence (Gordon et al., 2013).

La ressemble génétique des souches extra-intestinales humaines et aviaires indique une

possible transmission de ces souches entre les différents hôtes (Singer, 2015).

Bref, les E. coli pathogènes sont très diversifiés, et les transferts de gènes latéraux sont

particulièrement fréquents chez E. coli. Il est très difficile d’établir une nomenclature précise

en incluant toutes les souches atypiques et émergentes (Gordon et al., 2013). La figure 1

résume les relations entre les différents virotypes définis jusqu’à maintenant.

Page 21: ESCHERICHIA - Université de Sherbrooke

8

Figure 1 : Les relations entre les virotypes humains chez E. coli (adapté de Gordon et al.,

2013). Ce diagramme de Venn illustre chaque virotype (cercles) ayant des facteurs de

virulence et une pathogénicité spécifiques. Certaines souches, comme la souche O104 :H4,

partagent des facteurs de virulence avec plusieurs virotypes.

1.2. Le mécanismes évolutifs

Il est estimé que seulement 20 % du génome de base (core genome) est retrouvé dans

l’ensemble des souches d’E. coli (Gordon et al., 2013; Rasko et al., 2008). La souche

commensale E. coli K-12 MG1655 (NC_000913.3, NCBI ressource coordinators) à un

génome de 4,641,652 pb tandis que la souche E. coli O157 :H7 EDL933 (AE005174.2, NCBI)

possède un génome de 5,528,445 pb, avec 1,387 nouveaux gènes par rapport à la souche K-12

EPEC

atypique

EPEC

typique

Page 22: ESCHERICHIA - Université de Sherbrooke

9

(Gordon et al., 2013; Perna et al, 2001). Des études comparatives ont démontré la présence de

plusieurs séquences phagiques et éléments d’insertion chez plusieurs souches d’E. coli, ce qui

indique une grande plasticité chez le genre Escherichia spp. (Blattner et al., 1997). Chez E.

coli le spectre de pathogénicité est très diversifié incluant des infections intra et extra-

intestinales. L’évolution peut être adatative (augmentation du fitness) ou le fruit du hasard

suite à l’évolution de souches commensales. Plusieurs mécanismes génétiques peuvent être

utilisés par les bactéries pour favoriser la diversité génétique (Gordon et al., 2013). Ces

mécanismes sont : 1) le transfert horizontal de nouveaux gènes et 2) les altérations des gènes

existants (Gordon et al., 2013).

1) Le transfert horizontal (latéral) : Il s’agit d’un processus d’échange de matériel

génétique entre deux organismes qui ne sont pas des descendants. Chez les procaryotes, le

transfert latéral de gènes contribue grandement à la diversité et est l’un des facteurs

principaux d’acquisition de résistance aux antibiotiques. Chez E. coli, les gènes de

virulence transmis par transfert horizontal (conjugaison, transformation ou transduction)

peuvent provenir de d’autres souches E. coli ou d’autres genres (Shigella spp., Salmonella

spp.). Les facteurs de virulence sont fréquemment codés par des éléments génétiques

mobiles qui peuvent être mobilisés dans d’autres souches et être intégrés dans le génome

bactérien (Kaper et al., 2004). Les gènes de virulence sont le plus souvent localisés sur des

éléments génétiques mobiles et comprennent : les plamides, les prophages, les îlots

chromosomiques ou les transposons.

a) Les plasmides sont des éléments circulaires non chromosomiques qui ont la capacité

de se répliquer de façon indépendante. Les plasmides contribuent à la dissémination de

gènes apportant des avantages sélectifs, la plupart du temps, il s’agit de gènes de

virulence ou de résistance aux antibiotiques. Chez E. coli, différents plasmides sont

retrouvés codant pour des déterminants virulents (Mellmann et al., 2009). Chez

O157 :H7 EHEC, on retrouve le plasmide pO157 qui code pour des toxines; chez les

EPEC, on retrouve le plasmide EAF codant pour le bundle forming pili; chez les EIEC,

Page 23: ESCHERICHIA - Université de Sherbrooke

10

on retrouve le plasmide d’invasion; chez les ETEC, on retrouve des plasmides codant

pour des facteurs de colonisation et des toxines (entérotoxine LT); chez les EAEC, on

retrouve des plasmides codant pour des facteurs d’adhérence et des toxines; chez les

ExPEC, on retrouve les plasmides ColV et Vir. Chez Shigella, les gènes mxi et spa

codant pour le système de scérétion de type III sont localisés sur le plasmide pWR100

(Gordon et al., 2013).

b) Les prophages sont des bactériophages, c’est–à-dire des virus infectant les bactéries et

qui suite à l’injection de leur génome, celui-ci est intégré dans le génome bactérien

sous la forme de prophage. Ceci est la forme latente du phage où les gènes viraux se

retrouvent dans la bactérie. En conditons de stress (ex. : dommages cellulaires, UV), le

prophage est excisé du chromosome bactérien et entre dans le cycle lytique. À ce

moment, il y a lyse de la cellule et le phage peut infecter d’autres cellules (Gordon et

al., 2013). Des prophages sont retrouvés chez E. coli et codent pour des facteurs de

virulence qui sont exprimés dans la cellule hôte apportant un avantage évolutif. Chez

E. coli O157, par exemple, les prophages ont joué un rôle dans l’émergence de cette

souche pathogène alimentaire. En effet, les bactériophages (H-19B) codent pour les

toxines Stx1 et Stx2 (Dobrindt, 2005). Chez E. coli O157, jusqu’à 12 % du génome

bactérien est composé de séquences de prophages (Casjens, 2003 ; Ohnishi et al.,

2000). En plus, plusieurs gènes codant pour les effecteurs du SST3 comme EspJ

(Dahan et al., 2005) et NleA (Gruenheid et al., 2004) sont codés par des prophages. La

toxine ctdB (cytolethal distending toxin B) chez les EPEC (Asakura et al., 2007) ainsi

que la heat labile enterotoxin chez les ETEC (Jobling et Holmes, 2012) sont également

codés par les prophages.

c) Les îlots de pathogénicité sont définis comme une classe d’îlots génomiques (10-200

kb) ayant des gènes et éléments (IS, séquences répétées, intégrase) permettant leur

mobilité et leur recombinaison dans le chromosome bactérien. La majorité des PAIs

(îlots de pathogénicité) sont associés avec des locus d’ARNt (ARN de transfert). Les

Page 24: ESCHERICHIA - Université de Sherbrooke

11

îlots de pathogénicité codent pour des déterminants virulents, ainsi qu’un large spectre

de fonctions reliées à la pathogénicité. Ils jouent un rôle dans la pathogénicité et

contribuent à la diversité des microorganismes pathogènes chez les humains, mais

aussi chez les animaux et les plantes (Gordon et al., 2013). Par exemple, chez les

EHEC-EPEC, le locus d’effacement des entérocytes (36 kb) est un îlot de

pathogénicité majeur (McDaniel et al., 1995) qui code pour les protéines du système

de sécrétion de type 3 (SST3) (Boerlin et al., 1998 ; Garmendia et al., 2005 ; Kaper et

al., 2004). D’autres effecteurs sont situés sur des îlots de pathogenicité non-LEE

comme la EspC ou la Lymphostatine/ facteur d’adhérence EHEC (lymphostatin/EHEC

factor for adherence; lifA/Efa1). Plusieurs îlots de pathogenicité ont été décrits chez

des souches UPEC également. Chez la souche E. coli 536 UPEC par exemple, deux

ont été décrits : hémolysine opéron (hly) (PAI I536) et un autre avec d’autres gènes hly

et des gènes pour le pili (prf) (Hacker et al., 1990) (PAI II536). Environ 80 % des

souches NMEC ont le sérotype capsulaire K1 (Kaper et al., 2004). L’îlot de

pathogénicité kps code pour la capusle (pheV) chez E. coli K1.

d) Les transposons sont de petits segments d’ADN codant pour des transposases, leur

permettant de changer de position dans le génome (chromosomique ou plasmidique) de

façon autonome, mais qui ne peuvent pas se répliquer de façon autonome (Croxen et

al., 2013). La majorité du temps, les transposons sont excisés et reintregrés dans le

même génome, mais parfois ils peuvent être déplacés dans le génome d’autres

bactéries via le transfert d’ADN génomique ou plasmidique. Parfois, les transposons

peuvent induire des mutations et des changements dans la taille du génome menant à

un arrêt prematuré de la transcription. Les transposons peuvent aussi transporter des

gènes de virulence comme des résistance aux antibiotiques (Bhunia, 2008). Les

transposons les plus simples sont les séquences d’insertion codant pour la transposase

et sont encadrées par des motifs nucléotidiques inversement répétées spécifiques à la

transposase. Les transposons sont généralement associés aux eucaryotes, mais il est

possible d’en retrouver chez les bactéries (Bzuszkiewickz et al., 2011). L’entérotoxine

Page 25: ESCHERICHIA - Université de Sherbrooke

12

ST chez ETEC, par exemple, est codée par un transposon (Gordon et al., 2013; Mainil,

2013).

2) Les altérations génétiques représentent un deuxième type d’évolution génétique.

a) Les mutations faux-sens sont celles qui remplacent un nucléotide par un autre, ce qui

amène une modification de l’acide aminé codé. Les mutations peuvent être de

transition lorsqu’une base purique est remplacée par une base purique ou qu’une base

pyrimidique est remplacée par une base pyrimidique. Une mutation de transversion est

lorsque la base purique est remplacée par une base pyrimidique ou vice-versa. Ces

mutations peuvent amener des avantages évolutifs positifs ou négatifs. Les mutations

non-sens ont lieu lorsque le changement nucléotidique amène la création d’un codon

stop prématuré. L’introduction d’un codon stop prématuré va générer la production de

protéines tronquées ou mal repliées et affecter la fonction protéique, en particulier

lorsque les mutations se situent dans le site actif de la protéine, ce qui peut être toxique

pour la bactérie. Finalement, des mutations silencieuses (synonymes) ont lieu

lorsqu’un nuclétotique est remplacé par un autre nucléotide, mais n’amène aucun

changement dans l’acide aminé codé et donc, n’amene aucun changement dans la

structure de la protéine produite. Toutefois, ces mutations peuvent affecter le taux de

traduction suite à des modifications affectant la stabilité de l’ARN par exemple.

b) Les insertions et délétions (indel) sont un autre type de changement génétique.

Lorsque l’addition ou la suppression nucléotidique n’est pas un multiple de trois, il y a

un décalage du cadre de lecture dans toute la partie en aval du génome. La plupart du

temps, il y aura apparition d’un codon-stop prématuré dans la protéine codée. Autant

les insertions que les délétions peuvent amener une inactivation du gène et /ou de la

fonction protéique. Parfois, la délétion peut avoir lieu sur plusieurs gènes reliés ou sur

un opéron, ce qui évite d’avoir des métabolites ou réactions secondaires non-désirées.

Comme mentionné ci-haut les mutations ponctuelles non-sens peuvent amener

Page 26: ESCHERICHIA - Université de Sherbrooke

13

l’inactivation également. Ces mécanismes d’inactivation peuvent avoir lieu lorsqu’une

bactérie n’utilise plus certains gènes, au fil du temps la fonction sera perdue. Ils

peuvent aussi avoir lieu de façon adaptative lorsque la bactérie devra réduire son

génome afin d’améliorer son efficacité énergétique. Ce dernier mécanisme de

réduction adaptative va favoriser l’émergence de nouveaux variants bactériens, en

particulier chez les souches pathogènes. La duplication d’un gène peut mener à une

augmentation de l’expression de la protéine codée. Certaines souches d’E. coli O157 :

H7 par exemple, possèdent deux copies du gènes de virulence codant pour la toxine

Shiga-like 2 (Gordon et al., 2013). Des études in vitro ont en effet démontré que cette

duplication des gènes était correlée avec une augmentation de la production de la

toxine (Stx2). De plus, les duplications de gènes peuvent mener à l’émergence de

nouvelles protéines (Gordon et al., 2013).

La variabilité d’E. coli est très grande, et différents mécanismes contribuent à sa

diversité comme le transfert d’éléments génétiques mobiles codant la plupart du temps

pour des déterminants virulents et les modifications génétiques comme les mutations.

Les souches commensales et pathogéniques font face à une pression sélective et

doivent continuellement s’adapter. Il se peut aussi que certains facteurs auparavant non

essentiels pour la virulence soient déjà présents dans une souche et deviennent

importants pour la virulence de cette même souche dans d’autres conditions. Cela

pourrait favoriser l’évolution des souches commensales par exemple. La pathogénicité

des souches dépend à la fois de l’hôte (système immunitaire, type d’hôte) et de la

bactérie (gènes de virulence).

Page 27: ESCHERICHIA - Université de Sherbrooke

14

Figure 2 : Les mécanismes d’évolution des souches E. coli pathogènes (adapté de

Kaper et al., 2014). Cette figure montre les éléments génétiques mobiles et autres

mécanismes génétiques menant au développement de certaines virotypes E. coli à

partir de souches commensales.

Page 28: ESCHERICHIA - Université de Sherbrooke

15

1.3. Les mutations

1.3.1. L’hypermutabilité

Figure 3 : Le système de réparation de l’ADN (MMRS) (adapté de Hanne et al., 2013). Le

système de réparation de mésappariements des bases dans l’ADN existe chez les procaryotes

et les eucaryotes. Chez E. coli, ce système est basé sur l’hémi-méthylation de l’ADN lors de sa

réplication, et les protéines clés MutH, MutL et MutS sont impliquées directement dans la

reconnaissance et la réparation du mésappariement.

A. Procaryotes (E. coli) B. Eucaryotes

Page 29: ESCHERICHIA - Université de Sherbrooke

16

Les « mutateurs » (mutators) ou souches hypermutables sont des organismes avec un taux de

mutations plus élevé que la normale. En général, ces souches sont considérées comme des

mutateurs faibles lorsque le taux de mutations est de 10-20 fois plus haut que la normale,

mutateur moyen lorsque le taux de mutations est de 100-1000 fois plus haut que la normale et

mutateurs élevé lorsque le taux est plus grand 1000 fois plus haut que la normale. Les souches

hypermutables d’E. coli ont en général un taux de mutations de 100-1000 fois plus élevé que

la normale alors que le taux de mutations chez les souches sauvages (non hypermutables) est

extrêmemnt faible (Jayaraman, 2009). Le phenotype hypermutable amène des hauts coûts

énergétiques (fitness) et, à long terme, un trop haut taux de mutations peut être nocif et même

fatal pour l’organisme. Pour certains organismes, les mutations acquises procurent un

avantage évolutif. En effet, les mutations permettent une adaptation plus rapide que la normale

à un nouvel en environnement, leur permettant de survire en présence de différents facteurs

comme la compétition avec la microflore ou d’autres souches pathogènes, les réponses

immunitaires et les thérapies. Un haut taux de mutations chez les bactéries peut favoriser

l’apparition de résistances aux antibiotiques, ce qui pose un réel problème pour la santé

humaine. Surprenament, il a été démontré que dans la nature on retrouve un haut taux de

souches E. coli et Salmonella spp. hypermutables (>1 %) (Jayaraman, 2009; LeClerc et al.,

1996). Une autre étude a demontré qu’en effet autant dans les souches pathogènes que

commensales un haut taux de souches hypermutables est retrouvé (Jayaraman, 2009; Taddei et

al., 1997).

1.3.2. Les gènes mutateurs

Les gènes mutateurs sont des gènes qui lorsque mutés amènent un phénotype

d’hypermutabilité, c’est-à-dire un taux de mutations plus élevé que la normale et sont

impliqués dans diverses voies métaboliques. Certains mutateurs ont la tendance d’augmenter

seulement certains types de transitions, transversions, déletions et/ou changements de cadre de

lecture. Le gène mutT par exemple, qui est un très fort mutateur, augmente la fréquence des

Page 30: ESCHERICHIA - Université de Sherbrooke

17

transversions AT > CG. Les principaux gènes mutateurs chez E. coli sont décrits dans Miller

(1996).

Les gènes impliqués dans le système de réparation de l’ADN formant le MMRS sont tous de

forts mutateurs spontannés: mutS, mutL, mutH, uvrD et dam. Le gène mutD est un très très fort

mutateur et est impliqué dans le processus de correction des erreurs dans l’ADN. Les gènes

impliqués dans la réparation et la prévention des dommanges dommages oxidatifs (mutY,

mutM et mutT) sont également mutateurs, en particulier mutT qui est un fort mutateur. Le gène

oxyR est un plus faible mutateur, jouant un rôle clé dans la régulation positive des dommages

oxidatifs. D’autres gènes comme ndk, une kinase nucléoside diphosphate; sodA et sodB des

superoxides dismutases et mutA, mutC, des ARNt (ARN de transfert) sont des mutateurs

faibles à modérés (Miller, 1996).

Il a été reporté que certains gènes lorsque surexprimés, induisent des niveaux élevés de

mutations chez l’organisme. Chez E. coli, par exemple, les niveaux du gène dinB (polymérase

à ADN IV, à faible fidélité) sont surexprimés suite à l’induction du système SOS, ce qui induit

un haut taux de mutations. Le SOS est un système de survie des bactéries en réponse à des

dommages faits à l’ADN. Un haut taux de mutations est également observé lorsque les gènes

codant pour le facteur sigma S (rpos) ou la méthylase (dam) sont surexprimés (Yang et al.,

2004).

1.4. Le système de réparation de l’ADN: le MMRS

Chez E. coli, le MMRS (Methyl-directed Mismatch Repair System) permet de détecter et de

réparer les mésappariements des bases introduites par la polymérase lors de la réplication tout

en conservant l’appariement initial (Friedberg et al., 2005; Fukui, 2010). L’ADN polymérase

III, l’enzyme responsable de la réplication chez E. coli, peut introduire de 1 à 40 bases

erronnées à chaque réplication du chromosome, mais comme mentionnée ci-haut ce taux

d’erreur est extrêmement faible en réalité grâce au système de réparation de l’ADN. Le

Page 31: ESCHERICHIA - Université de Sherbrooke

18

MMRS permet ainsi de limiter les mutations délétères et le maintient de l’espèce. Le MMRS a

d’autres rôles comme sa contribution à bloquer les événements de recombinaison génétique

hétérologue entre séquences partiellement homolgogues, ce qui prévient l’infiltration d’ADN

étranger dans le génome. Il est également impliqué dans les réponses de dommages à l’ADN.

Le système MMRS est basé sur la reconnaissance de l’état hémiméthylé de l’ADN après la

réplication (Cebula et LeClerc, 2000). L’enzyme Dam est une méthylase, responsable de la

méthylation sur les séquences 5’GATC3’. Il y a un court moment suite à la réplication où seul

le brin matrice est méthylé, ce qui permet au MMRS d’identifier le brin nouvellement

synthétisé qui n’est pas encore méthylé. MutS forme un dimère (MutS2), reconnaît les

mésappariements sur le brin non méthylé et s’y lie. MutH se lie aux sites non méthylés GATC

sur le brin fille. Un dimère de MutL (MutL2) se lie au complexe MutS-ADN. Un changement

conformationnel survient alors dans l’ADN en présence de MutS, d’ATP et de MutL, ce qui

permet la liaison du mauvais appariement (MutS-MutL) et à la séquence GATC non méthylée

(MutH) la plus proche et active MutH. MutH, une endonucléase, peut alors cliver le nouveau

brin d’ADN à réparer près du site non méthylé GATC (5’ - >3’ ou 3’ -> 5’). Cela sert de porte

d’entrée pour UvrD (Hélicase II) qui va séparer les deux brins d’ADN et libèrer le brin fille.

Les exonucléases vont pouvoir digérer la partie à corriger sur le brin fille (ExoVII ou RecJ 5’ -

> 3’; ExoI ou ExoX 3’ -> 5’). Des protéines SSB (protéines de liaison à l’ADN simple brin)

se lient au brin brin matrice et le protègent jusqu’à ce que la machinerie de synthèse arrive. Le

brin complémentaire sera polymérisé par l’ADN polymérase III en utilisant le brin méthylé

comme matrice. La ligase va alors permettre l’hybridation de deux brins d’ADN. Finalement,

la méthylase Dam méthyle le brin nouvellement synthétisé (Hanne et al., 2013). La Figure 3

représente le mécanisme détaillé du MMRS.

Le MMRS est hautement conservée et est retrouvé dans tous les êtres vivants. Chez l’humain,

des mutations dans les homologues des protéines du MMRS (MutHLS) et autres gènes

impliquées dans l’hypermutabilité sont associés à certains types de cancers (human hMSH2 :

Syndrome de Lynch: cancer colorectal héréditaire; cancer ovarien…) (Hanne et al., 2013).

Page 32: ESCHERICHIA - Université de Sherbrooke

19

Certaines souches bactériennes ont un MMRS muté ou dysfonctionnel et cela se traduit par

une introduction de mutations. Le système de réparation de l’ADN est le mécanisme le plus

important impliqué dans l’apparition du phénotype hypermutable. Il peut y avoir

développement de résistance aux antibiotiques par mutations. Un MMRS non fonctionnel

permet aussi à des ADN hétérologues (jusqu’à 30 % de divergence) d’être recombinés à

l’intérieur d’un génome (Fukui, 2010 ; Matic, et al. 1995; Matic, et al. 1996 ; Vulic, et al.

1997), ce qui peut favoriser par exemple le transfert de gènes de virulence à partir d’espèces

plus éloignées phylogénétiquement. Cela peut favoriser le développement de nouveaux

virotypes chez E. coli. Les connaissances sur les mutations sont esssentielles pour comprendre

les processus évolutionnaires et moléculaires.

1.4.1. La région mutS-rpoS

La région mutS-rpoS contient des gènes importants dans la réparation de l’ADN et dans

l’intolérance aux mutations et est hautement polymorphique à l’intérieur mêmes des souches

d’E. coli. Il s’agit donc d’une région favorable aux insertions et aux délétions (Herbelin et al.

2000; LeClerc, et al. 1996; LeClerc, et al. 1999). Les mutations dans la région mutS-rpoS

pourraient être une cause ou une conséquence du MMRS défectueux. Il est possible qu’une

souche ayant un MMRS défectueux acquière des gènes de virulence dans la région mutS-rpoS.

Le gene mutS est un gene clé dans le système de reparation de l’ADN, MMRS. Il a été

démontré en effet que des mutations dans ce gene amènent un phenotype hypermutable. Le

gene rpoS, le facteur sigma S est aussi un mutateur spontannée et induit des mutations en

particulier lorsque surexprimé. Différents types de régions mutS-rpoS existent chez les

entérobactéries. Chez E. coli chaque region semble corrélée avec certains types de virotypes.

Page 33: ESCHERICHIA - Université de Sherbrooke

20

Figure 4 : L’évolution des souches atypiques. Les souches atypiques résultent de l’acquisition

de facteurs de virulence atypique ou de combinaisons spécifiques de facteurs de virulences

provenant de souches reconnues pathogènes. La souche E. coli O104 :H4 par exemple,

possède des facteurs de virulence associés à deux souches pathogènes différentes : les E. coli

entéroaggréagatifs et les E. coli producteurs de Shiga-toxine (Brzuszkiewicz et al., 2011). Ces

souches peuvent devenir des souches pathogènes émergentes comme ce fut le cas de la souche

O104 :H4, responsable d’une éclosion diarrhéique majeure en 2011 (Frank et al., 2011).

1.5. Souches atypiques et l’émergence de souches pathogènes

Les souches atypiques sont en général formées par des combinaisons de gènes de virulence ou

de variants différents des souches typiques connues. Elles sont peu étudiées, mais de plus en

plus isolées de cas cliniques.

Chez E. coli, par exemple, comme mentionné précédemment, il existe un groupe d’EPEC

atypique reconnu. Ce groupe atypique possède les facteurs de virulence retrouvés chez les

Page 34: ESCHERICHIA - Université de Sherbrooke

21

EPEC typiques comme le LEE, mais ne possède pas le plasmide EAF (Karper et al., 2004).

Les EPEC atypiques sont de plus en plus isolés dans les pays industrialisés et ont causé deux

grandes éclosions impliquant des adultes et des enfants (Trabulsi et al., 2002). Il existe

également des souches atypiques EAEC qui n’ont pas le régulon AggR contrairement aux

souches typiques (Kaper et al., 2004).

La souche E. coli O104 :H4 est un autre exemple de souche atypique. Cette souche possède

des caractéristiques propres aux EAEC, mais peut aussi produire la toxine Stx comme les

STEC-EHEC. Par sa combinaison de gènes de virulence EAEC et STEC, un nouveau virotype

a été proposé pour la souche O104 :H4: Entero-Aggregative-Hemorragic E. coli (EAHEC).

Cette souche a causé une large éclosion d’origine alimentaire en 2011 en Europe

(Brzuszkiewickz et al., 2011 ; Jandhyala et al., 2013).

Des études ont trouvé des facteurs de virulence spécifiques aux souches DAEC (E. coli à

adhérence diffuse), décrites pour leur habileté à adhérer des façon diffuse chez les cellules

Hep-2/HeLa ainsi que chez d’autres virotypes comme les EAEC, ETEC, EPEC et même chez

les souches extra-intestinales UPEC. Leur implication dans la pathogénicité humaine n’est pas

définie (Gordon et al., 2013).

Chez les ExPEC (NMEC), on observe des résistantes émergentes aux antibiotiques de type β-

lactamases à large spectre (CTX-M ou TEM) (Blanco et al., 2011; Gordon et al., 2013;

Moissenet et al., 2011). Cela pose un réel problème pour la santé humaine, car cette résistance

émergente a été observée sur les souches hautement pathogéniques comme ST131. Il devient

un véritable défi de trouver des traitements alternatifs.

En bref, les souches atypiques chez E. coli ont des caractéristiques peu communes ou non

retrouvées dans les souches actuelles suite à, par exemple, l’acquistion de combinaisons de

gènes de virulence (O104 :H4), des variants de gènes (ex. intimine) et des résistances aux

antibiotiques (NMEC). Cette évolution a lieu par l’intermédiaire d’un ou plusieurs transferts

Page 35: ESCHERICHIA - Université de Sherbrooke

22

latéraux, mutations ponctuelles, insertions/délétions. Elles ont des grands potentiels virulents

et ont la possibilité d’évoluer en souches pathogéniques.

Une souche bactérienne pathogène est définie comme l’agent causal d’une maladie infectieuse

(Cleaveland et al., 2007). Pour qu’une souche pathogène soit considérée comme émergente,

elle doit possèder au moins l’une de ces caractérisitiques spécifiques : première apparition

dans la population humaine, augmentation de son incidence, détection sur de noveaux

territoires ou/et première association avec la maladie. Les causes de l’émergence sont

nombreuses : augmentation de la consommation d’aliments frais ou non cuits,

complexification des chaînes de transport de la nourriture, augmentation des voyages

internationaux (ETEC), progression dans les méthodes de détection et identification des

souches pathogènes et des symptômes associés. L’incidence d’une souche pathogène peut

augmenter suite à l’apparatition d’un nouvel hôte ou à des chagements évolutifs, à long terme

(Cleaveland et al., 2007; Woolhouse et Dye, 2001). Il existe aussi des souches pathogènes qui

re-émergent après un certain temps dû à des changements à long-terme de leur épidémiologie.

La souche O157 :H7 a été identifiée en 1982 comme étant la cause de deux éclosions sévères

associées à la restauration rapide. Aucune souche similaire n’avait été reconnue comme

pathogène à ce moment et elle a connu une augmentation drastique dans les années suivantes.

En 1994, il a été reporté que cette souche était la cause de 30 éclosions différentes. Il n’est pas

connu quels sont les déterminants qui ont amené l’émergence de cette souche, mais il se

pourrait les changements dramatiques dans le bétail et l’industrie du bœuf soient impliqués. Il

est toutefois, évident qu’une multitude de facteurs mènent à l’émergence de souches

pathogènes. De plus, une augmentation de l’utilisation de bœuf dans des produits comme les

hamburgeurs qui sont fabriqués en masse peut avoir favorisé la transmission rapide des

souches pathogènes chez les humains. Une amélioration des programmes de surveillance et les

méthodes de détection des bactéries pathogènes peut aussi influencer. Il se peut aussi que les

facteurs de virulence, la faible dose infectieuse et sa capacité de colonisation asymptomatique

des EHEC aient favorisés l’émergence de cette souche pathogène en débit des changements

Page 36: ESCHERICHIA - Université de Sherbrooke

23

dans l’industrie agro-alimentaire du bœuf. Cette souche est souvent utilisée comme modèle

d’étude de microorganismes pathogènes émergents dans les pays industrialisés (Armstrong et

al., 1996).

D’autres exemples de microorganismes pathogènes alimentaires émergents sont

Campylobacter jejuni, Mycobacterim paratuberculosis, Yersinia enterolitica, Listeria

monocytogene, etc. Récemment, Escherichia fergusonii et Escherichia albertii, des souches

ayant un génome très proche de celui d’E. coli, ont été reconnues comme des souches

pathogènes émergentes (Bhunia, 2008).

1.5.1. E. albertii

Escherichia albertii est une souche pathogène émergente chez les humains et les animaux

(Huys et al., 2003). Les premières souches étaient initiallement classées en tant que H. alvei

par des tests biochimiques. Même encore aujourd’hui, les tests de routine ne permettent pas

l’identification rapide d’E. albertii, et il est estimé qu’un nombre considérable de souches

aurait été confondu avec d’autres souches comme E. coli. En effet, E. albertii possède

plusieurs gènes de virulence dont le LEE comme les EPEC et les EHEC et la cytotoxine ctdB

présente aussi chez les EPEC. Certaines souches expriment également certains variants Stx

(Hinenoya et al., 2014 ; Maheux et al., 2014 ; Murakami et al., 2014 ; Nimri, 2013 ; Oaks et

al., 2010 ; Oh et al., 2011 ; Ooka et al., 2012).

E. albertii peut causer de la diarrhée avec de la fièvre, des vomissements et des crampes

abdominales (Albert et al., 1991 ; Albert et al., 1992 ; Huys et al., 2003). Elle est aussi la

cause de plusieurs cas d’infection et de quelques écosions à travers le monde (Asoshima et al.,

2014 ; Oaks et al., 2010 ; Oh et al., 2011 ; Ooka et al., 2012 ; Nimri, 2013). E. albertii a aussi

été isolé d’oiseaux sauvages et domestiques, félins, cochons, bœuf, poulet, laitue et dinde. En

2004, elle était responsable de la mort de centaines de Common redpoll (Acanthis flammea) en

Alaska (Oaks et al., 2010).

Page 37: ESCHERICHIA - Université de Sherbrooke

24

1.6. Objectifs et hypothèses

Ce projet s’inscrit dans un projet plus large visant à analyser les facteurs de virulence et de

pathogénicité acquis chez des souches atypiques d’E. coli qui pourraient favoriser le

développement de souches pathogènes émergentes. Alors que de plus en plus d’E. coli

atypiques sont impliqués dans les maladies humaines, peu de recherches visent à expliquer

leur origine chez les animaux de ferme ou à diminuer leur dissémination; c’est ce que nos

efforts permettront de faire.

Par les études passées dans le laboratoire (Lefebvre et al., 2008), une variété de souches

atypiques ont été isolées de bovin et poulet, et deux de ces souches sont à la base de mon

projet de maîtrise. La première souche E. coli 06-03-01-17 est d’origine bovine. Elle a un

sérotype O157 et, selon les études d’hybridation sur puce, elle présente un profil de gènes de

virulence semblable aux souche O157: H7 ou autres EHEC, mais incomplet (ex.: absence de

toxines Stx, absence du plasmide pO157 et non-mobile). Cette souche est hypermutable,

multi-résistante aux antibiotiques avec des variants du SST3 atypique, non retrouvés chez E.

coli et provoque des lésions A/E atypiques. La deuxième souche E. albertii ECC-Litt-3-1 est

d’origine aviaire, hypermutable et possède aussi un SST3 atypique. Elle avait été initiallement

classée comme une souche E. coli atypique par la présence entre autres de variants du SST3

atypiques, mais les études de génomique ont permis sa ré-identification en tant qu’E. albertii.

1.6.1. Objetif 1 : Projet MMRS

Nous croyons que les souches hypermutantes atypiques qui seront étudiées ont un certain

pouvoir de colonisation et de virulence. Nous croyons aussi que le MMRS est impliqué dans

l’apparition de ces souches et leur caractérisation moléculaire permettra de comprendre leur

capacité d'adaptation aux pressions sélectives, leur virulence et le risque de causer des

maladies chez les animaux et l'humain.

Page 38: ESCHERICHIA - Université de Sherbrooke

25

Le but de la première partie de ce projet est de caractériser et comparer la varaibilité dans les

regions mutS-rpoS chez E. coli, Salmonella, Shigella et les deux isolats atypiques : E. coli 06-

03-01-17 et E. albertii ECC-Litt-3-1. Le phenotype hypermutable de ces souches est fort

probablement la conséquence de mutations dans les genes du MMRS et nous pensons qu’elle

pourrait être aussi liée à la région mutS-rpoS region. Aussi, deux genes situés dans la région

mutS-rpoS ont été explorés en tant que marqueurs pour l’identification et la caractérisation des

E. coli extra-intestinaux.

1.6.2. Objectif 2 : E. albertii

L’objectif est d’identifier des gènes spécifiques à E. albertii par des études de génomique

comparative et de développer une méthode PCR pour le détecter et caractériser certains de ces

gènes de virulence. E. albertii est une souche pathogène émergente au niveau agro-

alimentaire, mais peu caractérisée pour l’instant. Elle a été impliquée dans plusieurs cas

d’éclosion alimentaire, mais aucun test rapide et efficace n’existe pour détecter la présence

d’E. albertii dans les aliments et éviter de la confondre avec d’autres Enterobactériaceae.

Page 39: ESCHERICHIA - Université de Sherbrooke

26

CHAPITRE 2

Characterization of the mutS-rpoS regions in Escherichia, Shigella and Salmonella and

identification of molecular markers for extra-intestinal E. coli (ExPEC)

2.1. Introduction du premier article

Characterization of mutS-rpoS regions in Escherichia, Shigella and Salmonella and

identification of molecular markers for Extra-intestinal E. coli (ExPEC)

Auteurs : Catherine Lefebvre Garcia,

Rolland Jr. Vaillancourt, Pierre-Étienne Jacques,

Sébastien Rodrigue, Moussa S. Diarra, François Malouin

Statut de l’article : Cet article sera soumis sous peu à la revue Applied and Environmental

Microbiology.

Avant-propos : La rédaction de cet article a été faite par Catherine Lefebvre Garcia sous la

supervision des Prs François Malouin et Moussa S. Diarra. Le séquençage Illumina des

souches ECC-Litt-3-1 et 06-01-03-17 a été réalisé par les membres du laboratoire du Pr.

Sébastien Rodrigue (M. Vincent Baby et M. Dominik Matteau). Les analyses des résultats de

séquençage ainsi que les comparaisons génomiques et protéiques ont été faites par Catherine

Lefebvre Garcia, avec la collaboration de : Pr Pierre-Étienne Jacques, Pr Sébastien Rodrigue,

M. Vincent Baby et M. Rolland Jr. Vaillancourt. L’analyse des groupes de protéines

orthologues chez différentes souches pathogéniques d’E. coli avec le programme CogSoft a

été faite par M. Rolland Jr. Vaillancourt.

Page 40: ESCHERICHIA - Université de Sherbrooke

27

2.2. Résumé du premier article

La région chromosomique mutS-rpoS est connue pour être hautement polymorphique parmi

les Enterobacteriaceae. Dans cet article, nous avons pu confirmer cette diversité génomique

par la comparaison des régions inter-géniques mutS-rpoS de 115 souches des genres

Escherichia spp., Shigella spp. et Salmonella spp.. À l’intérieur même des souches d’E. coli,

quatre groupes différents de régions mutS-rpoS ont été identifiés et chaque polymorphisme

semble associé à un virotype spécifique chez E. coli.

Dans nos travaux, nous avons exploré plus en profondeur la région mutS-rpoS associée aux

ExPEC. En effet, comme les ExPEC sont très diversifiés en terme de pathogénicité, hautement

virulents et souvent difficiles à identifier, la région mutS-rpoS est un marquer potentiel très

intéressant. Un groupe de gènes à l’intérieur de cette région (c3302-04) était retrouvé

exclusivement chez les ExPEC les plus virulents. Dans cette étude, nous avons donc étudié ce

groupe de gènes et protéines associées chez des souches d’E. coli par des comparaisons

génomiques et protéiques. Nous avons étudié le polymorphisme à l’intérieur de ces gènes, les

variations génétiques (SNPs; polymorphisme d’un seul nucléotide) dans les régions codantes

ainsi que les fonctions moléculaires et les rôles biologiques des protéines codées par ces

gènes. L’étude de ces gènes est un pas de plus vers la compréhension de la virulence des

souches extra-intestinales.

Dans cette étude, nous avons ajouté un isolat bovin hypermutable de notre laboratoire : 06-01-

03-17 qui possède le même groupe de gènes dans la région mutS-rpoS que les ExPEC. Cet

isolat était initialement associé aux EPEC par la présence des facteurs de virulence associés

aux lésions d’attachement et d’effacement. Notre étude pourrait aider l’identification de

souches émergentes avec un haut potentiel de virulence comme l’isolat bovin caractérisé dans

cette étude.

.

Page 41: ESCHERICHIA - Université de Sherbrooke

28

2.3. Premier article

Characterization of mutS-rpoS regions in Escherichia, Shigella and Salmonella and

identification of molecular markers for Extra-intestinal E. coli (ExPEC)

Catherine Lefebvre Garcia,1

Rolland Jr. Vaillancourt,1 Pierre-Étienne Jacques,

1 Sébastien

Rodrigue,1 Moussa S. Diarra,

2 François Malouin

1*

Centre d’Étude et de Valorisation en Diversité Microbienne (CEVDM), Département de

biologie, Faculté de sciences, Université de Sherbrooke, Sherbrooke, Québec, Canada1;

Guelph Food Research Centre, Agriculture and Agri-Food Canada (AAFC), Guelph, Ontario,

Canada2

Running Head: ExPEC markers in mutS-rpoS region

*Address correspondence to François Malouin, [email protected]

Page 42: ESCHERICHIA - Université de Sherbrooke

29

ABSTRACT

Extra-intestinal Escherichia coli (ExPEC) can cause a large variety of infections in humans

and birds worldwide and possess diversified virulence genes in order to colonize extra-

intestinal sites making their specific detection as a group challenging. The mutS-rpoS region

is a hot spot for recombination and lateral gene transfer and has been described as a good

ExPEC marker (Ewers et al., 2014). The objectives of the present study were to perform

comparative and phylogenetic analyses of mutS-rpoS polymorphisms among 115

Enterobacteriaceae and to identify molecular markers for ExPEC. Our results showed that the

specific ExPEC loci c3302-04 allows the identification of non-synonymous SNPs located in

coding regions for conserved domains. According to our results, the protein c3302 was

computationally associated with catabolic activity, but not with β-lactamase activity as

previously suggested, and presents multiple predicted zinc binding sites. The c3303 locus, an

insertion sequence, indicates a possible recombination site while the protein c3304 was

associated with redox activity with a FMN (flavin mononucleotide) binding sites. The mutS-

rpoS region c3302-04 was also found in one atypical E. coli (intimin positive and

hypermutable) isolate from cattle. Data from the present study confirmed that the mutS-rpoS

intergenic region c3302-04 is a marker for highly pathogenic strains of ExPEC. Our data also

showed the potential of these genes in the virulence of ExPEC.

KEY WORDS: mutS-rpoS region, Extra-intestinal E. coli, ExPEC, Enterobacteriaceae,

Methyl-directed mismatch repair system (MMRS), atypical E. coli, c3302-3304

Page 43: ESCHERICHIA - Université de Sherbrooke

30

INTRODUCTION

Escherichia coli is a naturally commensal bacterium of humans and animal guts. E. coli

species exhibit high genome diversity and genome plasticity. About only 18 % of the genome

of the commensal K-12 is conserved in all E. coli strains (Herbelin et al., 2000). Some strains

have acquired virulence factors making them public health concerns, and the cause of

significant economic losses to the food industry. In addition to causing serious intestinal

damages, some E. coli strains (Extra intestinal pathogenic E. coli: ExPEC) have the ability to

infect extra-intestinal sites such as the urinary tract (Uropathogenic E. coli: UPEC) and the

blood stream of newborns (Neonatal Meningitis E. coli: NMEC). ExPEC strains possess a

broad spectrum of virulence factors such as adherence systems, toxins and iron uptake systems

for their adaptation to new environments (Ewers et al., 2014). The ExPEC group is large,

highly diversified and thus poorly defined (Singer, 2015).

Whole-genome sequencing and comparative studies in E. coli have pointed out many sites of

genomic variations which allowed better understanding of the genome evolution in E.coli. The

region between the mutS and rpoS genes is one of the most polymorphic regions in

Enterobacteriaceae. Among E. coli strains, this region of 3 to 14 kb, is a hot spot for

mutations and gene acquisition by horizontal transfer between species (Brown et al., 2001 ;

Ferenci, 2003 ; Kotewicz et al., 2003).

The gene mutS plays an important role in the methyl-mismatch directed DNA repair system

(MMRS). Together mutL, smutH and mutS are the major genes associated with the MMRS

pathway, which roles are to detect and correct DNA mismatch errors induced mostly by the

polymerase and to prevent heterologous recombination (Tsui et al., 1997). Homologs of the

mutS gene have been found in most bacteria and eukaryotes. Mutations in the mutS gene result

in hypermutable strains leading up to a 100-fold increase in mutations and recombination

events with foreign DNA in the host chromosome (Brown et al., 2001 ; Ferenci, 2003).

Page 44: ESCHERICHIA - Université de Sherbrooke

31

Mutator strains, mostly caused by mutS mutations are found in more than 1 % of all E. coli

and Salmonella isolates (LeClerc et al., 1996).

The rpoS gene encodes the σS

subunit of the RNA polymerase, an alternative sigma factor that

plays a central role in the transcription and expression of genes involved in stress adaptation

and survival (Ferenci, 2003). The rpoS gene is transcribed in the late exponential phase. It can

be activated by different environmental conditions like UV-radiation, temperature and

oxidative stress. The rpoS gene is the most important regulator of the stationnary phase genes.

It regulates hundred of genes associated with stress resistance (DNA damage, presence of

reactive oxygen species, osmotic shosk), transport regulation and metabolism (Landini et al.,

2014). It is also involved in the virulence and adaption to hostile environments of many

pathogens as pathogenic E. coli, Salmonella and Vibrio species (Dong and Schellhorn, 2009;

Dong and Schellhorn, 2010).

The mutS-rpoS polymorphism seems to be correlated with the E. coli pathotypes and several

studies suggested that this polymorphism offers an interesting potential for the

characterization of pathogenic strains (Culham and Wood ; Ewers et al., 2014, 2000; Hilali et

al., 2000; LeClerc et al., 1999). The role of the mutS-rpoS region is not clearly described but

is possibly linked with virulence factors and pathogenicity.

The objective of this study was to compare the mutS-rpoS region of E. coli and more

specifically of ExPEC, Salmonella and Shigella strains. Also, two genes (c3302 and c3304),

specifically found in the mutS-rpoS region of documented ExPEC strains, were explored for

their potential as markers to detect this E. coli pathotype. Part of this work has been presented

previously in summary form (Lefebvre Garcia et al., 2014, poster). Finally, we used this

information to characterize further an E. coli O157 strain previously reported as a

hypermutable EPEC that was multi-resistant to antibiotics and that clustered with the ExPEC

Page 45: ESCHERICHIA - Université de Sherbrooke

32

strains based on hybridization results on DNA arrays (Lefebvre et al., 2005 ; Lefebvre et al.,

2010).

MATERIALS AND METHODS

Bacterial genomes. For this study, 115 completed and draft genomes of strains from the

genus Escherichia spp., Salmonella enterica serovars and Shigella spp. were used (Table 1).

Genomes from NCBI nucleotide database (NCBI ressource coordinators, 2015) of commensal

K-12 and those of representative strains of most of the pathotypes: EHEC (Enterohemorrhagic

E. coli), EPEC (Enteropathogenic E. coli), ETEC (Enterotoxigenic E. coli), ExPEC

(Extraintestinal E. coli), NMEC (Neonatal Meningitis E. coli) and UPEC (Uropathogenic E.

coli) were selected. These genomes were downloaded on 2014, except for three isolates: E.

coli 06-01-03-17 (Lefebvre et al., 2005 ; Lefebvre et al., 2010), E. albertii ECC-Litt-3-1

(2Lefebvre et al., 2009) and E. fergusonii that are from our strain collection (Forgetta et al.,

2012).

Whole-genome sequencing and assembly. The complete genome of E. coli 06-01-03-17 was

sequenced using the Illumina technology with 50 bp paired-end reads. Illumina sequencing

libraries were prepared as previously described (Rodrigue et al., 2010). The resulting

sequences were assembled using de novo gsAssembler (Newbler, Roche, version 2.6)

software. The reads were also mapped on E. coli, Shigella and Salmonella strains and were re-

assembled to maximise the assembly of different regions possibly originating from other

strains or species. The results were uploaded to the Rapid Annotation using Subsystem

Technology (RAST) (Aziz et al., 2008 ; Aziz et al., 2012 ; Overbeek et al., 2014) for a

preliminary annotation. Specific annotations of regions and genes of interests were done using

BLASTn (The BLAST Sequence Analysis Tool) (NCBI ressource coordinators, 2015) and

results were visualized with CLC Genomics Workbench.

Page 46: ESCHERICHIA - Université de Sherbrooke

33

Genomic comparisons and data visualization. The sequences of interest were extracted

from all the 115 genomes of Escherichia, Salmonella and Shigella strains (Table 1). The

mutS-rpoS DNA sequences were identified by comparison of the the mutS and rpoS genes

with known regions in strains E. coli K-12 MG1655, E. coli O157:H7 and E. coli CFT073 and

using using BLASTn, homemade UNIX shell program and CodonCode Aligner (CodonCode

Corporation, 2013) for length detection. The intergenic mutS-rpoS regions were then

compared and groups of putative genes with similar length were then compared by BLAST to

check DNA and amino acid similarity. The ORFs (Open Reading Frames) in the mutS-rpoS

region of the isolates 06-01-03-17 and ECC-Litt-3-1 were predicted and contig organisation

was done with Contiguator2 (Galardini et al., 2011). The ORFs with repetitive regions, gaps

between contigs or uncertain sequences were re-sequenced by the Sanger method (Plate-forme

d’Analyses Génomiques de l’Université Laval, Quebec, Canada). The SNPs were confirmed

to be real SNPs when found in all the contigs obtained from the whole-genome sequencing

data (BLAST, CLC workbench). The genetic organization of all the mutS-rpoS sequences was

visualized with CLC-Workbench.

Phylogeny. For phylogenetic studies, sequences of interest (gyrB semi-conserved gene) were

aligned with Multiple Sequence Comparison by Log-Expectation (MUSCLE, EMBL-EBI)

((Edgar, 2004 ; McWilliam, 2013). Phylogenetic analysis was carried out using MEGA

software Ver. 6 (Tamura et al., 2013) and a phylogenetic tree was reconstructed using the

Neighbor-joining method. The setting options were as follows: The test for branch support

was assessed with 100 bootstraps replications, Substitutions type was nucleotide and the

model was the Kimura 2-parameter model, rates among sites were Gamma-distributed with

the gamma parameter 2, Gaps/missing data treatment was Complete deletion. No significant

difference was found when using other algorithms such as Maximum Likelihood (PhyML) and

Parcimony (BioNJ).

Protein analysis. The molecular function, the biological process and the binding sites were

found in silico by submission of the translated DNA sequence of c3302 and c3304 genes to

Page 47: ESCHERICHIA - Université de Sherbrooke

34

the I-TASSER (Roy et al., 2010; Yang et al., 2015; Zhang, 2008) online platform which uses

many databases such as Gene Ontology (GO) database (Gene Ontology Consortium, 2001).

The DNA coding regions were translated into amino acid sequence using ExPASy

Bioinformatics Resource Portal (standard genetic code) (Artimo et al., 2012). The conserved

domains were found by NCBI Conserved Domain Search and BLASTx of the translated

sequences of c3302 and c3304 against all the bacterial sequences available in the non-

redundant database of NCBI (NCBI ressource coordinators, 2015).

RESULTS

Genomics and phylogeny. The complete genome of the isolate 06-01-03-17 was sequenced

and assembled. The chromosome is of 3,935,416 bp and has 4,117 coding sequences

estimated. Figure 1 shows the cladogram based on the semi-conserved gyrB gene (Fukushima

et al., 2002) for 81 Escherichia strains. The separations of the Escherichia species are clearly

visible: E. coli, E. albertii, E. fergusonii. Also, some E. coli serotypes/pathotypes such as

O157:H7 STEC (EHEC), O145:H28 STEC (EHEC), O104:H4 (EAEC-STEC), O55:H7

(EPEC) and O111:H- (EPEC) formed distinctive clusters. However, most of the E. coli

pathotypes (in colors) did not form specific clusters based on the gyrB sequence. The isolate

E. coli O157:H- strain 06-01-03-17 clustered with most of the ExPEC but also with AIEC and

some strains with uncharacterized pathotypes. The E. coli strains, in black, with

uncharacterized pathotypes (include commensal and putative non-pathogenic strains) did not

seem to form a specific cluster. Figure 1S shows a cladogram based on the semi-conserved

gyrB gene showing a good phylogenetic separation of Escherichia, Salmonella and Shigella

strains.

Page 48: ESCHERICHIA - Université de Sherbrooke

35

Figure 1: Cladogram resulting from the alignments of the gyrB gene using Neighbor-joining

method (100 bootstraps). The branch support values are in percentages. The analysis was done

on 81 strains: 68 Escherichia coli, including strain 06-01-03-17 (our collection); 3 Escherichia

fergusonii; 7 E. albertii, including the strain ECC-Litt-3-1 (our collection); 1 E. hermanii; 1 E.

vulneris and 1 E. blattae. The E. coli pathotypes are color-based: pale blue: EHEC strains

(Enterohaemorrhagic E. coli); dark purple: EPEC (Enteropathogenic E. coli); yellow: EAEC-

STEC (Enteroaggregative and Shiga-toxigenic E. coli); dark blue: ETEC (Enterotoxigenic E.

coli); green: EAEC (Enteroaggregative E. coli); red: ExPEC (Extra-intestinal E. coli)

including UPEC (Uropathogenic E. coli) and NMEC (Neonatal Meningitis E. coli); light

purple: AIEC (Adherent-Invasive E. coli); grey: APEC (Avian Pathogenic E. coli). E. coli

strains that are in black are strains with uncharacterized pathotype (unknown pathogenicity or

non-pathogenic).

Page 49: ESCHERICHIA - Université de Sherbrooke

36

Figure 1S: Circular cladogram based on the gyrB gene using Neighbor-joining method (100

bootstraps). The branch support values are in percentages. The analysis was done on 115

strains: 81 Escherichia spp., including strains E. coli 06-01-03-17 and ECC-Litt-3-1 from our

collection, 5 Salmonella spp., 29 Shigella spp. In pale blue: E. coli strains; dark blue: E.

albertii; green: E. fergusonii; black: E. blattae, vulneris and hermannii; purple: Shigella spp.;

red: Salmonella spp.

Patterns found in the mutS-rpoS region. As expected, the E. coli pathotypes seems to be

correlated with mutS-rpoS patterns. Figure 2 shows seven different mutS-rpoS patterns found

in Escherichia, Salmonella and Shigella strains and the count of analyzed strains associated to

Page 50: ESCHERICHIA - Université de Sherbrooke

37

each pattern and similar to what was found previously (Ewers et al., 2014 ; Martinez-Garcia et

al., 2002). The mutS, rpoS and pphB genes were conserved in almost all E. coli strains.

The first pattern constitutes a 6.7 Kbp intergenic region with six predicted ORFs (the ygbI to

ygbN gene cluster) following mutS and pphB. This pattern was mostly observed in strains with

uncharacterized pathotypes including commensal E. coli K-12. It also was noted in all Shigella

sonnei and S. boydii (Figure 1: pattern II in Ewers et al., 2014). The second pattern of 2.8 Kbp

with 4 predicted ORFs (Z4045-48) presented no homology with the intergenic region of the

first pattern described above (Figure 1: pattern I in Ewers et al., 2014). This second pattern

was found in all O157:H7 (EHEC), most of the EHEC and in some EPEC strains as well as in

most of the S. dysenteriae and in all E. fergusonii. An insertion sequence instead of the pphB

locus was found in S. dysenteriae. The third pattern was a combination of the ygbI-N and

Z4045-48 gene groups found in patterns 1 and 2 and was detected in all O104:H4 strains

(EAEC-STEC) and in the majority of EPEC and E. albertii strains (Figure 1: pattern IV in

Ewers et al., 2014). The fourth pattern also harbored the ygbI-ygbN group found in the first

pattern in addition to a novel and unique group of 3.7 Kbp with two predicted ORFs (c3302

and c3304) (Figure 1: pattern III in Ewers et al., 2014). This pattern was observed in the

majority of ExPEC strains and in the the atypical and hypermutable O157 isolate 06-01-03-17.

The fifth pattern, showing only the mutS and rpoS genes in this region, was found in other

Escherichia species such as E. vulneris, E. hermannii and E. blattae. In some of these strains,

the rpoS gene was not detected. The sixth pattern was composed of some of the genes of the

groups ygbI-N and Z4045-48 and presented multiple insertion sequences. This pattern was

present in all Shigella flexneri strains. The seventh and last pattern was found in Salmonella

enterica strains and carried a unique group of 5 putative ORFs (t2811-15) although it also

contained homologs of the genes described in pattern 1 and 2. Noteworthy, those sequences

were partial and appeared in a reversed orientation compared to those found in E. coli strains

(i.e., ygbM-ygbI and Z4048-45).

Page 51: ESCHERICHIA - Université de Sherbrooke

38

Characterization of the c3302-04 region: phylogeny. The 3.7 Kb intergenic region with

putative genes c3302-04 representing the fourth mutS-rpoS pattern described above (Figure 2)

was previously reported in E. coli CFT 073 ExPEC (UPEC) (Culham and Wood, 2000 ; Ewers

et al., 2014). This region showed high homology (BLASTn) with the mutS-rpoS regions in 21

E. coli (5 uncharacterized strains, 3/3 AIEC, 1/2 APEC, 11/14 ExPEC, and isolate 06-01-03-

17) (Figure 2). All the targeted regions in these strains were aligned and a phylogenetic tree

was constructed with the region c3302-04 found in the 21 strains (Figure 3, left).

Characterization of the c3302-04 region: SNPs. The non-synonymous SNPs (nsSNPs) in

each of the 21 strains sharing pattern 4 (Figure 2) are represented by black boxes in the Figure

3. The SNPs profiles of the strain correlates with the clusters formed in the phylogenetic tree

(Figure 3, left). However, synonymous SNPs, which do not induced a change in the amino

acid produced, were found in a much higher frequency (not shown), an observation that

corroborates a previous study (Heberlin et al, 2000). Only one nsSNP found in the locus

c3302 of E. coli O6:H31:K15 str. 536 ExPEC (UPEC) was located in the region corresponding

to the zinc binding domain. All mutations found in the c3304 locus were located in the region

corresponding to the conserved FMN-reductase (Flavin mononucleotide) domain (Figure 3).

The region c3302-04 of isolate 06-01-03-17 clusters relatively closely (75 %) to that of E. coli

06:H3:K15 str. 536 ExPEC (UPEC) and E. coli 06:H31 str. F11 ExPEC (UPEC). The three

strains shared only one nsSNP in the 5’ c3302 locus and no nsSNP in the 3’ c3304 locus.

Isolate 06-01-03-17 harbored also a second SNP in the c3302 locus which is found in strains

E. coli ATCC 25922 and E. coli CFT 073 ExPEC (UPEC). A deletion was observed at the 3’

region of the locus c3302 in E. coli O25 str. NA114 ExPEC (UPEC). The strain E. coli ED1a

presenting a unique SNPs profile and did not cluster closely any other strains in the

cladogram.

Page 52: ESCHERICHIA - Université de Sherbrooke

39

Characterization of the c3302-04 region: proteins. The 5’ c3302 locus and the 3’ c3304

locus encode for two putative proteins that we named proteins c3302 and c3304, respectively.

A non-coding sequence was inserted between the two locus in all strains analyzed (Figure 3).

The analysis of the conserved domain in all strains using protein comparison in the NCBI

database ((NCBI ressource coordinators, 2015) showed a major zinc binding domain and

multiple punctual zinc binding sites in Protein c3302 while a major FMN-reductase binding

domain and multiple punctual FMN binding sites were detected in Protein c3304 (Figure 3).

Table 2 shows the predicted function of proteins c3302 and B according to I-TASSER

algorithms and comparison with the GO database. Protein c3302, encoded by the 3’ c3302

locus showed the highest similarity score, although relatively low (64 %), with proteins having

a β-lactamase/antibiotic/catabolic activity as well as with zinc ions binding proteins. Antibiotic

susceptibility tests performed in vitro, showed however no resistance of the two tested ExPEC

strains (E. coli CFT073 and E. coli 06-01-03-17) to cefotaxime and meropenem, ruling out the

presence of a functional metallo(Zn)--lactamase (data not shown). Protein c3302 showed a

lower similarity score (40 %) with proteins associated with electron carrier activity, FMN

binding and oxidoreductase activities. Protein c3304, encoded by the 5’ c3304 locus, had the

highest score similarity (99 %) with proteins binding to FMN, another high score (86 %) with

proteins having an electron carrier activity and a lower score (56 %) with proteins with

oxidoreductase activities.

Page 53: ESCHERICHIA - Université de Sherbrooke

40

Figure 2: Physical map (top of the figure) of the seven genomic mutS-rpoS patterns found in

Escherichia, Salmonella and Shigella spp. For each group of strains (same strains as in Figure

1 and 1S) listed, n represents the total number of strains in this group and, below each physical

map, the corresponding number of strains having the mutS-rpoS pattern. The groups of genes

in the mutS-rpoS region are classified by colours: in grey: mutS, pphB and rpoS genes; green:

ygbI-ygbN (locus b2735-b2740 from E. coli K-12 MG1655 GeneBank NC_000913.3); pink:

Z4045-Z4048 (locus Z4045-48 E. coli O157:H7 EDL933 STEC (EHEC) GeneBank

AE005174.2); orange: c3302-c3304 (locus c3302-04 E. coli 06:H1:K2 CFT073 ExPEC

(UPEC) GeneBank AE014075.1); blue: t2811-t2815 (locus t2811-15 Salmonella enterica

subs. enterica serovar Typhi Ty2 GeneBank AE014613.1). IS: Insertion Sequence.

Page 54: ESCHERICHIA - Université de Sherbrooke

41

Figure 3: On the left, cladogram based on the complete c3302-04 region using Neighbor-

joining method (100 bootstraps). The branch support values are in percentages. The analysis

was done for the 21 strains having the genes c3302-c3304 in their mutS-rpoS region (see

Figure 2, pattern 4, in orange). The physical map of the c3302 gene (coding for the putative

protein c3302), the c3303 region (IS, insertion sequence) and the c3304 gene (coding for the

putative protein c3304) shows the nsSNPs represented by small black boxes. The bigger black

box in E. coli O25 str. NA114 corresponds to a genomic deletion. On the top of the figure, in

red, is shown the putative zinc binding domain localization on protein c3302 and, in green, the

FMN (flavin mononucleotide) binding domain localization on protein c3304. Red arrows

represent the specific nucleotide sites possibly involved in zinc binding and the green arrows

in FMN binding.

Page 55: ESCHERICHIA - Université de Sherbrooke

42

Table 2: Predicted molecular and biological processes of the proteins c3302 and c3304

according to GOntology (GO).

DISCUSSION

Even though the 16S rDNA analysis is often used to classify organisms, it is not ideal for

separation of closely related species such as Shigella spp. and E. coli (Christense et al., 1998 ;

Fukushima et al., 2002). On the other hand, the DNA sequence of gyrB is often used in MLST

typing (multilocus sequence typing) of E. coli and is better than 16S rDNA to define

phylogenetic relationships of Shigella, E. coli and Salmonella (Fukushima et al., 2002). In this

study, the phylogenetic analysis of 115 Enterobacteriaceae was first done using the gyrB

housekeeping gene and allowed good separation of Escherichia spp., Salmonella spp. and

Shigella spp. (Figures 1 and 1S). In Figure 1S, Shigella spp. and E. coli cluster very closely.

Studies suggest that Shigella species are close enough to E. coli to be considered as a new E.

coli pathotype (Russo and Johnson, 2000). Also, in our study (Figure 1S), the strain Shigella

Page 56: ESCHERICHIA - Université de Sherbrooke

43

dysenteriae SD1D clustered perfectly with strain E. coli HS; both potential commensal strains

isolated from healthy human (Kaur et al., 2014; Rasko et al., 2008). The Escherichia species

(E. albertii, E. fergusonii and E. coli) are phylogenetically close but can all be distinctively

separated from each other by the gyrB-based analysis (Figure 1). The only exception was

strain E. albertii TW11588, an non-virulent environmental strain (Luo et al., 2011), which did

not cluster with the E. albertii group (Figure 1) as shown in the phylogenetic of core genes by

Luo et al. (2011).

Despite their phylogenetic cohesiveness, E. coli strains are very heterogeneous in terms of

pathogenicity and content in virulence genes. As mentioned above, E. coli strains can be

separated in three main categories: commensal, intestinal pathogen and extra-intestinal

pathogen. Commensal strains lack virulence traits found in pathogenic strains and do not

usually cause infection. Intestinal pathogenic strains are generally divided in well-known

pathotypes based on specific combinations of virulence traits such as that found in STEC-

EHEC, EPEC, ETEC, AIEC, and EAEC strains (Girardini et al., 2012; Russo and Johnson,

2000). Some atypical strains such as the highly virulent strains E. coli O104:H4 possess a

combination of virulence genes from the STEC (e.g., intimin) and EAEC pathotypes

(Brzuszkiewicz et al., 2011). Extra-intestinal pathogenic strains in addition to their ability to

colonize the intestinal tract of mammals and birds can infect almost all extra-intestinal organs

and thus cause a large range of diseases. At this time, only a few groups of site-specific

ExPEC are relatively well described in humans (UPEC and NMEC) and in avian strains

(APEC) (Russo et Johnson, 2000). As shown in Figure 1, some well-known intestinal E. coli

pathogens formed distinctive clusters by the gyrB-based phylogeny, but were not well

separated from non-pathogenic E. coli strains, similarly to that previously reported by

Fukushima et al. (2002). For example, our results indicated that the strains belonging to the

group of human and avian ExPEC (UPEC, NMEC; APEC), were not grouped in one specific

cluster and most of them could not be separated from other non-ExPEC strains (Figure 1).

ExPEC strains can have many combinations of virulence genes and their pathogenicity can be

influenced by many factors. Also, many ExPEC cannot be differentiated from commensal

Page 57: ESCHERICHIA - Université de Sherbrooke

44

strains based on their virulence profile (Köhler and Dobrindt, 2011) and commensal strains

can cause extra-intestinal infections when the host is compromised (Russo and Johnson,

2000). In brief, even if the gyrB-based phylogeny can separate E. coli from other

Enterobacteriaceae, it did not allow a good separation of pathogenic and non-pathogenic E.

coli strains. This was particularly true for ExPEC strains, which are composed of a large

number of strains with a wide range of pathogenic traits while also genetically similar to

commensal strains. We found here that the mutS-rpoS region may help discerning pathotypes,

including ExPEC strains.

The mutS-rpoS region is a chromosomal hot spot for recombination and gene exchange

(Brown et al., 2001). The mutS and rpoS genes are conserved among Enterobacteriaceae but

the intergenic mutS-rpoS region is highly diversified (Martinez-Garcia et al., 2003). The

groups of genes found in the mutS-rpoS region are not essential but most likely provide some

evolutionary advantages or abilities to adapt to stress or new environmental conditions. The

mutS-rpoS region may have contributed in evolution of pathogenic strains (Ewers et al., 2014).

The mutS-rpoS region was associated with some pathotypes in E. coli and this DNA region

could serve as chromosomal marker for virulence in E. coli strains (Herbelin et al., 2000 ;

Köhler and Dobrindt, 2011). Some particularities of the mutS-rpoS for ExPEC strains region

were recently reported (Ewers et al., 2014) and our study provides additional characterization

that documents further this DNA region and putative function in ExPEC.

We explored the intergenic mutS-rpoS region among 115 strains of the genus Escherichia,

Shigella and Salmonella. As shown in Figure 2, four of the seven mutS-rpoS region patterns

found in E. coli correlate with specific E. coli pathotypes. Pattern 1 is composed of six

specific putative coding regions, ygbI-ygbN, and is present in all mutS-rpoS region of

commensal K-12 and Shigella sonnei strains (Figure 2). This region may be an indicative of

lower or no pathogenicity. This region was also present in a majority of the uncharacterized E.

coli strains, a group composed mainly of commensal and non-pathogenic strains. Pattern 2

encloses four specific putative coding regions (Z4045-Z4048) and is found in most (77%)

Page 58: ESCHERICHIA - Université de Sherbrooke

45

EHEC strains and in all E. coli O157:H. It was also found in all Escherichia fergusonii and in

most of Shigella dysenteriae. This region may be associated with a common Shigella-like

ancestor and this is supported by the fact that the main Shigella-associated virulence factor:

Shiga-toxin (stx) is usually found in E. coli O157:H7, S. dysenteriae and E. fergusonii. Ewers

et al. (2014), did also associated this mutS-rpoS region with the typical EHEC strains (E. coli

O157:H7) and other EHEC class 1 as named by LeClerc et al. (1999). Pattern 3 shows a mix

of patterns 1 and 2 and contains both regions, ygbI-ygbN and Z4045-Z4048. This mutS-rpoS

pattern is found in O104:H4 strains, which contain virulence factors from EAEC and STEC

strains. This indicates lateral transfer between commensal strains (pattern 1) and E. coli

O157:H7 STEC-EHEC (pattern 2). Pattern 3 is found in EAEC-STEC strains but also in E.

albertii, in a majority of EPEC (67 %) including the EPEC reference strain E. coli E2348/69

and in some EHEC (23 %). All those pathotypes share a common major virulence factor, the

intimin, encoded by the LEE and leading to A/E lesions. This mutS-rpoS pattern is thus

associated with the groups of EPEC 1 and 2 and EHEC group 2 as defined by LeClerc et al.

(1999) and also reported by Ewers et al. (2014). The forth pattern is composed of nine putative

coding regions and is a mix of pattern 1 (ygbI-ygbN) with an additional unique coding region

(c3302-04). The latter region is the only region that is not found in other patterns among E.

coli and even among the large family of Enterobacteriaceae. The region c3302-04 may have

been transferred from another pathogenic strain that is still unknown.

The mutS-rpoS pattern 4 could thus be a good marker for ExPEC identification as we have

previously reported in a preliminary study (Lefebvre Garcia et al., 2014, poster) and as also

suggested by Ewers et al. (2014). This pattern was found in the majority (79 %) of ExPEC

including the UPEC strain E. coli CFT 073 and NMEC strains. In the study of Ewers et al.,

(2014), this mutS-rpoS pattern was also associated with E. coli CFT073 (UPEC) and other

highly pathogenic uro-pathogens (Culham and Wood, 2000; Heberlin et al., 2000). In the

same study, the strains having this fourth mutS-rpoS pattern both of clinical and faecal origin

were found exclusively in the B2 phylogenetic group. The B2 group is composed of the most

virulent ExPEC strains such as ST95, ST127, ST372, ST73, ST80 and the multi-resistant

Page 59: ESCHERICHIA - Université de Sherbrooke

46

ST131 (Clermont et al., 2013 ; Culham and Wood, 2000 ; Ewers et al., 2014). The

chromosomal virulence genes csgA, malX, chuA, vat and sitD were closely associated to this

mutS-rpoS pattern (Ewers et al., 2014). In our study, we found that other ExPEC strains

(21 %) could also be associated with the mutS-rpoS region pattern 2 (Figure 2), which is found

in highly pathogenic E. coli O157:H7 strains. One of the genes of pattern 2, slyA, has been

proved to cause tissue invasion in Salmonella strains and may thus help extra-intestinal tissue

invasion in E. coli strains (Buchmeier et al., 1997 ; Ewers et al., 2014). We found that one out

of two APEC strains also presents this pattern 2, which supports that APEC and ExPEC can be

closely related and can share some genetic background (Köhler and Dobrindt, 2011).

Also, in our study, all three AIEC strains as well as the atypical O157 isolate E. coli 06-01-03-

17 showed pattern 4. E. coli 06-01-03-17 was originally isolated from a healthy bovine host

but possesses virulence factors found in at least two highly pathogenic E. coli groups, ExPEC

and EPEC, having the capacity to induce intimin-associated lesions (1Lefebvre et al., 2009).

Furthermore, this isolate demonstrated a hypermutable phenotype which could be associated

with a defective MMRS (Kotewicz et al., 2002).

Besides, two others mutS-rpoS patterns (patterns 6 and 7, Figure 2) were found respectively in

Shigella flexneri and Salmonella enterica strains. Those patterns were composed of a mix of

patterns 1 and 2 suggesting lateral gene transfer between commensal E. coli, EHEC O157:H7,

Shigella flexneri and Salmonella enterica stains. In Shigella flexneri, the mutS-rpoS pattern

was however incomplete compared to those of E. coli and demonstrated many insertion

sequences, a sign of multiple recombination events in the mutS-rpoS region. In Salmonella

enterica strains, the mutS-rpoS intergenic region was found to be in the opposite orientation to

that found in E. coli strains and contained a novel group of genes not found in any of the E.

coli or Shigella strains analyzed.

In pattern 4, the proteins encoded by genes c3302 and c3304 in the mutS-rpoS region thus

appear associated with ExPEC strains.

Page 60: ESCHERICHIA - Université de Sherbrooke

47

In our study, the designated protein c3302, encoded by the 3’ c3302 locus, showed the highest

score similarity, although relatively low (64 %), with proteins having a β-

lactamase/antibiotic/catabolic activity and with proteins binding the zinc ion. However, the β-

lactamase function was excluded based on in vitro tests for strains harboring c3302-04 region.

Several studies, have also observed that the putative role of the protein encoded by c3302

showed limited level of similarity to enzymes implicated in antibiotic hydrolysis (Bellais et

al., 1999 ; Culham and Wood, 2000 ; Ewers et al., 2014;). We found that protein c3302 also

showed some similarity with proteins associated with electron carrier activity, FMN binding

and oxidoreductase activity and we suggest that protein c3302 may have a role in catabolic

activity ion (zinc) dependant. Besides, protein c3304, encoded by the 5’ c3304 locus, has

almost a perfect score similarity with proteins binding to FMN and several FMN binding sites

and a high score similarity with proteins having an electron carrier activity or oxidoreductase

activity. Culham and Wood (2000) has found low (26%) similarity between the 3’ locus c3304

(ORF183) and the WrbA protein, a flavodoxin-like protein expressed by E. coli K-12

MG1655 during stationary phase. Homologues of this protein exist in bacteria, yeast and

plants. Additional studies are needed to investigate the link between the two proteins.

However, the two proteins seem to have a similar function that is associated with

oxidoreductase and electron carrier activity.

However, some non-synonymous SNPs were found and may affect the expression or function

of the encoded proteins. For example, one unique nsSNP found in the c3302 gene of strain E.

coli O6:H3:K15 is in the conserved zinc binding domain. Also, all the nsSNPs found in the

c3304 region could have an effect on the FMN binding to the protein c3304 (Figure 3). Only

two exceptions, the atypical isolate 06-01-03-17 possesses a combination of nsSNPs found in

two different clusters of strains and strain E. coli ED1a showed a unique nsSNP pattern not

found in any other strains analyzed. The strains analyzed were grouped based on the sequence

of the complete c3302-04 DNA region and clustered according to their nsSNP patterns (Figure

3). Such an analysis could help characterization of ExPEC pathogenic subtypes and provide

additional information on the phylogeny of strains.

Page 61: ESCHERICHIA - Université de Sherbrooke

48

CONCLUSION

In this study, the mutS-rpoS intergenic regions of 115 strains: E. coli, Salmonella and Shigella

strains were compared and seven mutS-rpoS polymorphisms were identified. In E. coli strains,

four different mutS-rpoS patterns were found in specific pathotypes. One of the pattern was

strongly associated to ExPEC strains. This pattern is composed of a 3.7 Kb region that

contains the c3303-04 genes not found in other E. coli or Enterobacteriaceae. Those genes

represent interesting markers for ExPEC strains and ExPEC strains may be discriminated

further based on the nsSNP patterns found in this DNA region. Genes c3303-04 encodes two

proteins apparently having a similar function associated with oxidoreductase and electron

carrier activity. The functionality of those proteins and their role in ExPEC pathogenicity

remain to be determined.

ACKNOWLEDGEMENTS

This study was supported by Agriculture and Agri-Food Canada through the Sustainable

Agriculture Environmental Systems (SAGES) program to M. S. Diarra and by grant 89758-01

from the Natural Sciences and Engineering Research Council of Canada (NSERC) to F.

Malouin.

REFERENCES

1. Artimo P, Jonnalagedda M, Arnold K, Baratin D, Csardi G, de Castro E, Duvaud

S, Flegel V, Fortier A, Gasteiger E, Grosdidier A, Hernandez C, Ioannidis V,

Kuznetsov D, Liechti R, Moretti S, Mostaguir K, Redaschi N, Rossier G, Xenarios

I, Stockinger H. 2012. ExPASy: SIB bioinformatics ressource portal. Nucleic Acids

Res. 40:W597-W603.

2. Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA, Formsma

K, Gerdes S, Glass EM, Kubal M, Meyer F, Olsen GJ, Olson R, Osterman AL,

Overbeek RA, McNeil LK, Paarmann D, Paczian T, Parrello B, Pusch GD, Reich

Page 62: ESCHERICHIA - Université de Sherbrooke

49

C, Stevens R, Vassieva O, Vonstein V, Wilke A, Zagnitko O. 2008. The RAST

Server: rapid annotations using subsystems technology. BMC Genomics 9:75.

3. Aziz RK, Devoid S, Disz T, Edwards RA, Henry CS, Olsen GJ, Olson R,

Overbeek R, Parrello B, Pusch GD, Stevens RL, Vonstein V, Xia F. 2012. SEED

Servers: high-Performance Access to the SEED Genomes, Annotations, and Metabolic

Models. PLoS One 7:e48053.

4. Bellais S, Léotard S, Poirel L, Naas T, Nordmann P. 1999. Molecular

characterization of a carbapenem-hydrolyzing beta-lactamase from Chryseobacterium

(flavobacterium) indologens. FEMS Microbiol. Lett. 171:127-132.

5. Brown EW, Leclerc JE, Li B, Payne WL, Cebula TA. 2001. Phylogenetic Evidence

for Horizontal Transfer of mutS Alleles among Naturally Occurring Escherichia coli

Strains. J. Bacteriol. 183:1631–1644.

6. Brzuszkiewicz E, Thürmer A, Schuldes J, Leimbach A, Liesegang H, Meyer

FD, Boelter J, Petersen H, Gottschalk G, Daniel R. 2011. Genome sequences of two

isolates from the recent Escherichia coli outbreak in Germany reveal the emergence of

a new pathotypes: Entero-Aggregative-Haemorrhagic Escherichia coli (EAHEC).

Arch. Microbiol. 193:883-891.

7. Buchmeier N, Bossie S, Chen CY, Fang FC, Guiney DG, Libby SJ. 1997. SlyA, a

transcriptional regulator of Salmonella typhimurium, is required for resistance to

oxidative stress and is expressed in the intracellular environment of macrophages.

Infect. Immun. 65:3725–3730.

8. Christense H, Nordentoft S, Olsen JE. 1998. Phylogenetic relationships of

Salmonella based on rRNA sequences. Int. J. Syst. Bacteriol. 48:605-610.

9. Clermont O, Christenson JK, Denamur E, Gordon DM. 2013. The Clermont

Escherichia coli phylo-typing method revisited: Improvement of specificity and

detection of new phylo-groups. Environ. Microbiol. Rep. 5:58–65.

10. CodonCode Corporation. 2013. CodonCode Aligner, Better Software for DNA

sequencing. (http://www.codoncode.com/aligner/).

11. Culham DE, Wood JM. 2000. An Escherichia coli reference collection group B2-

and uropathogen-associated polymorphism in the rpoS-mutS region of the E. coli

chromosome. J. Bacteriol. 182:6272–6276.

Page 63: ESCHERICHIA - Université de Sherbrooke

50

12. Diarra MS, Giguère K, Malouin F, Lefebvre B, Bach S, Delaquis P, Aslam M,

Ziebell KA, Roy G. 2009. Genotype, serotype, and antibiotic resistance of sorbitol-

negative Escherichia coli isolates from feedlot cattle. J. Food Prot. 72:28–36.

13. Diarra MS, Silversides FG, Diarrassouba F, Pritchard J, Masson L, Brousseau R,

Bonnet C, Delaquis P, Bach S, Skura BJ, Topp E. 2007. Impact of feed

supplementation with antimicrobial agents on growth performance of broiler chickens,

Clostridium perfringens and enterococcus counts, and antibiotic resistance phenotypes

and distribution of antimicrobial resistance determinants in Escherichia coli isolates.

Appl. Environ. Microbiol. 73:6566–6576.

14. Dong T, Schellhorn HE. 2009. Global effect of RpoS on gene expression in

pathogenic Escherichia coli O157 :H7 strain EDL933. BMC Genomics. 10:349.

15. Dong T, Schellhorn HE. 2010. Role of RpoS in virulence of pathogens. Infect.

Immun. 78:887-897.

16. Edgar RC. 2004. MUSCLE: multiple sequence alignment with high accuracy and

high throughput. Nucleic Acids Res. 32:1792–1797.

(https://www.ebi.ac.uk/Tools/msa/muscle/).

17. Ewers C, Dematheis F, Singamaneni HD, Nandanwar N, Fruth A, Diehl I,

Semmler T, Wieler, LH. 2014. Correlation between the genomic o454-nlpD region

polymorphisms, virulence gene equipment and phylogenetic group of extraintestinal

Escherichia coli (ExPEC) enables pathotyping irrespective of host, disease and source

of isolation. Gut Pathog. 6:37.

18. Ferenci T. 2003. What is driving the acquisition of mutS and rpoS polymorphisms in

Escherichia coli?. Trends Microbiol. 11:457–461.

19. Forgetta V, Rempel H, Malouin F, Vaillancourt R Jr, Topp E, Dewar K, Diarra

MS. 2012. Pathogenic and multidrug-resistant Escherichia fergusonii from broiler

chicken. Poult. Sci. 91:512–25.

20. Fukushima M, Kakinuma K, Kawaguchi R. 2002. Phylogenetic analysis of

Salmonella, Shigella, and Escherichia coli strains on the basis of the gyrB gene

sequence. J. Clin. Microbiol. 40:2779–2785.

21. Galardini M, Biondi EG, Bazzicalupo M, Mengoni A. 2011. CONTIGuator : a

bacterial genomes finishing tool for structural insights on draft genomes. Source Code

Biol. Med. 6:11.

Page 64: ESCHERICHIA - Université de Sherbrooke

51

22. Gene Ontology Consortium. 2001. Creating the gene ontology resource: design and

implementation. Genome Res. 11:1425-1433.

23. Girardini LK, Siqueira FM, Krewer CC, da Costa MM, de Vargas AC. 2012.

Phylogenetic and pathotype analysis of Escherichia coli swine isolates from Southern

Brazil. Presq. Vet. Bras. 32:374–378.

24. Herbelin CJ, Chirillo SC, Melnick KA, Whittam, TS. 2000. Gene conservation and

loss in the mutS-rpoS genomic region of pathogenic Escherichia coli. J. Bacteriol.

182:5381–5390.

25. Hilali F, Ruimy R, Saulnier P, Barnabé C, Lebouquénec C, Tibayrenc M,

Andremont A. 2000. Prevalence of Virulence Genes and Clonality in Escherichia coli

Strains That Cause Bacteremia in Cancer Patients. Infect. Immun. 68:3983–3989.

26. Kaur G, Sathyabama S, Arora A, Verma S, Mubin N, Agrewala JN, Mayilraj S. 2014. Genome sequencing, annotation and comparative genomic analysis of Shigella

dysenteriae strain SD1D. Gut Pathog. 6:28.

27. Köhler CD, Dobrindt U. 2011. What defines extraintestinal pathogenic Escherichia

coli?. Int. J. Med. Microbiol. 301:642–647.

28. Kotewicz ML, Brown EW, Eugene LJ, Cebula TA. 2003. Genomic variability

among enteric pathogens: the case of the mutS-rpoS intergenic region. Trends

Microbiol. 11:2–6.

29. Kotewicz ML, Li B, Levy DD, LeClerc JE, Shifflet AW, Cebula TA. 2002.

Evolution of multi-gene segments in the mutS-rpoS intergenic region of Salmonella

enterica serovar Typhimurium LT2. Microbiology 148:2531–2540.

30. Landini P, Egli T, Wolf J, Lacour S. 2014. SigmaS, a major player in the response to

environmental stresses in Escherichia coli: role, regulation and mechanisms of

promoter recognition. Environ. Microbiol. Rep. 6:1-13.

31. LeClerc JE, Li B, Payne WL, Cebula TA. 1996. High mutation frequencies among

Escherichia coli and Salmonella pathogens. 274:1208-1211.

32. LeClerc JE, Li B, Payne WL, Cebula TA. 1999. Promiscuous origin of a chimeric

sequence in the Escherichia coli O157:H7 genome. J. Bacteriol. 181:7614–7617.

33. Lefebvre B, Diarra MS, Fairbrother JM, Dubois M Jr, Malouin F. 2010. Intestinal

mucosa adherence and cytotoxicity of a sorbitol-fermenting, Shiga-toxin-negative

Page 65: ESCHERICHIA - Université de Sherbrooke

52

Escherichia coli O157:NM isolate with an atypical type III secretion system.

Foodborne Pathog. Dis. 7:985-990.

34. Lefebvre B, Diarra MS, Giguère K, Roy G, Michaud S, Malouin F. 2005.

Antibiotic resistance and hypermutability of Escherichia coli O157 from feedlot cattle

treated with growth-promoting agents. J. Food Prot. 68:2411–2419.

35. Lefebvre B, Diarra MS, Moisan H, Malouin F. 2008. Detection of virulence-

associated genes in Escherichia coli O157 and non-O157 isolates from beef cattle,

humans, and chickens. J Food Prot. 71:1774–1784.

36. 1Lefebvre B, Diarra MS, Vincent C, Moisan H, Malouin F. 2009. Relative

cytotoxicity of Escherichia coli O157:H7 isolates from beef cattle and humans.

Foodborne Pathog. Dis. 6:357-364.

37. 2Lefebvre B, Gattuso M, Moisan H, Malouin F, Diarra MS. 2009. Genotype

comparison of sorbitol-negative Escherichia coli isolates from healthy broiler chickens

from different commercial farms. Poult. Sci. 88:1474–1484.

38. Lefebvre Garcia C, Vaillancourt R Jr, Jacques PE, Rodrigue S, Diarra MS,

Malouin F. 10-13 May 2014. MMRS-Related Genes in Hypermutable Escherichia

coli Strains. ECCMID, Barcelona, Spain (poster).

39. Luo C, Walk ST, Gordon DM, Feldgarden M, Tiedje JM, Konstantinidis KT. 2011. Genome sequencing of environmental Escherichia coli expands understanding

of the ecology and speciation of the model bacterial species. Proc. Natl. Acad. Sci.

U.S.A. 108:7200–7205.

40. Martinez-Garcia E, Tormo A, Navarro-Lloréns JM. 2003. Polymorphism in the

yclC-rpoS region of enterobacteria. Curr Microbiol. 46:365–370.

41. McWilliam H, Li W, Uludag M, Squizzato S, Park YM, Buso N, Cowley AP,

Lopez R. 2013. Analysis Tool Web Services from the EMBL-EBI. Nucleic Acids Res.

41:W597–600.

42. NCBI ressource coordinators. 2015. Database ressources of the National Center for

Biotechnology Information. Nucleic Acids Res.

43. Overbeek R, Olson R, Pusch GD, Olsen GJ, Davis JJ, Disz T, Edwards RA,

Gerdes S, Parrello B, Shukla M, Vonstein V, Wattam AR, Xia F, Stevens R. 2014.

The SEED and the Rapid Annotation of microbial genomes using Subsystems

Technology (RAST). Nucleic Acids Res. 42:D206–214.

Page 66: ESCHERICHIA - Université de Sherbrooke

53

44. Rasko DA, Rosovitz MJ, Myers GS, Mongodin EF, Fricke WF, Gajer P, Crabtree

J, Sebaihia M, Thomson NR, Chaudhuri R, Henderson IR, Sperandio V, Ravel J. 2008. The pangenome structure of Escherichia coli: comparative genomic analysis of

E. coli commensal and pathogenic isolates. J. Bacteriol. 190:6881–6893.

45. Rodrigue S, Materna AC, Timberlake SC, Blackburn MC, Malmstrom RR, Alm

EJ, Chisholm SW. 2010. Unlocking Short Read Sequencing for Metagenomics 5.

PLos One 5:e11840.

46. Roy A, Kucukural A, Zhang Y. 2010. I-TASSER: a unified platform for automated

protein structure and function prediction. Nat. Protoc. 5:725-738.

47. Russo TA, Johnson JR. 2000. Proposal for a new inclusive designation for

extraintestinal pathogenic isolates of Escherichia coli: ExPEC. J. Infect. Dis.

181:1753–1754.

48. Singer RS. 2015. Urinary tract infections attributed to diverse ExPEC strains in food

animals: evidence and data gaps. Front. Microbiol. 6:28.

49. Tamura K, Stecher G, Peterson D, Filipski A, Kumar S. 2013. MEGA6: Molecular

evolutionary genetics analysis version 6.0. Mol. Biol. Evol. 30:2725-2729.

50. Tsui HC, Feng G, Winkler ME. 1997. Negative regulation of mutS and mutH repair

gene expression by the Hfq and RpoS global regulators of Escherichia coli K-12. J.

Bacteriol. 179:7476–7487.

51. Yang J, Yan R, Roy A, Xu D, Poisson J, and Zhang Y. 2015. The I-TASSER Suite:

protein structure and function prediction. Nat. Methods. 12:7-8.

52. Zhang Y. 2008. I-TASSER server for protein 3D structure prediction. BMC

Bioinformatics 9:40.

Page 67: ESCHERICHIA - Université de Sherbrooke

54

CHAPITRE 3

Multiplex PCR Methods for Specific Detection of Escherichia albertii Strains

3.1. Introduction du deuxième article

Multiplex PCR Methods for the Detection and Molecular Identification of Escherichia

albertii

Auteurs de l’article: Catherine Lefebvre Garcia, Rolland Jr. Vaillancourt, Pierre-Étienne

Jacques, Sébastien Rodrigue, Moussa S. Diarra, François Malouin

Statut de l’article: Cet article sera soumis sous peu à la revue Applied and Environmental

Microbiology.

Avant-propos : La rédaction de cet article a été faite par Catherine Lefebvre Garcia sous la

supervision des Prs François Malouin et Moussa S. Diarra. Le séquençage Illumina des

souches ECC-Litt-3-1 et 06-01-03-17 a été réalisé par les membres du laboratoire du Pr.

Sébastien Rodrigue (M. Vincent Baby et M. Dominik Matteau). Les analyses des résultats de

séquençage ainsi que les comparaisons génomiques et protéiques ont été faites par Catherine

Lefebvre Garcia, avec la collaboration de : Pr Pierre-Étienne Jacques, Pr Sébastien Rodrigue,

M. Vincent Baby et M. Rolland Jr. Vaillancourt. Les réactions PCR ont été optimisées et

réalisées par Catherine Lefebvre Garcia avec le soutien technique de Mme Céline Ster et le Pr

François Malouin.

Page 68: ESCHERICHIA - Université de Sherbrooke

55

3.2. Résumé du deuxième article

Escherichia albertii est un organisme pathogène alimentaire émergent. E. albertii possède

plusieurs facteurs de virulence importants comme ceux associés aux lésions A/E chez les

EHEC-EPEC et exprime la toxine cytoléthale CDTB (Cytolethal distending toxin).

L’incidence de cette bactérie pathogène reste inconnue, mais des souches d’E. albertii ont été

reocnnues pour être l’agent causal d’éclosions diarrhéiques partout à travers le monde.

Il a été démontré qu’E. albertii a été directement impliqué dans des épisodes ponctuels et

sporadiques de diarrhée chez l’humain et les oiseaux. Le poulet pourrait représenter un vecteur

majeur pour la transmission chez l’humain. E. albertii ressemble beaucoup phénotypiquement

à d’autres Enterobacteriaceae et il a à maintes reprises été confondu avec E. coli ou Hafnia

alvei par les tests biochimiques.

Dans le laboratoire, un isolat de poulet E. albertii : ECC-Litt-3-1 a été isolé, caractérisé, et son

génome a été séquencé. Des analyses bio-informatiques incluant des comparaisons

génomiques avec d’autres souches d’E. albertii connues ont permis l’identification de gènes

spécifiques à E. albertii. Nous avons par la suite développer une méthode génomique (PCR)

pour identifier rapidement et spécifiquement E. albertii. Il s’agit d’une PCR nichée amplifiant

le gène putatif fumarate reductase permet la détection rapide et efficace d’E. albertii parmi

d’autres entérobactéries. La limite de détection est de 1-100 cfu. Une autre PCR mutlipex a été

dévelopée amplifiant des gènes de virulence présents chez E. albertii ainsi que trois gènes

spécifiques à E. albertii codant pour la fumarate reductase, superoxide reductase et Yad-like

fimbriae, permettant la caractérisation précoce des souches. Ces méthodes pourraient être

développées comme test de routine pour détecter et identifier des souches d’E. albertii dans

des spécimens cliniques. De plus, des études chez le poulet pourraient permettre de mieux

caractériser la prévalence d’E. albertii et son rôle dans la transmission chez l’humain.

Page 69: ESCHERICHIA - Université de Sherbrooke

56

3.3. Deuxième article

Multiplex PCR Methods for the Detection and Molecular Identification of Escherichia albertii

Catherine Lefebvre Garcia,1 Rolland Jr. Vaillancourt,

1 Pierre-Étienne Jacques,

1 Sébastien

Rodrigue,1 Moussa S. Diarra,

2 François Malouin

1*

Centre d’Étude et de Valorisation en Diversité Microbienne (CEVDM), Département de

biologie, Faculté de sciences, Université de Sherbrooke, Sherbrooke, Québec, Canada1;

Guelph Food Research Centre, Agriculture and Agri-Food Canada (AAFC), Guelph, Ontario,

Canada2

Running Head: PCR Detection and Identification of E. albertii

*Address correspondence to François Malouin, [email protected].

Page 70: ESCHERICHIA - Université de Sherbrooke

57

ABSTRACT

Escherichia albertii is associated with infections in humans and animals worldwide. This

emerging and potential foodborne pathogen is often misidentified by biochemical tests which

hardly discriminate it from other Enterobacteriaceae. In this study, whole genome sequencing,

comparative genome analysis and PCR methods were developed for an accurate detection of

E. albertii and some of its virulence genes. Genes specific to E. albertii were used to design

specific primers. A nested PCR using primers targeting an E. albertii putative fumarate

reductase gene provided accurate discrimination of E. albertii from other tested enterobacteria

with a detection limit of 1-100 cfu. Other nested multiplex PCR using primers targeting the

virulence genes eae (intimin) and ctdB (cytolethlal toxin subunit B) as well as three unique E.

albertii genes coding for the fumarate reductase, superoxide reductase and a Yad-like

fimbriae, provided some characterization of the isolates. Data from the present study showed

that whole genomic sequencing allowed the development of PCR methods to significantly

improve the detection of E. albertii while providing insight on the virulence potential of this

bacterium.

Key words: Multiplex PCR detection, Escherichia albertii, Enterobacteriaceae, food-borne

infections, emerging pathogen

Page 71: ESCHERICHIA - Université de Sherbrooke

58

INTRODUCTION

Escherichia albertii is an emerging enteric pathogen of humans and animals (Huys et al.,

2003). The first five strains of E. albertii, initially classified as Hafnia alvei, were isolated

from Bangladeshi children with diarrhea and symptoms such as dehydration, fever, vomiting

and abdominal distending (Albert et al., 1991; Albert et al., 1992; Huys et al., 2003). Sporadic

cases of E. albertii infections have occurred worldwide and several E. albertii outbreaks have

been reported (Asoshima et al., 2014 ; Nimri, 2013 ; Oaks et al., 2010; Oh et al., 2011; Ooka

et al., 2012;). In 2004, E. albertii caused the death of one hundred of Common redpoll

(Acanthis flammea) in Alaska (Oaks et al., 2010). E. albertii has been isolated from ill and

healthy birds and also from feline (Ooka et al., 2012), swine (Hinenoya et al., 2014), ground

beef, chicken giblet (liver), lettuce and turkey (Maeda et al., 2015). The chicken is considered

as a potential reservoir for human transmission (Oaks et al., 2010; Maeda et al., 2015). In

2003, a restaurant-associated outbreak occurred in Fukuoka, Japan. The causative agent of this

outbreak was originally described as an atypical E. coli but was later, classified as an E.

albertii strain (Ooka et al., 2013). Little is known on the prevalence and the distribution of E.

albertii in the environment and the food system. In United States, around 62,000,000 of food-

borne illnesses and around 3,200 deaths have unknown etiology and, emerging pathogens such

as E. albertii could be an important pathogen involved in these illnesses.

E. albertii strains can express several virulence genes including eae and ctdB as well as shiga-

like toxin (stx) which are directly associated with diarrhea (Hinenoya et al., 2014; Maheux et

al., 2014; Murakami et al., 2014; Nimri, 2013; Oaks et al., 2010; Oh et al., 2011; Ooka et al.,

2012). The eae gene located in the Locus of Enterocyte Effacement (LEE) encodes an intimin

protein which induces irreversible host-cell adhesion. In enterohemorragic E. coli (EHEC) and

enteropathogenic E. coli (EPEC) strains, this intimin and associated proteins (LEE or non-

LEE) cause attachment and effacement lesions (A/E) on the intestinal epithelium leading to a

severe diarrheal disease in the host. It has been reported that the intimin of E. albertii strains,

can cause A/E lesions in a rabbit model and induce atypical pedestal in vitro. In addition, some

Page 72: ESCHERICHIA - Université de Sherbrooke

59

E. albertii strains express the Stx but only the subtypes 2f (Ooka et al., 2012; Maeda et al.,

2015 ; Maheux et al., 2014; Murakami et al., 2014; Nimri, 2013; Ooka et al., 2012) or 2a

(Brandal et al., 2015) have been reported. The shiga-like toxin is a major virulence feature of

EHEC (STEC: Shiga Toxigenic E. coli) which can lead in 5-7 % of infected people to the

hemolytic uremic syndrome (HUS), a major concern for public health. Another important

characteristic of the majority of E. albertii strains is the presence of the ctdB gene encoding

the enzymatically active subunit of the cytolethal distending toxin: CDT. The CDT toxin cause

damages in host cell DNA and block the cellular replication cycle at the G1 or G2 phase, in

association with cell distension and eventually death. The ctdB gene is also common in STEC

(Shiga toxin producing E. coli) strains such as E. coli O157:H7, which can cause the

hemolytic uremic syndrome in up to 50 % of infected patients (Rosser et al., 2008). CTDB

homologues can also be found in other pathogenic genus such as Shigella spp. and

Campylobacter spp.. Until now, the E. coli heat labile and heat stable enterotoxin and the E.

coli EIEC (E. coli enteroinvasive) and Shigella invasion genes associated with a virulence

plasmid have not been detected in E. albertii strains.

E. albertii shares many phenotypic and genotypic features with other members of the

Enterobacteriaceae family and has probably been misclassified or non-detected by routine

tests. It represents a major pathogen in the food industry and its study should not be neglected.

The aim of this study was to identify specific and unique molecular targets to develop rapid

and specific multiplex PCR methods for the detection of E. albertii strains and identification

of some virulence genes. This was achieved using whole genome analysis of known E. albertii

strains as well as of an atypical eae-positive Escherichia strain isolated from broiler chicken.

Page 73: ESCHERICHIA - Université de Sherbrooke

60

Table 1 List of bacterial strains used in this study

Those strains will be used to test the PCR method for the detection and identification of E.

albertii. Gene’s description and length correspond to descriptions from E. albertii KF1;

GenBank Accession Number: CPOO7O25.1.

Page 74: ESCHERICHIA - Université de Sherbrooke

61

Table 2 List of primers used in this study

MATERIALS AND METHODS

Bacterial strains. All strains used in this study are presented in Table 1. The sequenced

isolate E. albertii ECC-Litt-3-1 initially identified as an atypical eae-positive atypical E. coli,

was from our collection. This strain was isolated from the litter of broiler chicken (Lefebvre et

al., 2009).

ECC-Litt-3-1 genome sequencing and assembly. The complete genome of the isolate ECC-

Litt-3-1 was sequenced using the next-generation Illumina technology. Illumina sequencing

libraries were prepared as fpreviously described (Rodrigue et al., 2010) and sequenced using

50 bp paired-end reads. The resulting sequences were assembled using the de novo

gsAssembler (Newbler) software version 2.6. The reads were also mapped to E. coli, Shigella

and Salmonella reference strains and were combiened for a final assembly. The results were

uploaded to the Rapid Annotation using Subsystem Technology (RAST, Aziz et al., 2008) for

a preliminary annotation. A specific annotation of regions and genes of interests was

Page 75: ESCHERICHIA - Université de Sherbrooke

62

performed using BLASTn (NCBI ressource coordinators, 2015) and results were visualized

with CLC Genomics Workbench (CLC Bio, Qiagen).

ECC-Litt-3-1 biochemical profiling. The biochemical properties of the strain ECC-Litt-3-1

were investigated using the API 20E strips according to the manufacturer’s specifications (API

20E Analytical Profile Index Biomérieux, QC, Canada). Additional characterization included

others biochemical tests: motility (Motility Test Medium), lactose fermentation (MacConkey

Agar and Trypticase Soy Agar) and sugar fermentation of glucose, mannitol, sorbitol and

rhamnose (Phenol red method). The E. albertii strains LMG 20973, E. albertii LMG 20976

and E. coli K-12 MG1655 were used as controls.

Genomic DNA extraction. Whole genomic sequences of all bacterial strains were extracted

with the GenElute Bacterial Genomic DNA Kit (Sigma-Aldrich, Oakville, ON), according to

the recommendations of the manufacturer.

Identification of distinctive genes. The identification of E. albertii-specific genes was done

in three steps. (1) The whole genome sequence of E. albertii KF1 (Fiedoruk et al., 2014) was

compared to the whole genome of E. coli K-12 MG1655 (NCBI nucleotide) using Contiguator

2 Bacterial Genomes Finishing Tool (default parameters) and all regions present in both

strains were excluded. (2) A second whole genome comparison was done to find conserved

genes among the four available E. albertii genomes documented in NCBI in 2014-2015 (KF1:

CP007025.1; TW15818: WGS project NZ_AEJY00000000.1; TW08933: WGS project

NZ_AEJU00000000.1; NBRC 107761/LMG 20976: WGS project NZ_BBMY00000000.1;

TW07627: WGS project NZ_BBMY00000000.1), in comparison to the genome of ECC-Litt-

3-1 using BLASTn (NCBI). (3) Finally, the conserved regions (100 % of homology and 100

% coverage) in all E. albertii strains were compared against the complete database of bacteria

available in NCBI and only unique and ubiquitous sequences in E. albertii strains were

chosen. Those regions were submitted to BLASTn (NCBI), BLASTx (NCBI) and RAST for

Page 76: ESCHERICHIA - Université de Sherbrooke

63

annotation (NCBI ressource coordinators, 2015). This analysis was done in parallel with the

analysis of orthologous protein clusters as described below.

Orthologous protein clusters comparisons. Eugene Koonin group’s COG software

(COGsoft, version 4.2.2), featuring the EdgeSearch algorithm, was used to compare the

clusters of orthologous groups (COG) between the E. albertii strains (Kristensen et al., 2010 ;

Tatusov et al., 2000). The program is freely available on the NCBI website

(http://ftp.ncbi.nih.gov/pub/wolf/COGs/COGsoft/). Briefly, COGs were constructed using the

PSI-BLAST function available on the NCBI website by comparing isolates between them and

determining the proteins likely to belong to an orthologous family (Altschul et al,. 1997).

Then, clusters were constructed using the symmetrical best hits between the isolates. These

results were manually separated to identify unique clusters of each isolates for comparison

purposes. The functions of clusters were then determined by RAST.

Primers design and in silico PCR. Primers were designed with the Primer3 online

application (Rozen and Skalestsky, 2000) in the selected coding regions specific to E. albertii.

The GyrB (DNA gyrase subunit B) gene was used as an internal positive control for

amplification of Enterobacteriaceae. The tested strains and primers used for the detection and

the identification of E. albertii are presented in Tables 1 and 2, respectively. In silico PCR

amplification (NCBI ressource coordinators, 2015) was performed using each pair of primers

with primer-BLAST (NCBI) to verify specificity of the primers in E. albertii.

Detection of E. albertii. A duplex nested colony PCR for the specific detection of E. albertii

strains among other Enterobacteriaceae was elaborated. The strains tested were E. albertii

ECC-Litt-3-1; two E. albertii (LMG20973 and LMG 20976), eight pathogenic and non-

pathogenic E. coli and four other pathogenic Enterobacteriaceae (Salmonella; Citrobacter;

Enterobacter and Escherichia fergusonii) that could be found in chicken. The primers were

designed to amplify two genetic targets: a region inside the semi-conserved gyrB gene (DNA

gyrase subunit B gene), which is the positive control for Enterobacteriaceae, and a region

Page 77: ESCHERICHIA - Université de Sherbrooke

64

inside of a putative fumarate reductase gene (FRD), specific to E. albertii strains. A second set

of primers (gyrB_nested and FRD_nested) hybridizing within the two first PCR products,

respectively, were designed to increase the sensitivity of the PCR (Table 2).

PCR detection limit for E. albertii. The duplex nested PCR for detection of E. albertii was

done with the primers previously described (gyrB, gyrB_nested, FRD and FRD_nested). In

order to verify the sensitivity of the PCR assay, different quantities of starting genomic

material in the first PCR were tested. (1) Ten-fold dilutions of E. coli K-12 MG1655 (105-10

0

cells); (2) Ten-fold dilutions of E. albertii ECC-Litt-3-1 (105-10

0 cells); (3) A mix of E. coli

(105 cells) and ten-fold dilutions of E. albertii (10

5 to 10

0 cells). The nested PCR was

performed using as starting material one µl of the first PCR reaction.

Identification of E. albertii and some of its virulence genes. This multiplex PCR was

performed on DNA of presumptive colonies of E. albertii. The primers (Table 2) were design

to amplify three E. albertii unique genes encoding for the putative fumarate reductase,

superoxide reductase and Yad-like fimbriae as well as two major virulence genes (eae and

ctdB II, III ,V) that can be found in E. albertii strains. The PCR was tested on ECC-Litt-3-1; E.

albertii LMG20973; E. albertii LMG 20976; E. coli K-12 MG1655.

PCR program and electrophoresis gel visualisation for all assays. The final 25-μl volume

of the PCR mixture contained 12.5 μl of Taq PCR Polymerase (New England Biolabs), 0.5

μM of each primer, 6.5 µl of molecular analysis-grade water, and genomic material (bacteria

or genomic DNA). The cycling conditions were 94°C for 3 min followed by 35 cycles of 94

°C for 30 s, 60 °C for 30 s, and 72 °C for 30 s. The PCR products were separated on a 1 %

Tris-acetate-EDTA buffered agarose electrophoresis gel stained with ethidium bromide. The

migration was 100 volts for 70 min. The bands were referenced to a 100-bp DNA ladder (New

England BioLabs Inc., Ville, Canada) to size the amplicons.

Page 78: ESCHERICHIA - Université de Sherbrooke

65

RESULTS

Bioinformatics. The whole genome of ECC-Litt-3-1 was sequenced and the chromosomal

DNA was assembled into 359 contigs. The genome size is of 4,293,476 bp and there are 4,179

predicted coding sequences. The complete gyrB (2415 bp) sequence comparison with the

whole bacterial non redundant (nr) NCBI nucleotide database showed the highest similarity

values with E. albertii KF1 at 99 % and with E. fergusonii ATCC 35469 and some E. coli

strains such as the uropathogenic E. coli CFT073, the avian pathogenic E. coli APEC O1 and

E. coli SMS-3-5 at 94 %. The species-specific primers used in this study were tested by in

silico PCR analysis and showed specific amplification of E. albertii strains among all the

bacterial NCBI genome database. Only one E. coli strain was amplified by all the species-

specific E. albertii and virulence gene primers designed in this study: E. coli 80B_L1 (WGS

project NZ_CDRK00000000.1, NCBI) and therefore, we suspected it to be an E. albertii.

ECC-Litt-3-1 biochemical profiling. The results of the API 20E test on type strains

E. albertii LMG20973 and LMG 20976 corresponded to that was found in other studies (Huys

et al., 2003), i.e., the identification of E. coli or Hafnia alvei with a poor confidence level.

Additional conventional tests for ECC-Litt-3-1 were done and it was found to be non-motile at

35 °C, glucose fermenting positive (with gas) and negative for the fermentation of lactose,

mannitol (variable), sorbitol and rhamnose. Considering only the biochemical tests of this

study, the strain ECC-Litt-3-1 has the same biochemical profile as E. albertii LMG20973.

Strain ECC-Litt-3-1 and E. albertii LMG20973 differed from E. coli K-12 MG1655 by the

lack of motility, the ornithine decarboxylase (positive) and showed no fermentation of lactose.

Detection of E. albertii. The result of the detection of E. albertii by PCR is shown in Figure 1.

The positive control gyrB product is of 982 bp, in the first PCR and 553 bp in nested PCR for

all Enterobacteriaceae tested including E.coli, E. fergusonii and Salmonella. The fumarate

reductase (FRD)-specific E. albertii PCR product was, as expected, of 351 bp in the first PCR

and of 160 bp in the nested PCR. The amplification product was observed only in E. albertii

Page 79: ESCHERICHIA - Université de Sherbrooke

66

strains but not in other Enterobacteriaceae and the results thus corresponded to in silico PCR

analysis.

PCR detection limit for E. albertii. Figures 2 and 3 show the results of the nested PCR

detection of E. albertii using variable quantities of starting genomic material in the first PCR:

E. albertii ECC-Litt-3-1 (105-1 cfu; left panel, Figure 2); E. coli K-12 MG1655 (10

5-1 cfu;

right panel, Figure 2) or a mix of E. coli (105 cfu) with E. albertii (10

5-1 cfu). The primers

targeting gyrB amplified specific products in both E. coli and E. albertii and the primers

targeting the FDR gene produced an amplicon only in E. albertii. The E. albertii products

resulting from the nested PCR assay were detectable using as little as 1-100 cfu as starting

material in the first PCR reaction. This was true even if E. albertii was mixed with as high as

105 E. coli cfu (Figure 3).

Identification of E. albertii and some of its virulence genes. Figure 4 shows the

amplification results using all six pairs of primers (Table 2) tested in simplex and in multiplex

for three E. albertii and one E. coli strains. The FRD, superoxide reductase and Yad-like

fimbriae primers amplified products of 351 bp, 164 bp and 555 bp, respectively, only in all

tested E. albertii strains. The results corresponded to the in silico PCR analysis. The eae and

cdtB primers amplified products of 698 and 351 bp in the E. albertii strains but not in E. coli

K-12 MG1655. Only the positive control, gyrB (982 bp) is amplified in both E. albertii and E.

coli strains, in both simplex and multiplex assays.

Page 80: ESCHERICHIA - Université de Sherbrooke

67

Figure 1 Detection of E. albertii by duplex PCR using the primers: gyrB_982 and FRD_351

for the first PCR and nested primers (gyrB_nested_553 and FRD_nested_160) and showing

amplification of the fumarate reductase (FRD) (351 bp and 160 bp) only in E. albertii strains

but not in the others Enterobacteriaceae tested. GyrB and gyrB_nested primers (targeting the

DNA gyrase subunit B gene) are used as postive controls. Lanes 1-15, first PCR; lanes 16-30,

nested PCR.

Lanes: M: 100-bp DNA Ladder; 1, 16: E. albertii ECC-Litt-3-1; 2, 17: E. albertii LMG

20973; 3, 18: E. albertii LMG 20976; 4, 19: E. coli K-12 MG1655; 5, 20: E. coli O127:H6

E2348/69 EPEC; 6, 21: E. coli O45:K-:H- ECL1001 EPEC; 7, 22: E. coli O78:H11 H10407

ETEC (ATCC 35401); 8, 23: E. coli O6:H1:K+ CFT073 UPEC; 9, 24: E. coli ATCC 25922;

10, 25: E. coli O1:K1:H7 NCTC 9001 APEC (ATCC 11775); 11, 26: E. coli O78:K80:H9

chi7122 APEC 12, 27: Salmonella enterica serovar Typhimurium (ATCC 14028); 13, 28:

Citrobacter freundii (ATCC 8090); 14, 29: Enterobacter cloacae (ATCC 35030); 15, 30:

Escherichia fergusonii ECD 227.

Page 81: ESCHERICHIA - Université de Sherbrooke

68

Figure 2: Duplex PCR using the primers: gyrB_982 and FRD_351 for the first PCR and

nested primers (gyrB_nested_553 and FRD_nested_160) showing amplification of the

fumarate reductase (FRD) (351 bp and 160 bp) in E. albertii strain only and not in E. coli

strain. GyrB and gyrB_nested primers (targeting the DNA gyrase subunit B gene) were used as

positive controls.

Lanes: 1-6: E. albertii ECC-Litt-3-1 (105-1 cfu) first PCR; 13-18: E. albertii ECC-Litt-3-1

(105-1 cfu) nested PCR; 7-12: E. coli K-12 MG1655 (10

5-1 cfu) first PCR; 19-24: E. coli K-

12 MG1655 (105-1cfu) nested PCR.

Page 82: ESCHERICHIA - Université de Sherbrooke

69

Figure 3 Duplex PCR using the primers: gyrB_982 and FRD_351 for the first PCR and nested

primers (gyrB_nested_553 and FRD_nested_160) showing amplification of the fumarate

reductase (FRD) (351 bp and 160 bp) only in E. albertii strains. The gyrB and gyrB_nested

primers (targeting the DNA gyrase subunit B gene) are used as positive controls. In each PCR

reaction, 105 cells of E. coli were added to ten-fold dilutions of E. albertii (10

5 to 1 cfu).

Lanes: 1-6: ECC-Litt-3-1 (105 to 1 cfu) and E. coli K-12 MG1655 (10

5 cfu) first PCR; Lanes

7-12: 1 µl of the first PCR reactions (lanes 1-6) were used in the nested PCR assay.

Page 83: ESCHERICHIA - Université de Sherbrooke

70

Figure 4. PCR identification of some virulence genes in E. albertii. Simplex and mutliplex

PCR using the primers gyrB_982, intimin_698, Yad-like_558, CDT, FRD_351 and SOR_164

showing amplification in E. albertii. The gyrB and gyrB_nested primers are used as positive

controls. The primers Yad-like_558, FRD_351 and SOR_164 target unique genes in E. albertii

strains. The primers: intimin_698 and CDT target the intimin (5’ eae) and the cytolethal toxin

(cdtB II, III, V), two virulence genes that can be found in in E. albertii and some other

Enterobacteriaceae.

Lanes: M: 100-bp DNA Ladder; 1-6: ECC-Litt-3-1 simplex; 7: E. albertii ECC-Litt-3-1

multiplex; 8-13: E. albertii LMG 20973 simplex; 14: E. albertii LMG 20973 multiplex: 15-

20: E. albertii LMG 20976 simplex; 21: E. albertii LMG 20976 multiplex; 22-27: E. coli K-

12 MG1655 simplex; 28: E. coli K-12 MG1655 multiplex.

Page 84: ESCHERICHIA - Université de Sherbrooke

71

DISCUSSION

Commercial biochemical test like API 20E or API 50CH (Biomérieux) have not integrated E.

albertii in their database yet and will lead typically to identification of E. albertii strains as

Hafnia alvei, E. coli, Shigella, Salmonella enterica or Yersinia ruckeri. In this study, ECC-

Litt-3-1 was, not surprisingly, identified as Hafnia alvei by API 20E strips. Even if E. albertii

shares many biochemical characteristics with Hafnia alvei or inactive E. coli (also called

Alkalescens/Dispar), their pathogenicity remains completely divergent. The 16S rDNA based

phylogeny is a typical method used in bacterial identification. In fact, many studies have used

this method to correctly classified E. albertii isolates into the Escherichia/Shigella

phylogenetic lineage. However, 16S rDNA sequencing does not usually allow good

discrimination between closely related strains when used alone as an identification method.

Also, the semi-conserved gene gyrB, used in this study allowed better separation of

Enterobacteriaceae. The gyrB gene in E. albertii isolate Litt-3-1 showed 99 % homology with

E. albertii KF1 and 94 % with E. coli and E. fergusonii. Other studies using DNA-DNA

hybridization studies, O-antisera serotyping, plasmid profile analysis (E. coli pVIR, pO157 or

pEAF), chromosome integration site of the LEE (in the pheU tRNA), phoE (OMP gene)

specific Escherichia/Shigella lineage gene and susceptibility to specific antibiotics and to

Hafnia alvei phages have helped the classification of E. albertii isolates into the Escherichia

family and provided hints for the creation of the new species E. albertii. The presence of

virulence genes can also help identification of specific strains and species. In particular, the

intimin gene eae can be found in typical EHEC strains. The intimin subtypes identified in

E. albertii strains are usually rare or previously undescribed in E. coli (Ooka et al., 2012).

Whole-genome sequencing has become more affordable in the last decade and has provided a

lot of information about bacterial genomic contents useful for phylogenetic classification.

Until now, only five E. albertii complete genomes are available on the NBCI nucleotide

database and only one multiplex PCR for E. albertii has been developed (Hyma et al., 2005).

The primers of this PCR are designed to detect regions in lysP (lysine specific permease) and

Page 85: ESCHERICHIA - Université de Sherbrooke

72

in mdh (malate dehydrogenase), two housekeeping genes of the E. albertii lineage. These

primers have been used in other studies. The study of Konno et al. (2012) expanded the PCR

test by targeting additional genes: stx, eae, uidA (β-D-glucuronidase) and ctdB. However,

Maeda et al. (2014) reported the amplification of a nonspecific product using the lysP/mdh

primers on other pathogenic species isolated from bean sprouts, which may lead to a false

positive detection of E. albertii in food. They also designed a novel set of primers: EA0134-

283F/EA0134-446R amplifying a 209 bp product specific to E. albertii. The latter primers

were tested on pure bacterial colonies but not on food samples. We found that such primers

however show some single nucleotide polymorphism (SNP) for strains E. albertii ECC-Litt-3-

1, KF-1, TW08933, TW15818, and E. coli 80B, the latter being possibly a E. albertii (data not

shown).

The PCR primers and method we have developed and reported here showed high specificity in

detecting E. albertii strains (in silico and using reference strains in vitro). Furthermore, the

nested primers we designed help to increase sensitivity for detection of as low as 1-100 cfu

even when mixed with a larger proportion of other Enterobacteriaceae such as E. coli. This is

thus a simple and easy PCR method that could be used as a routine test to accurately detect E.

albertii in food or fecal samples.

Besides, we also developed a multiplex PCR method that could be used on presumptive E.

albertii isolates with the objective of also characterizing their virulence potential. The

virulence genes eae and ctdB were chosen as targets because they appear to be critical

components of the virulence of E. albertii (Hinenoya et al., 2014; Maheux et al., 2014;

Murakami et al., 2014; Nimri, 2013; Oaks et al., 2010; Oh et al., 2011; Ooka et al., 2012).

Those genes were amplified in all E. albertii strains we tested including isolate ECC-Litt-3-1.

There are about 20 different subtypes of the intimin encoding gene. The intimin gene can be

found in other Enterobacteriaceae such as Citrobacterium and diarrheagenic E. coli causing

A/E lesions. The 3’ region of this gene, encoding the domain responsible for binding to host

epithelial cells, is highly variable (Oaks et al., 2010). The eae primers we selected in this study

Page 86: ESCHERICHIA - Université de Sherbrooke

73

were designed to target a well conserved 5’ region found in E. albertii but also in

EHEC/EPEC strains. Additionally, the cytolethal distending toxin (CDT) can be isolated from

a variety of pathogens including pathogenic E. coli, Shigella and Campylobacter spp.. The

CdtB subunit is an enzymatically active region homologous to a class of phosphodiesterases

which includes nucleases (Hyma et al., 2005). The primers of ctdB gene amplify a common

region in the subtypes II, III and V which are the most commonly subtypes found in E. albertii

strains (Maheux et al., 2014).

Our multiplex PCR that aims at strain characterization also amplifies three other genes unique

to E. albertii for confirmation of species identification. The specificity of the PCR assay was

demonstrated against three E. albertii and 12 other chicken pathogens. In silico PCR was also

performed against all de Enterobacteriaceae genomes available in the NCBI database. Finally,

the two PCR methods developed here (nested PCR for detection of E. albertii in mixed

samples and the multiplex PCR for species confirmation and strain characterization) allowed

confirmation of the classification of the isolate ECC-Litt-3-1 as an E. albertii eae and ctdB

positive. This potential pathogenic strain ECC-Litt-3-1 was isolated from chicken litter and

was initially misidentified as E. coli (Lefebvre et al., 2009). The next step is to test our PCR

methods on food or clinical samples.

CONCLUSION

E. albertii is poorly characterized and its incidence in food and its clinical impact are unknown

probably due in part to its misidentification by biochemical tests. E. albertii strains have a

high pathogenic potential and the detection of such emerging pathogens should not be

neglected. In this study, we develop two PCR methods for the detection of E. albertii among

other enteric bacteria and for the identification of some of its related virulence genes. The

primers were designed to target three specific and unique E. albertii genes, not previously

identified in other studies, and showed high specificity in vitro and in silico. This method is

very sensitive and can detect as low as 1-100 cfu even among a large concentration of other

Page 87: ESCHERICHIA - Université de Sherbrooke

74

Enterobacteriaceae. The PCR methods developed here could help quick identification of E.

albertii strains in routine tests and will certainly help the global distribution and clinical

impact of E. albertii strains in health and agro-food sectors.

ACKNOWLEDGEMENTS

This study was supported by Agriculture and Agri-Food Canada through the Sustainable

Agriculture Environmental Systems (SAGES) program to M. S. Diarra and by grant 89758-01

from the Natural Sciences and Engineering Research Council of Canada (NSERC) to F.

Malouin.

REFERENCES

1. Asoshima N, Matsuda M, Shigemura K, Honda M, Yoshida H, Hiwaki H, Ogata

K, Oda T. 2014. Identification of Escherichia albertii as a Causative Agent of a Food-

Borne Outbreak Occurred in 2003. Jpn. J. Infect. Dis. 67:139–140.

2. Albert MJ, Alam K, Islam M, Montanero J, Rahaman AS, Haider K, Hossain

MA, Kibriya AK, Tzipori S. 1991. Hafnia alvei, a probable cause of diarrhea in

humans. Infect. Immun. 59:1507-1513.

3. Albert MJ, Faruque SM, Ansaruzzaman M, Islam MM, Haider K, Alam K, Kabir

I, Robins-Browne R. 1992. Sharing of virulence-associated properties at the

phenotypic and genetic levels between Escherichia coli and Hafnia alvei. J. Med.

Microbiol. 37:310-314.

4. Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman, DJ. 1997. Gapped BLAST and PSI- BLAST: a new generation of protein database search

programs. Nucleic acids Res. 25:3389–3402.

5. Asoshima N, Matsuda M, Shigemura K, Honda M, Yoshida H, Hiwaki H, Ogata

K, Oda T. 2014. Identification of Escherichia albertii as a Causative Agent of a Food-

Borne Outbreak Occurred in 2003. Jpn. J. Infect. Dis. 67:139–140.

6. Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA, Formsma

K, Gerdes S, Glass EM, Kubal M, Meyer F, Olsen GJ, Olson R, Osterman AL,

Page 88: ESCHERICHIA - Université de Sherbrooke

75

Overbeek RA, McNeil LK, Paarmann D, Paczian T, Parrello B, Pusch GD, Reich

C, Stevens R, Vassieva O, Vonstein V, Wilke A, Zagnitko O. 2008. The RAST

Server: rapid annotations using subsystems technology. BMC Genomics 9:75.

7. Brandal LT, Tunsjø HS, Ranheim TE, Løbersli I, Lange H, Wester AL. 2015.

Shiga Toxin 2a in Escherichia albertii. J. Clin. Microbiol. 53:1454-1455.

8. Donato KA, Zareie M, Jassem AN, Jandu N, Alingary N, Carusone SC, Johnson-

Henry KC, Sherman PM. 2008. Escherichia albertii and Hafnia alvei are candidate

enteric pathogens with divergent effects on intercellular tight junctions. Microb.

Pathog. 45:377–385.

9. Felföldi T, Heéger Z, Vargha M, Márialigeti K. 2010. Detection of potentially

pathogenic bacteria in the drinking water distribution system of a hospital in Hungary.

Clin. Microbiol. Infect. 16:89–92.

10. Fiedoruk K, Daniluk T, Swiecicka I, Murawska E, Sciepuk M, Leszczynska K. 2014. First complete genome sequence of Escherichia albertii strain KF1, a new

potential human enteric pathogen. Genome Announc. 2:pii: e00004-14.

11. Hinenoya A, Shima K, Asakura M, Nishimura K, Tsukamoto T, Ooka T, Hayashi

T, Ramamurthy T, Faruque SM, Yamasaki S. 2014. Molecular characterization of

cytolethal distending toxin gene-positive Escherichia coli from healthy cattle and

swine in Nara, Japan. BMC Microbiol. 14:97.

12. Huys G, Cnockaert M, Janda JM, Swings J. 2003. Escherichia albertii sp. nov., a

diarrhoeagenic species isolated from stool specimens of Bangladeshi children. Int. J.

Syst. Evol. Microbiol. 53:807–810.

13. Hyma KE, Lacher DW, Nelson AM, Bumbaugh AC, Janda JM, Strockbine NA,

Young VB, Whittam TS. 2005. Evolutionary genetics of a new pathogenic

Escherichia species: Escherichia albertii and related Shigella boydii strains. J.

Bacteriol. 187:619–628.

14. Janda JM, Abbott SL. 2006. The genus Hafnia: from soup to nuts. Clin. Microbiol.

Rev. 19:12–18.

15. Kristensen DM, Kannan L, Coleman MK, Wolf YI, Sorokin A, Koonin E V,

Mushegian A. 2010. A low-polynomial algorithm for assembling clusters of

orthologous groups from intergenomic symmetric best matches. Bioinformatics

26:1481–1487.

Page 89: ESCHERICHIA - Université de Sherbrooke

76

16. Konno T, Yatsuyanagi J, Takahashi S, Kumagai Y, Wada E, Chiba M, Saito S. 2012. Isolation and identification of Escherichia albertii from a patient in an outbreak

of gastroenteritis. Jpn. J. Infect. Dis. 65:203–207.

17. Lefebvre B, Gattuso M, Moisan H, Malouin F, Diarra MS. 2009. Genotype

comparison of sorbitol-negative Escherichia coli isolates from healthy broiler chickens

from different commercial farms. Poult. Sci. 88:1474-1484.

18. Lindsey RL, Fedorka-Cray PJ, Abley M, Turpin JB, Meinersmann RJ. 2015.

Evaluating the Occurrence of Escherichia albertii in Chicken Carcass Rinses by PCR,

Vitek Analysis, and Sequencing of the rpoB Gene. Appl. Environ. Microbiol.

81:1727–1734.

19. Ling J, Sharma M, Bhagwat AA. 2008. Role of RNA polymerase sigma-factor

(RpoS) in induction of glutamate-dependent acid-resistance of Escherichia albertii

under anaerobic conditions. FEMS Microbiol. Lett. 283:75–82.

20. Maeda E, Murakami K, Okamoto F, Etoh Y, Sera N, Ito K, Fujimoto S. 2014.

Nonspecificity of Primers for Escherichia albertii Detection. Jpn. J. Infect. Dis.

67:503–505.

21. Maeda E, Murakami K, Sera N, Ito K, Fujimoto S. 2015. Detection of Escherichia

albertii from chicken meat and giblets. J. Vet. Med. Sci. 77:871-873.

22. Maheux AF, Boudreau DK, Bergeron MG, Rodriguez MJ. 2014. Characterization

of Escherichia fergusonii and Escherichia albertii isolated from water. J. Appl.

Microbiol. 117:597–609.

23. Murakami K, Etoh Y, Tanaka E, Ichihara S, Horikawa K, Kawano K, Ooka T,

Kawamura Y, Ito K. 2014. Shiga Toxin 2f-Producing Escherichia albertii from a

Symptomatic Human. Jpn. J. Infect. Dis. 67:204–208.

24. NCBI ressource coordinators. 2015. Database ressources of the National Center for

Biotechnology Information. Nucleic Acids Res.

25. Nimri LF. 2013. Escherichia albertii, a newly emerging enteric pathogen with poorly

defined properties. Diagn. Microbiol. Infect. Dis. 77:91–95.

26. Oaks JL, Besser TE, Walk ST, Gordon DM, Beckmen KB, Burek KA, Haldorson

GJ, Bradway DS, Ouellette L, Rurangirwa FR, Davis MA, Dobbin G, Whittam

TS. 2010. Escherichia albertii in wild and domestic birds. Emerg. Infect. Dis. 16:638–

646.

Page 90: ESCHERICHIA - Université de Sherbrooke

77

27. Oh JY, Kang MS, Hwang HT, An BK, Kwon JH, Kwon YK. 2011.

Epidemiological investigation of eaeA-positive Escherichia coli and Escherichia

albertii strains isolated from healthy wild birds. J. Microbiol. 49:747–752.

28. Ooka T, Seto K, Kawano K, Kobayashi H, Etoh Y, Ichihara S, Kaneko A, Isobe J,

Yamaguchi K, Horikawa K, Gomes TA, Linden A, Bardiau M, Mainil JG, Beutin

L, Ogura Y, Hayashi T. 2012. Clinical Significance of Escherichia albertii. Emerg.

Infect. Dis. 18:488-492.

29. Ooka T, Tokuoka E, Furukawa M, Nagamura T, Ogura Y, Arisawa K, Harada S,

Hayashi T. 2013. Human gastroenteritis outbreak associated with Escherichia albertii,

Japan. Emerg. Infect. Dis. 19:144–146.

30. Rodrigue S, Materna AC, Timberlake SC, Blackburn MC, Malmstrom RR, Alm

EJ, Chisholm SW. 2010. Unlocking Short Read Sequencing for Metagenomics 5.

PLos One 5:e11840.

31. Rosser T, Dransfield T, Allison L, Hanson M, Holden N, Evans J, Naylor S, La

Ragione R, Low JC, Gally DL. 2008. Pathogenic potential of emergent sorbitol-

fermenting Escherichia coli O157:NM. Infect. Immun. 76:5598–5607.

32. Rozen S, and Skalestsky HJ. 2000. Primer3 on the WWW for general users and for

biologist programmers. Methods Mol. Biol. 132: 365-386.

33. Sharma M, Kniel KE, Derevianko A, Ling J, Bhagwat AA. 2007. Sensitivity of

Escherichia albertii, a potential food-borne pathogen, to food preservation treatments.

Appl. Environ. Microbiol. 73:4351–4353.

34. Stock I, Rahman M, Sherwood KJ, Wiedemann B. 2005. Natural antimicrobial

susceptibility patterns and biochemical identification of Escherichia albertii and

Hafnia alvei strains. Diagn. Microbiol. Infect. Dis. 51:151–163.

Page 91: ESCHERICHIA - Université de Sherbrooke

78

CHAPITRE 4

DISCUSSION ET CONCLUSION

4.1. Le MMRS et la région mutS-rpoS

Certaines souches d’Escherichia coli ont acquis des gènes favorisant leur colonisation et leur

virulence chez les humains et les animaux. En effet, il existe plusieurs virotypes causant une

variété d’infections autant intestinales qu’extra-intestinales, en passant par la dysenterie, les

infections urinaires et la méningite. Les souches commensales et pathogéniques font face à

une pression sélective et doivent continuellement s’adapter à des nouvelles conditions

environnementales. À titre d’exemple, les études précédentes dans notre laboratoire ont

démontré que l’utilisation d’antibiotiques en tant que promoteurs de croissance chez les

animaux de ferme favorise le développement de souches résistantes (Lefebvre et al., 2005).

La variabilité d’E. coli est très grande et différents mécanismes contribuent à sa

diversité comme le transfert d’éléments génétiques mobiles codant la plupart du temps pour

des déterminants virulents et les modifications génétiques. Plusieurs études, ont en effet

démontré que le génome d’E. coli possède de nombreuses séquences d’insertion et de

bactériophages. De nombreux échanges génétiques entre des souches d’E. coli spp.,

Salmonella spp. et Shigella spp. ont eu lieu par le passé et comme nous l’avons démontré ces

souches sont très proches phylogénétiquement.

Afin d’atteindre les objectifs du projet, des études de génomique comparative ont été réalisées

sur certaines régions génomiques chez les entérobactéries. Nous avons inclut dans l’analyse

deux isolats atypiques hypermutables du genre Escherichia (06-01-03-17 et ECC-Litt-3-1)

dont les génomes complets ont été séquencés. Durant la dernière décennie, une augmentation

Page 92: ESCHERICHIA - Université de Sherbrooke

79

drastique de l’utilisation des technologies de séquençage à haut débit a été observée. Ces

technologies sont de plus en plus accessibles et permettent de produire des résultats sur

l’ensemble du génome. Cela peut s’avèrer très utile pour mieux comprendre les mécanismes

d’évolution au niveau génomique. Les applications des données de séquençage sont

nombreuses et incluent: l’épidémiologie, le diagnostic clinique, l’identification de cibles

moléculaires thérapeutiques, la génétique et même la surveillance des souches pathogènes

émergentes et les mécanismes reliés à cette émergence.

Le but de la première partie de ce projet était de caractériser et comparer la variabilité dans les

régions mutS-rpoS chez E. coli, Salmonella, Shigella et les deux isolats atypiques

hypermutables. Le phénotype hypermutable de la souche 06-01-03-17 est fort probablement la

conséquence de mutations dans les gènes du MMRS et nous pensons qu’elle pourrait être aussi

liée à la région mutS-rpoS. Aussi, deux gènes spécifiques aux ExPEC hautement pathogènes

ont été explorés en tant que marqueurs pour l’identification et la caractérisation des E. coli

extra-intestinaux.

La région mutS-rpoS est une des principales sources de diversité chromosomique chez E. coli.

C’est une région connue pour être hautement polymorphique et favorable aux mutations et aux

transferts latéraux chez les souches d’E. coli et même chez la grande famille des

Enterobacteriaceae. Comme décrit dans la littérature, nous avons observé sept régions mutS-

rpoS différentes de longueurs variables, ce qui nous a permis de constater la grande variabilité

dans cette région chez Escherichia spp., Salmonella spp. et Shigella spp. Chez, E. coli, la

région mutS-rpos a été décrite comme étant un bon marqueur de la pathogénicité des souches

puisque cette région est corrélée avec certains virotypes. De plus, les gènes à l’intérieur de

cette région sont vraisemblablement reliés à la virulence des souches et à l’adaptation rapide

dans un nouvel environnement (Ewers et al., 2014). Chez E. coli, quatre régions mutS-rpoS

ont été retrouvées et sont associées majoritairement à certains virotypes: 1) K-12 and

commensal 2) O157:H7 and EHEC 3) O104:H4 and EAEC and EPEC 4) ExPEC.

Page 93: ESCHERICHIA - Université de Sherbrooke

80

Nous avons examiné une sous-région de 3.7 kb à l’intérieur de la région mutS-rpoS retrouvée

chez la majorité des E. coli extra-intestinaux: c3302-04. Cette région n’est pas retrouvée chez

d’autres Enterobacteriaceae disponibles dans la banque de données NCBI. Comme décrit par

Ewers et al., 2014), cette sous-région est liée presqu’exclusivement au groupe phylogénétique

B2, composé des souches ExPEC hautement virulentes comme la souche multi-résistante

ST131 (Ewers et al., 2014; Clermont et al., 2013; Culham et Wood, 2000).

Bien qu’il existe énormément d’information dans la littérature sur la virulence des souches

intestinales, très peu d’information est disponible sur les souches invasives comme les ExPEC.

En plus de leur habileté à coloniser le tractus intestinal des mammifères et des oiseaux, elles

peuvent infecter pratiquement tous les organes et causer une grande variété de maladies. Les

groupes de souches les plus connues chez les souches d’E. coli extra-intestinales sont les

UPEC (urinaires) et les NMEC (méninigite) chez l’humain et les APEC, chez les oiseaux. La

présence de la région c3302-04 chez les APEC reste à confirmer, mais diverses études ont

démontré une grande similarité génomique entre les ExPEC humains et les APEC.

En plus, les souches ExPEC sont souvent confondues avec les souches commensales et la

différenciation basée sur leur profil de virulence est difficile. Il est connu que toute souche

pathogène peut coloniser de façon asymptomatique, mais peuvent être nocives lorsque les

défenses naturelles de l’hôte sont affaiblies. Nous avons en effet observé que certaines souches

E. coli dont la pathogénicité n’a pas été observée jusqu’à maintenant ont la même région

mutS-rpoS que les ExPEC et autres virotypes. Cela porte à croire que ces souches ont un

potentiel de virulence élevé et pourraient être de futures souches pathogènes émergentes. Il

serait quand même intéressant d’identifier les genes de virulence chez les souches étudiées

afin d’avoir une meilleure idée de leur profil de virulence et de leur virotypes, en particulier

les souches commensales, non pathogènes ou atypiques ayant une region mutS-rpoS différente

des autres souches du même virotype.

Page 94: ESCHERICHIA - Université de Sherbrooke

81

La région c3302-04 a été explorée en tant que marqueur pour l’identification et la

caractérisation des E. coli extra-intestinaux. Cette région a possiblement été transférée d’autres

genres ou espèces pathogéniques. Les rôles des régions codantes c3302 et c3304 sont

sûrement intimement associées à la pathogénicité de la plupart des ExPEC et autres souches

reliées: résistance aux mutations, colonisation et invasion extra-intestinale. Dans cette étude, le

locus c3302 était associé à la liaison au zinc et des activités cataboliques tandis que c3304 était

plutôt associé à la liaison du FMN (flavine mononucléotide) et les activités d’oxido-réduction.

Entre ces deux régions codantes, on retrouve une séquence d’insertion, ce qui indique un site

potentiel pour le transfert latéral et les recombinaisons génétiques dans cette région. Des

études supplémentaires pourraient être faites dans le but de vérifier si ces deux genes sont

toujours transférés ensemble et/ou si leur function est reliée.

En comparant cette région chez les souches d’E. coli, nous avons observé que les loci c3302-

04 sont très bien conservés. La majorité des mutations n’ont pas d’effet sur la protéine codée,

mais quelques mutations clés, situées dans les domaines protéiques conservés ont été trouvées.

Ces mutations pourraient avoir un effet important sur l’expression de la protéine et sur la

pathogénicité des souches et peut apporter des informations sur la phylogénie et la virulence

des ExPEC. La region c3302-04 était aussi présente chez l’isolat bovin E. coli hypermutable

06-01-03-17 et les mutations dans cette region pourraient être impliquées dans l’apparition du

phenotype d’hypermutabilité. Il serait intéressant de vérifier l’effet de cette region sur la

virulence de cet isolat ainsi que chez des souches UPEC et APEC dans un modèle animal;

d’étudier l’implication de chaque SNP dans la région c3302-04 sur l’expression des protéines

et leur rôle dans la virulence et de vérifier si les mutations dans le MMRS sont impliquées

dans l’apparition du phénotype hypermutable (identificaiton de SNPs, creations de mutants et

test d’hypermutabilité).

Page 95: ESCHERICHIA - Université de Sherbrooke

82

4.2. E. albertii, une souche pathogène émergente

L’isolat E. albertii ECC-Litt-3-1 était initiallement caractérisé comme E. coli eae+ atypique

par la présence des combinaisons de gènes de virulence et de variants différents de ce qui est

connu chez E. coli. Toutefois, cet isolat présentait de nombreuses caractéristiques

phenotypiques et génotypiques similaires à E. coli. En effet, plusieurs études ont démontré que

les souches d’E. albertii ont souvent été confondues avec d’autres membres des

Enterobacteriaceae et qu’ils ont probablement été souvent mal classifiés ou non détectés par

les tests de routine. Les tests commerciaux biochimiques n’incluent pas E. albertii dans leur

méthode de détection et notamment en utlisant le système API 20E, E. albertii est souvent

confondu avec Hafnia alvei et E. coli.

E. albertii est un bon exemple de bactérie pathogène émergente au niveau agro-alimentaire.

Elle a été impliquée dans plusieurs cas d’éclosion alimentaire. Elle est toutefois peu

caractérisée pour l’instant et aucun test rapide et efficace n’existe pour détecter la présence

d’E. albertii dans les aliments afin de ne pas le confondre avec d’autres Enterobacteriaceae.

Les objectifs de cette deuxième partie étaient d’identifier des cibles moléculaires spécifiques à

E. albertii par des études de génomique comparative en incluant l’isolat E. albertii ECC-litt-3-

1 et de développer une méthode PCR pour le détecter et caractériser certains de ces gènes de

virulence.

Les objectifs ont été atteints, car deux méthodes PCR ont été développées afin d’identifier et

caractériser les souches d’E. albertii. Une première méthode PCR a été développé avec une

cible moléculaire (fumarate reductase) spécifique à E. albertii. Cette méthode a été testée dans

un mélange d’entérobactéries, et E. albertii a été correctement identifié avec une sensibilité

allant jusqu’à 100 cfu. La deuxième méthode PCR permet l’identification de deux autres gènes

spécifiques à E. albertii, permettant la confirmation du premier PCR et la détection de certains

gènes de virulence présents chez les souches d’E. albertii. Il serait intéressant de tester cette

méthode PCR sur des échantillons cliniques, dans le poulet par exemple, et d’évaluer

Page 96: ESCHERICHIA - Université de Sherbrooke

83

l’incidence de cette souche pathogène dans les aliments et son risque de transmission chez

l’humain.

Bref, ces méthodes PCR développées pourraient permettre l’identification d’E. albertii dans

les tests de routine et aider la compréhesion globale de cette souche pathogène dans le secteur

agro-alimentaire.

4.3. Conclusion générale

Pour conclure, les souches atypiques étudiées dont celles incluses dans cette étude

représentent un modèle d’étude de l’évolutive des souches pathogéniques suite à l’acquisition

d’avantages sélectifs ponctuels ou permanents. Les souches atyiques sont des réservoirs

malléables pour l’échange et la transmission de facteurs de virulence. Ces souches ont un

risque zoonotique important et elles sont de plus en plus isolées de cas cliniques, mais leur

mécanisme évolutif est peu compris. Nous avons également étudié les souches hypermutables,

la région mutS-rpoS et les mutations à l’intérieur de cette région qui sont tous des mécanismes

majeurs dans la diversité génomique et le tranfert de déterminants virulents favorisant

l’adapatation et l’évolution des souches pathogènes.

La souche bovine E. coli 06-01-03-17 est une souche atypique avec des facteurs de virulence

associés aux ExPEC/EHEC et une région mutS-rpoS identifique aux souches hautement

pathogènes extra-intestinales. L’isolat avaire ECC-Litt-3-1 possède des caractéristiques et

gènes de virulence associés à la souche pathogène émergente: E. albertii. Bien que ces deux

souches aient été isolées à partir d’animaux de ferme en santé et même si leur pathogénicité

chez l’humain n’a pas été investiguée, elles ont un grand potentiel de virulence. Cela démontre

que les souches atypiques méritent une attention particulière et ont des facteurs de virulence

favorisant leur émergence.

Page 97: ESCHERICHIA - Université de Sherbrooke

84

À long terme, nos travaux permettront d’identifier les mécanismes d’évolution, de

dissémination et d’émergence de zoopathogènes. Plus concrètement, ces recherches font partie

d’un projet plus large ayant pour but ultime l’identification des pratiques d’élevage pouvant

diminuer l’incidence des souches virulentes chez les animaux de ferme.

BIBLIOGRAPHIE

Albert, M.J., Alam, K., Islam, M., Montanero, J., Rahaman, A.S., Haider, K., Hossain, M.A.,

Kibriya, A.K., and Tzipori, S. (1991). Hafnia alvei, a probable cause of diarrhea in

humans. Infect. Immun. 59, 1507-1513.

Albert, M.J., Faruque, S.M., Ansaruzzaman, M., Islam. M.M., Haider, K., Alam, K., Kabir, I.,

and Robins-Browne, R. (1992). Sharing of virulence-associated properties at the

phenotypic and genetic levels between Escherichia coli and Hafnia alvei. J. Med.

Microbiol. 37, 310-314.

Armstrong, G.L., Hollingsworth, J., and Morris, J.G. (1996). Emerging foodborne pathogens :

Escherichia coli O157 : H7 as a model of entry of a new pathogen into the food supply of

the developed world. Epidemiol. Rev. 18, 29–51.

Asakura, M., Hinenoya, A., Alam, M.S., Shima, K., Zhaid, S.H., Shi, L., Sugimoto, N.,

Ghosh, A.N., Ramamurthy, T., Faruque, S.M., et al. (2007). An inductible lambdoid

prophage encoding cytolethal distending toxin (Cdt-I) and a type III effector protein in

enteropathogenic Escherichia coli. Proc. Natl. Acad. Sci. U S A. 104, 14483-14488.

Asoshima, N., Matsuda, M., Shigemura, K., Honda, M., Yoshida, H., Hiwaki, H., Ogata, K.,

and Oda, T. (2014). Identification of Escherichia albertii as a causative agent of a food-

borne outbreak occurred in 2003. Jpn. J. Infect. Dis. 67, 139–140.

Beddoe, T., Paton, A.W., Le Nours, J., Rossjohn, J., and Paton, J.C. (2010). Structure,

biological functions and applications of the AB5 toxins. Trends Biochem. Sci. 35, 411–

418. doi: 10.1016/j.tibs.2010.02.003.

Bhunia, A.K. (2008). General mechanism of pathogenesis for foodborne pathogens. In

Foodborne Microbial Pathogens: Mechanisms and Pathogenisis, D.R. Heldman et D.A.

Golden, eds. (West Lafayette: Springer), pp. 93–112.

Blanco, J., Mora, A., Mamani, R., Lopez, C., Blanco, M., Dahbi, G., Herrera, A., Blanco, J.E.,

Alonso, M.P., Garcia-Garrote, E., et al. (2011). National survey of Escherichia

coli causing extraintestinal infections reveals the spread of drug-resistant clonal groups

Page 98: ESCHERICHIA - Université de Sherbrooke

85

O25b:H4-B2-ST131, O15:H1-D-ST393 and CGA-D-ST69 with high virulence gene

content in Spain. doi: 10.1093/jac/dkr235.

Blattner, F.R., Plunkett 3rd, G., Bloch, C.A., Perna, N.T., Burland, V., Riley, M., Collado-

Vides, J., Glasner, J.D., Rode, C.K., et Mayhew, G.F., et al. (1997). The complete

genome sequence of Escherichia coli K-12. Science 277, 1453-1462.

Boerlin, P., Chen, S., Colbourne, J.K., Johnson, R., De Grandis, S., and Gyles, C. (1998).

Evolution of enterohemorrhagic Escherichia coli hemolysin plasmids and the locus for

enterocyte effacement in shiga toxin-producing E. coli. Infect. Immun. 66, 2553-2561.

Bryan, A., Youngster, I., and McAdam, A. (2015). Shiga toxin producing Escherichia

coli. Clin. Lab. Med. 35, 247-272. doi: 10.1016/j.cll.2015.02.004.

Brzuszkiewicz, E., Thürmer, A., Schuldes, J., Leimbach, A., Liesegang, H., Meyer, F.D.,

Boelter, J., Petersen, H., Gottschalk, G., and Daniel, R. (2011). Genome sequence

analyses of two isolates from the recent Escherichia coli outbreak in Germany reveal

the emergence of a new pathotype : Entero-Aggregative-Haemorrhagic Escherichia

coli (EAHEC). Arch. Microbiol. 193, 883–891. doi: 10.1007/s00203-011-0725-6.

Casjens, S. (2003). Prophages and bacterial genomes: what have we learned so far?. Mol.

Microbiol. 49, 277-300.

Cebula, T., and LeClerc, J. (2000). DNA repair and mutators: effects on antigenic variation

and virulence of bacterial pathogens. In Virulence Mechanisms of Bacterial Pathogens,

K. Brogden, J. Roth, T. Stanton, C. Bolin, F. Minion, M. Wannemuehler, eds.

(Washington: ASM Press), pp. 143-159.

Cleaveland, S., Haydon, D.T., and Taylor, L. (2007). Overviews of pathogen emergence :

which pathogens emerge, when and why ? Curr. Top Microbiol. Immunol. 315, 85–111.

Clermont, O., Christenson, J.K., Denamur, E., and Gordon, D.M. (2013). The Clermont

Escherichia coli phylo-typing method revisited: Improvement of specificity and detection

of new phylo-groups. Environ. Microbiol. Rep. 5, 58–65. doi: 10.1111/1758-2229.12019.

Croxen, M.A., and Finlay, B.B. (2010). Molecular mechanisms of Escherichia coli

pathogenicity. Nat. Rev. Microbiol. 8, 26–39. doi: 10.1038/nrmicro2265.

Croxen, M.A., Law, R.J., Scholz, R., Keeney, K.M., Wlodarska, M., and Finlay, B.B. (2013).

Recent advances in undestanding enteric pathogenic Escherichia coli. Clin. Microbiol.

Rev. 26, 822-880.

Page 99: ESCHERICHIA - Université de Sherbrooke

86

Culham, D.E. and Wood, J.M. (2000). An Escherichia coli reference collection group B2- and

uropathogen-associated polymorphism in the rpoS-mutS region of the E. coli

chromosome. J. Bacteriol. 182, 6272–6276.

Dahan, S., Wiles, S., La Ragione, R.M., Best, A., Woodward, M.J., Stevens, M.P., Shaw,

R.K., Chong, Y., Knutton, S., Phillips, A., et al. (2005). EspJ is a prophage-carried type

III protein of attaching and effacing pathogens that modulates infection dynamics. Infect.

Immun. 73, 679-686.

Dobrindt, U. (2005). (Patho-)Genomics of Escherichia coli. Int. J. Med. Microbiol. 295, 357–

371.

Dozois, C.M., Dho-Moulin, M., Brée, A., Fairbrother, J.M., Desautels, J.M., and Curtiss, R.

3rd

. (2000). Relationship between the Tsh autotransporter and pathogenicity of avian

Escherichia coli and localization and analysis of the Tsh genetic region. Infect. Immun.

68, 4145-4154.

Ewers, C., Dematheis, F., Singamaneni, H.D., Nandanwar, N., Fruth, A., Diehl, I., Semmler,

T., and Wieler, L.H. (2014). Correlation between the genomic o454-nlpD region

polymorphisms, virulence gene equipment and phylogenetic group of extraintestinal

Escherichia coli (ExPEC) enables pathotyping irrespective of host, disease and source of

isolation. Gut Pathog. 6, 37. doi: 10.1186/s13099-014-0037-x.

Field, M., Graft, L.H., Laird, W.J., and Smith, P.L. (1978). Heat-stable enterotoxin of

Escherichia coli: In vitro effects on guanylate cyclase activity, cyclic GMP

concentration, and ion transport in small intestine. Proc. Natl. Acad. Sci. U S A. 75,

2800-2804.

Fleckenstein, J.M., Hardwidge, P.R., Munson, G.P., Rasko, D.A., Sommerfelt, H., and

Steinsland, H. (2010). Molecular mechanisms of enterotoxigenic Escherichia coli

infection. Microbes Infect. 12, 89–98. doi: 10.1016/j.micinf.2009.10.002.

Frank, C., Werber, D., Cramer, J. P., Askar, M., Faber, M., An Der Heiden, M. Bernard, H.,

Fruth, A., Prager, R., Spode, A, et al. (2011). Epidemic Profile of Shiga-Toxin–

Producing Escherichia coli O104:H4 outbreak in Germany. N. Engl. J. Med. 365, 1771–

1780. doi: 10.1056/NEJMoa1106483.

Frankel, G., Phillips, A.D., Novakova, M., Batchelor, M., Hicks, S., and Gordon, D. (1998).

Generation of Escherichia coli intimin derivatives with differing biological activities

using site-directed mutagenesis of the intimin C-terminus domain. Mol. Microbiol. 29,

559-570.

Page 100: ESCHERICHIA - Université de Sherbrooke

87

Friedberg, E.C., Lehmann, A.R., and Fuchs, R.P. (2005). Trading places: how do DNA

polymerases switch during translesion DNA synthesis?. Mol. Cell 18, 499-505.

Fukui, K. (2010). DNA mismatch repair in eukaryotes and bacteria. J. Nucleic Acids 27,

2010. doi: 10.4061/2010/260512.

Garmendia, J., Frankel, G., and Crepin, V.F. (2005). Enteropathogenic and

enterohemorrhagic Escherichia coli infections: translocation, translocation, translocation.

Infect. Immun. 73, 2573-2585.

Giannella, R.A. (1983). Escherichia coli heat-stable enterotoxin: biochemical and

physiological effects on the intestine. Prog. Food Nutr. Sci. 7, 157-165.

Gordon, D.M., Sahl, J.W., Morris, C.R., Rasko, D.A., Chattopadhyay, S., Sokurenko, E.V.,

Nisa, S., Scanlon, K.M., Donnenberg, M.S., Vanaja, S.K., et al. (2013). Escherichia coli

Pathotypes and Principles of Pathogenisis (Baltimore, Michael S. Donnenberg).

Gruenheid, S., Sekirov, I., Thomas, N.A., Deng, W., O’Donnell, P., Goode, D., Li, Y., Frey,

E.A., Brown, N.F., Metalnikov, P., et al. (2004). Identification and characterization of

NleA, a non-LEE-encoded type III translocated virulence factor of enterohaemorrhagic

Escherichia coli O157:H7. Mol. Microbiol. 51, 1233-1249.

Hanne, J., Liu, J., Lee, J., and Fishel, R. (2013). Single-molecule FRET Studies on DNA

Mismatch Repair. International Journal of Biophysics 3, 18–38. doi:

10.1016/j.dnarep.2014.03.007.

Herbelin, C.J., Chirillo, S.C., Melnick, K.A., and Whittam, T.S. (2000). Gene conservation

and loss in the mutS-rpoS genomic region of pathogenic Escherichia coli. J. Bacteriol.

182, 5381-5390.

Hinenoya, A., Shima, K., Asakura, M., Nishimura, K., Tsukamoto, T., Ooka, T., Hayashi, T.,

Ramamurthy, T., Faruque, S.M., and Yamasaki, S. (2014). Molecular characterization

of cytolethal distending toxin gene-positive Escherichia coli from healthy cattle and

swine in Nara, Japan. BMC Microbiol. 14, 97. doi: 10.1186/1471-2180-14-97.

Huys, G., Cnockaert, M., Janda, J.M., and Swings, J. (2003). Escherichia albertii sp., nov., a

diarrhoeagenic species isolated from stool specimens of Bangladeshi children. Int. J.

Syst. Evol. Microbiol. 53, 807-810.

Jandhyala, D.M., Vanguri, V., Boll, E.J., Lai, Y., McCormick, B.A., and Leong, J.M. (2013).

Shiga toxin-producing Escherichia coli O104:H4: an emerging pathogen with enhanced

virulence. Infect. Dis. Clin. North Am. 27, 631–49. doi: 10.1016/j.idc.2013.05.002.

Page 101: ESCHERICHIA - Université de Sherbrooke

88

Jayaraman, R. (2009). Mutators and hypermutability in bacteria : the Escherichia coli

paradigm. J. Genet. 88, 379–391.

Jobling, M.G., and Holmes, R.K. (2012). Type II heat-labile enterotoxins from 50 diverse

Escherichia coli isolates belong almost exclusively to the LT-IIc family and may be

prophage encoded. PLoS One. 7, e29898. doi: 10.1371/journal.pone.0029898.

Kalchayanand, N., Arthur, T.M., Bosilevac, J.M., Schmidt, J.W., Wnag, R., Shackelford, S.D.,

and Wheeler, T.L. (2012). Evaluation of commonly used antimicrobial interventions for

fresh beef inoculated with shiga toxin-producing Escherichia coli serotypes O26, O45,

O103, O111, O121, O145, and O157:H7. J. Food Prot. 75, 1207-1212. doi:

10.4315/0362-028X.JFP-11-531.

Kaper, J.B., Nataro, J.P., and Mobley, H.L. (2004). Pathogenic Escherichia coli. Nat. Rev.

Microbiol. 2, 123–140.

Khöler, C.D. and Dobrindt, U. (2011). What defines extraintestinal pathogenic Escherichia

coli?. Int. J. Med. Microbiol. 301, 642-647. doi: 10.1016/j.ijmm.2011.09.006.

Lavigne, J-P., and Blanc-Potard, A-B. (2008). Molecular evolution of Salmonella enterica

serovar Thyphimurium and pathogenic Escherichia coli: from pathogenesis to

therapeutics. Infect. Genet. Evol. 8, 217-226. doi: 10.1016/j.meegid.2007.11.005.

LeClerc, J.E., Li, B., Payne, W.L., and Cebula, T.A. (1996). High mutation frequencies among

Escherichia coli and Salmonella pathogens. 274, 1208-1211.

LeClerc, J.E., Li, B., Payne, W.L., and Cebula, T.A. (1999). Promiscuous origin of a chimeric

sequence in the Escherichia coli O157:H7 genome. J. Bacteriol. 181, 7614-7617.

Lefebvre, B., Diarra, M.S., Giguère, K., Roy, G., Michaud, S., and Malouin, F. (2005).

Antibiotic resistance and hypermutability of Escherichia coli O157 from feedlot cattle

treated with growth-promoting agents. J. Food Prot. 68, 2411-2419.

Lefebvre, B., Gattuso, M., Moisan, H., Malouin, F., and Diarra, M.S. (2008). Genotype

comparison of sorbitol-negative Escherichia coli isolates from healthy broiler chickens

from different commercial farms. Poult. Sci. 88, 1474-1484.

Maheux, A.F., Boudreau, D.K., Bergeron, M.G., and Rodriguez, M.J. (2014). Characterization

of Escherichia fergusonii and Escherichia albertii isolated from water. J. Appl.

Microbiol. 117, 597–609. doi: 10.1111/jam.12551.

Mainil, J. (2013). Escherichia coli virulence factors. Vet. Immunol. Immunopathol. 152, 2-12.

doi: 10.1016/j.vetimm.2012.09.032.

Page 102: ESCHERICHIA - Université de Sherbrooke

89

Matic, I., Rayssiguier, C., and Radman, M. (1995). Interspecies gene exchange in bacteria :

the role of SOS and mismatch repair systems in evolution of species. Cell 80, 507-515.

Matic, I., Taddei, F., and Radman, M. (1996). Genetic barriers among bacteria. Trends

Microbiol. 4, 69-72.

McDaniel, T.K., Jarvis, K.G., Donnenberg, M.S., and Kaper, J.B. (1995). A genetic locus of

enterocyte effacement conserved among diverse enterobacterial pathogens. Proc. Natl.

Acad. Sci. U S A. 92, 1664-1668.

Mellata, M., Dho-Moulin, M., Dozois, C.M., Curtiss, R.3rd

., Lehoux, B., and Fairbrother, J.M.

(2003). Role of avian pathogenic Escherichia coli virulence factors in bacterial

interaction with chicken heterophils and macrophages. Infect. Immun. 71, 494–503.

Mellmann, A., Fruth, A., Friedrich, A.W., Wieler, L.H., Harmsen, D., Werber, D.,

Middendorf, B., Bielaszewska, M., and Karch, H. (2009). Phylogeny and disease

association of Shiga toxin-producing Escherichia coli O91. Emerg. Infect. Dis. 15, 1474-

1477. doi: 10.3201/eid1509.090161.

Miller, J. H. (1996). Spontaneous mutators in bacteria: insights into pathways of mutagenesis

and repair. Annu. Rev. Microbiol. 50, 625–643.

Moissenet, D., Weill, F.X., Arlet, G., Harrois, D., Girardet, J.P., and Vu-Thien, H. (2011).

Salmonella enterica genotype Gambia with CTX-M-3 and armA resistance markers:

nosocomial infections with a fatal outcome. J. Clin. Microbiol. 49, 1676-1678. doi:

10.1128/JCM.02127-10.

Moura, R.A., Sircili, M.P., Leomil, L., Matté, M.H., Trabulsi, L.R., Elias, W.P., Irino, K., and

Pestana de Castro, A.F. (2009). Clonal relationship among atypical enteropathogenic

Escherichia coli strains isolated from different animal species and humans. Appl.

Environ. Microbiol. 75, 7399–7408. doi: 10.1128/AEM.00636-09.

Murakami, K., Etoh, Y., Tanaka, E., Ichihara, S., Horikawa, K., Kawano, K., Ooka, T.,

Kawamura, Y., and Ito, K. (2014). Shiga Toxin 2f-Producing Escherichia albertii from a

Symptomatic Human. Jpn. J. Infect. Dis. 67, 204–208.

NCBI ressource coordinators. (2015). Database ressources of the National Center for

Biotechnology Information. Nucleic Acids Res.

Nimri, L.F. (2013). Escherichia albertii, a newly emerging enteric pathogen with poorly

defined properties. Diagn. Microbiol. Infect. Dis. 77, 91–95. doi:

10.1016/j.diagmicrobio.2013.06.028.

Page 103: ESCHERICHIA - Université de Sherbrooke

90

Oaks, J.L., Besser, T.E., Walk, S.T., Gordon, D.M., Beckmen, K.B., Burek, K.A., Haldorson,

G.J., Bradway, D.S., Ouellette, L., and Rurangirwa, F.R., et al. (2010). Escherichia

albertii in wild and domestic birds. Emerg. Infect. Dis. 16, 638–646. doi:

10.3201/eid1604.090695.

Oh, J.Y., Kang, M.S., Hwang, H.T., An, B.K., Kwon, J.H., and Kwon, Y.K. (2011).

Epidemiological investigation of eaeA-positive Escherichia coli and Escherichia

albertii strains isolated from healthy wild birds. J. Microbiol. 49, 747–752. doi:

10.1007/s12275-011-1133-y.

Ohnishi, M., Murata, T., Nakayama, K., Kuhara, S., Hattori, M., Kurokawa, K., Yasunga, T.,

Yokoyama, K., Makino, K., Shinagawa, H., et al. (2000). Comparative analysis of the

whole set of rRNA operons between an enterohemorrhagic Escherichia coli O157:H7

Sakai strain and an Eschericia coli K-12 strain MG1655.

Olesen, B., Scheutz, F., Andersen, R.L., Menard, M., Boisen, N., Johnston, B., Hansen, D.S.,

Krogfelt, K.A., Nataro, J.P., and Johnson, J.R. (2012). Enteroaggregative Escherichia

coli O78:H10, the cause of an outbreak of urinary tract infection. J. Clin. Microbiol. 50,

3703-3711. doi: 10.1128/JCM.01909-12.

Ooka, T., Seto, K., Kawano, K., Kobayashi, H., Etoh, Y., Ichihara, S., Kaneko, A., Isobe, J.,

Yamaguchi, K., Horikawa, K., et al. (2012). Clinical Significance of Escherichia

albertii. Emerg. Infect. Dis. 18, 488-492. doi: 10.3201/eid1803.111401.

Organisation mondiale de la santé (OMS). (2015). Escherichia coli entérohémorragique

(ECEH). Aide-mémoire No 125. Décembre 2011.

(http://www.who.int/mediacentre/factsheets/fs125/fr/).

Perna, N.T., Plunkett, G.3rd

., Burland, V., Mau, B., Glasner, J.D., Rose, D.J., Mayhew, G.F.,

Evans, P.S., Gregor, J., Kirkpatrick, H.A., et al. (2001). Genome sequence of

enterohaemorrhagic Escherichia coli O157 : H7. Nature 409, 529–533.

Pruimboom-Brees, I.M., Morgan, T.W., Ackermann, M.R., Nystrom, E.D., Samuel, J.E.,

Cornick, N.A., and Moon, H.W. (2000). Cattle lack vascular receptors for Escherichia

coli O157:H7 Shiga toxins. Proc. Natl. Acad. Sci. U S A. 97, 10326-10329.

Rasko, D.A., Rosovitz, M.J., Myers, G.S., Mongodin, E.F., Fricke, W.F., Gajer, P., Crabtree,

J., Sebaihia, M., Thomson, N.R., Chaudhuri, R. et al., 2008. The pangenome structure of

Escherichia coli: comparative genomic analysis of E. coli commensal and pathogenic

isolates. J. Bacteriol. 190, 6881-6893. doi: 10.1128/JB.00619-08.

Redford, P., and Welch, R.A. (2002). Extraintestinal Escherichia coli as a model system for

the study of pathogenicity islands. In Pathogenicity Islands and the Evolution of

Page 104: ESCHERICHIA - Université de Sherbrooke

91

Pathogenic Microbes, Vol 1, J. Hacker et J.B. Kaper, eds. (New York: Springer-Verlag),

pp.16.

Roe, A.J., Hoey, D.E.E, and Gally, D.L. (2003). Regulation, secretion and activity of type III-

secreted proteins of enterohaemorrhagic Escherichia coli O157. Biochem. Soc. Trans. 31,

98-103.

Russo, T.A., and Johnson, J.R. (2000). Proposal for a new inclusive designation for

extraintestinal pathogenic isolates of Escherichia coli: ExPEC. J. Infect. Dis. 181, 1753–

1754.

Russo, T.A., and Johnson, J.R. (2003). Medical and economic impact of extraintestinal

infections due to Escherichia coli: focus on an increasingly important endemic problem.

Microbes Infect. 5, 449-456.

Salvadori, M.I., Sontrop, J.M., Garg, A.X., Moist, L.M., Suri, R.S., and Clark, W.F. (2009).

Factors that led to the Walkerton tragedy. Kidney Int. 75, Suppl. S33-34. doi:

10.1038/ki.2008.616.

Singer, R.S. 2015. Urinary tract infections attributed to diverse ExPEC strains in food animals:

evidence and data gaps. Front Microbiol. 6: 28. doi: 10.3389/fmicb.2015.00028.

Smith, D.G.E., Naylor, S.W., and Gally, D.L. (2002). Consequences of EHEC colonisation in

humans and cattle. Int. J. Med. Microbiol. 292, 169-183.

Taddei, F., Matic, I., Godelle, B., and Radman, M. (1997). To be a mutator, or how pathogenic

and commensal bacteria can evolve rapidly. Trends Microbiol. 5, 427–428.

Tarr, P.I., Fouser, L.S., Stapleton, A.E., Wilson, R.A., Kim, H.H., Vary, J.C., and Clausen,

A.R. (1996). Hemolytic-uremic syndrome in a six-year-old girl after a urinary tract

infection with shiga-toxin-producing Escherichia coli O103:H2. N. Engl. J. Med. 335,

635-638.

Tenaillon, O., Skurnik, D., Picard, B., and Denamur, E. (2010). The population genetics of

commensal Escherichia coli. Nat. Rev. Microbiol. 8, 207–217. doi:

10.1038/nrmicro2298.

Todar, K. (2008-2012). Todar’s online textbook of bacteriology. The good, the bad, and the

deadly. Science 304, 1421. (http://textbookofbacteriology.net/kt_toc.html).

Torres, A.G., Vazquez-Juarez, R.C., Tutt, C.B., and Garcia-Gallegos, J.G. (2005).

Photoadaptive mutation that mediates adherence of shiga-toxin producing Escherichia coli

O111. Infect. Immun. 73, 4766-4776.

Page 105: ESCHERICHIA - Université de Sherbrooke

92

Trabulsi, L. R., Keller, R., and Tardelli Gomes, T.A. (2002). Typical and atypical

enteropathogenic Escherichia coli. Emerg. Infect. Dis. 8, 508–513.

Vulić, M., Dionisio, F., Taddei, F., and Radman, M. (1997). Molecular keys to speciation:

DNA polymorphism and the control of genetic exchange in enterobacteria. Proc. Natl.

Acad. Sci. U S A. 94, 9763-9767.

Woolhouse, M.E., and Dye, C. (2001). Population biology of emerging and re-emerging

pathogens-preface. Philos. Trans. R. Soc. Lond. B. Biol. Sci. 356, 981-982.

Yang, H., Wolff, E., Kim, M., Diep, A., and Miller, J.H. (2004). Identification of mutator

genes and mutational pathways in Escherichia coli using a multicopy cloning approach.

Mol. Microbiol. 53, 283–295.

Zhang, W.L., Khöler, B., Oswald, E., Beutin, L., Karch, H., Morabito, S., Capriolo, A.,

Suerbaum, S., and Schmidt, H. (2002). Genetic diversity of intimin genes of attaching

and effacing Escherichia coli strains. J. Clin. Microbiol. 40, 4486-4492.

Page 106: ESCHERICHIA - Université de Sherbrooke

93