Gene Information

Name : ECOK1_3199 (ECOK1_3199)
Accession : YP_006102319.1
Strain : Escherichia coli IHE3034
Genome accession: NC_017628
Putative virulence/resistance : Virulence
Product : ClpA/ClpB family protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3262234 - 3264879 bp
Length : 2646 bp
Strand : +
Note : identified by match to protein family HMM PF00004; match to protein family HMM PF02861; match to protein family HMM PF07724; match to protein family HMM PF07728; match to protein family HMM TIGR03345

DNA sequence :

ATGACAGGAAATCACCCCGCCGCGCTGCTGCGTCGCCTTAACCCATACTGTGCACGGGCGCTGGACGCTGCCGCCTCACT
GTGTCAGACCCGCGCCCATGCGGAGATAACCATTGAACACTGGCTGCTGAAACTGCTGGAGCAGGGAGAAGGCGATATCA
CGGTGATTGCCCGCCGCTATGAATGGGATATCGACACGCTCTGGCAGTCTCTGCTGGCACATCTGGACACCTTACCCCGC
TCGGTCCGCGAACGTCCGCAGCTTTCTGAACCCCTGACGGCGCTTATCAGGCAGGCGTGGCTGATTGCCTCGCTGGAAGG
CGACGACCCGCAAATCCGCAGTCAGCACCTGCTGATGGCGCTGACAGAAAAATCGATGCTGCCCGCCTGTAATGACCTGT
GGGTATTGCTGAGTCTGAGCCGCGTGCAGCTTGAGCGGCTGCGTCCCCTGCTGGATGCGCAGTCGGATGAATGTCCGGCA
CGTCAGCCACAGGTCACCGAACCGCTGACCTCTGCACTGCCGGAGACGGCAACGGCGGACGCACCGGCAAAAACGCTGAC
GGAGAAACAGGATGACGCCCTGCTGGCGGTGCTTAACCGCTTTACCGAAGACGTGACGGAAAAAGCCCGCAGCGGGCGAA
TCGACCCGGTATTCGGGCGCGACACGGAAATTCGCCAGATGGTCGATATCCTCTCCCGTCGCCGCAAAAACAACCCGATT
CTGGTGGGAGAACCGGGGGTGGGCAAAACCGCGCTGGTGGAAGGGCTGGCGCTGCGTATCACCGAAGGCAACGTGCCGGA
CAGCCTGAAAACGGTGCATATCCGCACACTGGACCTCGGTCTGTTACAGGCTGGCGCGGGCGTTAAAGGTGAATTTGAAC
AGCGGCTGAAAAATGTCATCGATGCAGTGCAGAAATCACCGGAGCCGGTACTGCTGTTTATTGATGAAGCCCATACCATT
ATCGGTGCGGGTAATCAGGCAGGCGGCGCGGATGCGGCGAACCTGCTGAAACCGGCACTGGCAAGGGGCGAACTGCGCAC
CATCGCGGCGACCACGTGGAGCGAATACAAACAGTATTTTGAGCGCGACGCCGCGCTGGAGCGCCGCTTCCAGATGGTTA
AGGTTGACGAGCCGGATGATGACACCGCCTGTCTGATGCTGCGGGGACTGAAGGCTCGCTATGCACAGCACCACGGCGTG
CATATGCTGGACAGCGCCATTCAGACCGCCGTGCGCCTGTCGCGCCGCTATCTGACCGGACGCCAGCTGCCGGACAAGGC
GGTTGATTTGCTGGATACCGCCGGGGCAAGAGTCCGCATGAGCCTTGACACCCTGCCGGAACCGTTGACGCAGCTTCATG
CGCGACTGGCGGCACTGGATATTGAGCGGGAAGCGATTGAGCAGGACAGCGTATTTTATCCCGAAGCCAGCCCGGAGCGG
CTGGCGGAACTGACCGATTTGCGTGATGAGCTACAGGCAGAAGCCGGGCATCTGGAAGCGCAGTATCAGCAGGAAAAGGC
ACTGGCGCAGCAGATTATGACGTTGCGTCAGGAAGGAACAGACAGCACTGAACTGCAACAGCAACTGCGAACGCATCAGG
GCTTTGCACCGCTGCTGGCGCTGGATGTGGACGCCCGCGCCGTCGCTACGGTGGTGGCGGACTGGACCGGCATCCCGCTC
TCATCCCTGCTCAGGGACGAGCAGAGCGATCTGCTCAGTATGGAACAGAGCCTTGAAAACCGCGTGGTCGGGCAACGCCC
GGCGCTCTGCGCCATCGCACAGCGGCTGCGGGCGGCTAAAACCGGCCTCACGCCGGAGAACGGCCCACAGGGGGTATTCC
TGCTGACCGGCCCCAGCGGCACCGGCAAAACCGAAACTGCGCTCACACTGGCCGACACCCTGTTTGGTGGTGAAAAATCC
CTTATCACCATTAATCTTTCGGAATACCAGGAACCGCATACCGTTTCCCAGTTGAAAGGTTCGCCTCCGGGCTATGTCGG
CTACGGTCAGGGCGGCGTACTTACCGAAGCCGTTCGCAAACGCCCTTACAGCGTGGTGCTGCTCGACGAAGTGGAAAAGG
CGCATCGCGACGTGATGAACCTGTTCTATCAGGTGTTCGACCGGGGCTTTATGCGCGACGGCGAAGGGCGGGAAATCGAC
TTCCGCAACACCGTCATTCTGATGACCGCCAATCTGGGCAGCGACCACATCATGCAGCTGCTGGAGGAAAAACCGGACGC
CACGGACGCAGACCTGCATGAACTGCTGTATCCCCTTCTGCGAGACCATTTTCAGCCTGCACTGATGGCGCGTTTTCAGA
CGGTGATTTACCGCCCGCTGGGACAGGAAGCGATGCGCACCATTGTGGAAATGAAACTGGCGCAGGTGGTCCGCCGTCTT
CACCAGCACTACGGACTGGAAACGGAAATCAACGACAGCCTGTATGACCAGCTTACCGCCGCCTGCCTGCTGCCGGACAC
CGGTGCGCGTAATATCGACAGCCTGCTGAACCAGCAAATCCTGCCGGTCTTAAGCCAGCAGTTGCTGGCACAGCAGGCCG
CGCACCGTAAACCAGCCCAACTACGGCTTGGCTGGGATGAGGAGGACGGGATTGTACTGGAGTTCGCTACGGAAGAGATG
CAATAA

Protein sequence :

MTGNHPAALLRRLNPYCARALDAAASLCQTRAHAEITIEHWLLKLLEQGEGDITVIARRYEWDIDTLWQSLLAHLDTLPR
SVRERPQLSEPLTALIRQAWLIASLEGDDPQIRSQHLLMALTEKSMLPACNDLWVLLSLSRVQLERLRPLLDAQSDECPA
RQPQVTEPLTSALPETATADAPAKTLTEKQDDALLAVLNRFTEDVTEKARSGRIDPVFGRDTEIRQMVDILSRRRKNNPI
LVGEPGVGKTALVEGLALRITEGNVPDSLKTVHIRTLDLGLLQAGAGVKGEFEQRLKNVIDAVQKSPEPVLLFIDEAHTI
IGAGNQAGGADAANLLKPALARGELRTIAATTWSEYKQYFERDAALERRFQMVKVDEPDDDTACLMLRGLKARYAQHHGV
HMLDSAIQTAVRLSRRYLTGRQLPDKAVDLLDTAGARVRMSLDTLPEPLTQLHARLAALDIEREAIEQDSVFYPEASPER
LAELTDLRDELQAEAGHLEAQYQQEKALAQQIMTLRQEGTDSTELQQQLRTHQGFAPLLALDVDARAVATVVADWTGIPL
SSLLRDEQSDLLSMEQSLENRVVGQRPALCAIAQRLRAAKTGLTPENGPQGVFLLTGPSGTGKTETALTLADTLFGGEKS
LITINLSEYQEPHTVSQLKGSPPGYVGYGQGGVLTEAVRKRPYSVVLLDEVEKAHRDVMNLFYQVFDRGFMRDGEGREID
FRNTVILMTANLGSDHIMQLLEEKPDATDADLHELLYPLLRDHFQPALMARFQTVIYRPLGQEAMRTIVEMKLAQVVRRL
HQHYGLETEINDSLYDQLTAACLLPDTGARNIDSLLNQQILPVLSQQLLAQQAAHRKPAQLRLGWDEEDGIVLEFATEEM
Q

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	4e-142	45

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
ECOK1_3199	YP_006102319.1	ClpA/ClpB family protein	VFG2084	Protein	1e-131	44
ECOK1_3199	YP_006102319.1	ClpA/ClpB family protein	VFG2076	Protein	2e-149	44
ECOK1_3199	YP_006102319.1	ClpA/ClpB family protein	VFG0079	Protein	4e-100	41