Gene Information

Name : BTH_II0264 (BTH_II0264)
Accession : YP_438466.1
Strain :
Genome accession: NC_007650
Putative virulence/resistance : Virulence
Product : ClpA/B type protease
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 323701 - 326358 bp
Length : 2658 bp
Strand : +
Note : identified by match to protein family HMM PF00004; match to protein family HMM PF07724

DNA sequence :

ATGTCCGATATCGGCCGAGTGACCTTGTTCGGAAAGCTGAACGCTTTTCTCTACGAGACATTGGAGCAGGCGACGGGCTT
CTGCCGGCTGCGCGGCAATCCGTACGTCGAGCTCGCGCACTGGCTGAACCAGATGCTCCAGCGCCCGGACAGCGACGTGC
ACCGGGTCCTGCGCCGCTTCGACATCGAAGCGGCCGCGATCGATCGCGGGATCGTCTCGGCGCTCGACCGGTTGCCGCGC
GGCGCGGGCTCCGTGTCCGATCTGTCCGCGCACATCGACGACGCGGTCGAGCGCGCGTGGGTCTACGCGACGCTCAAATA
CGACGCGACGCAGATCCGCGGCGCGGTGCTGCTGCTCGCGATCGTGAAGACGGCGCAACTGCGCAACGTGCTGTATGCGA
TCGCGCGCGACTTCGAGCGGATCGTGCCGGACGTGTTCGCCGACGAACTCGAGCGGATCGTCGAAGGCTCGCCGGAAGCG
CCGCCGCCGGCGGCGCGCGCATCGGCGGGCGCGGGGGGCGGCGCATCGCCCGCCGCGCGGGAAGGCTCGGCGCTCGCGCG
CTACGCGGTCGATCTGACCGCGCGGGCGCGCGCGGGTGAGATCGATCCGGTGGTGGGCCGCGACGGCGAGATTCGTCAGA
TCGTCGACATCCTGCTGCGCCGCCGGCAGAACAATCCGCTGCTCGTCGGCGAGGCGGGCGTCGGCAAGACCGCGGTCGCA
GAAGGCTTCGCGCTGCGCATCGTCGCGGGCGACGTGCCGCCGCCGCTGCGCGACGTCGAACTGTATCTGCTCGACATCGG
CCTGCTGCAAGCGGGCGCGAGCGTGAAGGGCGAATTCGAGAGCCGCCTGCGCGGCGTGATCGACGAGGCGACATCGAGCG
AGCGGCCCGTCATTCTGTTCGTCGACGAGGTGCATACGCTCGTCGGCGCGGGCGGCGCGGCGGGCACGGGCGACGCGGCG
AACCTCTTGAAGCCCGCGCTCGCGCGCGGCCTGCTGCGCACGATCGGCGCGACGACGTGGTCCGAGTACAAGCAGTACAT
CGAGAAGGACCCGGCGCTCACGCGGCGCTTCCAGCTCGTGCAGGTGCGCGAGCCGGAGGAGGGCGCGGCGCTGACGATGC
TGCGCGGACTCGCCGCGAAGCTGGAGGCGCACCACCGCGTGCTCGTGCTCGACGATGCGTTGCAGGCGGCCGTCACGCTG
TCGCATCGCTACATTCCGGCGCGGCAATTGCCCGACAAGGCGATCAGCCTGCTCGACACCGCGTGCGCGCGCGTCGCGGT
CAGCCAGCACGCGGTGCCCGCGCCGATCGAGGATGCGCGGCGGCGGATCGACAGCCTGCGCGTCGAGCGCGAACTGATCG
CGCGCGAGTGCGCGCTCGGCGCGGGCGATGCGCCGCGGCTCGATGCGATCGATGCGTCGATCGCGAGCGAACAGGCCGCG
CTCGATGCGCTCGACGCGCGCTGGCAGGCGGAGCGCGACGCGCTCGGCCAGATCGTCGACTGGCGGGCCTCGCTGCTGGC
CGACGATCCTTCGCGCGCGCTCGATGAGACGGCGCGCGCGGACGTGCAGGCGAAGCTCTCGGCTGCGCTGCGCGCGCTCG
CCGAGTTGCAGGGCGAGACGCCGCTCGTGCTGCCCGCGGTCGACACGCACGCGGTGGCCGCCGTCGTGTCCGACTGGACC
GGCATCCCGCTCGGCCGGATGGTGCGTGACGAGATGCAATCGGTGCTGAAGCTCGCCGACACGCTCGCCGAGCGTGTGGT
CGGCCAGCGGCACGCGGTCGAGCTGATCGCCGAGCGCATCCAGACCGCGCGCGCGCGGCTCGACGATCCGGCCAAGCCGC
ACGGCGTGTTCCTGCTGTGCGGGCCGTCCGGCGTCGGCAAGACCGAGACGGCGCTCGCGCTCGCCGAGACGCTGTACGGC
GGCGAGCACAACGCGATCACGATCAACATGAGCGAGTTCCAGGAGGCGCATACCGTATCGACGCTCAAGGGCGCGCCGCC
CGGCTACGTCGGCTACGGACAGGGCGGCGTGCTGACCGAGGCGGTGCGGCGGCGGCCGTACAGCGTCGTGCTGCTCGACG
AAATCGAGAAGGCGCACCGCGACGTGCACGAGATCTTCTTTCAGGTGTTCGACAAGGGCTGGATGGAAGACGGCGAAGGG
CGCTACATCGACTTTCGCAACACGGTGATCCTCCTCACGTCGAACGTCGGTTCCGAGCGCGTGATGCAGCTGTGCCGCGA
CCCGCAGCGCCTGCCCGATGCGCAGACCTTGACCGATGCGCTGCGCGCGCCGCTGCGCGAAGTGTTCCCCGCCGCGTTGT
TGGGACGCCTGAGCGTCGTGCCGTACTACCCGCTCACCGACGAGATGCTCGCGCGGATCGTCGCGTTGCAGCTCGCGCGC
ATCGAGCGCCGAATCGAATCGCACCACGGCATCGCGCTGCGCTGCGAGGATTCGGCGACCGCGCTGATCGTCGAGCGCTG
CCGGACGATCGAATCCGGCGGCCGGATGGTCGACGCGATTCTCACGCACACGGTGCTGCCGCGCATCAGCCAGGAGATCC
TGCGCGCGACGATCGAGGGGCGCGCGCTGCGGGCGATCGACGTGAGCGCCGAAGACGGCCAGTTCGTTTATCGATTCGAA
GAGGAGGGTGCGACGTGA

Protein sequence :

MSDIGRVTLFGKLNAFLYETLEQATGFCRLRGNPYVELAHWLNQMLQRPDSDVHRVLRRFDIEAAAIDRGIVSALDRLPR
GAGSVSDLSAHIDDAVERAWVYATLKYDATQIRGAVLLLAIVKTAQLRNVLYAIARDFERIVPDVFADELERIVEGSPEA
PPPAARASAGAGGGASPAAREGSALARYAVDLTARARAGEIDPVVGRDGEIRQIVDILLRRRQNNPLLVGEAGVGKTAVA
EGFALRIVAGDVPPPLRDVELYLLDIGLLQAGASVKGEFESRLRGVIDEATSSERPVILFVDEVHTLVGAGGAAGTGDAA
NLLKPALARGLLRTIGATTWSEYKQYIEKDPALTRRFQLVQVREPEEGAALTMLRGLAAKLEAHHRVLVLDDALQAAVTL
SHRYIPARQLPDKAISLLDTACARVAVSQHAVPAPIEDARRRIDSLRVERELIARECALGAGDAPRLDAIDASIASEQAA
LDALDARWQAERDALGQIVDWRASLLADDPSRALDETARADVQAKLSAALRALAELQGETPLVLPAVDTHAVAAVVSDWT
GIPLGRMVRDEMQSVLKLADTLAERVVGQRHAVELIAERIQTARARLDDPAKPHGVFLLCGPSGVGKTETALALAETLYG
GEHNAITINMSEFQEAHTVSTLKGAPPGYVGYGQGGVLTEAVRRRPYSVVLLDEIEKAHRDVHEIFFQVFDKGWMEDGEG
RYIDFRNTVILLTSNVGSERVMQLCRDPQRLPDAQTLTDALRAPLREVFPAALLGRLSVVPYYPLTDEMLARIVALQLAR
IERRIESHHGIALRCEDSATALIVERCRTIESGGRMVDAILTHTVLPRISQEILRATIEGRALRAIDVSAEDGQFVYRFE
EEGAT

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	0.0	55
aec27	YP_851418.1	ATPase	Not tested	PAI II APEC-O1	Protein	2e-127	43
aec27	AAQ96721.1	Aec27	Not tested	AGI-1	Protein	1e-127	43

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
BTH_II0264	YP_438466.1	ClpA/B type protease	VFG2076	Protein	0.0	58
BTH_II0264	YP_438466.1	ClpA/B type protease	VFG2084	Protein	2e-147	44