Gene Information

Name : BTH_II0140 (BTH_II0140)
Accession : YP_438342.1
Strain :
Genome accession: NC_007650
Putative virulence/resistance : Virulence
Product : ClpA/B type protease
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 166857 - 169613 bp
Length : 2757 bp
Strand : +
Note : identified by match to protein family HMM PF00004; match to protein family HMM PF02861; match to protein family HMM PF07724

DNA sequence :

ATGTCGTGCCTTTCCAGGCAAGCGCGCTTGCACATGACGGAGCCGGACACGACGCGCCATTTTCCGGTTTTGCATGCAAG
CGTCGCATATTCACGAATTCACGATCGAGACATGACAGTTTCAAGACAGGCACTATTCGGCAAGCTCGGCCACTCGCTGT
TTCGCAGCATCGAGTCGGCGACGGCGTTCTGCAAGCTTCGCGGCAACCCCTACGTCGAACTGGTGCATTGGCTGCATCAG
ATGCTTCAGGCCGCTGACGGCGATATCCAGCGGATCGCTCGTCACTGCGATATCGACATCGGCGAACTGGATCGCGACAT
GGTGCGCGCGCTCGATGAGTTGCCGGCGGGCGCGAGCTCGATCAGCGATTTCTCGCACCATATCGAGACGGCGATCGAGC
GCGCGTGGGTGCTGGCGACACTGGACTTCGGCGATCGTCGGATTCGGGGCGCGTGGCTGTTGGCTGCGTTGCTGAAAACG
CCGGAGCTCAGGCGCGTATTGCTGTCGATTTCGTCCGCGTTCGGCCGGATTCGCGTCGACGAGCTCGACGCGATGTTGCC
GGCGTGGATCGATGGCTCGCCCGAGGCGAACGAGACGCCGTACGACAACAGCGACTTCGGCGCCGCCACACCGGGCGAGG
CATCGAGCGCGCTGCAGCAGAAGGGGGGCGGTTCGCCGCTGGAGCAGTTCTGCCTCGACCTCACCGCGCGGGCGCGAGCG
GGGCAGATCGATCCGGTGGTCGGTCGCGAGCTGGAAATCCGGACGATGATCGACGTCCTGCTGCGCCGCCGCCAGAACAA
TCCGCTGCTCACGGGCGAGGCGGGTGTGGGCAAGACGGCCGTCGTCGAAGGGCTCGCGCGTGCGATCGCCGATGGCGATG
TGCCGCCGAAGCTTGCCGATGTGCGCCTGCTGAGCCTCGATGTCGGCGCGCTGCTGGCCGGGGCGAGCATGAAGGGCGAA
TTCGAGGCGCGCCTGAAAGGCGTGCTGGAAGCGGCGACGAAAGCGACGCAGCCCGTCATTCTGTTTGTCGACGAGATCCA
CACGCTGATCGGCGCGGGCGGCCAGGCGGGCACCGGAGATGCCGCGAACCTGCTCAAGCCCGCGCTCGCGCGCGGCACGC
TTCGAACGATCGGTGCGACGACGTGGGCGGAATACAAGCGGCACATCGAAAAAGATCCGGCGCTCACACGCCGCTTCCAG
GTGTTGCAGGTGCCCGAGCCCGATGAGGCGGCCGCGATCGACATGGTGCGCGGGCTGACGCGCACCTTCTCGCGTCATCA
CGGCGTCGTCGTGCTGGACGAGGCGATTCGCGCGGCGGTCAAGCTGTCGCATCGCTACATTCCATCCCGTCAGTTGCCGG
ACAAGGCGATCAGCTTGCTCGATACGGCGTGCGCGCGCGTCGCGTTGTCGCAACATGCGCCGCCGCGTGAGTTGCAGGAC
GTCCGTAGAAGATTGGAAGCGGCGAGGGTGCGGCTCGAACTGCTCGACGGCGAGCAGCGCATTGGCCTCGGCGACGAAAG
CGCGCTCGCGCAGTCTCGCGACGAAATCGCCGCGCTCGAAGTGCAAGAGCAAGCGATCGATGCGTGCTGGCGGCAGCAGA
TCGAGGCGGCGCAGGCGCTGCTCAGCGCGCGCGAAGCGGCGGGCGACGATCCGGCAACGGCGATCGACGCGCTGCGCGAG
CTGGAGCGAGCGCTGTCGAGCTTGCAAGGCGATTGCGCATTCGTCTTCCCCGAGGTCAACGAAGCGATCGTCGCCGAGAT
CATGTCCGACTGGACCGGCATTCCGGTGGGCAGGATGGTGACGGACGAAGTGTCCGCCGTGCGTGCATTGCCGGATACGC
TGGCCGCCCGGGTGATCGGTCAACGCGATGCGCTGCATCAGATTTGCGATCGGGTGCAAACGGCGCGCGCCGGATTGACG
GACCCGAAGAAGCCGCTCGGCGTGTTTCTGCTCGCGGGGCCGTCGGGCGTCGGCAAGACGGAGACAGCGTTGGCGCTTGC
CGAAGCGCTGTACGGCGGCGAGCAGAATCTCATCACGATCAACATGAGCGAGTATCAGGAGGCGCATACGGTATCGGGGC
TGAAGGGCGCGCCGCCGGGTTACGTCGGATACGGCGAGGGCGGCGTGCTGACCGAGGCTGTGCGCCGGCGTCCGTATTCC
GTCGTGCTCCTCGACGAGATCGAGAAGGCGCATCCCGACGTCCACGAAATGTTCTTCCAGGTATTCGACAAGGGCTACAT
GGAGGACGGCGACGGTCGCTATATCGATTTTCGCAACACGACGATTCTTCTCACCAGCAACGCAGGCTCCGAACTCGTGT
CCGGACTGTGCACGGACGAGGCTTGCGCGCCCGACGCGGATGGCCTTTGCGCCGCGCTCGCTCCGGCATTGCTCAAGACG
TTTCCCGCCGCGTTTCTCGGGCGCGTGACGCTGGTGCCCTATCGTCCGCTGGCGCAAGAAACGCTATCGCGCATCGTCAG
GCTGCATCTCGATCGAGTGGTGGCCCGAATGGCCGAGAATCAGGCGGTCGCACTGAGCTATTCGGACAATGTCGTCGATT
ACGTCGTCGGTCGCTGTCTCGTCCAGGAAACGGGCGCGCGCCTGCTGATCGGCTTCATCGAGCAGCATGTGCTGCCGCTG
CTCGCGAAGTGCTGGCTGGATTCGCTTTCGTCCAAGACCGTGTTCACGCGGGTCGATCTCGACGTTGCCGATTCCGGCGC
GGCTCCCGCGCAAGCGTTTGTCCTGCGCGCTTCTTGA

Protein sequence :

MSCLSRQARLHMTEPDTTRHFPVLHASVAYSRIHDRDMTVSRQALFGKLGHSLFRSIESATAFCKLRGNPYVELVHWLHQ
MLQAADGDIQRIARHCDIDIGELDRDMVRALDELPAGASSISDFSHHIETAIERAWVLATLDFGDRRIRGAWLLAALLKT
PELRRVLLSISSAFGRIRVDELDAMLPAWIDGSPEANETPYDNSDFGAATPGEASSALQQKGGGSPLEQFCLDLTARARA
GQIDPVVGRELEIRTMIDVLLRRRQNNPLLTGEAGVGKTAVVEGLARAIADGDVPPKLADVRLLSLDVGALLAGASMKGE
FEARLKGVLEAATKATQPVILFVDEIHTLIGAGGQAGTGDAANLLKPALARGTLRTIGATTWAEYKRHIEKDPALTRRFQ
VLQVPEPDEAAAIDMVRGLTRTFSRHHGVVVLDEAIRAAVKLSHRYIPSRQLPDKAISLLDTACARVALSQHAPPRELQD
VRRRLEAARVRLELLDGEQRIGLGDESALAQSRDEIAALEVQEQAIDACWRQQIEAAQALLSAREAAGDDPATAIDALRE
LERALSSLQGDCAFVFPEVNEAIVAEIMSDWTGIPVGRMVTDEVSAVRALPDTLAARVIGQRDALHQICDRVQTARAGLT
DPKKPLGVFLLAGPSGVGKTETALALAEALYGGEQNLITINMSEYQEAHTVSGLKGAPPGYVGYGEGGVLTEAVRRRPYS
VVLLDEIEKAHPDVHEMFFQVFDKGYMEDGDGRYIDFRNTTILLTSNAGSELVSGLCTDEACAPDADGLCAALAPALLKT
FPAAFLGRVTLVPYRPLAQETLSRIVRLHLDRVVARMAENQAVALSYSDNVVDYVVGRCLVQETGARLLIGFIEQHVLPL
LAKCWLDSLSSKTVFTRVDLDVADSGAAPAQAFVLRAS

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	0.0	63

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
BTH_II0140	YP_438342.1	ClpA/B type protease	VFG2076	Protein	0.0	55
BTH_II0140	YP_438342.1	ClpA/B type protease	VFG2084	Protein	2e-127	41