Gene Information

Name : ECA4278 (ECA4278)
Accession : YP_052365.1
Strain : Pectobacterium atrosepticum SCRI1043
Genome accession: NC_004547
Putative virulence/resistance : Unknown
Product : Rhs-family protein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG3209
EC number : -
Position : 4792990 - 4797273 bp
Length : 4284 bp
Strand : +
Note : Similar to Photorhabdus luminescens Rhs Rhs-corE SWALL:AAN64198 (EMBL:AY144117) (1469 aa) fasta scores: E(): 3.6e-127, 42.61% id in 1361 aa, and to Escherichia coli O157:H7 rhs core protein with extension ecs0605 SWALL:Q8X2J4 (EMBL:AP002552) (1616 aa) fas

DNA sequence :

ATGCGTGATGAAATTCTGGCTCGTATTGCGCGGGTGGGTGCGATGCACGCCGGCAACCGCCCCACGCTGCCGCCCGATTT
ACCCGCACCCGGCAGTGGTTCTCCCCCCACTTCACCGGACAAGCCCATCAAACACAGCAGCTTTCTGGGGGCGTTGCTCG
GTGCCGTTGCCGGGGCCCTAGTGGCGGCAGCAGTTGCCGCGGTCGCGGTCGCGTTGGTCGGGGTGACGGGCGGGCTGGCG
ATTGCACTGGTAGGCGGATTGGCGGTACTGGGGGCGGGTAGTCTGATATCTGCGGTAAGTGGCCGGGTATCCGCCATGGT
AGACAGCGCCTCGCCGCCCGCCGGAGCGGTGGCTGACGGTTCACCTAACGTGTCTGTTGAAGGCAACCCTGTATCCCGGG
CGGAAGTCGATGCAGTGGCGTGTACCAAACATAGCGGCCCGCAACTCATTGCACAGGGCAGCGAAACCGTCTTCGTTAAC
GGTCATCCGGCCGCGCGGATAGGCGATAAAACCGTGTGTGGTGCTACCATCAAGGAAGGAGCATCTACCGTATTCTTTGG
CTCCGGACAGGCTACGGTACTGGAGATACAAGATGAGTTCAGCGGTTGGCAGAAAGCGCTGCTGATTGCGGTGGAATTTC
TTGTGCCACCGACGCGTGGGTTATTTCGCGGGCTGGGGAAATTATTCTTTCGCGGCCCTAAAGCGGTCATGAAAGGGCTG
GGTGCCGGAGCTCTCTGGGCGGGTAAACGCTTTAAGCAAAAGACACGCTGTGCCACCCGCGCATTTAAGGCGAACAAAGG
CCGGGCGCGGGTGACCCAAGCGGCCAAAGCCTTCAAGAAAGACCCAGTGTATATCGCCAGCGGCGAGGTGATTGAAAACC
GCACTGATATCGAACTGGGGCAGACTCTTCCACTGGTGTTCGAACGCACCTACCGTACCGCCTCTTCACATGTCGGATTA
TTAGGCCATGGCTGGCAGGATAGCTGGAGCGAAGTCGCTACCGTCAGCCGTGATGACGGCGACACCCATGTAGTCATTAC
ACTGGCACAGGGCTACAACATCGATTTCACCTTCGGGGTGGGCACTACGGTGGTGTACTGCGCCGAATACCCGGAGTTCA
AACTAGTTAGGCGGCATAACGGCTTTCACCTGTGGCACCGTGACAGCCAGACCTGGCGTGCGTTTACCGTCAGGCAGGAT
GACCAGCTATTGTTGTCGGCCATCACTGACAACCATTTCAACCGAATCGATTTTATCCGCGACCCCAAAGGCTACCTGCG
CAAGGTGCAGCACAGCGACGGCATCGAGCTGCTGCTGGTATGGCAAGGGGAATTTCTCCGCCAGGTGCAACGTATCGACG
GCGGGCAGAAAACCGTGCTGGCCGAATACCGGCAGGATGAACAAGGGAGACTGATCGAGGCCGATGCGGCGCATGCCTAT
CACCTGTTCTACGAGTACGATAACCACAACCGCTTGGCGCGCTGGCACGACAACGACCAGACCTGGGCACAGTATGAATA
TGACCATCAGGGGTGCTGCATTTACACCACCTGCGCCGACGGCTACCTGACCGCCAACTTCGAGTATCTGGCAGACCGCG
TGGTGATGACAGACGGGCTGGGACAACGCCATGAATATGGCTTTAATGACCTGTACCTGATGACATGGGAGAAATCCCCG
CTCGGCCATATCACCCGCTTTGAGTATGACGATGTCGGTAATCTGCTACGGGAAATCTCCCCTGCGGGCCGGATGGTGGA
ATTTGCCTATCTGGGCGACAGCGGGCTGGTCAGTACCTTCACCGATGGCAGTGGCCATCAATGGCATTACGACTATGACG
ACAGCGATCGCCTCACCAGTATCACCGACCCTCTCGGGCGCAACTGGGTCTGGCAGTACGACACGAAGGGCAATCCGCAA
AGCCTGACCGGGCCGGACAACAGCGAAGTGCATTTTGCGTGGAACCGCTACGGCCTGCTGACCGAAGTCAGTGACCAAGG
TGGACAGGTGCAGGCCAGTCTGTTTTACGACCATCGACAGCGCCTGCTCAGTGCCACGGATGCGGAGTCCCGCACTCAAC
AACTACGCTACGACCAACAGGACAGACTGACCACCTGGACACGCCCGGACGGTTCCACCTATCGCTTGGGTTATCGCCGT
GCCAGTTGGAAACTGCCGGAACAACTGCTACGCCCAGACGACAAGCAAGAACAGCGTCAATACGACAAACACAACAACCT
ACTGAATTACACTGATGGCAACGGCGCGGTTTGGCGGCAAACCTATGGCCCATTCGATCTTCTGACGTCCCGTACCGATG
CGGAAGGCCGCACCTGGCGTTACGAGTACGACAAAGAGAGCCAACAACTCGTCGCTGTTATCGCCCCAGATGGGAACCGC
TGGCAATGGTGGTTGGATGCCGATGCACGGGTTATCCGCGAGCAGGATATGGCTGGCACCGAAACTCGCTACGGCTATGA
CGAGGATGGCCACTGCATTAGCATCCACAACGGCGAAGGCGAAACCCGCCACTTCCTGTACGACGGACGCGGGCTACTCA
TCAAAGAAACCGCACCGGACGATACGCTGCACTACCGCTACGATGGGGCAGGCCGACTTACTGAAGTGACGTCTGCGACC
AGCTATATCCAGTTGTCGTATGACGTACGAGACCGAGTGGTGCAGGAACGGAACAGCGGAACAGAAATCCGACGCCACTA
TCAGGCAGAGTCTGACGCCGTTACCCGCAGCTTGTACTGGGAAGGCGAAGAGAGCAGCGCGGCACTCACCAGCACCTTCC
GCTATAGTGCCACGGGTGAACTGCGGCAGGTGCAGTTGCCGGATGACGCAGAGCTAACGTTGGCTCACGACGCCGCAGGA
CGAGAAGCCGCCCGAAATAGCAACGGCGGCTTTATGCAGCAGCGCGAATACGACGCCATGGGCTGGCTGACGCGCGAGAT
GAGTGGGCAGCAGCGGGATGGTCGTTTACAGGCCGAACAGAGCCGTGAACATTTGTATGATGGCGCAGGCAACCTAACGG
GCACCCGGCACAACCGCGAGGCCGAAGGCTACCGGTTGGATGCCAGCGGACGAGTGCTAACCGTCCTGAGCGGCGGCACA
GGCCGTACCGTCAATACCGAAGAAGAATACCGCTACACCCGCACCGGCCTGCCGCAGGACGCCACAAGATTGACCGAGTG
GCAAGCGAGCAGGCTTATTCAGCGTGACGATACCCACTATCAGTACGACAAAGCCGGACGGCTGATACGCAAACAGGTGG
TACAGCCAGGCTACCGGCCGCAGGTTTGGCACTACCGCTGGGACAGTCGTAACCAGCTCAGAGTGGTGGATACGCCAACG
GGTGAGCGCTGGTTCTACCGTTACGACCCATTCGGGCGACGCACCGGCAAACGCTGTGACCAGAAAGCAGAAGACATCCG
TTACCTCTGGGACGGCGACCAGATAGCTGAAGTGCGGCATTACCGCGAAAACCAGCTCATCAGCCGCCGCCACTGGGTAC
ACAATGGCTGGGAGTTGCTGGTGCAACAGCGCCAGAATACCGACGGGAATTGGGAGACGGATTTTGTCACCAGCAGCCAT
AACGGCGAGCCGCAGGCTATCTTTAATCAGGCTGGTGAGCTTCGCTGGCAGGCGCCGCGCACGAACTTATGGGGGCACCG
GACTACAGATAATACTGAAAGTCTCGATCCGGGGCTGGCATTTGCTGGGCAATACCGTGACGAAGAAAGTGGCTTATGCT
ATAACCGATTTCGGTATTATGATCCAAGCGGTGGTTGCTATATCTCACCTGACCCGATAGGGATAAGAGGTGGTCTTAAC
CTTTATGCGTATGTTAAAAACCCTGTAAATTGGATCGATCCGAAAGGGTTAGCTGGATGTAATATAGTCCATAGGGCGGT
GACTCCTGAACAAGCAGCAAGTATCCGAGCAGGCAATGGAATATCAAGGCCGACTCCATATCATAGAACGACACCGACTC
AGCATGTAGCAGGAGCACCGCACTCGCGTGATCCGTGGATATCAACAACTAGAAGTCAATCAACAGCAGAATACTTCGCC
ACTCATGGTGGAACCCAAGCAGCAAATCCAATTGTTAATATAGATCTGTCTAAAATTCCGAGCGATAAGATTTTAGATGT
ATCAAACGCTCAAAAGGCTGCGGAACATTTGCAGACTCCATTCACCCGAAATGTAGCGGCAGCCCACCAAGAAGTATTAA
TCTTTGGAGAAATACCATCGGAAGCGATAATTGGATTTTTATAG

Protein sequence :

MRDEILARIARVGAMHAGNRPTLPPDLPAPGSGSPPTSPDKPIKHSSFLGALLGAVAGALVAAAVAAVAVALVGVTGGLA
IALVGGLAVLGAGSLISAVSGRVSAMVDSASPPAGAVADGSPNVSVEGNPVSRAEVDAVACTKHSGPQLIAQGSETVFVN
GHPAARIGDKTVCGATIKEGASTVFFGSGQATVLEIQDEFSGWQKALLIAVEFLVPPTRGLFRGLGKLFFRGPKAVMKGL
GAGALWAGKRFKQKTRCATRAFKANKGRARVTQAAKAFKKDPVYIASGEVIENRTDIELGQTLPLVFERTYRTASSHVGL
LGHGWQDSWSEVATVSRDDGDTHVVITLAQGYNIDFTFGVGTTVVYCAEYPEFKLVRRHNGFHLWHRDSQTWRAFTVRQD
DQLLLSAITDNHFNRIDFIRDPKGYLRKVQHSDGIELLLVWQGEFLRQVQRIDGGQKTVLAEYRQDEQGRLIEADAAHAY
HLFYEYDNHNRLARWHDNDQTWAQYEYDHQGCCIYTTCADGYLTANFEYLADRVVMTDGLGQRHEYGFNDLYLMTWEKSP
LGHITRFEYDDVGNLLREISPAGRMVEFAYLGDSGLVSTFTDGSGHQWHYDYDDSDRLTSITDPLGRNWVWQYDTKGNPQ
SLTGPDNSEVHFAWNRYGLLTEVSDQGGQVQASLFYDHRQRLLSATDAESRTQQLRYDQQDRLTTWTRPDGSTYRLGYRR
ASWKLPEQLLRPDDKQEQRQYDKHNNLLNYTDGNGAVWRQTYGPFDLLTSRTDAEGRTWRYEYDKESQQLVAVIAPDGNR
WQWWLDADARVIREQDMAGTETRYGYDEDGHCISIHNGEGETRHFLYDGRGLLIKETAPDDTLHYRYDGAGRLTEVTSAT
SYIQLSYDVRDRVVQERNSGTEIRRHYQAESDAVTRSLYWEGEESSAALTSTFRYSATGELRQVQLPDDAELTLAHDAAG
REAARNSNGGFMQQREYDAMGWLTREMSGQQRDGRLQAEQSREHLYDGAGNLTGTRHNREAEGYRLDASGRVLTVLSGGT
GRTVNTEEEYRYTRTGLPQDATRLTEWQASRLIQRDDTHYQYDKAGRLIRKQVVQPGYRPQVWHYRWDSRNQLRVVDTPT
GERWFYRYDPFGRRTGKRCDQKAEDIRYLWDGDQIAEVRHYRENQLISRRHWVHNGWELLVQQRQNTDGNWETDFVTSSH
NGEPQAIFNQAGELRWQAPRTNLWGHRTTDNTESLDPGLAFAGQYRDEESGLCYNRFRYYDPSGGCYISPDPIGIRGGLN
LYAYVKNPVNWIDPKGLAGCNIVHRAVTPEQAASIRAGNGISRPTPYHRTTPTQHVAGAPHSRDPWISTTRSQSTAEYFA
THGGTQAANPIVNIDLSKIPSDKILDVSNAQKAAEHLQTPFTRNVAAAHQEVLIFGEIPSEAIIGFL

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
rhs-core	AAN64198.1	Rhs	Not tested	macrophage toxin pathogenicity island	Protein	0.0	42