Gene Information

Name : YpsIP31758_0415 (YpsIP31758_0415)
Accession : YP_001399408.1
Strain : Yersinia pseudotuberculosis IP 31758
Genome accession: NC_009708
Putative virulence/resistance : Unknown
Product : insecticidal toxin complex protein
Function : -
COG functional category : S : Function unknown
COG ID : COG5281
EC number : -
Position : 487828 - 491421 bp
Length : 3594 bp
Strand : -
Note : identified by similarity to GB:CAI77374.1

DNA sequence :
ATGCCTACTAGCACTGTATTAAATAAAATTAACGAATCGCGCCGCGACGCATTGGTTAACTACTATCTTGCTAAAAATGT
CAGCGGCGATGAGGAAATTAAAACCGCAGAACAACTGTATCAATACTTATTATTAGACACTAAAATTAGCCATGAAGTAA
AAACCTCACCTATTGCCGAAGCGATCAGTAGTCTACAAATTTATATTAATCGTTGTGTTGATGGAGAAGAAACTGATCTT
CATGAAAAAAGCATCAGTAAACATTTCAGCACTGATAATTTTTTGCATAACTGGAATATCTATAATAAACGCTATGCACG
CTGGGCAGGTAAAGAGAAGCTGATGTATTATGCGGCTGACTATATTGACCCCACTTTACGCTATAATAAAACTGAGCTAT
TTAATACCTTTGAGCAAAGCATTAATAACAGCAAATTGACAGAAAAATCAGTAAAATCAGCATTGCAAAGCTATTTAATC
AGCTATGAAAAATTGTCTCAAATAGACACTATCAAAGAGTTATATGTAGAAGATATTAAAACTTATTTTTTCCTCGGTAA
AACCCGAGAATCACCTTGCCAATATTATTGGCGTAGTAGTGAAAAATTGTCTAATGATAGTAATAATCTACACTGGTCTG
AATGGAGAAAAGTTAATTGCAACATCAATGGTACAGAAGAAAAATTCTTTATTAATCTTAGTTGGCATCGAAGTGGCCTT
TATATTGACTGGATTAATACATTTTCCATCAAGGCCAATAAAGATGAAACCACAGAGAAATACCATTACAATCGTGTATA
CAAAAACGATGATAATACTTGGTCCGAACTCATTATCAATATGGATATAGGATTTAAATTGAGATCCTCAAGCGAGGTTG
TAACATTGCCTCCTTTCTTTATAAATCAAGGTGATCCAAACTCTAAAGAAGAAGTTGAAAATTTATTTTTAACTAATGGA
ACTAGCATAAAAAAAATAGAGTCACGTATTCATGGCTATATCAATGGTGACATTAAAATATTATGTAATGAAGATAACAT
ATCGTTCGAAATAGCGGAAAAACTCATCAATGGAAATAATGGAACAATCAACGACATTAAATTAATTGAGGATGGGAAAG
AGACATTAATCATAAAAAATGAAAAGGGGGAAAAGAAAGAAATAAAGTTAATAGATAAATTTGAAATTAAAATATTTCCA
TATAATGAATTAGTAGCCAGTTCTATTGTATTCAATAGAATAAAACCTGAAAAAAAAATAATAAATGAATTGGAAAATAA
AATTTCTTTACTATCACCGAATAGTCTACCATTAAAAGAAAAACTTCAAAAGTCAATTGATGAACTGCTCAGTTATAGCA
CCCAAAAAGATAAAGTAGGATTAGACGCATTCAATGGCTCCTACGGTATTTATTTATGGGAGTTGTTCTTCCATATTCCG
TTACTGGCATCTATGCGGTTCCTAAATGAACAGCGTTTTGATCTGGCACAGCATTGGTTAAAATATCTGTTTAATAGTGC
CGGTTATCGTGATGAGAATGGTAGTTTGCTAAAGGAAGGTGATAATATCCTTTATTGGAATAGCCTGCCACTGCAACATG
ATACCGATTGGGACAACAACACTCTCATCCAAGAAACTGACGACCCCGATGTTATTGCCATGCAAGATCCGATGCAATAT
AAGTTGGCGATCTTTATGCGTACATTAGACTTGATTATTAGCCAAGGCGATCAGGCTTATCGTCAATTAGAACGAGATAC
ACTGGCAGAGGCTAAAATCTATTATATTCAGGCCAGTCAATTATTGGGTACACGGCCAGATCTTAATCATGGTCATCAGT
GGGAAAATATAAAATTAGCCGAAGAAAGTCGCCAAGCGGAGAATGGTCATTTCCTGCCGCCGTATAACGAACTATTATTA
TCCTATTGGGATAAACTGGAAATTCGCTTATATAACCTGCGCCATAATCTAAATTTGGATGGTCAACCATTACATTTACC
ACTCTTTGCCACACCAGTGGATCCTAAAGCATTACAGCGTCAACACGGGGTCGGTAATGGCATCAATAGTGGTGAGCAAA
TGGCAACAGCGCAAACCTCGCTGTATCGCTTTCCACTGTTAATTGAGCGGGCAAAAAGTGCTGTCAGTTCGGTGATTCAG
TTCGGTAACAGCCTGCAAAACGTGCTGGAGAGGCAGGATAACGAAGCCATGACCCTATTGTTCCAGCAACAACAACAGCA
AGTCTTGCAGCACACTAAAAATATTCAAAACAACAATATCCTCGTATTACAAGCTAGCCTGAATGCAACAAGTTCACTGA
AAAGTGCCGCAGAACAACGCAGCAAACACTACAAGGAGTTACTGGATAACGGCATTTCCAGCCGTGAACAAAGTGGCCTT
GATCTCCGTATTGACGCTGGAGCGGTCAATATTGCATCAGTCGCACCCTTAATGCTCGCTGCCGCTTTAGATACCGCACC
CAATGTTTTTGGTTTGGCTGACGGCGGTTCTCACTGGGGAGCAGTGCCATACGCGACTTCTGCAACACTACAAATCAGTG
CTGGTTTAACAGAAAGCCGTGCCAATATTAATGATATCAAAGCCAATTATGACCGCCGTGTACAAGAGTGGACGCTGCAA
AAAAATCAGGCTGATAAAGACGCTGAACAGTTAGCGCACCAATATACCAGCGTGCAGGAGCAGCTCAATATGGCGCAAAA
ACAGCTCAATTTAGCTGAGTTAGAGCAAGGCCATGCCGATGCACTGTATCAGATGCAAAGCACCCGTTTTACTGGCAAAG
AGTTATACAACTGGATGGCAGGCCGCCTCTCAGGCCTCTATTTCCAACTGTTTGATGCCACTCAACCCCTGTGTTTAATG
GCAAAGGCGGCACTGGAAAAAGAGGTCGATAAAGCGAAAACCGATGGCTTATTTATTCGCTCCGGTTGGAATGATCTCTA
TCAGGGGCTACTGGCGGGTGAAGACCTGCAACTCAATCTACAAAAACTGGAAAATGTGTGGCTGATGGAAGAACAGCGGG
GGCTGGAAGTGGAACGCACCGTCTCATTGGCTCAGCATTATCAGCAATTAGGTGACCATAAGTTCGATCTGGCAGAAATC
GTCACAGGCTATATGGCGCAAGATAAAACTGAAAAAGCCGGTAATGAACAAGACGGTGTGGAATTAAAAGATGGCACTTT
AATTGTCTCCCTCAGCATCAATGGCCTGAATCTGATCGAGGATTATCCGGCACCCATGCATTTAGGCGATATCCGCCGTA
TTAAGCAGATAAGCGTAAGTTTACCTGCGCTGTTAGGACCCTATCAGGATATTCAAGCCACCCTCGATTATGCAGGTGAA
AATACCCACTTGGCGAAAGGATGCTCTGCCCTGGCGATCTCTCGTGGGATGAACGATAGCGGCCAGTTCCAACTGGACTT
TAACGACGGTAAATACCTGCCGTTTGAAGGAATTGATATCAGCGACAAGGGCACATTGGTGCTTCGCTTCCCCAATGCAA
CCGGCAAACAAAAACTGCTGCTGCAAAGCCTGAGCGACATCATTTTGCATATTCGCTACACCATCCGTTCCTGA

Protein sequence :
MPTSTVLNKINESRRDALVNYYLAKNVSGDEEIKTAEQLYQYLLLDTKISHEVKTSPIAEAISSLQIYINRCVDGEETDL
HEKSISKHFSTDNFLHNWNIYNKRYARWAGKEKLMYYAADYIDPTLRYNKTELFNTFEQSINNSKLTEKSVKSALQSYLI
SYEKLSQIDTIKELYVEDIKTYFFLGKTRESPCQYYWRSSEKLSNDSNNLHWSEWRKVNCNINGTEEKFFINLSWHRSGL
YIDWINTFSIKANKDETTEKYHYNRVYKNDDNTWSELIINMDIGFKLRSSSEVVTLPPFFINQGDPNSKEEVENLFLTNG
TSIKKIESRIHGYINGDIKILCNEDNISFEIAEKLINGNNGTINDIKLIEDGKETLIIKNEKGEKKEIKLIDKFEIKIFP
YNELVASSIVFNRIKPEKKIINELENKISLLSPNSLPLKEKLQKSIDELLSYSTQKDKVGLDAFNGSYGIYLWELFFHIP
LLASMRFLNEQRFDLAQHWLKYLFNSAGYRDENGSLLKEGDNILYWNSLPLQHDTDWDNNTLIQETDDPDVIAMQDPMQY
KLAIFMRTLDLIISQGDQAYRQLERDTLAEAKIYYIQASQLLGTRPDLNHGHQWENIKLAEESRQAENGHFLPPYNELLL
SYWDKLEIRLYNLRHNLNLDGQPLHLPLFATPVDPKALQRQHGVGNGINSGEQMATAQTSLYRFPLLIERAKSAVSSVIQ
FGNSLQNVLERQDNEAMTLLFQQQQQQVLQHTKNIQNNNILVLQASLNATSSLKSAAEQRSKHYKELLDNGISSREQSGL
DLRIDAGAVNIASVAPLMLAAALDTAPNVFGLADGGSHWGAVPYATSATLQISAGLTESRANINDIKANYDRRVQEWTLQ
KNQADKDAEQLAHQYTSVQEQLNMAQKQLNLAELEQGHADALYQMQSTRFTGKELYNWMAGRLSGLYFQLFDATQPLCLM
AKAALEKEVDKAKTDGLFIRSGWNDLYQGLLAGEDLQLNLQKLENVWLMEEQRGLEVERTVSLAQHYQQLGDHKFDLAEI
VTGYMAQDKTEKAGNEQDGVELKDGTLIVSLSINGLNLIEDYPAPMHLGDIRRIKQISVSLPALLGPYQDIQATLDYAGE
NTHLAKGCSALAISRGMNDSGQFQLDFNDGKYLPFEGIDISDKGTLVLRFPNATGKQKLLLQSLSDIILHIRYTIRS