PAI Gene Information


Name : siiE
Accession : CAE11797.1
PAI name : SPI-4
PAI accession : AJ576316
Strain : Salmonella enterica RSK2980
Virulence or Resistance: Virulence
Product : large repetitive protein
Function : -
Note : Salmonella typhimurium LT2 gene STM4261
Homologs in the searched genomes :   36 hits    ( 35 protein-level,   1 DNA-level )  
Publication :
    -Morgan,E., "Direct Submission", Submitted (11-JUL-2003) Morgan E., Division of Microbiology, Institute for Animal Health, High Street, Compton, Nr Newbury, Berkshire, RG20 7NN, UNITED KINGDOM.

    -Morgan,E., Campbell,J.D., Rowe,S.C., Bispham,J., Stevens,M.P., Bowen,A.J., Barrow,P.A., Maskell,D.J. and Wallis,T.S., "Identification of host-specific colonization factors of Salmonella enterica serovar Typhimurium", Mol. Microbiol. 54 (4), 994-1010 (2004) PUBMED 15522082.


DNA sequence :
ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACCACGCCGCGTGGTTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGATGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCTGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGTACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTTACAGCGCCTGAAACATTGACTGATGGAACATATAATCTGGAGGCAGAGGCCAAGACTGCTGATGGG
AGCGGTAGCGCCAAACTTGTCATTACTATCGATTCCGTTACCGATAAACCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCCGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAGGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCTGTAGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTGCTCCAGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACCCTGCCAACATTTATTGGTGTGGCGGAACCCGGTTCTACAGTCTCTATTTATCTTGGACTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACAGCTACTGATATTGCCGGGCATACCTCAGCGACGGCAAATCTGCCTTTTACTATTGATACACGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACGAATGATAGCGGTATTGTCGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCCGACTCAGTGGAAGGGATTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATTGATACTATTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGATTATGTT
GTTTTGCCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATTTCTCAGGATGCCGCCGGCAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCGGATAGGTTTGCTACCGTAAATATCCTTATTGACGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCAGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGACTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACACCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGTGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAGGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGAACCGCTGCACCCTATTCAACGGTTAAA
CTCTATATTGATGGTGCACTGATCGCTGAGGTCAGAACAAATAAAGATGGCAGATGGGAGTATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCTCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTTCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCAT
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGCGCGATATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTTACAGGCGATAACCTGACCAATATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCCGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCTCAATGGTAGTTGGTTATTTATACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAACTACTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGATAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACTCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGGATAGCGCGGACG
ACACCGGCATCCAGGGCGATAACATGACGAATAGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTTTAC
GCCGCCGACATCATGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCGACGAT
AATCTGACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCAGGCGTCTGGGATTATATCTGGCCGGATGATGTGGCCGACG
GAGGCTATACCCTGACGGTAGAAGCGACCGATGAGGCGGGAAATAAGGCAACACAGACGCTCGATTTCACCATCGATACC
ACTCTGTCTGTGCCGACCCTCTCGCTGGACAGCGCAGATGACAGCGGCATCGCGGGCGATAATATCACCAATGTTAAAAC
GCCGGGCTTTACCCTCAACAATATTGATACCGATGTCAGCCGGGTGATAGTGGAGGTAATGCACAATGGCATTAAACAGG
AGGTGCCACTGGTTCAGACCGGCGGACAGTGGCGCTTTGCGCCGACCAGCGACTGGGCGGACGGCGACTATATCCTGACG
GTGAAGGTAGAAGATAGGGCCGGAAATGTGAAGCAGTCCGCGCCGTTGACGGTGACAGTAGACACGCATATCGCCATTGA
CCGTATTGAACTGGTTAACGACAGCGGTATCCCCGGCGATAATCTGACCAATGAAGCGCGCCCGCACTTTCAGGTGACAG
TACCGGCGGATGTTAACGGTGTAAGACTGAGTATTGATGGCGGCAAAACGTGGTTTGACGCCACGCAGAGCGCGACGTCG
GGCGTCTGGGATTACACCTGGCTGACGAATGTGGCTAACGGCCCTCACACCCTGATGGTGGAAGCGTCCGACAAGGCGGG
AAACAAAACGACGCAGAAACTGGACTTCACCATCGATACCATTCTGTCAGAACCGACGATTACCCTGGACAGCGCGGATG
ATAGCGCCGCTGGCGATAACATCACCAACGTTAAGATGCCAGGCTTTACCCTCGGTAATATCGACGCCGACGTGACCAAA
GTGGTGGTGACGGTGGCGCATGATGGTAAGAACCAACAGATAGAGTTGATTAAGAACGGCGGTGTGTGGCGCTTTACGCC
GGGCGCAGCCTGGACCGATGGCGACTATACGTTGACGGTAAAGGTAGAAGATAAGGCGGGTAATACAAATTATTCTGCGC
CGCTGACGGTGACTATCGATACGCAAACGTCTATTGATCGCATTGAGCTTCTTAATGACACGGGTATTGTCGGGGATAAC
CTGACCAATGAAGCACGTCCACAGTTTCATATTACGGTACCGACGGACGTGAACTCTGTGCAACTGAGTCTTGATGGCGG
CATCAACTGGGTTAACGCAACGCTGACGTCTGACGGCGTTTGGGAGTATATATGGCCGACAGATCTGGTCGAAAATACGT
ATACCCTGACAGTGAAAGCAACCGATGTTGCAGGCAACACGGCGACGGAAACGCTCAATTTTATCATTGATACCACATTG
TCGACACCGACCATCACGCTGGATAGCGCAGATGATAGCGGCACCGCCAACGATAATAAGACTAACGTTAAAACGCCGGG
TTTTATTATCGGCGGTATTGATTCTGACGTGACTCAGGTCGTCGTGCAGGTGATGCGCGATGGTCACAGCGAGGAGGTGG
AGCTGACGCAGACTAACGGGCAGTGGCGTTTTGTACCCGGCAGCGCGTGGACTGATGGCGACTATACGCTGACGGTAACG
GTGAAAGATGAGGCGGGTAATATTCGCCACTCAGCGCCGTTGACGGTCACCATCGATACGCAAATCACCATTGACCATAT
TGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTAACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTACCGA
CGGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGTAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTC
TGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGTAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACAA
AACGACGCAGCAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAGCACGGACGACAGCG
GAACAAAAGGCGATCACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC
ACGGTTGAGGTACAGCATGGCGGCACGAAAGAGGTGCTGACGGCCACCAAAGACGCGACCGGCAACTGGAGCGTGACACC
GACCGGCACATGGGCAGATGGCGACTATACGCTGACAGTGAGGGTGGAAGATGAGGCGGGGAACGAAAAACACTCAGCGT
CGCTGACGGTCACTGTTGATACCCAAATCACCATTGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAAT
ATGACTAACGACGCCCATCCGCAGTTCCGCGTGACGGTACCGGGGGACGTTAACGAAGTCAGTCTGAGCATTGACGGTGG
CGTGACCTGGGTTAAGGCGACACAGAGCGCGACGCCGGGCGTCTGGAATTATACCTGGCCGGGCACCGTGCCGGATGGCG
ACTATACGCTGAATGTGAAAGCGACTGACAATGCGGGTAATACGGTGACGGAGACACTCCACTTCACTATTGATACTACG
TTGTCGACGCCGGTGATCGTACTGGATAGCGCGGACGACAGTGGTGTCCATGGCGATAACATGACCAATCACACCCAGCC
GACATTTGCCCTGCAGCATATTGATGATGATGCCGTTCGCGTTACGGTCAGCGTAGAGCATGGCGGCGTCACCACCACAT
TTGACGCCACGAAAGACGCAGGCGGATGGACCTTTACGCCGACAGGGGCGTGGGCGGATGGTGATTATACCCTGAGTGTG
TCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTGCATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAA
CATTGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGACGGTAC
CGACTGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCGACCCAGAGCGCGACGCCGGGT
GTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAA
CAAAACGACGCAGCAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAACACGGACGACA
GCGGAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTAT
GTCACGGTTGAGGTGCAACATGGCGGCACGAAAGAAGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGAC
ACCGACCGGCACATGGGCAGATGGCGACTATACGCTGACGGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCAG
CGCCGCTGACGGTCACGGTTGACACCCAAATCACCATCGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGAC
AACCTGACCAATGACGTTCGTCCACACTTCCGCGTCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGG
CGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGC
TACATACCCTGACGGTAGAAGCGACCGATAAGGCGGGAAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGG
CTGTCAACGCCTACCATCGCTATGGATAGCAGGGACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACC
GGGCTTTACTATTGGCAATATTGACGCCGATGCGCACTCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAG
TGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTACGCCAGATGCTGACTGGGCGGACGGTAGCTATACGCTGACGGTA
GAGGTAACGGATAACGCAGGAAACGTTCGTCAGTCCACGCCGCTGGTGGTGACGGTGGACACGCAAACCAGCATTACTGA
TATTACATTGGTCAATGATCATGGCGTGCCTGATGACAATCTAACTAATAGCACCCGTCCGCAGTTTGAGATCACGGTGC
CGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGGGGGCGCAAACTGGGTGAGCGCGACGCAGGGTATCGAAGGCGTC
TGGGGCTATACCTGGCCAACGGATATGGGCGATGGAAAACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATAC
GGCGACGCAAACGCTTGAATTTTTCATCGACACCCGGTTGTCGACGCCGACCATTGCGCTGGATAGCACGGATGATACCG
GTACGCCTGGCGATGATATGACCAATCGCACCCGACCGACCTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTT
ACAGTCAGCGTCACGCATAATGGAACGACAACCTCGTTTACTGCGACACAGGGGGCTGGAGGATGGAGCTTTACACCGCC
AGCGCCGTGGGGCGACGGTGATTATACGCTGACGGTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGC
TGACGGTGACAGTGGATACGCAAATAGCCATTGATCGTATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTG
ACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCAC
GACCTGGGTTACTGCAATCAAGAGTTCGACGGCTGGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGC
ATACCCTGACCGTGGAAGTGACTGACGGTGCGGGTAATAAGATGACGGAGACGCTCAATTTCACTATCGATATCACGTTG
TTAACGCCAACCATTGAGCTAGCGCCCGATCAGGATACCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAGCC
GGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTACTCACCGAATCAGCCGACGGCTGGCGCTATCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTG
ACGGTAACAGATGTGGCAGGCAACCAGCAAACATCCGCGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGT
GATTGAACTGGCAGCTGGCGAAGATAGCGGTACTGTTGGCGATCGCCTCACCAATCACGATCGGCCTGTGTTCGACATAC
ATCAGGTTGATTCTGACGTTACGCGCGTGATGGTCAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTC
ACCAATGGTCAATGGCGCTTTACGCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCT
GGCGGGGAATGTAAAAGAGTCTGCGCCGTTTGAGGTGCGTATTGATACCACGACAACCATTAACAATATCGTATTGCTTA
ATGATACCGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCGTC
CAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAG
CCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACTAATATACAGGTTCCTACTATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACCGCC
GATAATATTACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAAGTCGTGGTGACGAT
TGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCATTCCGGATGGTTCTT
ATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACG
GCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAAGTCGACAAGCCGCA
GTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAA
AAGGAGGGGATGGCCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCTTGGTTGATGTGACT
GATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGA
TCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCG
ATAATGATGTATCACACATTGTGGTTCATATTGATGGTCGGGATTACACCATTGAAAACACAGGGGGGAATTTAACCTTT
ACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATC
GGCCGAACTGCGGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATC
ACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTC
GATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGGAATTTACTGCAGGTAGCGCATTGCCTGATGG
TCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTTCACCGTGGATACGC
AGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCA
CGTTTTGAAATTTCAGCCAGAGAACCGCTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACACTGACTCAGGG
GGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATA
TCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTATTGATTTGCTGGAT
GCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATTGGCAATGTACCCGC
CGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATACTTCTGAAACT
AAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGAAATTCCAATAG
CGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGTGATTACCATTGTTG
ACGATAAGTCAGGTCGGGAGGTTTTAAAACAAACGATTACGGTTGGCGCTGATGGCAACTGGAGTGTGACGCCGAATATA
CTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCAC
TATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGCATGAAGCAACCAGCCTGC
GTCCTGAGTTCAAAGGGTTTGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGGTCGGCTCGGCAAAC
GCCAATGCGAATGGCGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAA
AGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTCGTAATACCTGTTATTGATGTCACGCCTCCAACCATAA
AGCTCAGCGAGGAGAGCGATAGTGGCGCCTTAGGAGACTTTACCACGAATAATAAAACGCCGACCCTGATTGGGAGCACG
TTACCTAATACGATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGTCGATATAC
TTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAATAGCGAACTGC
GTTCTACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGA
TATATCAATACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGA
AAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGACGGTAATTATGAAT
TAACGTTTAAAGTTGAAGACGTTGCCGGTAATATCAGAGAGTTTGGTCCGCAGAATGTAATACTGGATACAGTAATTTCG
CCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCAT
CGATGGTACTGCCGAAGCCGGAAGTACTTTAACCATCAGGAATCCGCAGGGAGTGGTTATTGCTACCCTGGTGGTAGGCA
ATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGC
AACAGTCAACAAAAAGAGATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAA
TAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTAC
AGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAAT
AGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAGTCTGCGATTACAACCGT
GACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCGAGCGTTGTCAG
TCTCAGGTGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCT
GATGGCACATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCTGG
CAACACTGAAGTGAGCAAGGATTATAGCGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAACCTTGAAGATGCAA
GCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTATTAGTTGGCACCGCAGAAGCGGGAGCCACA
ATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTTCTTGTGCTTGAAGATGGAACCTGGTCCTATCAGTTTGATAA
TGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTAC
TCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAATGGTATTTTCAGTAATGAT
AGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGAGT
GCTAGTCGATACGATCACGGTGACCGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCA
TTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATACCTTTAATACG
ACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGA
CACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATCATTAATGGCTTAAATGTGG
GGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAGGCCAACTGGATATC
ACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTTGATACGCATATCAAGGTATT
TACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGAATGGTGGAGTAATAGCGATCTCATTACCATGCGAGGCA
CGGGTGAAATTGGCGCTACGGTATCATTAATCGTGGCTGGCGTCACGCTGGCAACTGCTGTTGTGGCGGCAACAGGACGA
TGGGAATTATCAACAGACAAGCTTCCAGAAGGGACTTACGATATTAGTTTGGTCATTGAAGATAGCGCCGGAAATCGTTG
GGAAGATGTGCGTGAAATATTTATTGACCGAACGCCGCCAAATGCTCCGGTCGTAACGTATTCAGATATTGTCAACGATC
TAATTATTATGCAGGGGACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTGAGGGGAATACTTATACGTTAACC
GTTCCTGATAATGGTAAATGGAGTATGGCTATCCCGTATCCATCAGAAGGGAAGTTTACCATTACGAGTGTGGATGCTAT
TGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCAGACAGTG
GTACGGTGGGCGATAATATTACGCGAGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTT
CAGGTCGATATCAATGGGACCGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTT
AGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTTACCCATTACTGTCA
CGATCGACAGCACGCTGACGGTGCCGGAGATTGCGTTGGCAGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTG
ACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTAAACGTGACGCATAA
TGGCGTGACAGACATCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATGACGGTA
ACTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAATTCACAGCAATCTGCTTCGCTAGCGGTGACGGTTGACTCA
ACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGGCAACAGCGGTTACTCCACCGGAGTC
TGAAACAGTGAATGCCGAAAGCGCTACGCATCTTCGTACAGAGCCGTCTGCGGCGGAAGAAAGCGTGGTGAAGGTGACAG
CCTATAGTATTACATTGTTAAACGCTGACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTTGAAATA
TCAGTACCTGAGAATATTGTTAATGTCAGTATTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCAGAAAGC
AATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAAAGACAATGATTTCC
TGATTAAGGAGAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGTAAGAGGAAAGACCGAG
GATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTTTTCGCCGTTAATGA
AGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPRGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDDAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTIAPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTNDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGINNLTFTVEDVAGNKKDFSFSYVIDTIAPVPPTVSLEDYV
VLPNGIILSGNDLPALVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYIDGALIAEVRTNKDGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGISDDN
LTNIVKPTLHLKDIDPDIISVQVWDAMSDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAIFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFIPGNTWADGSYTL
TVKVEDKAGNTNYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLDSADDTGIQGDNMTNSTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWTFTPPTSWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDD
NLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGVWDYIWPDDVADGGYTLTVEATDEAGNKATQTLDFTIDT
TLSVPTLSLDSADDSGIAGDNITNVKTPGFTLNNIDTDVSRVIVEVMHNGIKQEVPLVQTGGQWRFAPTSDWADGDYILT
VKVEDRAGNVKQSAPLTVTVDTHIAIDRIELVNDSGIPGDNLTNEARPHFQVTVPADVNGVRLSIDGGKTWFDATQSATS
GVWDYTWLTNVANGPHTLMVEASDKAGNKTTQKLDFTIDTILSEPTITLDSADDSAAGDNITNVKMPGFTLGNIDADVTK
VVVTVAHDGKNQQIELIKNGGVWRFTPGAAWTDGDYTLTVKVEDKAGNTNYSAPLTVTIDTQTSIDRIELLNDTGIVGDN
LTNEARPQFHITVPTDVNSVQLSLDGGINWVNATLTSDGVWEYIWPTDLVENTYTLTVKATDVAGNTATETLNFIIDTTL
STPTITLDSADDSGTANDNKTNVKTPGFIIGGIDSDVTQVVVQVMRDGHSEEVELTQTNGQWRFVPGSAWTDGDYTLTVT
VKDEAGNIRHSAPLTVTIDTQITIDHIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGV
WDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTLLSEPTIVLDSTDDSGTKGDHLTNVNKPTFLLGNIDADARYV
TVEVQHGGTKEVLTATKDATGNWSVTPTGTWADGDYTLTVRVEDEAGNEKHSASLTVTVDTQITIDVIELVNDNGIPGDN
MTNDAHPQFRVTVPGDVNEVSLSIDGGVTWVKATQSATPGVWNYTWPGTVPDGDYTLNVKATDNAGNTVTETLHFTIDTT
LSTPVIVLDSADDSGVHGDNMTNHTQPTFALQHIDDDAVRVTVSVEHGGVTTTFDATKDAGGWTFTPTGAWADGDYTLSV
SVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPG
VWDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTLLSEPTIVLDNTDDSGTKGDNLTNVNKPTFLLGNIDADARY
VTVEVQHGGTKEVLTATKGATGIWSVTPTGTWADGDYTLTVRVEDDAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGD
NLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTAGIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTR
LSTPTIAMDSRDDTGAIGDHITSVKRPGFTIGNIDADAHSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTV
EVTDNAGNVRQSTPLVVTVDTQTSITDITLVNDHGVPDDNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSATQGIEGV
WGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTRLSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINV
TVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTVTVEDRAGNTRPSTPLTVTVDTQIAIDRIELVNDSGVPGDNV
TKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTAGIWDYTWPTDMPEGQHTLTVEVTDGAGNKMTETLNFTIDITL
LTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTV
TVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGTVGDRLTNHDRPVFDIHQVDSDVTRVMVKVTYNGKTHEEAAVF
TNGQWRFTPSASWADGSYQLAVVVEDLAGNVKESAPFEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVV
QVRVTLDGGANWNVIRKNADGQWIFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTA
DNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTT
AEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVT
DIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHIDGRDYTIENTGGNLTF
TPDQPLSDGQHTISVTVTDIAGNTKTSAELRIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSF
DGVNWTPISKNAAGQWEFTAGSALPDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSP
RFEISAREPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLD
ADDTGESAVDNITSVTTPRFVIGNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSET
KLPFTIDTTTSVSVRMEPASDTGNSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKQTITVGADGNWSVTPNI
LPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIRLSDPSIDDQHEATSLRPEFKGFAEAFSTIMIQWDGKVVGSAN
ANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGST
LPNTIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGG
YINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVIS
PLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAG
NSQQKEILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPAN
SADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEA
DGTWRAPILLQDDGTFNIHFSITDVAGNTEVSKDYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGAT
IHIYVDEKIVANVLVLEDGTWSYQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSND
SITSQTRPTFSIFGEMNQSVQIFIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNT
TPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDI
TVKSTDRAGNVNQEKYSIWVDTHIKVFTSELDDNKSSSKTEWWSNSDLITMRGTGEIGATVSLIVAGVTLATAVVAATGR
WELSTDKLPEGTYDISLVIEDSAGNRWEDVREIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSEGNTYTLT
VPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVV
QVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNV
TNHTQPKFTLQHIDADVTGVTVNVTHNGVTDIYQATQGADGWTFTPPAAWNDGNYTLSVTVVDRAGNSQQSASLAVTVDS
TVTVTADSQHDDASDDATATAVTPPESETVNAESATHLRTEPSAAEESVVKVTAYSITLLNADSGDEIDRSISQTPSFEI
SVPENIVNVSIMFEGEEFTLPITNQKAIFEVPLSLEDGEYTMDVKFIDKDNDFLIKEKTFSVDHSSADIVNAMNVRGKTE
DDINDSPSTSSVGHNNNGAIDVFAVNEVTLPVDNQEEHA