PAI Gene Information

Name : sigD
Accession : NP_455588.1
PAI name : SPI-5
PAI accession : NC_003198_P2
Strain : Salmonella enterica RSK2980
Virulence or Resistance: Virulence
Product : cell invasion protein
Function : -
Note : Salmonella dublin SopB TR:O34105 (EMBL:U90203) fasta scores: E(): 0, 97.0% id in 561 aa and to Salmonella typhimurium invasion protein SigD TR:O30916 (EMBL:AF021817) fasta scores: E(): 0, 97.7% id in 563 aa.
Homologs in the searched genomes : 48 hits ( 48 protein-level )
Publication :

Direct Submission

Submitted (25-OCT-2001) Submitted on behalf of the Salmonalla sequencing team, Sanger Centre, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SA, UK

Complete genome sequence of a multiple drug resistant Salmonella enterica serovar Typhi CT18

Nature 413 (6858), 848-852 (2001) PUBMED 11677608

Direct Submission

Submitted (10-SEP-2013) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

DNA sequence :
ATGCAAATACAGAGCTTCTATCACTCAGCTTCACTAAAAACCCAGGAGGCTTTTAAAAGCCTACAAAAAACCTTATACAA CGGAATGCAGATTCTCTCAGGCCAGGGCAAAGCGCCGGCTAAAGCGCCCGACGCTCGCCCGGAAATTATTGTCCTGCGAG AACCTGGCGCGACATGGGGGAATTATCTACAGCATCAGAAGACGTCTAACCACTCGCTGCATAACCTCTATAACTTACAG CGCGATCTTCTTACCGTCGCGGCAACCGTTCTGGGTAAACAAGACCCGGTTCTAACGTCAATGGCAAACCAAATGGAGTT AGCCAAAGTTAAAGCGGACCGGCCAGCAACAAAACAAGAAGAAGCTGCGGCAAAAGCATTGAAGAAAAATCTTATCGAAC TTATTGCAGCACGCACTCAGCAGCAAAATGGCTTACCTGCAAAAGAAGCTCATCGCTTTGCGGCAGTAGCGTTTAGAGAT GCTCAGGTCAAGCAGCTCAATAACCAGCCCTGGCAAACCATAAAAAATACACTCACGCATAACGGGCATCACTATACCAA CACGCAGCTCCCTGCCGCAGAGATGAAAATCGGCGCAAAAGATATCTTTCCCAGTGCTTATGAGGGAAAGGGCGTATGCA GTTGGGATACCAAGAATATTCATCACGCCAATAATTTGTGGATGTCCACGGTGAGTGTGCATGAGGACGGTAAAGATAAA ACGCTTTTTTGCGGGATACGTCATGGTGTGCTTTCCCCCTATCATGAAAAAGATCCGCTTCTGCGTCAGGCCGGCGCTGA AAACAAAGCCAAAGAAGTATTAGCTGCGGCACTTTTTAGTAAACCTGAGTTGCTTAACAGAGCCTTAGAGGGCGAAGCGG TAAGCCTGAAACTGGTATCCGTCGGGTTACTCACCGCGTCGAATATTTTCGGCAAAGAGGGAACTATGGTCGAGGATCAA ATGCGCGCATGGCAATCGTTGACCCAGCCGGGAAAAATGATTCATTTAAAAATCCGCAATAAAGATGGCGATCTACAGAC GGTAAAAATAAAACCGGACGTCGCCGCATTTAATGTGGGTGTTAATGAGCTGGCGCTCAAGCTCGGCTTTGGCCTTAAAG CATCAGATAGCTATAATGCCGAAGCGCTACATCAGTTATTAGGCAATGATTTACGCCCTGAAGCCAGACCAGGTGGCTGG GTTGGCGAATGGCTGGCGCAATACCCGGATAATTATGAGGTCGTCAATACATTAGCGCGCCAGATTAAGGATATCTGGAA AAATAACCAACATCATAAAGATGGCGGCGAACCCTATAAACTCGCACAACGCCTTGCCATGTTAGCCCATGAAATTGACG CGGTGCCCGCCTGGAATTGTAAAAGCGGCAAAGATCGTACAGGGATGATGGATTCAGAAATCAAGCGAGAGCTCATTTCT TTCCATCAGACCCATATGTTAAGTGCGCCTGGTAGTCTTCCGGATAGCGGTGGACAGAAAATTTTCCAAAAAGTATTACT GAATAGCGGTAACCTGGAGATTCAGAAACAAAATACGGGCGGGGCGGGAAACAAAGTAATGAAAAATTTATCGCCAGAGG TGCTCAATCTTTCCTATCAAAAACGAGTTGGGGATGAAAATATTTGGCAGTCAGTAAAAGGTATTTCTTCATTAATCACA TCTTGA
Protein sequence :
MQIQSFYHSASLKTQEAFKSLQKTLYNGMQILSGQGKAPAKAPDARPEIIVLREPGATWGNYLQHQKTSNHSLHNLYNLQ RDLLTVAATVLGKQDPVLTSMANQMELAKVKADRPATKQEEAAAKALKKNLIELIAARTQQQNGLPAKEAHRFAAVAFRD AQVKQLNNQPWQTIKNTLTHNGHHYTNTQLPAAEMKIGAKDIFPSAYEGKGVCSWDTKNIHHANNLWMSTVSVHEDGKDK TLFCGIRHGVLSPYHEKDPLLRQAGAENKAKEVLAAALFSKPELLNRALEGEAVSLKLVSVGLLTASNIFGKEGTMVEDQ MRAWQSLTQPGKMIHLKIRNKDGDLQTVKIKPDVAAFNVGVNELALKLGFGLKASDSYNAEALHQLLGNDLRPEARPGGW VGEWLAQYPDNYEVVNTLARQIKDIWKNNQHHKDGGEPYKLAQRLAMLAHEIDAVPAWNCKSGKDRTGMMDSEIKRELIS FHQTHMLSAPGSLPDSGGQKIFQKVLLNSGNLEIQKQNTGGAGNKVMKNLSPEVLNLSYQKRVGDENIWQSVKGISSLIT S