Gene Information

Name : SG1031 (SG1031)
Accession : YP_002226090.1
Strain : Salmonella enterica 287/91
Genome accession: NC_011274
Putative virulence/resistance : Unknown
Product : hypothetical protein
Function : -
COG functional category : S : Function unknown
COG ID : COG3523
EC number : -
Position : 1116332 - 1119853 bp
Length : 3522 bp
Strand : -
Note : Note the limited similarity to the Legionella pneumophila icmF protein

DNA sequence :

GTGTTCAGATTACCGACCCCCCGATTATTCAGCACACTGAGATCGGCACTCAGACCGGCAATGCCCCGGTTTAAGGTTTC
TGCCGCCTGGCTGCTGGCGCTGGCGTGGATTTTGCTGCTGGTATGGATCTGGTGGAAAGGTCCGTCATGGACGCTCTACG
AGCAGCGCTGGCTGGCCCCGCTGGCGAACCGCTGGCTGGCCACCGCCGCCTGGGGGTTGATTGCGCTGACGTGGCTGACC
GTCCGGGTCATGAAGCGCCTGCAACTGCTGGAAAAACAGCAGCGCCAGCAACGGGACGAGGCGCAGGATCCGCTCAGCGT
GGAACTGAACACCCAGCAACGCTATCTCGATCACTGGTTACGGCGTCTGCAACGCCATCTCGACAGCCGCCGCTCTCTGT
GGCAGCTACCGTGGTATATGGTCACTGGCCCGGCGGGAAGCGGTAAAACCACGCTGCTGCGCGAAGGGTATCCGTCCGAC
ATTATTTATGCCCCGGAGGCGCTGCGGGGCGTGGAGCAGCGCCGGTATGTTATCCCGCATGTGGGAAAACAGGCGGTGAT
TTTTGACGCTGACGGCCTCCTCTTTGAGCAACAGGATGCGGATATACTGCATCGCCGCCTGTGGACCCATATGCTGGACT
GGCTGGCGCAAAAACGCGCCCGGCAGCCGCTGAACGGCCTGATACTGACGCTGGATCTGCCCGATCTTCTGACCGCCGAC
AAGCCACGCCGTGAGCACCTGTTGCAGATCCTGCGCGGACGTTTGCAGGATATACGCCAGCATCTTCACTGCCAGCTCCC
CGTCTATGTGGTGCTGACCCGGCTGGATCTACTGCACGGTTTCGCCGCCCTGTTTCAGTCACTGGACCGCAACGATCGCG
ACGCCATTCTTGGCGTCACCTTTACCCGTCATGCCCATGAAAATGACGACTGGCGTACAGAACTGAATGCCTTCTGGCAG
ACATGGGGCGAACAGTTGAATAACGTCCTGCCGGAGCGGATGTTAGCCCCCGGCTCCCGCAGTTCCCTGTTCAGCTTTGT
CCGCCAGATCCAAGGGGGCCGCGAGCCGCTGATCGCCCTGCTGAACGGGCTGCTGGACGGGGAAAATATGGATGTGATGC
TGCGCGGCGTGTACCTCACCTCCTCCCTGCAACGCGGCCAGATAGACGATATTTTTATGCAGTCCGCCGCCCGTCAGTTC
CGGCTGGGCAGCAGTCCGCTGACCGCCTGGCCGCTGGTGGACACGTTACCGTATTTCACCCGTAATCTGTTTCCGCAGAC
CTTACTGGCTGAGCCGAACCTCGCCAGTGAAAGCCGCGTCTGGCTGATGCAGTCCCGCCGCCGGTTGTCCGTGTTTTCCG
CCACTGGCGGCATCGCCGCCCTGCTGCTGATTATCGGCTGGCATCACTATTACAATAACAACTGGCGTTCCGGCATCACC
GTACTGGAGCAGGCCAAAGCTTTTATGTCGGTTCCGCCACCGCAGGGTATGGACGATTATGGCAACCTGCAACTACCGTT
ACTTAACCCGGTGCGTGACGCCACGCTGGCCTACGGCGACTGGGGCGATCGCAGTCGTCTGGCCGATATGGGATTATATC
AGGGCAGGCGTGTCGGCCCATATGTGGAGCAGACCTACCTGCAACTGCTGGAGCAGCGTTACCTGCCCGCCCTGTTTAAC
GGCCTGGTCAAAGAGATGAATGCCGCGCCTGCGGAGAGCGAGGAGAAGCTCGCGGTATTGCGCGTTATCAGAATGCTGGA
AGATAAAAGCGGACGCAGCGACGAGGTGGTGAAGCAGTATATGGCGAAACGCTGGAGCGATAAATTTCACGGCCAGCGCG
ATATTCAGGCACAGCTAATGTCTCATCTGGACTACGCGCTGAAACACACCGACTGGCACGCGGAGCGTCAGGCAGGCGAC
GGCGACGCCATCAGCCGCTGGACGCCGTATGACAATCCGGTCGTGGCGGCGCAGAAAGAGCTCAGCAAACTGCCCGTCTA
CCAGCGCGTTTACCAGAGTCTGAAAACGCGGGCGATGGGCGTGCTGCCCGCTGATCTGAACCTGCGTGACCAGGTGGGCG
CCACGTTTGATCAGGTCTTTACCTCCGGGGATGATAATAAGCTCATTGTTCCGCAGTTCCTCACCCGTTACGGTCTGCAA
AGTTATTTTGTCAAACAGCGCGACGCGCTGATCGAACTGACGGCGATGGATTCCTGGGTGCTGAACCTGACCCGCAGCGT
GAAATACAGCGACGCCGACCGGGCGGAAATCCAGCGCCAGCTCACTGAACAGTATCTCAGCGACTACACCGCCACCTGGA
GCGCCGGAATGGACAACCTTAACGTGCGCAATTACGAATCCATTGCGCAACTGACCGGGGCGCTGGAGCAGATCATCAGC
GGCGATCAGCCGCTCCAGCGGGCGCTGACGGCACTGCGCGACAACACGCAGCCTGCCGTTCTCTCTGAAAAACTGGATGA
CAAGGCGCTTCAGGAGGCGATGGCGGAGCCGGATTACCAGTTGCTGACCCGCCTGGGGCATGAATTTGCCCCGGAAAACA
GCACGCTGGCGGTACAGAAAGACAAAGAAAACACTCTCCAGGCGGTCTATCAGCAACTGACGGAGCTGCACCGTTACCTG
CTGGCTATTCAGAACGCGCCGGTGCCGGGAAAATCAGCGCTGAAAGCGGTGCAGCTACGGCTGGATCAGAACAGCAGCGA
TCCTATTTTCGCCACCCGCCAGATGGCGAAAACCCTGCCTGCCCCGCTCAACCGCTGGGTGGGCAAGCTGGCGGATCAGG
CCTGGCATGTGGTGATGGTGGAGGCAGTTCACTATATGGAAGTGGACTGGCGCGACAACGTGGTCAAACCCTTTAATGAA
CAACTTGCCGACAATTATCCGTTTAACCCACGCTCACAGTCAGATGCGTCGCTGGATGCGTTTGAACGCTTCTTTAAACC
GAATGGCGTACTGGATACCTTTTATCAGCAGAACCTGCGTCTGTTTATGGAAAACGATCTGAGTCTGGAGGACGGGGATA
ACAACGTGATTATTCGTGAGGATGTCCGGGAGCAACTGGATACCGCACAGGAAATCCGCGAGGCGTTTTTCAGCAGACAG
AACGGCCTGGGCGCGCAGTTTGCCGTGGAAACTGTGTCGCTTTCCGGCAACAAACGGCGCAGCGTGCTGAATCTGGACGG
GCAGTTAGTGGACTACAGCCAGGGCCGCAATTACACCGCCCATCTGGTCTGGCCGAACAACATGCGTGAAGGCAATGAAA
GTAAGCTGACGCTGATAGGCGTCAGTGGCGGCGCGCCGCGCAGCATCAGTTTCAGCGGGCCGTGGGCGCAGTTCAGGCTG
TTCGGCGCCGGGCAACTTACCGGCGTTCAGGAGGGGACATTCAGCGTGCGCTTTAACGTGGACGGCGGAGCGATGGTGTA
CCGGGTACATACCGATACGGAAGATAACCCCTTCACCGGCGGGCTGTTCAGTCAGTTCCGGCTGCCGGATACCCTGTACT
GA

Protein sequence :

MFRLPTPRLFSTLRSALRPAMPRFKVSAAWLLALAWILLLVWIWWKGPSWTLYEQRWLAPLANRWLATAAWGLIALTWLT
VRVMKRLQLLEKQQRQQRDEAQDPLSVELNTQQRYLDHWLRRLQRHLDSRRSLWQLPWYMVTGPAGSGKTTLLREGYPSD
IIYAPEALRGVEQRRYVIPHVGKQAVIFDADGLLFEQQDADILHRRLWTHMLDWLAQKRARQPLNGLILTLDLPDLLTAD
KPRREHLLQILRGRLQDIRQHLHCQLPVYVVLTRLDLLHGFAALFQSLDRNDRDAILGVTFTRHAHENDDWRTELNAFWQ
TWGEQLNNVLPERMLAPGSRSSLFSFVRQIQGGREPLIALLNGLLDGENMDVMLRGVYLTSSLQRGQIDDIFMQSAARQF
RLGSSPLTAWPLVDTLPYFTRNLFPQTLLAEPNLASESRVWLMQSRRRLSVFSATGGIAALLLIIGWHHYYNNNWRSGIT
VLEQAKAFMSVPPPQGMDDYGNLQLPLLNPVRDATLAYGDWGDRSRLADMGLYQGRRVGPYVEQTYLQLLEQRYLPALFN
GLVKEMNAAPAESEEKLAVLRVIRMLEDKSGRSDEVVKQYMAKRWSDKFHGQRDIQAQLMSHLDYALKHTDWHAERQAGD
GDAISRWTPYDNPVVAAQKELSKLPVYQRVYQSLKTRAMGVLPADLNLRDQVGATFDQVFTSGDDNKLIVPQFLTRYGLQ
SYFVKQRDALIELTAMDSWVLNLTRSVKYSDADRAEIQRQLTEQYLSDYTATWSAGMDNLNVRNYESIAQLTGALEQIIS
GDQPLQRALTALRDNTQPAVLSEKLDDKALQEAMAEPDYQLLTRLGHEFAPENSTLAVQKDKENTLQAVYQQLTELHRYL
LAIQNAPVPGKSALKAVQLRLDQNSSDPIFATRQMAKTLPAPLNRWVGKLADQAWHVVMVEAVHYMEVDWRDNVVKPFNE
QLADNYPFNPRSQSDASLDAFERFFKPNGVLDTFYQQNLRLFMENDLSLEDGDNNVIIREDVREQLDTAQEIREAFFSRQ
NGLGAQFAVETVSLSGNKRRSVLNLDGQLVDYSQGRNYTAHLVWPNNMREGNESKLTLIGVSGGAPRSISFSGPWAQFRL
FGAGQLTGVQEGTFSVRFNVDGGAMVYRVHTDTEDNPFTGGLFSQFRLPDTLY

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
aec30	YP_851415.1	hypothetical protein	Not tested	PAI II APEC-O1	Protein	0.0	78
aec30	AAQ96724.1	Aec30	Not tested	AGI-1	Protein	0.0	78
pmt1	AAN64194.1	Pmt1	Not tested	macrophage toxin pathogenicity island	Protein	0.0	57