PAI Gene Information

Name : unnamed
Accession : ACU09439.1
PAI name : LEE
PAI accession : GQ338312
Strain : Escherichia coli 042
Virulence or Resistance: Not determined
Product : IS66 family element transposase
Function : -
Note : orf14_71074; similar to the Escherichia coli O157:H7 str. Sakai hypothetical protein ECs4547 in NP_312574.1
Homologs in the searched genomes : 596 hits ( 585 protein-level, 11 DNA-level )
Publication :

Direct Submission

Submitted (29-JUN-2009) Public Health Agency of Canada, Laboratory for Foodborne Zoonoses, ADRI, Township RD 9-1, Lethbridge, Alberta T1K 3Z4, Canada

DNA sequence :
ATGAACGACATCTCTTCTGACGACATCTTCCTGCTGAAACAGCGCCTGGCCGAACAGGAAGCGCTGATCCACGCCCTGCA GGAAAAGCTGAGCAACCGGGAGCGCGAAATAGACCATCTGCAGGCGCAGCTGGATAAACTCCGCCGGATGAACTTCGGCA GTCGTTCCGAAAAAGTCTCCCGCCGTATCGCACAAATGGAAGCCGATCTGAACCGGCTTCAGAAAGAGAGCGATACGCTG ACTGGTAGGGTGTATGACCCGGCAGTACAGCGTCCGTTGCGTCAGACCCGCACCCGTAAGCCGTTCCCTGAATCACTACC CCGTGACGAAAAGCGACTGTTGCCTGCGGCGCCGTGCTGCCCGAACTGCGGCGGTTCACTGAGCTATCTGGGCGAGGATA CCGCCGAACAGCTGGAGTTGATGCGTAGCGCCTTCCGGGTTATCCGGACGGTACGGGAAAAACATGCCTGTACTCAGTGC GATGCCATCGTGCAGGCACCTGCACCTTCGCGGCCCATCGAGCGGGGTATCGCCGGACCGGGGCTGCTGGCCCGCGTGCT GACCTCGAAGTATGCAGAGCACACCCCGCTGTATCGCCAGTCAGAAATATACGGCCGGCAAGGTGTGGAGCTGAGGCGTT CACTGCTGTCGGGCTGGGTGGATGCATGCTGCCGGCTGCTGTCTCCGCTGGAAGAGGCGCTTCATGGCTATGTCATGACT GACGGCAAACTCCATGCCGATGATACCCCGGTCCAGGTACTGCTGCCGGGTAATAAGAAGACGAAGACCGGGCGATTGTG GGCGTATGTTCGTGATGACCGCAATGCAGGGTCAGCGTTGGCACCTGCAGTGTGGTTCGCTTACAGCCCGGACAGAAAAG GCATCCATCCGCAGACTCATCTTGCCTGCTTCAGCGGTGTGCTGCAAGCGGATGCGTACGCCGGGTTCAACGAGCTGTAT CGCAATGGTGGGATAACGGAAGCTGCCTGCTGGGCTCATGCCCGCCGAAAGATCCACGATGTGCACGTCCGCATCCCGTC AGCACTGACGGAAGAAGCCCTGGAGCAGATCGGTCAGTTGTACGCCATAGAGGCGGATATAAGGGGAATGCCGGCAGAGC AGCGGCTTGCTGAACGTCAGCGAAAAACGAAACCGTTGTTGAAATCCCTGGAAAGCTGGTTGCGTGAAAAGATGAAGACC CTGTCGCGACACTCAGAGTTGGCGAAGGCGTTCGCGTACGCACTTAACCAGTGGCCGGCACTGACGTACTATGCGAACGA TGGCTGGGTGGAAATCGACAACAACATCGCTGAAAATGCCCTGCGGGCGGTCAGTCTGGGTCGTAAAAACTTCCTGTTCT TCGGCTCTGATCATGGTGGTGAGCGGGGAGCGCCACTGTACAGCCTGATCGGGACGTGCAAACTGAATGACGTGGATCCA GAAAGCTACCTTCGCCATGTGCTTGGCGTCATAGCAGACTGGCCGGTCAACCGGGTCAGCGAACTGCTTCCGTGGCGCAT AGCACTGCCAGCTGAATAA
Protein sequence :
MNDISSDDIFLLKQRLAEQEALIHALQEKLSNREREIDHLQAQLDKLRRMNFGSRSEKVSRRIAQMEADLNRLQKESDTL TGRVYDPAVQRPLRQTRTRKPFPESLPRDEKRLLPAAPCCPNCGGSLSYLGEDTAEQLELMRSAFRVIRTVREKHACTQC DAIVQAPAPSRPIERGIAGPGLLARVLTSKYAEHTPLYRQSEIYGRQGVELRRSLLSGWVDACCRLLSPLEEALHGYVMT DGKLHADDTPVQVLLPGNKKTKTGRLWAYVRDDRNAGSALAPAVWFAYSPDRKGIHPQTHLACFSGVLQADAYAGFNELY RNGGITEAACWAHARRKIHDVHVRIPSALTEEALEQIGQLYAIEADIRGMPAEQRLAERQRKTKPLLKSLESWLREKMKT LSRHSELAKAFAYALNQWPALTYYANDGWVEIDNNIAENALRAVSLGRKNFLFFGSDHGGERGAPLYSLIGTCKLNDVDP ESYLRHVLGVIADWPVNRVSELLPWRIALPAE