Gene Information

Name : c3694 (c3694)
Accession : NP_755569.1
Strain : Escherichia coli CFT073
Genome accession: NC_004431
Putative virulence/resistance : Unknown
Product : hypothetical protein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG1887
EC number : -
Position : 3522336 - 3526136 bp
Length : 3801 bp
Strand : -
Note : Residues 495 to 1078 of 1266 are 33.16 pct identical to residues 10 to 602 of 807 from GenPept.129 : >gb|AAK05019.1|AE006326_10 (AE006326) teichoic acid biosynthesis protein [Lactococcus lactis subsp. lactis]

DNA sequence :
ATGTTGTTAACTAAGTTAGCTAAAAAAATATGCCAATCCAAAGAATATATTAACGGAATTTCTCTATACAAAAAAAAAGA
ATGGGAGAAGGCATTATTGTTCTTTGAGAAATCAATCATAAAAAAAACAAAACATGCGGAGAGCTATTTTAAAGCAGGAA
TATGCAATCTTAAATTGCATAGATATGAAGAGGCATTTAAATATATAAGTAAAGCATTAGAATTGGAACCCTCAAATATA
CAGTGGAAAGAACAACTCGAACAGTGTGCAAGGCATCTTGATAAGTTAAATAATCATATGGTGAGCAAATCATCTACTGA
AGAAGATTTATTAAGGGAAAAACTTAATACAGACTTTAATAATCCAAAATTACACGATAGACTTGCTGAGGTTCTTCATA
AAAAAGGGCGTTGGTGGCAGGAAGTTGATACGCTGAAAAACGCAATAAAATTAGATCCTTCAATACCTGAACGTTATTTC
AAACTTGGCACCGCATTAGAAAAGATGGGGCGTTTTAATGAGGCTAGTATATATTATAAAAAAGGACTTGAATTTAATAA
AAAACATGATGCTATTTGGTATTATGCACTCGGATATTCGCTTGAATCTGATGAAACAAACAATGTAGAAAATGTCCGTA
GTTCTAAAATAGCATATGCGACAGCTATATCGTTAGACAAAAAATTAAATAGTAATAAATTTGGAATAGGAGCATTTCAT
CAATATAAGGGACGCTGGGCTAAGGCTATTGATGCGTATGAAAAACATACATCCATAAATCCATTATGTGCAGAGCTATA
TTATAGGCTCGGATTATCTTATGATAGATGTTATCAATGGGATAAAGCCGCAGAGAATTATCGCAAGGCATTATCACTCG
ATGAAAATCATCCTTATTGGCATTATAGGCTAGGGTTTGTTTTAGAGAGAAGTCAAAAGTATCTTGATGCTGCTGTTGCT
TATCAATTTGCAGCACAAAGCAATATCAAACATATCTCGATTTGGTACTATAGATCTGGGTACGCATATGCTAAGGCTAA
TAAATACAGGCAATCCTGTGAAATGTATATAAAAGCATATGACTCTTCTCAGGAAATTTATGCATCACAAATAAAAGTTA
TTGATAACAATGATACCCATTTAAACTCTTACAGAAAAAAACTTAAATATGAAAGCAGGATTAATACTTTAGAGTCAGCA
ATTTCTAATTCATGCATAAATTATGGATTATGGTATGAATTAGGTAAAACATATGAATCTTCATGTAATTGGAATGATGC
TGTCATTGCATATCATGAAGGTATTATGAGAAACAATACATATACCAAAGACTATTATTATAGAATCGGATATTCATTAT
TCCGCGATGGGAATTATCAACAGGCATGTAATTTTTTTCGTAAAATAGAGATTTTTGGAACACCGTATGGGGCTCCTGAT
GATATTCTAACAAAAAATTTAACTTTTAGGAGGAATGCTACATACACTGAATTTTATGAAACATTATCAATTGAAAAAAA
CACTATACTTTATGAAAGCTTTCATGGTGCAAGTATTTCTTGTAACCCATATGCATTATTTTTAGATATTATTGATGATC
AACGATTTGATAATTTCAGACATATTTGGGTTATCAATAATGAAAAAAAAATCCCTGAGCAGCTAAAAAATAAAAAAAAT
GTATATTTTGTTTCAAGGCAAAGTGATTTATACATGCAATGTTTGGCATCATGTGAATTTTTGATAAATAATGTTAGTTT
TCCTGAGTATTTTATAAGAAAGAAAGGGCAGCGATATTTAAATACTTGGCATGGAACTCCTATAAAATTTCTTGGAAAAG
ATATTAAAGATGAATTTTTAGCACATAAAAATGTGGCTAGAAATTTCCTTCACACAACACATTTACTTAGTCCTAATACA
CACACAACTAATATTTTATTAGATAGGTATGATATATCTAATATATTTAGTGGGGAAATTAAAGAGTTAGGTTATCCTCG
CATTGACCGGACTATTAATCTTAGCTCTGAACGGAAGGAATATATACGTAGGAAAATTAATGCGAACGTTTACGATAAAG
TAGTCTTGTATGCTCCAACTTGGAGAGGAATACATGGAAAGGCAACTTTAGATATAGAAAAACTAAAGAACGATCTTGAA
AAGTTGGCTGACCAGGATTGTCATATCGTTTTCCGTGGTCATCATATGATCGAAAAATTAGTAAGTGAGCAGAATATTTC
TGGTATAACAATTGTTCCTTCTGAGATTGACACGAATGAGTTACTAGGGGCGATTGATATTCTTATCACAGATTATTCAA
GTATTGCTTTCGATTTTTTTGTAATGAATAGACCAGTAATTTACTATGCGTATGATATTGAGCAATATAATAATGAGAGA
GGGTTGTATTTTCCTCTAAATGAATTACCTGGAACCGTTTGTTTTAATGATGTAGAGTTACTTAACACGTTAAGTGGATA
TCTTCGTAATGAAATATATTTCGATGCATCTAAAGGTATTGATAAGTTTTGTAAAAATGATGATGGAAGTGTATGTGGAA
AAGTAATTGAATGGTTCTTCTTTGAAGAAAAATCCATATTGCTTAATAAAAACAAAAATAAAAATATACTTTTTTATATT
GGTCCATTTATTCCAAATGGTATATTGTCATCATGGCTAAATCTTATATCGGTAATTGATCGTGATAAATATAATATTTC
TTTGGTTGTTGACCCAAAATCAATTCATGGTTTTCAAGAACGGTTCGAGCAGTTTAAGAGAGTCTCTCCAGATATTCAAG
TCATTGGAACTTGTGGAAACATGCTTTATAATATTGAAGAGAAATGGCTTAATGATAAATTAAATAATCAATTCACCCTG
GCAAGTAAGGAAATGTATGATATTCTTGATCATGCTTACCAACGAGAGTTTTTAAGGCTCTTTGGCTATAGTCATATTGA
TCATCTAATCCATTTTGAAGGTTATAATCAATCTTGGGTTATCCGGTTTGCTAATGCTCCGAAAGATACAGTTAGAAATA
AAATAATATTTCAACATAATGATAAGTTGAGCGAGTGGAGAGAAAGATTTCCATATCTTAGAGTTGTTTTTGATTTTTAT
AAATCTTACAATAAAATTGTTTCTGTTTCTGAAAAAACGATGGAGTTGAACAGAGATAACTTAAGCGAATTTTTTAATAT
TGAGCATGATAAGTTTATTTATTGTGATAATGTTCAGAATCCAGATGAGGTGATTAAAAAATCTGATGATATTGATACAA
GTGGATTTATTTTTGAAAATGATAAAATCTACTTTATAACTTTGGGCAGACTTTCAGTCGAAAAAGATCAACAAAAGTTG
ATTAATGCCTTTTGCAGATTACAAAAATTATATCCTAATATTGAGTTATTAATTCTTGGAGACGGCCCCCTCAAGATTGA
TTTACAACGCCAGATTATAACTTTAGGACTTGAAAAATCCGTACATCTTCTGGGACGCATATCAAATCCTTTTCCACTGC
TAAAGAGAGCTGACTGTTTTGTCCTCTCTTCAAATCATGAAGGGCAACCTATGGTTCTTTTCGAAGCAATGATTCTAGAT
AAACCTATAATATCAACTGACATTACTGGTTCTAGAAGTGCTCTTGAAGGGCGTTCTGGTGTATTAGTTGAAAATAGTGT
AGACGGTCTCTTCAACGGAATGCGGGACTTTATCTTGGGAAGGTTGGAGTTTAAACATTTTGACATTGAATCTTATCAAA
AAAATGCTTTGTCGATGTTTTATGAAAAATGCCTTCATTAA

Protein sequence :
MLLTKLAKKICQSKEYINGISLYKKKEWEKALLFFEKSIIKKTKHAESYFKAGICNLKLHRYEEAFKYISKALELEPSNI
QWKEQLEQCARHLDKLNNHMVSKSSTEEDLLREKLNTDFNNPKLHDRLAEVLHKKGRWWQEVDTLKNAIKLDPSIPERYF
KLGTALEKMGRFNEASIYYKKGLEFNKKHDAIWYYALGYSLESDETNNVENVRSSKIAYATAISLDKKLNSNKFGIGAFH
QYKGRWAKAIDAYEKHTSINPLCAELYYRLGLSYDRCYQWDKAAENYRKALSLDENHPYWHYRLGFVLERSQKYLDAAVA
YQFAAQSNIKHISIWYYRSGYAYAKANKYRQSCEMYIKAYDSSQEIYASQIKVIDNNDTHLNSYRKKLKYESRINTLESA
ISNSCINYGLWYELGKTYESSCNWNDAVIAYHEGIMRNNTYTKDYYYRIGYSLFRDGNYQQACNFFRKIEIFGTPYGAPD
DILTKNLTFRRNATYTEFYETLSIEKNTILYESFHGASISCNPYALFLDIIDDQRFDNFRHIWVINNEKKIPEQLKNKKN
VYFVSRQSDLYMQCLASCEFLINNVSFPEYFIRKKGQRYLNTWHGTPIKFLGKDIKDEFLAHKNVARNFLHTTHLLSPNT
HTTNILLDRYDISNIFSGEIKELGYPRIDRTINLSSERKEYIRRKINANVYDKVVLYAPTWRGIHGKATLDIEKLKNDLE
KLADQDCHIVFRGHHMIEKLVSEQNISGITIVPSEIDTNELLGAIDILITDYSSIAFDFFVMNRPVIYYAYDIEQYNNER
GLYFPLNELPGTVCFNDVELLNTLSGYLRNEIYFDASKGIDKFCKNDDGSVCGKVIEWFFFEEKSILLNKNKNKNILFYI
GPFIPNGILSSWLNLISVIDRDKYNISLVVDPKSIHGFQERFEQFKRVSPDIQVIGTCGNMLYNIEEKWLNDKLNNQFTL
ASKEMYDILDHAYQREFLRLFGYSHIDHLIHFEGYNQSWVIRFANAPKDTVRNKIIFQHNDKLSEWRERFPYLRVVFDFY
KSYNKIVSVSEKTMELNRDNLSEFFNIEHDKFIYCDNVQNPDEVIKKSDDIDTSGFIFENDKIYFITLGRLSVEKDQQKL
INAFCRLQKLYPNIELLILGDGPLKIDLQRQIITLGLEKSVHLLGRISNPFPLLKRADCFVLSSNHEGQPMVLFEAMILD
KPIISTDITGSRSALEGRSGVLVENSVDGLFNGMRDFILGRLEFKHFDIESYQKNALSMFYEKCLH