PAI Gene Information

Name : DIP0113 (DIP0113)
Accession : NP_938509.1
PAI name : Not named
PAI accession : NC_002935_P1
Strain : Corynebacterium diphtheriae 241
Virulence or Resistance: Not determined
Product : riboflavin biosynthesis protein
Function : -
Note : Similar to Streptomyces griseus deoxyribodipyrimidine photolyase Phr SW:PHR_STRGR (P12768) (455 aa) fasta scores: E(): 3.5e-36, 36.75% id in 468 aa, and to Escherichia coli deoxyribodipyrimidine photolyase PhrB or Phr or B0708 SW:PHR_ECOLI (P00914) (472 a
Homologs in the searched genomes : 179 hits ( 179 protein-level )
Publication :

Direct Submission

Submitted (03-OCT-2003) Cerdeno-Tarraga A.M., submitted on behalf of the Pathogen Sequencing Unit, Sanger Institute, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SA E-mail: amct@sanger.ac.uk

Direct Submission

Submitted (08-APR-2002) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

The complete genome sequence and analysis of Corynebacterium diphtheriae NCTC13129

Nucleic Acids Res. 31 (22), 6516-6523 (2003) PUBMED 14602910

DNA sequence :
ATGGCTCGCTCAGTGGTGGTGTGGTTCCGTGACGATTTACGCGTCCACGATAATCCAGCTCTTATGAAGGCATGGGAGCT TGTTCGTGCCAACCCTGCGGACTTGCATGCGGTCTACATTGCCAACGAGGTGGGGGTTCGCCCCCTTGGTGGGGCAGTCA AGTGGTGGCTGCACCACAGCCTGCTGGCATTGTCTGAGCAGCTGGCGCAGCGTGGTGTGCGTCTGCATGTGCTCTCCGGT GACCCACTCACGCTGTTGCCACAGCTAGTGACTTCCTGTGGTGCTACAGCGGTGACGATGAATCGTCGCTATGATCCCGC AGCACGCAGTATTGATGATGCATTCGTCGCTGATGCCAGTGCCCACGATGTGGAGGTCTACGACTTCCCTTGCCATCTGC TGGCAGAACCAGGGGAGATCACCACCACAACCGGTGGCAGCTACAAGGTGTTTACGCCCTTTTCCCGTAACCTTCGCGAC GCCATCGGTGACCTGCCCTTAGATACGCTTGCGGCACCACCCAAGGCCGAACAGCCCATAGACGACACGGAAACCCAGGC CGCGATTGCGGACTTAGGCTGGGACGCATGGTGGGCTGCGTCGATAAGCAAGGCGTGGACCCCAGGTGAACCCGCCGCCC GCGAAGCCCTCGCCGAGCTCGACGACATCCTCCCGCGCTACCTAGACGACCGCGACCGCCCTGACATCGACGGCACTTCT AGGCTAAGCCCGCGCCTGCGCTTCGGGGAACTCAGCGTCGCTGAGGTGTGGAACCATGCCCACACCTCGGAGGGGTTCCG CCGCCAACTCATGTGGCGAGATTTCGCCTGGCACCGCCTCGACGCGCACCCCGACATGGCGACCGCCAACATCCGCCCCG AATTTGACCACTTCCCTTGGGACGGCGGTGACTTCGAAGCCGAACTGAACGCTTGGCGTCATGGCCGCACCGGCATCGCG CTTGTCGACGCCGGCATGCGCGAACTATGGGCCACCGGAACCATGCACAACCGTGTGCGCATGGTCGCCGCATCCCTGCT GGTCAAAAACCTAGGAATCCACTGGCGGCACGGCGAGCAATGGTTCTGGGACACCCTCGTTGATGCCGACCCAGCGTCCA ACCCCTTCAACTGGCAATGGGTAGCCGGCAGTGGTGACGACGCCGCCCCCTACTTCCGCATCTTCAACCCCGATACCCAA GCGCGCCGCTTTGACCCCGACGGCACCTACCGCACGCGATGGCTGCCCATCATGAGCGCGGACTATCCCGAAGAGGCGAT CGTAGACCTTAAAGAATCCCGACTTCGGGCTCTCGACGCCTATAACGCTTGTAAACGCTGA
Protein sequence :
MARSVVVWFRDDLRVHDNPALMKAWELVRANPADLHAVYIANEVGVRPLGGAVKWWLHHSLLALSEQLAQRGVRLHVLSG DPLTLLPQLVTSCGATAVTMNRRYDPAARSIDDAFVADASAHDVEVYDFPCHLLAEPGEITTTTGGSYKVFTPFSRNLRD AIGDLPLDTLAAPPKAEQPIDDTETQAAIADLGWDAWWAASISKAWTPGEPAAREALAELDDILPRYLDDRDRPDIDGTS RLSPRLRFGELSVAEVWNHAHTSEGFRRQLMWRDFAWHRLDAHPDMATANIRPEFDHFPWDGGDFEAELNAWRHGRTGIA LVDAGMRELWATGTMHNRVRMVAASLLVKNLGIHWRHGEQWFWDTLVDADPASNPFNWQWVAGSGDDAAPYFRIFNPDTQ ARRFDPDGTYRTRWLPIMSADYPEEAIVDLKESRLRALDAYNACKR