The Silkworm Genome Information Database

Gene

KWMTBOMO04723 Validated by peptides from experiments

Pre Gene Modal

BGIBMGA009929

Annotation

PREDICTED:_arginine-glutamic_acid_dipeptide_repeats_protein_[Papilio_xuthus]

Location

Bomo_Chr8(-):13217845-13223629 View in EpiBrowser

Location in the cell

Nuclear Reliability : 3.942

CDS

ATGGCTCAAAATCAAGGAGAAGTTCCAGTAGGTACTCCGAGTCAACCCGTCAAAGATAAGGATATATATGCTTGCTTGCCGGAGATGCGAATTGATGGGCCGCTGGGACCCGACGATCCTTGTCCAGGTGGTGAAGATCTACGATGGCTGCCTGCACAGGCTACGGACAGGGACCTTGTAATGTACTTACGTGCCGCACGTTCAATGGCAGCGTTTGCGGGAATGTGTGATGGTGGCTCTCCTGATGACGGCTGCGTTGCCGCCAGTCGAGACGATACGACTATCAATGCTCTTGACGTGCTGCACGACTCTGGCTACGATCCTGGTCGAGCGTTACAAGCTCTCGTGAAATGTCCGGTACCCAAAGGTATTGAGAAAAAGTGGTCAGAAGACGAAACAAAACGTTTTGTTAAAGGGATACGGCAATTTGGCAAGAATTTTTTCAAAATTAGAAAAGACCTACTGCCTCATAAAGACACTGCAGAACTTGTTGAATTTTATTATCTCTGGAAAAAGACTCCGGGTGCTAGTAGTAATAGACCTCACAGAAGAAGAAGACAAGCATCATTAAGGAGAGTCCGTAATACAAGGAATTCACGCGCAGGTACTCCCAAGGAACAAACGCCTGAAGTTGTACCTGCTTTGCCAGAGACAAATGGTTCTAGACCGTCACCAAATCCAAAGGAAGCCGGAGAAATGAGTTCAGTCACTGAAGATGAAATTTCTGAAGATGATAGTGATTCACGAGATGCCGGTGATTTAGCCAAGAGTGAAAATGGTAGAATTGTAGAAAACCCTGATGACTCACCGAGCAGAATGAGAACAAGAAATAAATCTAAAGAACAAACTACACCGAACGGTAAGAAAGCTCCGGAGGAAAGTGATATTGAACAAAAAGCAAAACCTAAACCAAAAGCTATTGTTCAAAGCAATAATAACAATATTCCCGATAAAGTAATTTCTTCACCTGTAAGTAAAGAAGTTAAGAAAAAGGTGACAAATGGAAAAGTTGATGCATCTAAAGTGAAGAAACGACTGCCAGATGATACGAAACCGGATGGAATTATGGATGGAGATGTACAAATGAAAAAGAAGAGAGCCGACCCTCCAGAAAGTCCTTCGGAGAGCCTAACTAATGATAGTTTCCCAGCCATGGATGAGACTGAAACTCAAGAACAAGAACCGGAAGCCTGTAACTTCAGTTTCAACAAAACAGATAAAGAAAGTGTAGAACAAAATAAAGAACCTGAATCTGAGCAACAACAGTCAAAACCAAATGAACATCTTGAAGTTCAAGTTAAAGTAGAAGCAAACAATGAACCACTCATTAAAACTGAAAAAGACCTTATAGCTCCTACATTCAAACTGGCTACTGATAAAGATCAAAAGAATGTTTTGGACTTAAAAACGGATACCAATGTGACTAAAAATCCTGAAAATGTGGACATGAGACCACTATCAATGCAGAATTCAGTATTCCCCAAAACAGAATTAATAATTCCTAAAGTGACACCAATGACAGTTGAAGCCATGGAAAAGATAAAAATCAAGGAAGAAATAGACCCTGAAGATCAAACTCTTAATCTACACAAGGATGAGTATCAGAAAGACCCGTTATCTCACAGTTACCCAGGACATCCTATGACTCAAGCCAATAAACCTCTAAATCTAGAAAATACTAACTTTTTTGTGAAAGATAGTCACATATACAATCCTAAACTTGGGCATGGTATTAAAATTGAAGGTGTCCCAAATATTTTCAACCCAATGAATATAACAAAAGAAAGTACAATAATCAGGAATTCAAAAGAGTATTCTGCAAGTATTCCTCCCTTTCCCTATTCATCAAATCTTAGTTTTGGCAGTGATCCTGGAAAACACAATCCTCATGGCATCAATCCATTGAAAACTGTCATAAAATTGGAACCAAGAGATGAAACAAGTGAATTAAAGAGTCAAAACGCCCCTGAAATTTTCACTGCTACAATATCAGCAGGAAATAAGGTTGATTCTCCAAACACACCAAGATTGGATTCCTTACAAAGGATTAGTCCTTCACCATCAAATGTACATGGTGCATCACCACCACCCATGGAACATCCTACTGCCATAGGAAATACTGAACCCATATCACCTGCAAACTCACAAGAAAAAGAATCAGATACCGATGATAAGCAACCAACAGACTTGAAAACTCAACATATATCAAAACCTGAAAATCAAAGAGACAGCTTGAGGCCACCAGCTTTTGCTCATCCAATAAGACCTGACAATTTGGGACTCAGAACAACTGAAGCTACCATTGTGTCTGTTGCCGGACAGAACATGCCTCCTCCACCTTTAAGTCAAGCTTCCATATCAGGATTATTGCACCCAGGTCCTTTGATAACTGTAGGTAGTGGTGCAAATGTTGGTCCGTATGGATTTATGGCAACGTCTCTCTATGGTCATCCAGGGCATCCTTCATTAGAAAAACCAGGTTCAATGCCACCTCTTATGCAACAAATTCCGCCTTCACATGGTCATCCTAGCAGTAATTCTATACAACAACAATCTAATCAAAATGATCCATCTATGCCACAAGATTTGAAAATTAAACAAGAAGTACCTGACAATATACCTGCCAATTTATCAACACACCCTTCAGATCCGTTGCAATCTCTGAAAGAAGTCAAAGTTCCAGGCTATCCTATAGGAAGTGCAATTGCTCAACATTTGAATACGGAACGAGATCGAGAATCTGTTTCTAGTGTTGAAAACAGTAGTCGACCACCAAGTCAACCGACAAATGAAAGTACAAATATGCCCAGTGGATTCCTCGGTCCTCGAATTGAAAGTATAAAAAAGGAACCGGAATTTTTACATCAACCCCACATTACTCCAGTATCTACCTCCCATGGACCACCTGATTCTATAAACACTATAACTCCAGTAAAAAGTCCACATACACCTACACCTATCAAGAGTCAACCAAGTCATAATGGTACACCTCATGGCTCTCATCGATCCACAACTTCACCATTTTCGAGACATCTGACAAGTCCATCACAACCAAGGCAAATATCTGCTTCTCCAGTTCAACCTCATACTCCAGTTTCTCATTCTGCCTTAAACTTGATGAATCCTACGCCTATTTCGATAGCAGCAACGATACCGGGACCTGTTATGCACTCTGGACAACCTGGTCACCCACCTCCACATCCGTTTGCGTCACCTCTGCATCACCCCCCTCACCCTTTGCTTCATCATCCCTCAATATTTCAACTATCTGCAGCAGCAGCGGCACACGCTATGCATCCTTACTATCCACATCCACACCCTGGATATTCAATGCCTTATCCTTATCCCTACGGACCTCTGCCACAACCCCACCCGATCCCTCCTATGCACCCTGCAGTCAGCACGGCTGGGCGTCACGATCCAGTAAAACCTTCAACAATAGAATCAACAACAATGCTTAGTTCTCATCACAGTACCAGTTCTTCAGTAACCACAAGATCTCTCCGGGAGATATCGGAAAGTAGTGAAGACCCGAGAAACCCGAATGCCACTACTGAAAGGCAGCTGCACGAAACGACAATGACCCATCATCATTCTACAAGCCACCACAGTGCAGTTCATACAAGTACAGAGAAGCAACCAAGTCACGCAGGAGGAGGCACTAATCATACGTTATCAATATCACATTCGACTTCGAGTAGCTCCTCGCAGTCAATACAACATAAAATTAACACTCAACAAAAATCTGCGGGACATTCAAGCTCACCTCACCATTTATCAGCAAGTGTTTCTCAGACCACTAGTTCATCATCAAGCGTGAATGTCACCAACAACCATACGCACCACCACTCCCACCATCTTGCGCATCATCCGGAAAGGCTATCTCCTGCGGACTCTATGCTGCTCCGACATCATCCTAAAATGCTACCCGGAAATCCAAGCCATCTCATGATTCCACCACCATCAATGGGACATCCAATGGGCTTGGGGCTTCCACCAGGGCCAGGTCCCAGTTCGATAGAAAGTTTACGATTACATGCCCAAGCTGCAGCAGGACTGCCTCCGACTCACCAGAGATCTGGATCACCTCATCAAATGCCACACGGTCATCCTCATCTAAGAGGTCCGCCGCGTCAGATTCCCGATGAAAACCCTGAACTCAAACTTGAGACACAATCACAACCGGAAGAAGAAGAAATTCCAAGTCCGGCTCACATTCCACACGGACCTAGCCCAGAGCCAAAAATAGAAGATACCGAATGTCACAGATCACAGTCTGCTATATTCCTCAGACATTGGAATCGCGGTGACTATAATTCTTGTGCGCGAACTGATCTTACATTCAAACCGGTACCTGAATCAAAACTTGCTCGAAAACGAGAGGAAAGATTGAGGAAACAAGCGGAACGTGATAGAGAAGAAAGGGAGAAGATAGCGCAGCAAGCACATAGAAAAATAGCGACGCCGGAGAAGCCGGACACGAAACCACCGTCACGCGGTGCCATAGAGACGATATCATCGCCATACGACCGTTTCCCTAGACCTCCAGGCTACCCCGACACGCCTGCGTTGCGTCAGTTATCTGAGTATGCCCGACCTCACGCCGGCTTTAGCCCGGGCAATCTGCCTCGTCACTGTATGGACCAGATGTTGCAGTATCAACTGAGCTCAATGTACGGCGCACCCGGGGCCCGTGAAAGATTAGAACTCGAACACCTCGAAAGAGAGAAACGTGATAGGGAAATTCGAGAATTACGCGAACGCGAGCTCAATGATCGGTTGAAGGAAGAACTACTCAAGAACAACGTAGGACCTCGAGCACTCGATCCTCACTGGCTCGAGATGCACCGGCGGTACGGAATGCCGCCACCACCGCCCCAGGGTGCAATCCCAGTGCAGTTCGGCCTATATCCTGGCGGACACGCACCCGGGGCGCTCTCTCAACTAGAACGCGAGCGACTCGAGCGCCTCGGCATCCCTCCGTCGGGTCCCGGTCCCACAGGACCCGGTGGCGGTCCACACCACGGCCATCACCCGCACCCCGTCGCCGCGGCTCAACTCGAAGCAGCCGAACGTCTCGCTCTAGCCGCTGACCCGATGGTGCGATTGCAGATGGCCGGGATAAATCCAGAGTATCACGCGCACACGCACGCGCACACTCATGCACACTCTCACACGCACTTGCATTTACATCCGGGACAACAAGCGGCGGCGGCACAGCAGGAAGCGCTCGGCCTTGGACCGTATCGGCCGCTACCTCACCCCGACCTGTTAGGCAGGCCGTATGCTGAGCAGTTAGCGCAGCAGGCGGCGGCACACGAGCAGTTGCAGCGTCAACTGTTACTAGACCGGGAGCGGGGCTTCCTTCACCCCGCGCACCACGAAGACTTCCTGCGGCAGCAGCGCGAGCGCGAGCTCAAGGTACGCGCTCTGGAGGAGGCGGCGCGGGCCTCTCGCCCTTAG

Protein

MAQNQGEVPVGTPSQPVKDKDIYACLPEMRIDGPLGPDDPCPGGEDLRWLPAQATDRDLVMYLRAARSMAAFAGMCDGGSPDDGCVAASRDDTTINALDVLHDSGYDPGRALQALVKCPVPKGIEKKWSEDETKRFVKGIRQFGKNFFKIRKDLLPHKDTAELVEFYYLWKKTPGASSNRPHRRRRQASLRRVRNTRNSRAGTPKEQTPEVVPALPETNGSRPSPNPKEAGEMSSVTEDEISEDDSDSRDAGDLAKSENGRIVENPDDSPSRMRTRNKSKEQTTPNGKKAPEESDIEQKAKPKPKAIVQSNNNNIPDKVISSPVSKEVKKKVTNGKVDASKVKKRLPDDTKPDGIMDGDVQMKKKRADPPESPSESLTNDSFPAMDETETQEQEPEACNFSFNKTDKESVEQNKEPESEQQQSKPNEHLEVQVKVEANNEPLIKTEKDLIAPTFKLATDKDQKNVLDLKTDTNVTKNPENVDMRPLSMQNSVFPKTELIIPKVTPMTVEAMEKIKIKEEIDPEDQTLNLHKDEYQKDPLSHSYPGHPMTQANKPLNLENTNFFVKDSHIYNPKLGHGIKIEGVPNIFNPMNITKESTIIRNSKEYSASIPPFPYSSNLSFGSDPGKHNPHGINPLKTVIKLEPRDETSELKSQNAPEIFTATISAGNKVDSPNTPRLDSLQRISPSPSNVHGASPPPMEHPTAIGNTEPISPANSQEKESDTDDKQPTDLKTQHISKPENQRDSLRPPAFAHPIRPDNLGLRTTEATIVSVAGQNMPPPPLSQASISGLLHPGPLITVGSGANVGPYGFMATSLYGHPGHPSLEKPGSMPPLMQQIPPSHGHPSSNSIQQQSNQNDPSMPQDLKIKQEVPDNIPANLSTHPSDPLQSLKEVKVPGYPIGSAIAQHLNTERDRESVSSVENSSRPPSQPTNESTNMPSGFLGPRIESIKKEPEFLHQPHITPVSTSHGPPDSINTITPVKSPHTPTPIKSQPSHNGTPHGSHRSTTSPFSRHLTSPSQPRQISASPVQPHTPVSHSALNLMNPTPISIAATIPGPVMHSGQPGHPPPHPFASPLHHPPHPLLHHPSIFQLSAAAAAHAMHPYYPHPHPGYSMPYPYPYGPLPQPHPIPPMHPAVSTAGRHDPVKPSTIESTTMLSSHHSTSSSVTTRSLREISESSEDPRNPNATTERQLHETTMTHHHSTSHHSAVHTSTEKQPSHAGGGTNHTLSISHSTSSSSSQSIQHKINTQQKSAGHSSSPHHLSASVSQTTSSSSSVNVTNNHTHHHSHHLAHHPERLSPADSMLLRHHPKMLPGNPSHLMIPPPSMGHPMGLGLPPGPGPSSIESLRLHAQAAAGLPPTHQRSGSPHQMPHGHPHLRGPPRQIPDENPELKLETQSQPEEEEIPSPAHIPHGPSPEPKIEDTECHRSQSAIFLRHWNRGDYNSCARTDLTFKPVPESKLARKREERLRKQAERDREEREKIAQQAHRKIATPEKPDTKPPSRGAIETISSPYDRFPRPPGYPDTPALRQLSEYARPHAGFSPGNLPRHCMDQMLQYQLSSMYGAPGARERLELEHLEREKRDREIRELRERELNDRLKEELLKNNVGPRALDPHWLEMHRRYGMPPPPPQGAIPVQFGLYPGGHAPGALSQLERERLERLGIPPSGPGPTGPGGGPHHGHHPHPVAAAQLEAAERLALAADPMVRLQMAGINPEYHAHTHAHTHAHSHTHLHLHPGQQAAAAQQEALGLGPYRPLPHPDLLGRPYAEQLAQQAAAHEQLQRQLLLDRERGFLHPAHHEDFLRQQRERELKVRALEEAARASRP

Uniprot

A0A0L7LIN2

Pubmed

26227816

EMBL

JTDY01001032 KOB75076.1

Proteomes

UP000037510

Pfam

PF03154 Atrophin-1

Interpro

IPR009057   Homeobox-like_sf        + More
IPR017884   SANT_dom
IPR002951   Atrophin-like
IPR001005   SANT/Myb
IPR000949   ELM2_dom

SUPFAM

SSF46689 SSF46689

ProteinModelPortal

A0A0L7LIN2

PDB

2YQK E-value=1.14099e-19, Score=244

KEGG

101736618 K05628 arginine-glutamic acid dipeptide repeats protein | (RefSeq) atrophin-1-like

GO

GO:0005634 GO:0003677 GO:0006355 GO:0006412 GO:0006511 GO:0016020 GO:0035023 GO:0005515 GO:0016742 GO:0003824

Subcellular location

Nucleus

Length:

1820

Number of predicted TMHs:

0

Exp number of AAs in TMHs:

0.00039

Exp number, first 60 AAs:

0

Total prob of N-in:

0.00001

outside

1 - 1820

Pi

200.223886

Theta

181.267931

Tajima's D

0.488828

CLR

0.326155

CSRT

0.512174391280436

Interpretation

Uncertain

Sequence

Summary

Ontologies

Topology

Population Genetic Test Statistics