The Silkworm Genome Information Database

Gene

KWMTBOMO12801

Pre Gene Modal

BGIBMGA010456

Annotation

hypothetical_protein_RR48_13816_[Papilio_machaon]

Location

Bomo_Chr21(-):15202762-15209725 View in EpiBrowser

Location in the cell

Nuclear Reliability : 3.367

CDS

ATGGATATTAAATCATTAAAGAAAACTAGATCTAGCCATAAGGCGAAGCTTACCATATTTAAAACATATATAGATTCACTTTTGCCTAGTAAAAGGGTCAATGAGGTACAAGCTTTTGAATTAAAGGCTCGCTTAGATAAAATTCTAGATTTATACAATGAGTTCGATTCAGTTCAGACTGATTTAGAAAGTCTTGTGGAAATTTCAGATGATGAACACAAGGAAAGAGAGATTTTCGAGAACAGCTACTTCGGCTGCGTGGCTTTTGCGCAGAAGATGCTCAGCGCTGCCTCTGCGGATCAGGATGCCGGGTCGGTGACGGGTTCTAATATTAACACTGGACCGTCTGGTAGGCCAAACATTAAATTACCTACTATAAATTTGCCGATCTTTTCTGGACGCTATCAGGAATGGCTAGAATATCACGACACTTACAAATCCCTTATACACGACAACACAACCATTCCCAAAATCCATAAGTTTCACTACTTACGAAATACATTAAAAGAGAGCGCTTCATATATTATTAAATCCCTAGAGTTCTCCGCTGAAAATTATGACATCGCATGGGATCTGTTATGCGATCGATATAATAACGATCGAATTTTGGTCAATAATCACATACAAGCAATATTTAACATACCAACAATAGTTCAAGAATCGTCCAAGGCTTTAAGAAGTACAATAGATTCAGTTAATCGAAATTTAAGAGCTTTAAAAACACTGAATCTACCTACAGAGCACTGGGACATTATCATAATACACATGGTGTCTGGTAAGTTAGACCCAGGCACACTACGTGACTGGGAAGAGAAACGCAATAATTTAACGAGATTACCTACGTTACAAGATTTTCACACATTTCTAAAAAATCGTGCTGACTTACTAGAGACAGTGGAAGAATCATCAACATATACAAAACAGCAACCATCACAACGCAGACACAGCGATATTACTCACAACCGTCCAAAGACGTTTGTAGTTAACCAAACACAAAAACAAGCGCTGTTTAGATGTCCTGTGTGCAAGAATAATCATGCAATTTACCAATGTATGAAATTCAAATCAATGCCGATTGAGATGCGTCTTGACCGAGTTAAACAATTAAATCTATGCACAAACTGTTTGCGTGCAGGTCATGATGAACAGCGCTGTAGGCTCAGTTCCTGTAAGCTGTGCACACAGCGCCACAACACTCTGTTACACAATAAAAACACTGTTCCGGAAGCTTCAACTTCATCAGCGGGCTGTGTAGTCTTGCCCACTGTGCAGGAACAGACTCAAAAGGAATCGAGTGGTGTCACACTCTCATCCACACATCACAGTCAGGTACTTCTATCCACTGCTATGGTCAATATACAAGGCTGTGATGGTCAAACACATAAAGTTCGTGTACTACTCGACAATGGAAGTACATCTAGTTTTGTCACAGAAACTTTACGAGCGAAATTAGGAATACGCAGTTATTCTACTTCACTACTAGTACAAGGGTTGAACAATCAGTCCTCAAAAATTACAAAAAGATGTGACGTCACCATATCGTCACTCACAAGCAGTGGTTATACAACTGACGTCAATTGTTTTGTTGTACCACATATCACTCAGTTGATACCTACTTCACAAATTAATTGCAATTTCTTTTTCATTCCCTCTCGCATCCACCTCGCGGATCCAACCTTCTCCACGCCGTCTGAGGTGCAGATGTTGCTGGGGGCGGACATCTTTTGGGATGTCCTTCAAAACAATCATATTGTCCTGGGAAAGAACAAGCCAACTCTGATTGAAACAACATTAGGGTGGCTTGTCACCGGCTCTATACGATCAAACACAAAATTTAACACCAACAATACAGTCCATTGCCATTTTCTAAACAACAATGAGCTTGATGAGAAGTTAGACAAATTTTTCGAACTAGAATCAGTTCCCTCTGCTCAACAAATCCATACTAAAGGTGAGAGTGAGTGTGAACAAATATTTACACAAACAACAAAGCGCCACCCAGATGGCAAATTTATTGTTACCATTCCATTAAAAGGATCACCTGAATCTTTAGGGGATTCCAAACAACAAGCTCTAATTAGGTTTCAATCTTTGGAACGTAAATTTAAACGCAACGCAGAGTTCAAAGAAAAATACACAAATTTTCTTGAAGAATATTTGGCTTTAGGTCACATGTCAGAAAATGAAACAATACAAAACGACTGCATTTCATACTTCATGCCTCATCATGGCGTTTTGCGGGAAAACAGCCTCACTACAAAATTACGTACAGTCTTTGATTGTTCAGCTGTAACAAGCACGGGTTTATCATTCAATGATATTCAACATATTGGGCCCACTGTACAAGATGATTTACTTAGCATATTGATTCGATTTAGACAGCATAAGTTTGTAGTAACGTCAGATATAGAAAAAATGTATAGACAAATTTATGTTAACAATAAACAACGATGTTTGCAACAAATATTTTGGCGATCACACCCCAGCCAGCCAATTAAACAATATAAATTAAACACAGTCACATATGGGACCGCATCAGCACCGTATTTAGCAACTAGATGTCTGGTACAGCTGGGACAAGAATGCACCAATGAGGATGTTCGGGAAGCAATTTTACACGATTTTTATGTAGATGATTATATATCTGGGCATGATGATGAAAAAACTTTAATACAAATATGTAAAGGCGTCATTCAGACGTTAGAAGGCGCACGTTTTCATTTACGTAAATGGCTGTCCAATCAACCGTCTATCCTGGATGATATTGTTAGCGAAAATAATACAGACGAGTTATTAAACTTAAACAAACATGATTATACAAAAACATTAGGTTTACTCTGGGCCTGTAAAAAGGACACATTATTATTTGCAGTAAATAAAATATCAAATCAGCCTAACACAAATAAACGTACAATTTTATCCACAATTGCTCAAGTGTTTGATCCACTTGGTTTAATTAATCCTTGCATGTTACAGGCAAAACTCATATTACAAACACTATGGGCTAAGAATATCACATGGGATGACCAGCTACCTGCTGATGTTGAGTCACAATGGCACGACTTTATTAAATACTTACCAGAAATTACAAAAATAGAAATCCCTCGTAGAGTGTTATGCAATTCGTATGTTAAGGTCGAATTGCACGCGTTTTCTGATGCCTCCATTAAGGCCTATTCAGCTTGTATATATCTACGCTCAGTGTCTGAAACTGGGAATGTACAAGTACATTTGATACTTGCAAAGGGCAGAGTGGCACCATTGAAGCAAAGGCTGACTATGCCAAGGTTGGAGCTTTGCGGCGCCCTTCTCGCTACAAGGTTAACAAAAAAGGTAGTAAATTCATTACGTTTAAACATTGACTCAACATTTTTTTGGTGTGACTCAACTATTGTGCTGGGCTGGATCAAAACATGCAAGTTAAAACTAAAACAATTAAAAGGATCACCTGAATCTTTAGGGGATTCCAAACAACAAGCTCTAATTAGGTTTCAATCTTTGGAACGTAAATTTAAACGCAACGCAGAGTTCAAAGAAAAATACACAAATTTTCTTGAAGAATATTTGGCTTTAGGTCACATGTCAGAAAATGAAACAATACAAAACGACTGCATTTCATACTTCATGCCTCATCATGGCGTTTTGCGGGAAAACAGCCTCACTACAAAATTACGTACAGTCTTTGATTGTTCAGCTGTAACAAGCACGGGTTTATCATTCAATGATATTCAACATATTGGGCCCACTGTACAAGATGATTTACTTAGCATATTGATTCGATTTAGACAGCATAAGTTTGTAGTAACGTCAGATATAGAAAAAATGTATAGACAAATTTATGTTAACAATAAACAACGATGTTTGCAACAAATATTTTGGCGATCACACCCCAGCCAGCCAATTAAACAATATAAATTAAACACAGTCACATATGGGACCGCATCAGCACCGTATTTAGCAACTAGATGTCTGGTACAGCTGGGACAAGAATGCACCAATGAGGATGTTCGGGAAGCAATTTTACACGATTTTTATGTAGATGATTATATATCTGGGCATGATGATGAAAAAACTTTAATACAAATATGTAAAGGCGTCATTCAGACGTTAGAAGGCGCACGTTTTCATTTACGTAAATGGCTGTCCAATCAACCGTCTATCCTGGATGATATTGTTAGCGAAAATAATACAGACGAGTTATTAAACTTAAACAAACATGATTACACAAAAACATTAGGTTTACTCTGGGCCTGTAAAAAGGACACATTATTATTTGCAGTAAATAAAATATCAAATCAGCCTAACACAAATAAACGTACAATTTTATCCACAATTGCTCAAGTGTTTGATCCACTTGGTTTAATTAATCCTTGCATGTTACAGGCAAAACTCATATTACAAACACTATGGGCTAAGAATATCACATGGGATGACCAGCTACCTGCTGATGTTGAGTCACAATGGCACGACTTTATTAAATACTTACCAGAAATTACAAAAATAGAAATCCCTCGTAGAGTGTTATGCAATTCGTATGTTAAGGTCGAATTGCACGCGTTTTCTGATGCCTCCATTAAGGCCTATTCAGCTTGTATATATCTACGCTCAGTGTCTGAAACTGGGAATGTACAAGTACATTTGATACTTGCAAAGGGCAGAGTGGCACCATTGAAGCAAAGGCTGACTATGCCAAGATTTGCAGGCAAAACTTATCAGCCTATCATGGGCAACCTACCTCTACAAAGATTGCAAGCAGACTACCCTTTCAGTAATACAGCTGTGGACTATGCTGGTCCCATCATGATGGCAAACAGAAAAGGTCGTGGCTGTCGGTTGAAGAAGGCATATATTGCCGTTTTTGTTTGCCTGGCAGTGAGAGCGATGCACATAGAACTCGTCACCGACTTAAGTTCTAAAGGTTTCATTGCAGCCTTAAATAGATTTATTGCCCGCAGAGGTAAGCCAGCTGTGATCTACTCCGACAACGGAACTAATTTCGTGGGTGCTTGCAACGAAATAGTTAGGTTTCTAAAAAATCAATCTAACGATATTATTTCATACGGTGCTGAAAACGAAATTAATTTCAAATTTAGTCCAGCCTACAGTCCACATTTTAACGGCGTAGCAGAAGGGTCAGTTAAATCAATTAAAAAACATTTAACTCATGTATTGTCAATGGCTCATTTGGATTATGAAGAGATGAACACTGTATTGGTTCAAATTGAGGCAATACTGAATTCTAGACCTCTCACTCCAATTTCATCTGATCCATCAGATTTAGTTCCTCTTACACCAGCGCATTTCTTGATTGGACGAACGCTCACTATGTTACCTGCTCCCCAGGTCGATGATACTCCAGTTCATATGCTTTCCAGATATAAAAGGATACAATTATTAAAAACACATTTTTGGAATCGATACTACAAGGAGTACGTTTCAGAATTGCAGATCCGAAACAAATGGCGCACAAATAGAGGACAACCACAGCCAGGAGAGATGGTTCTCATTAAAGATGATCGGCTGCCCCCCAATAGATGGCTGCTGGGACGTGTCACCACAGTTTACCCAGGCGCTGACGGCGTCAACCGGGTGGCAGACGTAAAAACTACTTCAGGAACCTTACGCAGAGCTTGGAATAGGCTCTGTCCATTACCAGTTATGTTGGACCAGAAAGATGCATCTGCTCCAAGAGGGCCAGTCTGTTAA

Protein

MDIKSLKKTRSSHKAKLTIFKTYIDSLLPSKRVNEVQAFELKARLDKILDLYNEFDSVQTDLESLVEISDDEHKEREIFENSYFGCVAFAQKMLSAASADQDAGSVTGSNINTGPSGRPNIKLPTINLPIFSGRYQEWLEYHDTYKSLIHDNTTIPKIHKFHYLRNTLKESASYIIKSLEFSAENYDIAWDLLCDRYNNDRILVNNHIQAIFNIPTIVQESSKALRSTIDSVNRNLRALKTLNLPTEHWDIIIIHMVSGKLDPGTLRDWEEKRNNLTRLPTLQDFHTFLKNRADLLETVEESSTYTKQQPSQRRHSDITHNRPKTFVVNQTQKQALFRCPVCKNNHAIYQCMKFKSMPIEMRLDRVKQLNLCTNCLRAGHDEQRCRLSSCKLCTQRHNTLLHNKNTVPEASTSSAGCVVLPTVQEQTQKESSGVTLSSTHHSQVLLSTAMVNIQGCDGQTHKVRVLLDNGSTSSFVTETLRAKLGIRSYSTSLLVQGLNNQSSKITKRCDVTISSLTSSGYTTDVNCFVVPHITQLIPTSQINCNFFFIPSRIHLADPTFSTPSEVQMLLGADIFWDVLQNNHIVLGKNKPTLIETTLGWLVTGSIRSNTKFNTNNTVHCHFLNNNELDEKLDKFFELESVPSAQQIHTKGESECEQIFTQTTKRHPDGKFIVTIPLKGSPESLGDSKQQALIRFQSLERKFKRNAEFKEKYTNFLEEYLALGHMSENETIQNDCISYFMPHHGVLRENSLTTKLRTVFDCSAVTSTGLSFNDIQHIGPTVQDDLLSILIRFRQHKFVVTSDIEKMYRQIYVNNKQRCLQQIFWRSHPSQPIKQYKLNTVTYGTASAPYLATRCLVQLGQECTNEDVREAILHDFYVDDYISGHDDEKTLIQICKGVIQTLEGARFHLRKWLSNQPSILDDIVSENNTDELLNLNKHDYTKTLGLLWACKKDTLLFAVNKISNQPNTNKRTILSTIAQVFDPLGLINPCMLQAKLILQTLWAKNITWDDQLPADVESQWHDFIKYLPEITKIEIPRRVLCNSYVKVELHAFSDASIKAYSACIYLRSVSETGNVQVHLILAKGRVAPLKQRLTMPRLELCGALLATRLTKKVVNSLRLNIDSTFFWCDSTIVLGWIKTCKLKLKQLKGSPESLGDSKQQALIRFQSLERKFKRNAEFKEKYTNFLEEYLALGHMSENETIQNDCISYFMPHHGVLRENSLTTKLRTVFDCSAVTSTGLSFNDIQHIGPTVQDDLLSILIRFRQHKFVVTSDIEKMYRQIYVNNKQRCLQQIFWRSHPSQPIKQYKLNTVTYGTASAPYLATRCLVQLGQECTNEDVREAILHDFYVDDYISGHDDEKTLIQICKGVIQTLEGARFHLRKWLSNQPSILDDIVSENNTDELLNLNKHDYTKTLGLLWACKKDTLLFAVNKISNQPNTNKRTILSTIAQVFDPLGLINPCMLQAKLILQTLWAKNITWDDQLPADVESQWHDFIKYLPEITKIEIPRRVLCNSYVKVELHAFSDASIKAYSACIYLRSVSETGNVQVHLILAKGRVAPLKQRLTMPRFAGKTYQPIMGNLPLQRLQADYPFSNTAVDYAGPIMMANRKGRGCRLKKAYIAVFVCLAVRAMHIELVTDLSSKGFIAALNRFIARRGKPAVIYSDNGTNFVGACNEIVRFLKNQSNDIISYGAENEINFKFSPAYSPHFNGVAEGSVKSIKKHLTHVLSMAHLDYEEMNTVLVQIEAILNSRPLTPISSDPSDLVPLTPAHFLIGRTLTMLPAPQVDDTPVHMLSRYKRIQLLKTHFWNRYYKEYVSELQIRNKWRTNRGQPQPGEMVLIKDDRLPPNRWLLGRVTTVYPGADGVNRVADVKTTSGTLRRAWNRLCPLPVMLDQKDASAPRGPVC

Uniprot

X1WSV3

EMBL

ABLF02028302 ABLF02041631

Proteomes

UP000007819

Pfam

PF17921   Integrase_H2C2        + More
PF05585   DUF1758
PF18701   DUF5641
PF05380   Peptidase_A17
PF03564   DUF1759

Interpro

IPR005312   DUF1759        + More
IPR001584   Integrase_cat-core
IPR012337   RNaseH-like_sf
IPR008737   Peptidase_asp_put
IPR040676   DUF5641
IPR041588   Integrase_H2C2
IPR036397   RNaseH_sf
IPR008042   Retrotrans_Pao

SUPFAM

SSF53098 SSF53098

Gene 3D

3.30.420.10

ProteinModelPortal

X1WSV3

KEGG

105841320 no KO assigned | (RefSeq) uncharacterized LOC105841320

GO

GO:0003676 GO:0015074 GO:0020037 GO:0009435 GO:0030170 GO:0030429 GO:0004003 GO:0005634 GO:0006289 GO:0016286

Length:

1901

Number of predicted TMHs:

0

Exp number of AAs in TMHs:

0.0212499999999999

Exp number, first 60 AAs:

0.00013

Total prob of N-in:

0.00029

outside

1 - 1901

Pi

14.545952

Theta

20.007023

Tajima's D

-1.154042

CLR

30.492103

CSRT

0.108144592770361

Interpretation

Uncertain

Sequence

Summary

Ontologies

Topology

Population Genetic Test Statistics

Multiple alignment of Orthologues

Gene Tree