The Silkworm Genome Information Database

Gene

KWMTBOMO11755

Annotation

PREDICTED:_uncharacterized_protein_LOC106710892_[Papilio_machaon]

Location

Bomo_Chr19(+):13395674-13400792 View in EpiBrowser

Location in the cell

Nuclear Reliability : 4.02

CDS

ATGCTAGCCCTAAGCCCACTACCGTCACATTTGATAGAAAACAGTCAGAAGTACGAAATTAACAAAATTGAGACGGAAACTGACATAGATAAAGAACTTTGTGAAAATTTAAAGAAAATTCGTACCAGCCACATGAACGAGGAAGAAAAACGGGAAATTACTAAAATCTGCTATCAGTACCGTGACATATTCTACTCGGAAAACATTCCTTTATCGTTTACCCATACAGTAAAACACGAATTAAGACTAACCGACGACACCCCCATCTTTGTACGAAGTTATAGACAGGCTCCCCAACAACGAACAGAGATACAGAAACAGGTAGATAGTCTGTTAAAACAAGGAATCATTAGGGAAAGTATCTCCCCTTGGTCGTGCCCGGTACACATTGTTCCGAAAAAACCGGATGCATCAGGAAAAGTTAAATGGAGACTTGTTATTGACTATAGAAGACTTAATGACAGAATTATAGAAGACAAGTACCCCTTACCAAACATTAACGACATCCTTGACAGATTAGGGCGCGCACAATATTTCACGACCATAGATTTAGCAAGCGGCTACCATCAATTAGAAATGCACCCTAAAGACGTAGAGAAAACAGCGTTTACTACTGAAAGAGGCCACTATGAGTTCCTAAGAATGCCTTTCGGACTAAAAAATGCCCCGAGCACTTTCCAGCGTCTTATGGACCATATACTCCGAGGTATAGACAACGTATTTATGTACTTAGATTACGTCATAATAGCCGCGACGTCCCTACAAAACCACAATGAAAAACTGAAATTAGTATTTCAGCGATTCAAAATGCATAATCTGAAAGTTCAGTTAGACAAATCAGAATTTCTACAGAAGCACGTTAACTTTCTAGGACATGAATTGACTGACCAAGGACTAAATCCTAACAAGGACAAAATTAAAGCAGTATTAAATTTCCCTATACCACAAACGCAAAAAGACATAAAAGCTTTCTTAGGCCTAGTCGGGTACTATAGGAAGTTTATTAAGGACTTCGCGAAGTTGACGAAACCTTTAACAGCATGTCTAAAAAAGAACGCAAAGGTTGAACATACAAACGAATTTTTAGACGCAGTTGATAAATGCAAACAAATTCTAACAAACGCCCCAATCCTGCAATACCCTGACTTCGACAAACCGTTTATTTTAACGACAGACGCATCTGACTTTGCTTTAGGAGCAGTACTTTCCCAAGGCAATGTGGGCTCAGATAAACCAGTAGCCTATGCCTCAAGGACATTATCAGATACTGAGATCCGTTACTCTACCATAGAGAAAGAACTGTTAGGGATAGTATGGGCAATTAAGTATTTTAGACCTTACTTATATGGCCGTAAATTTACAATTTATACGGACCATAGACCCCTTACATGGTTAATGAGTCTAAAGGACCCTAACTCTAAATTAACACGATGGAAACTAAAGTTAGCAGAGTATGATTACAAAGTTGTTTATAAAAAGGGCAAACAAAACACTAACGCAGATGCACTATCTCGAGCAAAAATTTTTCATAATAGTATAGATTCTCTAGCTGTTAATGTTGATGACAATAGTGACGACAACATAATAAATAGAATATTCGAAAACGCCCGTAGACAGGCAGAGGTAGAAACTGATGACCCGAATAACCAAGACAATGAACGTAACAATACTGACAATGACGACCAACCTTATAACAACAATGACGTAGAAATGACCAGTATCTATCCCTCTCAAATTGACGAAGAGACAGACACAAGGAGTGCAACAACAGTCGACCCCGATCAATTAGTTTCTACAAATCATACCCAACCTGATAATGAAAATAACGGTATCCCTATAATATCCGACGCTATTGATAGACAGTTGAAACAATTTTACGTTAGGTCCACACCAGGTTCTACATACAGAGTAGAGGACAGATCAACAAACTCTAGGACAGTTATTAAGGATGTTTTCATCCCAGTAAATAACACTGAATCAGAAATTATCAAATTTTTAAAGGAACACACAATAGCTGACCGTGTTTTTCATTGCTATTTTTACGACGAAAATCTATACTTAGCCTTTTCAAGAGTGTATACTACGATATTTAATGACAGAGGACCTAAATTAATAAGATGTACTTCGCGGGTCACACTTGTTGAAAATAAAACTGAACAACAAGAACTCATTAAGCGATATCACGAAGGTAAATCATCGCATCGCGGTATCCAAGAGACCTTTAAGCATCTGCATAGGAATTATCACTGGCCTAATATGTTATTGACAGTTCAAAGGTTCATTAATCAATGCGACCTTTGCCTAAAGGCCAAATATGAAAGAAATCCTTTAAAACCTCCATTGATTATAACAGAGACACCTACGAAGCCATTTCAACACTTGTTCATGGATCTCTATAGTACTGGAGGTGCAACATTTTTAACAATTATCGACAATTTCTCTAAATTTGCCCAGGCGGTGCCTCTGAATGCTTCTAGTAGTGTTCACATCGCAGAAGCTCTATTACAAGTATTTTCTGTACTAGGACTACCTCTTAAAATCACCACAGACTCAGATACAAAGTTCGATAATGACGTCATAAAAGAGATATGTGCTTCGCATGATATCCACATTCACTTCACGACGCCTTACAACCCAAACTCTAACTCACCCATTGAACGATTTCATTCAACCATCGCAGAAATAATAAGAATTCAAAGAATGACAAATAAAGACGACCCCATACAATTGATCATGAAATACGCTATAATCGCCTATAACAACGCTATTCATTCTACTACAGGCTATACACCACGTGAGCTTTTATTCGGTCATACGGCATCCCGAAATCCATTAGAGCTATATTATCCTAAAGAATTTTATCAAGATTATGTCCTCAATCACCGCAAGAATGCAGAAGCAGTACAGGAATGTATAGCAGCCCACGTGTCTAAGAACAAAGAGCAGGTAATAGAAAAGAGAAACCAGGCAGCGCAAACAATCACGTTTAAGGTAGGTGAAACCGTTTACAAACAGGTCGCCAAAACCACCAGGAGCGACAAGACAAAACCAGTATTTAAAGATAAACAAAACCTCACCATTATTCCTAAATCCAAATACCTAGCACTGGGAACCAACGAGTACTCATACCTGGAGGAAGATTGCAAAAAGATCACACAAGACGTCCAACTCTGCACATCGCTGAACACCCAACCTGTGGAGAACTCTGAAGACTGCATAGTAACTCTTATAAAACACGAGAGCACAAACTGCACCCGTGCCAGGATGAACCTGAAACAAGGCAAGATCCAGAGACTAGAAGACAACAAATGGCTTATCATCTTGAAAGACGAACAAATCCTGAAATCTCGCTGCGGAAGGAAATCTGACTATAAAAAGATGTCAGGAATATACATCGCCAGCATTACAAGCGATTGTCAAGTGGAAATATTCAACCGAACACTGAAGACAAACACGGACACTATTACAGCTGATGAAATCGTACCCATTCCCAGCGAAACCACTATTCTAGAAGGGAATATTCGCTATAACCTACAACTGAAAGATATATCTCTGGATAGCATCCACGAACTGATGGACCGGGTTGAAAACATTCAACAACCTGTCATCGACTGGCAGACTATGATGACTACCCCAAGTTGGTCAACACTGGGACTCTACCTCATTCTGATAGCAATAATCATCTGGAAGCTGTGGCAGTGGAGACAGCGACGACTACAATCAAAGAACGAGAGCCCCGAGAACACTAGCATCGAGGACGCTGCTGGAAGCTGCGGGACGCGCTTCTATCTTAAGGAGGGAGGAGTTAGGCAATCGCCCGATGCCCGTATTTGCTGA

Protein

MLALSPLPSHLIENSQKYEINKIETETDIDKELCENLKKIRTSHMNEEEKREITKICYQYRDIFYSENIPLSFTHTVKHELRLTDDTPIFVRSYRQAPQQRTEIQKQVDSLLKQGIIRESISPWSCPVHIVPKKPDASGKVKWRLVIDYRRLNDRIIEDKYPLPNINDILDRLGRAQYFTTIDLASGYHQLEMHPKDVEKTAFTTERGHYEFLRMPFGLKNAPSTFQRLMDHILRGIDNVFMYLDYVIIAATSLQNHNEKLKLVFQRFKMHNLKVQLDKSEFLQKHVNFLGHELTDQGLNPNKDKIKAVLNFPIPQTQKDIKAFLGLVGYYRKFIKDFAKLTKPLTACLKKNAKVEHTNEFLDAVDKCKQILTNAPILQYPDFDKPFILTTDASDFALGAVLSQGNVGSDKPVAYASRTLSDTEIRYSTIEKELLGIVWAIKYFRPYLYGRKFTIYTDHRPLTWLMSLKDPNSKLTRWKLKLAEYDYKVVYKKGKQNTNADALSRAKIFHNSIDSLAVNVDDNSDDNIINRIFENARRQAEVETDDPNNQDNERNNTDNDDQPYNNNDVEMTSIYPSQIDEETDTRSATTVDPDQLVSTNHTQPDNENNGIPIISDAIDRQLKQFYVRSTPGSTYRVEDRSTNSRTVIKDVFIPVNNTESEIIKFLKEHTIADRVFHCYFYDENLYLAFSRVYTTIFNDRGPKLIRCTSRVTLVENKTEQQELIKRYHEGKSSHRGIQETFKHLHRNYHWPNMLLTVQRFINQCDLCLKAKYERNPLKPPLIITETPTKPFQHLFMDLYSTGGATFLTIIDNFSKFAQAVPLNASSSVHIAEALLQVFSVLGLPLKITTDSDTKFDNDVIKEICASHDIHIHFTTPYNPNSNSPIERFHSTIAEIIRIQRMTNKDDPIQLIMKYAIIAYNNAIHSTTGYTPRELLFGHTASRNPLELYYPKEFYQDYVLNHRKNAEAVQECIAAHVSKNKEQVIEKRNQAAQTITFKVGETVYKQVAKTTRSDKTKPVFKDKQNLTIIPKSKYLALGTNEYSYLEEDCKKITQDVQLCTSLNTQPVENSEDCIVTLIKHESTNCTRARMNLKQGKIQRLEDNKWLIILKDEQILKSRCGRKSDYKKMSGIYIASITSDCQVEIFNRTLKTNTDTITADEIVPIPSETTILEGNIRYNLQLKDISLDSIHELMDRVENIQQPVIDWQTMMTTPSWSTLGLYLILIAIIIWKLWQWRQRRLQSKNESPENTSIEDAAGSCGTRFYLKEGGVRQSPDARIC

Uniprot

A0A1B6DI21 A0A146KMA2 A0A0A9YJ44 A0A0K8S7R8 Q65353 A0A224XIQ6 + More
A0A023EZI9 A0A023F0Y8 A0A224XAI1 A0A023F0X4 U5ES61 A0A0A9Y0U3 U5EU37 Q9NHF7 A0A0K8TRT3

Pubmed

26823975 25401762 1692964 25474469 26369729

EMBL

GEDC01017847 GEDC01011974 JAS19451.1 JAS25324.1 GDHC01021754 JAP96874.1 + More
GBHO01012506 JAG31098.1 GBRD01016627 JAG49199.1 M32662 AAA92249.1 GFTR01008505 JAW07921.1 GBBI01004049 JAC14663.1 GBBI01004048 JAC14664.1 GFTR01008492 JAW07934.1 GBBI01004051 JAC14661.1 GANO01002504 JAB57367.1 GBHO01018861 JAG24743.1 GANO01002503 JAB57368.1 AF222049 AAF36671.1 GDAI01000737 JAI16866.1

PRIDE

Q9NHF7

Pfam

PF00078   RVT_1        + More
PF17917   RT_RNaseH
PF00665   rve
PF17921   Integrase_H2C2
PF17919   RT_RNaseH_2
PF02902   Peptidase_C48

Interpro

IPR041588   Integrase_H2C2        + More
IPR036397   RNaseH_sf
IPR041373   RT_RNaseH
IPR000477   RT_dom
IPR021109   Peptidase_aspartic_dom_sf
IPR012337   RNaseH-like_sf
IPR001584   Integrase_cat-core
IPR041577   RT_RNaseH_2
IPR038765   Papain-like_cys_pep_sf
IPR003653   Peptidase_C48_C
IPR001969   Aspartic_peptidase_AS

SUPFAM

SSF53098   SSF53098        + More
SSF54001   SSF54001
SSF50630   SSF50630

Gene 3D

2.40.70.10 3.30.420.10

ProteinModelPortal

A0A1B6DI21 A0A146KMA2 A0A0A9YJ44 A0A0K8S7R8 Q65353 A0A224XIQ6 + More
A0A023EZI9 A0A023F0Y8 A0A224XAI1 A0A023F0X4 U5ES61 A0A0A9Y0U3 U5EU37 Q9NHF7 A0A0K8TRT3

PDB

4OL8 E-value=4.59604e-76, Score=729

KEGG

NA

GO

GO:0003676 GO:0015074 GO:0008234 GO:0004190

Length:

1278

Number of predicted TMHs:

1

Exp number of AAs in TMHs:

21.18375

Exp number, first 60 AAs:

0

Total prob of N-in:

0.00012

outside

1 - 1209

TMhelix

1210 - 1232

inside

1233 - 1278

Pi

0

Theta

0

Tajima's D

0

CLR

20.785858

CSRT

0

Interpretation

Uncertain

Sequence

Summary

Ontologies

Topology

Population Genetic Test Statistics

Multiple alignment of Orthologues

Gene Tree