The Silkworm Genome Information Database

Gene

KWMTBOMO03844

Annotation

PREDICTED:_uncharacterized_protein_LOC106710892_[Papilio_machaon]

Location

Bomo_Chr7(-):4018179-4023179 View in EpiBrowser

Location in the cell

Nuclear Reliability : 4.02

CDS

ATGCTAGCCCTAAGCCCACTACCGTCACATTTGATAGAAAACAGTCAGAAGTACGAAATTAACAAAATTGAGACGGAAACTGACATAGATAAAGAACTTTGTGAAAATTTAAAGAAAATTCGTACCAGCCACATGAACGAGGAAGAAAAACGGGAAATTACTAAAATCTGCTATCAGTACCGTGACATATTCTACTCGGAAAACATTCCTTTATCGTTTACCCATACAGTAAAACACGAATTAAGACTAACCGACGACACCCCCATCTTTGTACGAAGTTATAGACAGGCTCCCCAACAACGAACAGAGATACAGAAACAGGTAGATAGTCTGTTAAAACAAGGAATCATTAGGGAAAGTATCTCCCCTTGGTCGTGCCCGGTACACATTGTTCCGAAAAAACCGGATGCATCAGGAAAAGTTAAATGGAGACTTGTTATTGACTATAGAAGACTTAATGACAGAATTATAGAAGACAAGTACCCCTTACCAAACATTAACGACATCCTTGACAGATTAGGGCGCGCACAATATTTCACGACCATAGATTTAGCAAGCGGCTACCATCAATTAGAAATGCACCCTAAAGACGTAGAGAAAACAGCGTTTACTACTGAAAGAGGCCACTATGAGTTCCTAAGAATGCCTTTCGGACTAAAAAATGCCCCGAGCACTTTCCAGCGTCTTATGGACCATATACTCCGAGGTATAGACAACGTATTTATGTACTTAGATTACGTCATAATAGCCGCGACGTCCCTACAAAACCACAATGAAAAACTGAAATTAGTATTTCAGCGATTCAAAATGCATAATCTGAAAGTTCAGTTAGACAAATCAGAATTTCTACAGAAGCACGTTAACTTTCTAGGACATGAATTGACTGACCAAGGACTAAATCCTAACAAGGACAAAATTAAAGCAGTATTAAATTTCCCTATACCACAAACGCAAAAAGACATAAAAGCTTTCTTAGGCCTAGTCGGGTACTATAGGAAGTTTATTAAGGACTTCGCGAAGTTGACGAAACCTTTAACAGCATGTCTAAAAAAGAACGCAAAGGTTGAACATACAAACGAATTTTTAGACGCAGTTGATAAATGCAAACAAATTCTAACAAACGCCCCAATCCTGCAATACCCTGACTTCGACAAACCGTTTATTTTAACGACAGACGCATCTGACTTTGCTTTAGGAGCAGTACTTTCCCAAGGCAATGTGGGCTCAGATAAACCAGTAGCCTATGCCTCAAGGACATTATCAGATACTGAGATCCGTTACTCTACCATAGAGAAAGAACTGTTAGGGATAGTATGGGCAATTAAGTATTTTAGACCTTACTTATATGGCCGTAAATTTACAATTTATACGGACCATAGACCCCTTACATGGTTAATGAGTCTAAAGGACCCTAACTCTAAATTAACACGATGGAAACTAAAGTTAGCAGAGTATGATTACAAAGTTGTTTATAAAAAGGGCAAACAAAACACTAACGCAGATGCACTATCTCGAGCAAAAATTTTTCATAATAGTATAGATTCTCTAGCTGTTAATGTTGATGACAATAGTGACGACAACATAATAAATAGAATATTCGAAAACGCCCGTAGACAGGCAGAGGTAGAAACTGATGACCCGAATAACCAAGACAATGAACGTAACAATACTGACAATGACGACCAACCTTATAACAACAATGACGTAGAAATGACCAGTATCTATCCCTCTCAAATTGACGAAGAGACAGACACAAGGAGTGCAACAACAGTCGACCCCGATCAATTAGTTTCTACAAATCATACCCAACCTGATAATGAAAATAACGGTATCCCTATAATATCCGACGCTATTGATAGACAGTTGAAACAATTTTACGTTAGGTCCACACCAGGTTCTACATACAGAGTAGAGGACAGATCAACAAACTCTAGGACAGTTATTAAGGATGTTTTCATCCCAGTAAATAACACTGAATCAGAAATTATCAAATTTTTAAAGGAACACACAATAGCTGACCGTGTTTTTCATTGCTATTTTTACGACGAAAATCTATACTTAGCCTTTTCAAGAGTGTATACTACGATATTTAATGACAGAGGACCTAAATTAATAAGATGTACTTCGCGGGTCACACTTGTTGAAAATAAAACTGAACAACAAGAACTCATTAAGCGATATCACGAAGGTAAATCATCGCATCGCGGTATCCAAGAGACCTTTAAGCATCTGCATAGGAATTATCACTGGCCTAATATGTTATTGACAGTTCAAAGGTTCATTAATCAATGCGACCTTTGCCTAAAGGCCAAATATGAAAGAAATCCTTTAAAACCTCCATTGATTATAACAGAGACACCTACGAAGCCATTTCAACACTTGTTCATGGATCTCTATAGTACTGGAGGTGCAACATTTTTAACAATTATCGACAATTTCTCTAAATTTGCCCAGGCGGTGCCTCTGAATGCTTCTAGTAGTGTTCACATCGCAGAAGCTCTATTACAAGTATTTTCTGTACTAGGACTACCTCTTAAAATCACCACAGACTCAGATACAAAGTTCGATAATGACGTCATAAAAGAGATATGTGCTTCGCATGATATCCACATTCACTTCACGACGCCTTACAACCCAAACTCTAACTCACCCATTGAACGATTTCATTCAACCATCGCAGAAATAATAAGAATTCAAAGAATGACAAATAAAGACGACCCCATACAATTGATCATGAAATACGCTATAATCGCCTATAACAACGCTATTCATTCTACTACAGGCTATACACCACGTGAGCTTTTATTCGGTCATACGGCATCCCGAAATCCATTAGAGCTATATTATCCTAAAGAATTTTATCAAGATTATGTCCTCAATCACCGCAAGAATGCAGAAGCAGTACAGGAATGTATAGCAGCCCACGTGTCTAAGAACAAAGAGCAGGTAATAGAAAAGAGAAACCAGGCAGCGCAAACAATCACGTTTAAGGTAGGTGAAACCGTTTACAAACAGGTCGCCAAAACCACCAGGAGCGACAAGACAAAACCAGTATTTAAAGATAAACAAAACCTCACCATTATTCCTAAATCCAAATACCTAGCACTGGGAACCAACGAGTACTCATACCTGGAGGAAGATTGCAAAAAGATCACACAAGACGTCCAACTCTGCACATCGCTGAACACCCAACCTGTGGAGAACTCTGAAGACTGCATAGTAACTCTTATAAAACACGAGAGCACAAACTGCACCCGTGCCAGGATGAACCTGAAACAAGGCAAGATCCAGAGACTAGAAGACAACAAATGGCTTATCATCTTGAAAGACGAACAAATCCTGAAATCTCGCTGCGGAAGGAAATCTGACTATAAAAAGATGTCAGGAATATACATCGCCAGCATTACAAGCGATTGTCAAGTGGAAATATTCAACCGAACACTGAAGACAAACACGGACACTATTACAGCTGATGAAATCGTACCCATTCCCAGCGAAACCACTATTCTAGAAGGGAATATTCGCTATAACCTACAACTGAAAGATATATCTCTGGATAGCATCCACGAACTGATGGACCGGGTTGAAAACATTCAACAACCTGTCATCGACTGGCAGACTATGATGACTACCCCAAGTTGGTCAACACTGGGACTCTACCTCATTCTGATAGCAATAATCATCTGGAAGCTGTGGCAGTGGAGACAGCGACGACTACAATCAAAGAACGAGAGCCCCGAGAACACTAGCATCGAGGACGCTGCTGGAAGCTGCGGGACGCGCTTCTATCTTAAGGAGGGAGGAGTTAGGCAATCGCCCGATGCCCGTATTTGCTGA

Protein

MLALSPLPSHLIENSQKYEINKIETETDIDKELCENLKKIRTSHMNEEEKREITKICYQYRDIFYSENIPLSFTHTVKHELRLTDDTPIFVRSYRQAPQQRTEIQKQVDSLLKQGIIRESISPWSCPVHIVPKKPDASGKVKWRLVIDYRRLNDRIIEDKYPLPNINDILDRLGRAQYFTTIDLASGYHQLEMHPKDVEKTAFTTERGHYEFLRMPFGLKNAPSTFQRLMDHILRGIDNVFMYLDYVIIAATSLQNHNEKLKLVFQRFKMHNLKVQLDKSEFLQKHVNFLGHELTDQGLNPNKDKIKAVLNFPIPQTQKDIKAFLGLVGYYRKFIKDFAKLTKPLTACLKKNAKVEHTNEFLDAVDKCKQILTNAPILQYPDFDKPFILTTDASDFALGAVLSQGNVGSDKPVAYASRTLSDTEIRYSTIEKELLGIVWAIKYFRPYLYGRKFTIYTDHRPLTWLMSLKDPNSKLTRWKLKLAEYDYKVVYKKGKQNTNADALSRAKIFHNSIDSLAVNVDDNSDDNIINRIFENARRQAEVETDDPNNQDNERNNTDNDDQPYNNNDVEMTSIYPSQIDEETDTRSATTVDPDQLVSTNHTQPDNENNGIPIISDAIDRQLKQFYVRSTPGSTYRVEDRSTNSRTVIKDVFIPVNNTESEIIKFLKEHTIADRVFHCYFYDENLYLAFSRVYTTIFNDRGPKLIRCTSRVTLVENKTEQQELIKRYHEGKSSHRGIQETFKHLHRNYHWPNMLLTVQRFINQCDLCLKAKYERNPLKPPLIITETPTKPFQHLFMDLYSTGGATFLTIIDNFSKFAQAVPLNASSSVHIAEALLQVFSVLGLPLKITTDSDTKFDNDVIKEICASHDIHIHFTTPYNPNSNSPIERFHSTIAEIIRIQRMTNKDDPIQLIMKYAIIAYNNAIHSTTGYTPRELLFGHTASRNPLELYYPKEFYQDYVLNHRKNAEAVQECIAAHVSKNKEQVIEKRNQAAQTITFKVGETVYKQVAKTTRSDKTKPVFKDKQNLTIIPKSKYLALGTNEYSYLEEDCKKITQDVQLCTSLNTQPVENSEDCIVTLIKHESTNCTRARMNLKQGKIQRLEDNKWLIILKDEQILKSRCGRKSDYKKMSGIYIASITSDCQVEIFNRTLKTNTDTITADEIVPIPSETTILEGNIRYNLQLKDISLDSIHELMDRVENIQQPVIDWQTMMTTPSWSTLGLYLILIAIIIWKLWQWRQRRLQSKNESPENTSIEDAAGSCGTRFYLKEGGVRQSPDARIC

Uniprot

A0A1B6DI21 A0A146KMA2 A0A0A9YJ44 A0A0K8S7R8 Q65353 A0A224XIQ6 + More
A0A023EZI9 A0A023F0Y8 A0A224XAI1 A0A023F0X4 U5ES61 A0A0A9Y0U3 U5EU37 Q9NHF7 A0A0K8TRT3

Pubmed

26823975 25401762 1692964 25474469 26369729

EMBL

GEDC01017847 GEDC01011974 JAS19451.1 JAS25324.1 GDHC01021754 JAP96874.1 + More
GBHO01012506 JAG31098.1 GBRD01016627 JAG49199.1 M32662 AAA92249.1 GFTR01008505 JAW07921.1 GBBI01004049 JAC14663.1 GBBI01004048 JAC14664.1 GFTR01008492 JAW07934.1 GBBI01004051 JAC14661.1 GANO01002504 JAB57367.1 GBHO01018861 JAG24743.1 GANO01002503 JAB57368.1 AF222049 AAF36671.1 GDAI01000737 JAI16866.1

PRIDE

Q9NHF7

Pfam

PF00078   RVT_1        + More
PF17917   RT_RNaseH
PF00665   rve
PF17921   Integrase_H2C2
PF17919   RT_RNaseH_2
PF02902   Peptidase_C48

Interpro

IPR041588   Integrase_H2C2        + More
IPR036397   RNaseH_sf
IPR041373   RT_RNaseH
IPR000477   RT_dom
IPR021109   Peptidase_aspartic_dom_sf
IPR012337   RNaseH-like_sf
IPR001584   Integrase_cat-core
IPR041577   RT_RNaseH_2
IPR038765   Papain-like_cys_pep_sf
IPR003653   Peptidase_C48_C
IPR001969   Aspartic_peptidase_AS

SUPFAM

SSF53098   SSF53098        + More
SSF54001   SSF54001
SSF50630   SSF50630

Gene 3D

2.40.70.10 3.30.420.10

ProteinModelPortal

A0A1B6DI21 A0A146KMA2 A0A0A9YJ44 A0A0K8S7R8 Q65353 A0A224XIQ6 + More
A0A023EZI9 A0A023F0Y8 A0A224XAI1 A0A023F0X4 U5ES61 A0A0A9Y0U3 U5EU37 Q9NHF7 A0A0K8TRT3

PDB

4OL8 E-value=4.59604e-76, Score=729

KEGG

NA

GO

GO:0003676 GO:0015074 GO:0008234 GO:0004190 GO:0005007 GO:0005524 GO:0008284 GO:0008543 GO:0016021 GO:0004672 GO:0048384

Length:

1278

Number of predicted TMHs:

1

Exp number of AAs in TMHs:

21.18375

Exp number, first 60 AAs:

0

Total prob of N-in:

0.00012

outside

1 - 1209

TMhelix

1210 - 1232

inside

1233 - 1278

Pi

37.866634

Theta

37.444689

Tajima's D

-0.55784

CLR

355.311613

CSRT

0.232188390580471

Interpretation

Uncertain

Sequence

Summary

Ontologies

Topology

Population Genetic Test Statistics

Multiple alignment of Orthologues

Gene Tree