The Silkworm Genome Information Database

Gene

KWMTBOMO15615

Annotation

PREDICTED:_uncharacterized_protein_LOC106710892_[Papilio_machaon]

Location

Bomo_Chr26(+):4217019-4224333 View in EpiBrowser

Location in the cell

Nuclear Reliability : 4.063

CDS

ATGCTAGCCCTAAGCCCACTACCGTCACATTTGATAGAAAACAGTCAGAAGTACGAAATTAACAAAATTGAGACGGAAACTGACATAGATAAAGAACTTTGTGAAAATTTAAAGAAAATTCGTACCAGCCACATGAACGAGGAAGAAAAACGGGAAATTACTAAAATCTGCTATCAGTACCGTGACATATTCTACTCGGAAAACATTCCTTTATCGTTTACCCATACAGTAAAACACGAATTAAGACTAACCGACGACACCCCCATCTTTGTACGAAGTTATAGACAGGCTCCCCAACAACGAACAGAGATACAGAAACAGGTAGATAGTCTGTTAAAACAAGGAATCATTAGGGAAAGTATCTCCCCTTGGTCGTGCCCGGTACACATTGTTCCAAAAAAACCGGATGCATCAGGAAAAGTTAAATGGAGACTTGTTATTGACTATAGAAGACTTAATGACAGAATTATAGAAGACAAGTACCCCTTACCAAACATTAACGACATCCTTGACAGATTAGGGCGCGCACAATATTTCACGACCATAGATTTAGCAAGCGGTTACCATCAATTAGAAATGCACCCTAAAGACGTAGAGAAAACAGCGTTTACTACTGAAAGAGGCCACTATGAGTTCCTAAGAATGCCTTTCGGACTAAAAAATGCCCCGAGCACTTTCCAGCGTCTTATGGACCATATACTCCGAGGTATAGACAACGTATTTACGTACTTAGATGACGTCATAATAGCCGCGACGTCCCTACAAAACCACAATGAAAAACTGAAATTAGTATTTCAGCGATTCAAAATGCATAATCTGAAAGTTCAGTTAGACAAATCAGAATTTCTACAGAAGCACGTTAACTTTCTAGGACATGAATTGACTGACCAAGGACTAAATCCTAACAAGGACAAAATTAAAGCAGTATTAAATTTCCCTATACCACAAACGCAAAAAGACATAAAAGCTTTCTTAGGACTAGTAGGGTACTATAGGAAGTTTATAAAGGACTTTGCGAAGTTGACGAAACCTTTAACAGCATGTCTAAAAAAGAACGCAAAGGTTGAACATACAAACGAATTTTTAGACGCAGTTGATAAATGCAAACAAATTCTAACAAACGCCCCAATCCTGCAATACCCTGACTTCGACAAACCGTTTATTTTAACGACAGACGCATCTGACTTTGCTTTAGGAGCAGTACTTTCCCAAGGCAATGTGGGCTCAGATAAACCAGTAGCCTATGCCTCAAGGACATTATCAGATACTGAGACCCGTTACTCTACCATAGAGAAAGAACTGTTAGGGATAGTATGGGCAATTAAGTATTTTAGACCTTACTTATATGGCCGTAAATTTACAATTTATACGGACCATAGACCCCTTACATGGTTAATGAGTCTAAAGGACCCTAACTCTAAATTAACACGATGGAAACTAAAGTTAGCAGAGTATGATTACAAAGTTGTTTATAAAAAGGGCAAACAAAACACTAACGCAGATGCACTATCCCGAGCAAAAATTTTTCATAATAGTATAGATTCTCTAGCTGTTAATGTTGATGACAATAGTGACGACAACATAATAAATAGAATATTCGAAAACGCCCGTAGACAGGCAGAGATAGAAACTGATGACCCGAATAACCAAGACAATGAACGTAACAATACTGACAATAACGACCAACCTTATAACAATAATGACGTAGAAATGACCAGTATCTATCCCTCTCAAATTGACGAAGAGACAGACACAAGGAGTGCAACAACAGTAGACCCCGATCAATTAGTTTCTACAAATCATACCCAACCTGATAATGAAAATAACGGTATCCCTATAATATCCGACGCTATTGATAGACAGTTGAAACAATTTTACGTTAGGTCCACACCAGGTTCTACATACAGAGTAGAGGACAGATCAACAAACTCTAGGACAGTTATTAAGGATGTTTTCATCCCAGTAAATAACACTGAATCAGAAATTATCAAATTTTTAAAAGAACACACAATAGCTGACCGTGTTTTTCATTGCTATTTTTACGACGAAAATCTATACTTAGCCTTTTCAAGAGTGTATACTACGATATTTAATGACAGAGGACCTAAATTAATAAGATGTACTTCGCGGGTCACACTTGTTGAAAATAAAACTGAACAACAAGAACTCATTAAGCGATATCACGAAGGTAAATCATCGCATCGCGGTATCCAAGAGACCTTTAAGCATCTGCATAGGAATTATCACTGGCCTAATATGTTATTGACAGTTCAAAGGTTCATTAATCAATGCGACCTTTGCCTAAAGGCCAAATATGAAAGAAATCCCTTAAAACCTCCATTGATTATAACAGAGACACCTACGAAGCCATTTCAACACTTGTTCATGGATCTCTATAGTACTGGAGGTGCAACGTTTTTAACAATTATCGACAATTTCTCTAAATTTGCCCAGGCGGTACCTCTGAATGCTTCTAGTAGTGTTCACATCGCAGAAGCTCTATTACAAGTATTTTCTGTACTAGGACTACCTCTTAAAATCACCACAGACTCAGATACAAAGTTCGATAATGACGTCATAAAAGAGATATGTGCTTCGCATGATATCCACATTCACTTCACGACGCCTTACAACCCAAACTCTAACTCACCCATTGAACGATTTCATTCAACCATCGCAGAAATAATAAGAATTCAAAGAATGACAAATAAAGACGACCCCATACAATTGATCATGAAATACGCTATAATCGCCTATAACAACGCTATTCATTCTACTACAGGCTATACACCACGTGAGCTTTTATTCGGTCATACGGCATCCCGAAATCCATTAGAGCTATATTATCCTAAAGAATTTTATCAAGATTATGTCCTCCATCACCGCAAGAATGCAGAAGCAGTACAGGAATGTATAGCAGCCCACGTGTCTAAGAACAAAGAGCAGGTAATAGAAAAGAGAAACCAGGCAGCGGAAACAATCACGTTTAAGGTAGGTGAAACCGTTTACAAACAGGTCGCCAAAACCACCAGGAGCGACAAGACAAAACCAGTATTTAAAGATAAACAAAACCTCACCATTATTCCTAAATCCAAATACCTAGCACTGGGAACCAACGAGTACTCATACCTGGAGGAAGATTGCAAAAAGATCACACAAGACGTCCAACTCTGCACATCGCTGAACACCCAACCTGTGGAGAACTCTGAAGACTGCATAGTAACTCTTATAAAACACGAGAGCACAAACTGCACCCGTGCCAGGATGAACCTGAAACAAGGCAAGATCCAGAGACTAGAAGACAACAAATGGCTTATCATCTTGAAAGACGAACAAATCCTGAAATCTCGCTGCGGAAGGAAATCTGACTATAAAAAGATGTCAGGAATATACATCGCCAGCATTACAAGCGATTGTCAAGTGGAAATATTCAACCGAACACTGAAGACAAACACGGATACTATTACAGCTGATGAAATCGTACTCATTCCCAGCGAAACCACTATTCTAGAAGGGAATATTCGCTATAACCTACAACTGAAAGATATATCTCTGGATAGCATCCACGAACTGATGGACCGGGTTGAAAACATTCAACAACCTGTCATCGACTGGCAGACTATGATGACTACCCCAAGTTGGTCAACACTGGGACTCTACCTCATTCTGATAGCAATAATCATCTGGAAGCTGAGGCAGTGGAGACAGCGACGACTACAATCAAAGAACGAGAGCCCCGAGAACACTAGCACCGAGGACGCTGCTGGAAGCTGCGGGACGCGCTTCTATCTTAAGGAGGGAGGAGTTAGGCAATCGCCCGATGCCCGTATTTGCTGA

Protein

MLALSPLPSHLIENSQKYEINKIETETDIDKELCENLKKIRTSHMNEEEKREITKICYQYRDIFYSENIPLSFTHTVKHELRLTDDTPIFVRSYRQAPQQRTEIQKQVDSLLKQGIIRESISPWSCPVHIVPKKPDASGKVKWRLVIDYRRLNDRIIEDKYPLPNINDILDRLGRAQYFTTIDLASGYHQLEMHPKDVEKTAFTTERGHYEFLRMPFGLKNAPSTFQRLMDHILRGIDNVFTYLDDVIIAATSLQNHNEKLKLVFQRFKMHNLKVQLDKSEFLQKHVNFLGHELTDQGLNPNKDKIKAVLNFPIPQTQKDIKAFLGLVGYYRKFIKDFAKLTKPLTACLKKNAKVEHTNEFLDAVDKCKQILTNAPILQYPDFDKPFILTTDASDFALGAVLSQGNVGSDKPVAYASRTLSDTETRYSTIEKELLGIVWAIKYFRPYLYGRKFTIYTDHRPLTWLMSLKDPNSKLTRWKLKLAEYDYKVVYKKGKQNTNADALSRAKIFHNSIDSLAVNVDDNSDDNIINRIFENARRQAEIETDDPNNQDNERNNTDNNDQPYNNNDVEMTSIYPSQIDEETDTRSATTVDPDQLVSTNHTQPDNENNGIPIISDAIDRQLKQFYVRSTPGSTYRVEDRSTNSRTVIKDVFIPVNNTESEIIKFLKEHTIADRVFHCYFYDENLYLAFSRVYTTIFNDRGPKLIRCTSRVTLVENKTEQQELIKRYHEGKSSHRGIQETFKHLHRNYHWPNMLLTVQRFINQCDLCLKAKYERNPLKPPLIITETPTKPFQHLFMDLYSTGGATFLTIIDNFSKFAQAVPLNASSSVHIAEALLQVFSVLGLPLKITTDSDTKFDNDVIKEICASHDIHIHFTTPYNPNSNSPIERFHSTIAEIIRIQRMTNKDDPIQLIMKYAIIAYNNAIHSTTGYTPRELLFGHTASRNPLELYYPKEFYQDYVLHHRKNAEAVQECIAAHVSKNKEQVIEKRNQAAETITFKVGETVYKQVAKTTRSDKTKPVFKDKQNLTIIPKSKYLALGTNEYSYLEEDCKKITQDVQLCTSLNTQPVENSEDCIVTLIKHESTNCTRARMNLKQGKIQRLEDNKWLIILKDEQILKSRCGRKSDYKKMSGIYIASITSDCQVEIFNRTLKTNTDTITADEIVLIPSETTILEGNIRYNLQLKDISLDSIHELMDRVENIQQPVIDWQTMMTTPSWSTLGLYLILIAIIIWKLRQWRQRRLQSKNESPENTSTEDAAGSCGTRFYLKEGGVRQSPDARIC

Uniprot

A0A1B6DI21 A0A0K8S7R8 A0A146KMA2 A0A0A9YJ44 Q65353 A0A224XIQ6 + More
A0A224XAI1 Q9NHF7

Pubmed

26823975 25401762 1692964

EMBL

GEDC01017847 GEDC01011974 JAS19451.1 JAS25324.1 GBRD01016627 JAG49199.1 + More
GDHC01021754 JAP96874.1 GBHO01012506 JAG31098.1 M32662 AAA92249.1 GFTR01008505 JAW07921.1 GFTR01008492 JAW07934.1 AF222049 AAF36671.1

PRIDE

Q9NHF7

Pfam

PF00078   RVT_1        + More
PF17917   RT_RNaseH
PF00665   rve
PF17921   Integrase_H2C2
PF17919   RT_RNaseH_2
PF02902   Peptidase_C48

Interpro

IPR041588   Integrase_H2C2        + More
IPR036397   RNaseH_sf
IPR041373   RT_RNaseH
IPR000477   RT_dom
IPR021109   Peptidase_aspartic_dom_sf
IPR012337   RNaseH-like_sf
IPR001584   Integrase_cat-core
IPR003653   Peptidase_C48_C
IPR041577   RT_RNaseH_2
IPR038765   Papain-like_cys_pep_sf

SUPFAM

SSF53098 SSF53098 + More
SSF54001 SSF54001

Gene 3D

2.40.70.10 3.30.420.10

ProteinModelPortal

A0A1B6DI21 A0A0K8S7R8 A0A146KMA2 A0A0A9YJ44 Q65353 A0A224XIQ6 + More
A0A224XAI1 Q9NHF7

PDB

4OL8 E-value=2.51974e-77, Score=740

KEGG

NA

GO

GO:0003676 GO:0015074 GO:0008234 GO:0016021 GO:0046872 GO:0030126 GO:0030117 GO:0006418 GO:0003707 GO:0006281 GO:0006259

Length:

1278

Number of predicted TMHs:

1

Exp number of AAs in TMHs:

20.516

Exp number, first 60 AAs:

0

Total prob of N-in:

0.00000

outside

1 - 1206

TMhelix

1207 - 1229

inside

1230 - 1278

Pi

207.155282

Theta

185.130821

Tajima's D

1.620307

CLR

0.249531

CSRT

0.812059397030149

Interpretation

Uncertain

Sequence

Summary

Ontologies

Topology

Population Genetic Test Statistics

Multiple alignment of Orthologues

Gene Tree