SGID Silkworm Genome Informatics Database
Gene
KWMTBOMO01001  Validated by peptides from experiments
Pre Gene Modal
BGIBMGA001347
Annotation
fibroin_P25_[Bombyx_mandarina]
Full name
Fibrohexamerin      
Alternative Name
25 kDa silk glycoprotein
p25
Location in the cell
Extracellular   Reliability : 2.257 PlasmaMembrane   Reliability : 1.766
 

Sequence

CDS
ATGCTGGCGCGGTGTCTAGCTGTAGCCGCTGTGGCAGTTTTGGCTTCTGCAGGGCCGCCGAGTCCGATCTACAGGCCCTGCTACTTGGACGATTACAAATGCATCTCCGACCACCTGGCCGCGATCTCGAAATGTATCCCGGGCAGAGGGCAGATCCCCTCGCAGTACGAGATACCGGTGTTCCAGTTTGAAATACCATACTTCAACGCCACCTACGTCGACCATAATCTCATTACCCGTAACCACGACAAATGCCGTGTCAGCGAATTTTATGACAATGTGAGAACTTTAAAAACAGTTTTAACCGTGGACTGTCCGTGGCTGAACTTTGAATCCAATCGGACCTTGGCTCAGCACATGTCGTTCAAGGAAGACGTCGTCTTAAGCTTCTACATCAATGGATCTTATCCTTTGATCAGGCTAACGACAGTGTTTGATAAGGGCAACAATTTCGACTTGTGTTCGGCTTTCACGTTCGCAGACCTGGCCGGGGGTCTGCCCATCTTCCACATTAACCCTAATGACCAACGCACAGCGCAGTGGTTGTCTAAAGATCTGACCCTGCTGCACATTTACGAGAGAGAGCACATCTTCGGAAAGAGGAACTGGCTGGCGAGGTCCTTCATCAGCAGAACACTCTGCGACTTCGGTTGTCACCACTGA
Protein
MLARCLAVAAVAVLASAGPPSPIYRPCYLDDYKCISDHLAAISKCIPGRGQIPSQYEIPVFQFEIPYFNATYVDHNLITRNHDKCRVSEFYDNVRTLKTVLTVDCPWLNFESNRTLAQHMSFKEDVVLSFYINGSYPLIRLTTVFDKGNNFDLCSAFTFADLAGGLPIFHINPNDQRTAQWLSKDLTLLHIYEREHIFGKRNWLARSFISRTLCDFGCHH

Summary

Subunit
Silk fibroin elementary unit consists in a disulfide-linked heavy and light chain and a p25 glycoprotein in molar ratios of 6:6:1. This results in a complex of approximately 2.3 MDa.
Miscellaneous
It is unclear whether the N-terminal residue of the mature protein is Ala-17 or Gly-18.
Keywords
Complete proteome   Direct protein sequencing   Disulfide bond   Glycoprotein   Reference proteome   Secreted   Signal   Silk protein  
Feature
chain  Fibrohexamerin
Pfam
PF07294   Fibroin_P25
Interpro
IPR009911   Fibroin_P25        + More
IPR016024   ARM-type_fold       
IPR011989   ARM-like       
IPR038606   To_sf       
SUPFAM
SSF48371   SSF48371       
Gene 3D

Ontologies

Topology

Subcellular location
Secreted  
SignalP
Position:   1 - 17,         Likelihood:  0.997161
 
 
Length:
220
Number of predicted TMHs:
0
Exp number of AAs in TMHs:
1.63405
Exp number, first 60 AAs:
1.45424
Total prob of N-in:
0.12829
outside
1  -  220
 
 

Population Genetic Test Statistics

Pi
288.442107
Theta
210.220679
Tajima's D
0.910725
CLR
0.737083
CSRT
0.634218289085546
Interpretation
Uncertain
Peptides ×
Source Sequence Identity Evalue
20029844 LTTVFDKGNNFDLCSAF 100.00 9e-16
20029844 TLAQHMSFK 100.00 9e-16
20029844 EDVVLSFYIN*GSYPLIR 96.77 5e-14
20029844 EDVVLSFYIN*GSYPLIR 96.77 5e-14
20029844 EDVVLSFYIN*GSYPLIR 96.77 5e-14
20029844 GNNFDLCSAFTFADLAGGLPIFHINPNDQR 96.77 5e-14
20029844 EDVVLSFYIN*GSYPLIR 96.77 5e-14
20029844 TFADLAGGLPIFHINPNDQRTAQ 100.00 1e-12
20029844 TFADLAGGLPIFHINPNDQRTAQ 100.00 1e-12
20029844 DLCSAFTFA 100.00 1e-12
20029844 DLCSAFTFA 100.00 1e-12
20029844 DLAGGLPIFHINPN 100.00 1e-12
20029844 TFADLAGGLPIFHINPNDQRTAQW 100.00 3e-11
20029844 TFADLAGGLPIFHINPNDQRTAQ 100.00 3e-11
20029844 ADLAGGLPIFH 100.00 3e-11
20029844 TFADLAGGLPIFHINPNDQ*RTAQW 100.00 3e-11
20029844 TFADLAGGLPIFH 100.00 5e-11
20029844 TFAD*LAGGLPIFH 100.00 5e-11
20029844 TFADLAGGLPIFH 100.00 5e-11
20029844 TFADLAGGLPIF 100.00 5e-11
20029844 DKGN*NFDLCSAF 100.00 5e-11
20029844 TFADLAGGLPIFHINPNDQRTAQ 96.00 8e-11
20029844 TFADLAGGLPIFHINPNDQRTAQ 96.00 8e-11
20029844 TFADLAGGLPIFH 96.00 8e-11
20029844 ADLAGGLPIFHINPNDQRTA 95.83 3e-10
20029844 ADLAGGLPIFHINPNDQRTA 95.83 3e-10
20029844 GPPSPIYRPCYLDD*Y 100.00 4e-10
20029844 GPPSPIYRPCYLDD*Y 100.00 4e-10
20029844 ADLAGGLPIFH 95.65 2e-09
20029844 YLDDYKCISDHL 100.00 2e-09
20029844 ADLAGGLPIFHINPNDQRTAQW 100.00 5e-09
20029844 DLCSAFTFA 100.00 6e-09
20029844 TTVFDKGNNFDLC 100.00 7e-09
20029844 TVFDKGNNFDLC 100.00 7e-09
20029844 ADLAGGLPIFHINPN 100.00 7e-09
20029844 TTVFDKGNNFDLC 100.00 7e-09
20029844 ADLAGGLPIFHINPN 100.00 7e-09
20029844 ADLAGGLPIFH 100.00 7e-09
20029844 GNNFDLCSAFTFADLAGGLPIFHI*NPNDQR 100.00 3e-08
20029844 GNNFDLCSAFTFADLAGGLPIFHINPNDQR 100.00 3e-08
20029844 YLDDYKCISDHL 100.00 7e-08
20029844 YLDDYKCISDHL 100.00 7e-08
20029844 SKDLTLL 100.00 8e-08
20029844 AGPPSPIYRPCYLD 100.00 8e-08
20029844 SYPLIRLTTVF 100.00 3e-07
20029844 ADLAGGLPIFHINPNDQRTA 95.24 4e-07
20029844 DHLAAN*SKCIPGRGQIPSQY 100.00 2e-06
20029844 GPPSPIYRPCYLD 100.00 2e-06
20029844 DHLAAN*SKCIPGRGQIPSQY 100.00 2e-06
20029844 INGSYPLIRL 100.00 2e-06
20029844 EDVVLSFYIN*GSYPLIR 100.00 1e-05
20029844 DLTLLHIY 100.00 1e-05
20029844 SITDLLRGV 100.00 1e-05
20029844 DLAGGLPIFH 100.00 2e-05
20029844 GGLPIFHINPNDQ 100.00 2e-05
20029844 GGLPIFHINPNDQ 100.00 2e-05
20029844 GGLPIFHINPNDQR 100.00 2e-05
20029844 ADLAGGLPIFHINPN 100.00 2e-05
20029844 GGLPIFHIN*PN 100.00 2e-05
31253818 Carbamidomethyl 100.00 2e-05
20029844 DLTLLHIYER 100.00 2e-05
20029844 DLTLLHIYER 100.00 2e-05
20029844 LSKDLTLLHIY 100.00 4e-05
20029844 ADLAGGLPIFHINPNDQRTAQW 100.00 4e-05
20029844 IRLTTVF 100.00 4e-05
20029844 IRLTTVF 100.00 4e-05
20029844 IN*GSYPLIRLTTVFDKGNNF 100.00 4e-05
20029844 IRLTTVFDKGNNFDLCSAF 100.00 4e-05
20029844 ADLAGGLPIFH 100.00 5e-05
20029844 ADLAGGLPIFH 100.00 5e-05
20029844 TTVFDKGNNFDLC 100.00 5e-05
20029844 GPPSPIYRPCYLDDYKCISDHL 100.00 5e-05
20029844 GPPSPIYRPCYLDD*Y 100.00 5e-05
20029844 TLCDFGCHH 100.00 6e-05
20029844 GPPSPIYRPC 100.00 8e-05
20029844 DLTLLHIYER 100.00 8e-05
20029844 GPPSPIYRPC 100.00 8e-05
20029844 AGPPSPIYRPCYLDDY 100.00 8e-05
20029844 TLCDFGCHH 100.00 8e-05
20029844 RNWLAR 100.00 8e-05
20029844 VSEFYDNVR 100.00 1e-04
20029844 VSEFYDNVR 100.00 1e-04
20029844 TVLTVDCPWLNFESN*R 100.00 1e-04
20029844 VSEFYDNVR 100.00 1e-04
20029844 TVLTVDCPWLNFESN*R 100.00 1e-04
20029844 VSEFYDNVR 100.00 1e-04
20029844 VSEFYDNVR 100.00 1e-04
20029844 TVLTVDCPWLNFESN*R 100.00 1e-04
20029844 VSEFYDNVR 100.00 1e-04
20029844 TTVFDKGNNFDLCSAF 100.00 2e-04
20029844 IRLTTVFDKGNN*FDLCSAF 100.00 2e-04
20029844 DLCSAFTFA 100.00 3e-04
20029844 DLCSAFTFA 100.00 3e-04
20029844 DLCSAFTFA 100.00 3e-04
20029844 GPPSPIYRPCYLDDY 100.00 3e-04
20029844 GGLPIFHINPNDQ 100.00 4e-04
20029844 GPPSPIYRPCYLDDY 100.00 4e-04
20029844 GPPSPIYRPCYLDDY 100.00 4e-04
20029844 GPPSPIYRPCYLDDY 100.00 4e-04
20029844 GPPSPIYRPCYLDDY 100.00 4e-04
20029844 KTVLTVDCPW 100.00 0.001
20029844 KTVLTVDCPW* 100.00 0.001
20029844 KTVLTVDCPW* 100.00 0.001
20029844 KTVLTVDCPW* 100.00 0.001
20029844 KTVLTVDCPW 100.00 0.001
20029844 DQCRVSEFYDNVRTL 100.00 0.001
20029844 GQIPSQYEIPVFR 100.00 0.001
20029844 CISDHLAAN*SK 100.00 0.001
20029844 CISDHLAAN*SK 100.00 0.001
20029844 CISDHLAAN*SK 100.00 0.001
20029844 CISDHLAAN*SK 100.00 0.001
20029844 CISDHLAAN*SK 100.00 0.001
20029844 GGLPIFHINPNDQ*RTAQWL 100.00 0.002
20029844 HIYEREHIFGKR 100.00 0.002
20029844 AAN*SKCIPGRGQIPSQY 100.00 0.002
20029844 DKGNNFDLCSAF 100.00 0.002
20029844 DKGNNFDLCSAF 100.00 0.002
20029844 DKGNNFDLCSAF 100.00 0.002
20029844 TTVFDKGNN*FDLCSAF 100.00 0.002
20029844 DKGNN*FDLCSAF 100.00 0.002
20029844 HIYEREHIFGKR 100.00 0.002
20029844 AGPPSPIYRPCYL 100.00 0.002
20029844 AGPPSPIYRPCYL 100.00 0.002
20029844 SKDLTLL 100.00 0.003
20029844 SKDLTLL 100.00 0.003
20029844 GGLPIFHINPN 100.00 0.003
20029844 DLAGGLPIFH 100.00 0.003
20029844 AGGLPIFHINPN 100.00 0.003
20029844 GGLPIFHINPN 100.00 0.003
20029844 YLDDYKCISDHL 100.00 0.004
20029844 EFYDNVRTL 100.00 0.004
20029844 EFYDNVRTL 100.00 0.004
20029844 INGSYPLIRL 100.00 0.004
20029844 ADLAGGLPIFHINPNDQRTA 100.00 0.006
20029844 ADLAGGLPIFHINPN*DQRTAQW 100.00 0.007
20029844 SKDLTLL 100.00 0.007
20029844 ADLAGGLPIFHINPNDQ*RTAQWL 100.00 0.007
20029844 SFKEDVVLS 100.00 0.016
20029844 SFKEDVVL 100.00 0.016
20029844 YINGSYPL 100.00 0.016
20029844 SFKEDVVLS 100.00 0.016
20029844 SFKEDVVL 100.00 0.016
20029844 SFKEDVVLS 100.00 0.016
20029844 TTVFDKGNNFDLCSAF 100.00 0.017
20029844 TTVFDKGNNFDLCSAF 100.00 0.017
20029844 TVFDKGNNFDLCSAF 100.00 0.017
20029844 TTVFDKGN*NFDLCSAF 100.00 0.017
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 YLDDYKCI 100.00 0.039
20029844 YLDDYKCI 100.00 0.039
20029844 GGLPIFHINPNDQ 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
20029844 GPPSPIYRPC 100.00 0.039
Copyright@ 2018-2023    Any Comments and suggestions mail to:zhuzl@cqu.edu.cn   渝ICP备19006517号

渝公网安备 50010602502065号