SGID Silkworm Genome Informatics Database
Gene
KWMTBOMO08464  Validated by peptides from experiments
Pre Gene Modal
BGIBMGA009393
Annotation
FIB-L_protein_[Bombyx_mori]
Full name
Fibroin light chain      
Alternative Name
L-fibroin
PG-1
Location in the cell
Extracellular   Reliability : 3.752
 

Sequence

CDS
ATGAAGCCTATATTTTTGGTATTACTCGTCGCTACAAGCGCCTACGCTGCACCATCGGTGACCATCAATCAATACAGTGATAATGAAATTCCACGCGACATTGATGATGGAAAAGCTAGTTCCGTAATCTCACGTGCATGGGACTACGTCGATGACACTGACAAAAGCATCGCCATCCTCAACGTTCAAGAGATCTTGAAGGACATGGCCAGCCAGGGCGATTATGCAAGTCAAGCATCAGCGGTGGCCCAAACCGCCGGAATTATCGCCCATCTATCTGCCGGTATCCCCGGTGATGCCTGTGCAGCCGCTAACGTCATTAACTCTTACACAGACGGCGTCAGGTCCGGAAACTTCGCCGGCTTCAGACAATCTCTCGGTCCCTTCTTCGGACACGTGGGACAAAACTTGAATCTTATCAATCAACTCGTCATCAACCCTGGTCAACTCCGATACTCTGTCGGACCAGCCCTGGGTTGTGCCGGAGGTGGAAGAATCTATGACTTCGAAGCCGCTTGGGATGCAATCTTAGCCAGCAGTGACTCTAGTTTCTTAAATGAAGAGTACTGCATCGTCAAGAGATTGTACAACTCTCGCAACAGCCAAAGCAACAACATCGCTGCCTACATCACCGCTCACTTACTTCCCCCGGTTGCTCAAGTGTTCCACCAATCAGCTGGATCAATCACAGACCTCCTGAGAGGCGTTGGCAACGGTAATGACGCGACCGGTTTAGTTGCTAATGCTCAAAGATATATTGCACAAGCAGCCAGCCAGGTTCACGTCTAA
Protein
MKPIFLVLLVATSAYAAPSVTINQYSDNEIPRDIDDGKASSVISRAWDYVDDTDKSIAILNVQEILKDMASQGDYASQASAVAQTAGIIAHLSAGIPGDACAAANVINSYTDGVRSGNFAGFRQSLGPFFGHVGQNLNLINQLVINPGQLRYSVGPALGCAGGGRIYDFEAAWDAILASSDSSFLNEEYCIVKRLYNSRNSQSNNIAAYITAHLLPPVAQVFHQSAGSITDLLRGVGNGNDATGLVANAQRYIAQAASQVHV

Summary

Description
It is likely that the major role of L-chain is to prevent the retention of H-chain in ER by forming the disulfide linkage.
Subunit
Silk fibroin elementary unit consists in a disulfide-linked heavy and light chain and a p25 glycoprotein in molar ratios of 6:6:1. This results in a complex of approximately 2.3 MDa.
Keywords
Acetylation   Complete proteome   Direct protein sequencing   Disulfide bond   Reference proteome   Secreted   Signal   Silk protein  
Feature
chain  Fibroin light chain
Pfam
PF05849   L-fibroin
Interpro
IPR008660   L-fibroin       

Ontologies

Topology

Subcellular location
Secreted  
SignalP
Position:   1 - 16,         Likelihood:  0.999024
 
 
Length:
262
Number of predicted TMHs:
0
Exp number of AAs in TMHs:
1.24129
Exp number, first 60 AAs:
1.18211
Total prob of N-in:
0.04342
outside
1  -  262
 
 

Population Genetic Test Statistics

Pi
239.014506
Theta
159.823903
Tajima's D
1.658423
CLR
0.205713
CSRT
0.820058997050148
Interpretation
Uncertain
Peptides ×
Source Sequence Identity Evalue
25860555 QSSSSYQSQSYNK 97.92 7e-26
24093152 DKWPDCPTINEVR 97.92 7e-26
27102218 DIDDGKASSVISR 97.92 7e-26
20029844 YIAQAASQVHV 100.00 1e-15
20029844 NVQEILKDM*ASQGDYASQASAVAQ 100.00 7e-15
20029844 NVQEILKDMASQGDYASQ*ASAVAQ 100.00 7e-15
20029844 NVQEILKDM*ASQGDYASQ*ASAVAQ 100.00 7e-15
20029844 SVTINQY 100.00 6e-14
20029844 SVTINQYSDN*EIPRDIDDGKASSVI 100.00 6e-14
20029844 APSVTINQYSDNE*IPR 100.00 2e-13
20029844 YSVGPALGCAGGGR 100.00 2e-13
20029844 YSVGPALGCAGGGR 100.00 2e-13
20029844 NVQEILKDMASQGDYASQASAVAQTAGIIAHL 100.00 3e-12
20029844 SVTINQYSDNEIPRDIDDGKASSVI 96.67 3e-12
20029844 APSVTINQYSDNEIPRDIDDGKASSVISRAW 96.67 3e-12
20029844 ASQASAVAQ*TAGIIAHL 100.00 3e-12
20029844 SVTINQYSDNE*IPR 100.00 6e-12
20029844 S*VTINQYSDNEIPR 100.00 6e-12
20029844 APSVTINQYSDNEIPR 96.67 8e-12
20029844 YSVGPALGCAGGGR 96.55 1e-11
20029844 SVTINQYSDNEI*PRDIDDGKASSVISR 100.00 2e-11
20029844 S*VTINQYSDNEIPRDIDDGK 100.00 2e-11
20029844 NSQ*SNNIAAYITAH 100.00 4e-11
20029844 DYVDDTDKSIAILN 96.55 1e-10
20029844 YIAQAASQ*VHV 100.00 2e-10
20029844 AGIIAHLSAGIPGDACAAAN 96.43 2e-10
20029844 SAGIPGDACAAANVINSYTDGVRSGNF 96.43 2e-10
20029844 NVQEILKDM*ASQGDYASQASAVAQ 100.00 2e-10
20029844 P*SVTINQYSDNEIPR 96.43 3e-10
20029844 SVTINQYSDNEIPRDIDDGKASSVISR 96.43 3e-10
20029844 LSAGIPGDACAAANVINSYTDGVR 100.00 3e-10
20029844 DM*ASQGDYASQASAVAQTAGIIAH 100.00 6e-10
20029844 DM*ASQGDYASQASAVAQTAGIIAH 100.00 6e-10
20029844 DM*ASQGDYASQASAVAQTAGIIAH 100.00 6e-10
20029844 DM*ASQGDYASQ*ASAVAQTAGIIAH 100.00 6e-10
31253818 MIKTFVITTDSDGNESIVEEDVLmK 100.00 3e-09
30270257 ALPcVNc 100.00 3e-09
20029844 SVTINQYSDNEIPRDIDDGKASSVISR 100.00 3e-09
20029844 AWDYVDDTD*K 100.00 3e-09
20029844 DIDDGKASSVISR 100.00 3e-09
20029844 ITAHLLPPVAQVF 100.00 4e-09
20029844 AHLLPPVAQ*VF 100.00 4e-09
20029844 ITAHLLPPVAQ*VF 100.00 4e-09
20029844 HQ*SAGSITDLLRGV 100.00 4e-09
20029844 LLPPVAQ*VF 100.00 4e-09
20029844 NLINQLVI*NPGQLRY 100.00 5e-09
20029844 INQLVINPGQLRY 100.00 5e-09
20029844 NLINQ*LVINPGQLRY 100.00 5e-09
20029844 INQLVINPGQLRY 100.00 5e-09
20029844 Q*YSDNEIPRDIDDGKAS 100.00 7e-09
20029844 Q*YSDNEIPRDIDDGKAS 100.00 7e-09
20029844 SIAILNVQEI*LK 100.00 7e-09
20029844 SIAILNVQ*EILK 100.00 7e-09
20029844 YIAQAASQVHV 96.15 7e-09
20029844 LSAGIPGDACAAANVINSYTDGVR 96.00 3e-08
20029844 LSAGIPGDACAAANVINSYTDGVR 96.00 3e-08
20029844 NSQSNNIAAYITAH 100.00 3e-08
20029844 SDNE*IPRDIDDGKASSVISRAW 100.00 1e-07
20029844 AWDYVDDTDKSIAILNVQEILK 95.65 2e-07
20029844 HQSAGSITDLLRGVGNGNDATGL 95.83 2e-07
20029844 HQSAGSITDLLRGVGNGNDATGL 95.83 2e-07
20029844 HQSAGSITDLLRGVGNGNDATGL 95.83 2e-07
20029844 HQSAGSITDLLRGVGNGNDATGL 95.83 2e-07
20029844 LLPPVAQ*VF 95.83 2e-07
20029844 N*VQEILKDMASQGDY 96.00 2e-07
20029844 NVQEILKDM*ASQGDY 96.00 2e-07
20029844 NVQEILKDMASQGD*Y 96.00 2e-07
20029844 SDNEIPRDIDDGKASSVISRAW 95.65 3e-07
20029844 SIAILNVQE*ILK 96.00 3e-07
20029844 DMASQGDYASQASAVAQTAGIIAH 96.00 3e-07
20029844 DMASQGDYASQASAVAQTAGIIAH 96.00 3e-07
20029844 SVTINQYSDNE*IPR 100.00 4e-07
20029844 ITAHLLPPVAQVFHQSAGSITDLLR 100.00 4e-07
20029844 N*SQSNNIAAYITAH 100.00 4e-07
20029844 N*SQSNNIAAYITAH 100.00 4e-07
20029844 IYDFEAAWDAILASSDSSFLNEEYCIVK 95.45 5e-07
20029844 LSAGIPGDACAAAN*VINSYTDGVR 100.00 6e-07
20029844 Q*YSDNEIPRDIDDGKAS 100.00 8e-07
20029844 NVQEILKDMASQGDYASQASAVAQTAGIIAHL 100.00 2e-06
20029844 NEIPRDIDDGKASSVISRAW 100.00 3e-06
20029844 SVGPALGCAGGGRIYDFEAAW 100.00 1e-05
20029844 Q*YSDNEIPRDIDDGKAS 100.00 2e-05
20029844 Q*YSDNEIPRDIDDGKAS 100.00 2e-05
20029844 SAVAQTAGIIAHL 100.00 2e-05
20029844 ASQASAVAQTAGIIAHLSAGIPGDACAAAN 100.00 2e-05
20029844 SAGIPGDACAAANVINSY 100.00 2e-05
20029844 SAGIPGDACAAANVINSY 100.00 2e-05
20029844 SAGIPGDACAAANVIN*SYTDGVRSGNF 100.00 2e-05
20029844 AGFR*QSLGPF 100.00 4e-05
20029844 HQSAGSITDLLR*GVGNGNDATGL 100.00 5e-05
20029844 DLLRGVGN*GNDATGL 100.00 5e-05
20822545 DGLALTLSNDVHGNDGR 100.00 5e-05
20029844 IAQAASQVHV 100.00 8e-05
20029844 IAQAASQVHV 100.00 8e-05
20029844 SVTINQYSDNEIPR*DIDDGKASSVISRAW 100.00 8e-05
20029844 QYSDNEIPRDIDD 100.00 8e-05
20029844 SVTINQYSDNEIPR*DIDDGKASSVISRAW 100.00 8e-05
20029844 IAQAASQVHV 100.00 8e-05
20029844 SVTINQYSDNEIPRDIDDGKASSVISRAW 100.00 8e-05
20029844 VINPGQLRYSVGPALGC 100.00 9e-05
20029844 LLPPVAQVFHQSAGSITDLLR 100.00 1e-04
20029844 GVGN*GNDATGLVANAQR 100.00 1e-04
20029844 GVGN*GNDATGLVANAQR 100.00 1e-04
20029844 WDAILASSDSS*FLN 100.00 2e-04
20029844 WDAILASSDSSF 100.00 2e-04
20029844 RAW*DYVDDTDKSIAI 100.00 3e-04
20029844 SDNE*IPRDIDDGKAS 100.00 3e-04
20029844 SDNEIPRDIDDGKASSVISR 100.00 3e-04
20029844 QYSDNEIPRDIDDGKAS 100.00 3e-04
20029844 QNLNLINQ*L 100.00 4e-04
20029844 VI*NPGQLRYSVGPALGC 100.00 4e-04
20029844 S*VTINQYSDNEIPRDIDDGKASSVISR 100.00 5e-04
20029844 S*VTINQYSDNEIPRDIDDGKASSVISR 100.00 5e-04
20029844 QSLGPFFGHVGQNLNL 100.00 8e-04
20029844 DYVDDTDKSIAIL 100.00 9e-04
20029844 DYVDDTDKSIAILNVQEILKDM*ASQGDY 100.00 9e-04
20029844 NVQEILKDMASQGDYASQASAVAQTA 100.00 0.001
20029844 ANVIN*SYTDGVR 100.00 0.002
20029844 APSVTINQYSDNEIPRDIDDGKASSVISR 100.00 0.002
20029844 IAQAASQ*VHV 100.00 0.003
31253818 AWDYVDDTDK 100.00 0.003
30270257 AWDYVDDTDK 100.00 0.003
20029844 FGHVGQNLNLINQLVINPGQLR 100.00 0.003
20029844 LINQLVINPGQLR 100.00 0.003
20029844 LINQLVINPGQLR 100.00 0.003
20029844 HVGQNLNLINQLVI*NPGQLR 100.00 0.003
31250652 NTYGFNNIEASK 100.00 0.003
20029844 RQSLGPFFGHVGQ*NL 100.00 0.003
20029844 RQSLGPFFGHVGQNL 100.00 0.004
20029844 AGFRQSLGPFFGHVGQNL 100.00 0.004
20029844 AGFR*QSLGPF 100.00 0.004
20029844 AGFR*QSLGPF 100.00 0.004
20029844 NSRNSQSNNIAAY 100.00 0.004
20029844 NSRNSQSNNIAAY 100.00 0.004
20029844 LLPPVAQ 100.00 0.005
20029844 NVQEILKDMASQGDY 100.00 0.005
20029844 DYVDDTDKSIAILNVQEIL 100.00 0.007
20029844 NVQ*EILKDMASQGDY 100.00 0.007
20029844 NVQ*EILKDMASQGDY 100.00 0.007
20029844 SVTINQYSDNE*IPR 100.00 0.008
20029844 YSVGPALGCAGGGR 100.00 0.012
20029844 ASSDSS*FLNEEYCIVK 100.00 0.012
20029844 Q*YSDNEIPRDIDDGKAS 100.00 0.012
20029844 WDAILASSDSS*FLNEEYCIVK 100.00 0.012
20029844 RAW*DYVDDTDKSIAI 100.00 0.012
20029844 IYDFEAAWDAI*LASSDSSFLNEEYCIVK 100.00 0.012
20029844 SSDSS*FLNEEYCIVK 100.00 0.014
Copyright@ 2018-2023    Any Comments and suggestions mail to:zhuzl@cqu.edu.cn   渝ICP备19006517号

渝公网安备 50010602502065号