FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0056, 1533 aa
1>>>pF1KB0056 1533 - 1533 aa - 1533 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 17.4126+/-0.000504; mu= -31.4118+/- 0.031
mean_var=852.4858+/-176.494, 0's: 0 Z-trim(125.9): 197 B-trim: 0 in 0/58
Lambda= 0.043927
statistics sampled from 50388 (50710) to 50388 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.82), E-opt: 0.2 (0.595), width: 16
Scan time: 22.420
The best scores are: opt bits E(85289)
XP_016866763 (OMIM: 142580) PREDICTED: protein PRR (2086) 6038 399.4 1.6e-109
NP_542417 (OMIM: 142580) protein PRRC2A [Homo sapi (2157) 6038 399.4 1.6e-109
NP_004629 (OMIM: 142580) protein PRRC2A [Homo sapi (2157) 6038 399.4 1.6e-109
XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 585 53.8 1.7e-05
XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 585 53.8 1.7e-05
XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 585 53.8 1.7e-05
XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 585 53.8 1.7e-05
XP_011529151 (OMIM: 301050,303630) PREDICTED: coll (1696) 531 50.3 0.00016
XP_016884752 (OMIM: 301050,303630) PREDICTED: coll (1136) 492 47.7 0.00064
NP_203699 (OMIM: 301050,303630) collagen alpha-5(I (1691) 496 48.1 0.00073
NP_000486 (OMIM: 301050,303630) collagen alpha-5(I (1685) 481 47.2 0.0014
XP_016884749 (OMIM: 301050,303630) PREDICTED: coll (1690) 481 47.2 0.0014
XP_016884748 (OMIM: 301050,303630) PREDICTED: coll (1693) 478 47.0 0.0016
XP_011508875 (OMIM: 120190,130000) PREDICTED: coll (1453) 465 46.1 0.0025
NP_000384 (OMIM: 120190,130000) collagen alpha-2(V (1499) 465 46.1 0.0026
NP_002448 (OMIM: 158370) mucin-2 precursor [Homo s (5289) 463 46.4 0.0074
>>XP_016866763 (OMIM: 142580) PREDICTED: protein PRRC2A (2086 aa)
initn: 6788 init1: 5978 opt: 6038 Z-score: 2087.2 bits: 399.4 E(85289): 1.6e-109
Smith-Waterman score: 6158; 63.8% identity (72.2% similar) in 1565 aa overlap (1-1532:1-1454)
10 20 30 40 50 60
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPLESQPLPASQTPASN
::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
XP_016 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPPESQPLPASQTPASN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 TPEKEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TPETEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFR
:::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPP-------
790 800 810 820 830
850 860 870 880 890
pF1KB0 LDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGPPQAPQ-GPSPRPPTRYEPQRV
. : :. ... . . :: :: : :: . . . :: . :: .
XP_016 ---YLASYPGFPENGAPGPPISRFPLEEPG--PRPLPWPPGSDEVAKIQTPPPKKEPPKE
840 850 860 870 880
900 910 920 930 940 950
pF1KB0 NSGLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSG
... . : : .:::: :.: .: ::.:. : : : .:.
XP_016 ETAQLTGP--EAGRKPARGVG-----SGGQGPPPPRRESRT--------ETRWGPRPGSS
890 900 910 920 930
960 970 980 990 1000 1010
pF1KB0 FLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAG
: :: :: : : .: : .: :...: : .:.:. :
XP_016 RRGIPPEEPG--APPRRAG-----P----------IKKPPPPTKVEEL--PPKPLEQ--G
940 950 960 970
1020 1030 1040 1050 1060 1070
pF1KB0 TEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPP-
: . . :. . .:: ... :.:.:. : . .: . .. . :.:
XP_016 DETPKPPKPDPLKITKGKLGGP--KETPPNGNLSPAPR--LRRDYSYERVGPTSCRGRGR
980 990 1000 1010 1020
1080 1090 1100 1110 1120 1130
pF1KB0 GSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQF
: : : : . : . . . : : : : : :.: ::.
XP_016 GEYFARGRGFRGTYGGRGRGARSREFR-----SYREFRGDDGRGGGTGGPNH---PPAPR
1030 1040 1050 1060 1070 1080
1140 1150 1160 1170 1180 1190
pF1KB0 GTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCV
: . :. : .. . :. .:. ... .: :: . :. .: . .
XP_016 GRT--ASETRSEGSEYEEIPKRRRQRGSETGSETHESDLAPSDKEAPTPKEGTLTQVPLA
1090 1100 1110 1120 1130
1200 1210 1220 1230 1240 1250
pF1KB0 PEPSSSGQRLYPEVFYGSAG--------PSSSQISGGAMDSQLHPNSGGFRPGTPSLHPY
: : .. : : . .: :: .:: :. : :. : . :: :
XP_016 PPPPGAPPSPAPARFTARGGRVFTPRGVPSRRGRGGGRPPPQVCP---GWSPPAKSLAP-
1140 1150 1160 1170 1180 1190
1260 1270 1280 1290 1300
pF1KB0 RSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYP----PPSFLYS
..: : :: ::: :: ... ... :. ...: . : ..
XP_016 -KKP---PTGPLPPSKE----PLKEKLIPGPLSPVARGGSNGGSNVGMEDGERPRRRRHG
1200 1210 1220 1230 1240
1310 1320 1330 1340 1350 1360
pF1KB0 PAFCPSPLPD-TSLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLP
: . : : : :.. :. : : ::..::. . : :
XP_016 RAQQQDKPPRFRRLKQERENAARGSE--------GKPSLTLPASAPGPEEALTTV-----
1250 1260 1270 1280 1290
1370 1380 1390 1400 1410 1420
pF1KB0 VVNFGSLPPAPPPAP---PPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPARPFPASLG
.. ::: : : :: : . : . . : . : :
XP_016 -----TVAPAPRRAAAKSPDLSNQNSDQANEEWETASESSDFTSERRGDKEAPP------
1300 1310 1320 1330 1340
1430 1440 1450 1460 1470 1480
pF1KB0 RAELHPVELKPFQDYQKLSSNLGGPGSSRTPP-TGRSFSGLNSRLKATPSTYSGVFRTQR
:: : : : .. :: :.. .: .. : . :..: : : : : .::
XP_016 -----PVLLTP-----KAVGTPGGGGGGAVPGISAMSRGDLSQRAKDL-SKRS--FSSQR
1350 1360 1370 1380
1490 1500 1510 1520
pF1KB0 VDLYQQASPPDALRWIPKPWERTG-----PPPREGPSRRAEE----PGSRG----DKEPG
. .: : . .: : : ::.: .. : .:. .. ::
XP_016 PGMERQNRRPGPGGKAGSSGSSSGGGGGGPGGRTGPGRGDKRSWPSPKNRSRPPEERPPG
1390 1400 1410 1420 1430 1440
1530
pF1KB0 LP-PPR
:: ::
XP_016 LPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGLPQAPQG
1450 1460 1470 1480 1490 1500
>--
initn: 3689 init1: 3689 opt: 3709 Z-score: 1289.6 bits: 251.8 E(85289): 4.3e-65
Smith-Waterman score: 4306; 89.6% identity (89.8% similar) in 703 aa overlap (831-1533:1455-2086)
810 820 830 840 850 860
pF1KB0 AEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
::::::::::::::::::::::::::::::
XP_016 PGRGDKRSWPSPKNRSRPPEERPPGLPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
1430 1440 1450 1460 1470 1480
870 880 890 900 910 920
pF1KB0 SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
:::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
XP_016 SRQGSVTAPGGHPRHKPGLPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
1490 1500 1510 1520 1530 1540
930 940 950 960 970 980
pF1KB0 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
1550 1560 1570 1580 1590 1600
990 1000 1010 1020 1030 1040
pF1KB0 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
1610 1620 1630 1640 1650 1660
1050 1060 1070 1080 1090 1100
pF1KB0 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
1670 1680 1690 1700 1710 1720
1110 1120 1130 1140 1150 1160
pF1KB0 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
1730 1740 1750 1760 1770 1780
1170 1180 1190 1200 1210 1220
pF1KB0 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
1790 1800 1810 1820 1830 1840
1230 1240 1250 1260 1270 1280
pF1KB0 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDF
::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
XP_016 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGLALKGQFLDF
1850 1860 1870 1880 1890 1900
1290 1300 1310 1320 1330 1340
pF1KB0 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
1910 1920 1930 1940 1950 1960
1350 1360 1370 1380 1390 1400
pF1KB0 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
::::::::::::::
XP_016 GQSGFLPSGAPAQQ----------------------------------------------
1970
1410 1420 1430 1440 1450 1460
pF1KB0 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
:::::::::::::::::::::::::::::::::::
XP_016 -------------------------LHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
1980 1990 2000 2010
1470 1480 1490 1500 1510 1520
pF1KB0 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
2020 2030 2040 2050 2060 2070
1530
pF1KB0 SRGDKEPGLPPPR
:::::::::::::
XP_016 SRGDKEPGLPPPR
2080
>>NP_542417 (OMIM: 142580) protein PRRC2A [Homo sapiens] (2157 aa)
initn: 6028 init1: 5978 opt: 6038 Z-score: 2087.0 bits: 399.4 E(85289): 1.6e-109
Smith-Waterman score: 6158; 63.8% identity (72.2% similar) in 1565 aa overlap (1-1532:1-1454)
10 20 30 40 50 60
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPLESQPLPASQTPASN
::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
NP_542 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPPESQPLPASQTPASN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 TPEKEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 TPETEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFR
:::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPP-------
790 800 810 820 830
850 860 870 880 890
pF1KB0 LDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGPPQAPQ-GPSPRPPTRYEPQRV
. : :. ... . . :: :: : :: . . . :: . :: .
NP_542 ---YLASYPGFPENGAPGPPISRFPLEEPG--PRPLPWPPGSDEVAKIQTPPPKKEPPKE
840 850 860 870 880
900 910 920 930 940 950
pF1KB0 NSGLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSG
... . : : .:::: :.: .: ::.:. : : : .:.
NP_542 ETAQLTGP--EAGRKPARGVG-----SGGQGPPPPRRESRT--------ETRWGPRPGSS
890 900 910 920 930
960 970 980 990 1000 1010
pF1KB0 FLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAG
: :: :: : : .: : .: :...: : .:.:. :
NP_542 RRGIPPEEPG--APPRRAG-----P----------IKKPPPPTKVEEL--PPKPLEQ--G
940 950 960 970
1020 1030 1040 1050 1060 1070
pF1KB0 TEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPP-
: . . :. . .:: ... :.:.:. : . .: . .. . :.:
NP_542 DETPKPPKPDPLKITKGKLGGP--KETPPNGNLSPAPR--LRRDYSYERVGPTSCRGRGR
980 990 1000 1010 1020
1080 1090 1100 1110 1120 1130
pF1KB0 GSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQF
: : : : . : . . . : : : : : :.: ::.
NP_542 GEYFARGRGFRGTYGGRGRGARSREFR-----SYREFRGDDGRGGGTGGPNH---PPAPR
1030 1040 1050 1060 1070 1080
1140 1150 1160 1170 1180 1190
pF1KB0 GTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCV
: . :. : .. . :. .:. ... .: :: . :. .: . .
NP_542 GRT--ASETRSEGSEYEEIPKRRRQRGSETGSETHESDLAPSDKEAPTPKEGTLTQVPLA
1090 1100 1110 1120 1130
1200 1210 1220 1230 1240 1250
pF1KB0 PEPSSSGQRLYPEVFYGSAG--------PSSSQISGGAMDSQLHPNSGGFRPGTPSLHPY
: : .. : : . .: :: .:: :. : :. : . :: :
NP_542 PPPPGAPPSPAPARFTARGGRVFTPRGVPSRRGRGGGRPPPQVCP---GWSPPAKSLAP-
1140 1150 1160 1170 1180 1190
1260 1270 1280 1290 1300
pF1KB0 RSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYP----PPSFLYS
..: : :: ::: :: ... ... :. ...: . : ..
NP_542 -KKP---PTGPLPPSKE----PLKEKLIPGPLSPVARGGSNGGSNVGMEDGERPRRRRHG
1200 1210 1220 1230 1240
1310 1320 1330 1340 1350 1360
pF1KB0 PAFCPSPLPD-TSLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLP
: . : : : :.. :. : : ::..::. . : :
NP_542 RAQQQDKPPRFRRLKQERENAARGSE--------GKPSLTLPASAPGPEEALTTV-----
1250 1260 1270 1280 1290
1370 1380 1390 1400 1410 1420
pF1KB0 VVNFGSLPPAPPPAP---PPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPARPFPASLG
.. ::: : : :: : . : . . : . : :
NP_542 -----TVAPAPRRAAAKSPDLSNQNSDQANEEWETASESSDFTSERRGDKEAPP------
1300 1310 1320 1330 1340
1430 1440 1450 1460 1470 1480
pF1KB0 RAELHPVELKPFQDYQKLSSNLGGPGSSRTPP-TGRSFSGLNSRLKATPSTYSGVFRTQR
:: : : : .. :: :.. .: .. : . :..: : : : : .::
NP_542 -----PVLLTP-----KAVGTPGGGGGGAVPGISAMSRGDLSQRAKDL-SKRS--FSSQR
1350 1360 1370 1380
1490 1500 1510 1520
pF1KB0 VDLYQQASPPDALRWIPKPWERTG-----PPPREGPSRRAEE----PGSRG----DKEPG
. .: : . .: : : ::.: .. : .:. .. ::
NP_542 PGMERQNRRPGPGGKAGSSGSSSGGGGGGPGGRTGPGRGDKRSWPSPKNRSRPPEERPPG
1390 1400 1410 1420 1430 1440
1530
pF1KB0 LP-PPR
:: ::
NP_542 LPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGLPQAPQG
1450 1460 1470 1480 1490 1500
>--
initn: 4960 init1: 4960 opt: 4960 Z-score: 1717.8 bits: 331.1 E(85289): 6.1e-89
Smith-Waterman score: 4960; 99.7% identity (99.9% similar) in 703 aa overlap (831-1533:1455-2157)
810 820 830 840 850 860
pF1KB0 AEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
::::::::::::::::::::::::::::::
NP_542 PGRGDKRSWPSPKNRSRPPEERPPGLPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
1430 1440 1450 1460 1470 1480
870 880 890 900 910 920
pF1KB0 SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
:::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
NP_542 SRQGSVTAPGGHPRHKPGLPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
1490 1500 1510 1520 1530 1540
930 940 950 960 970 980
pF1KB0 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
1550 1560 1570 1580 1590 1600
990 1000 1010 1020 1030 1040
pF1KB0 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
1610 1620 1630 1640 1650 1660
1050 1060 1070 1080 1090 1100
pF1KB0 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
1670 1680 1690 1700 1710 1720
1110 1120 1130 1140 1150 1160
pF1KB0 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
1730 1740 1750 1760 1770 1780
1170 1180 1190 1200 1210 1220
pF1KB0 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
1790 1800 1810 1820 1830 1840
1230 1240 1250 1260 1270 1280
pF1KB0 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDF
::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
NP_542 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGLALKGQFLDF
1850 1860 1870 1880 1890 1900
1290 1300 1310 1320 1330 1340
pF1KB0 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
1910 1920 1930 1940 1950 1960
1350 1360 1370 1380 1390 1400
pF1KB0 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
1970 1980 1990 2000 2010 2020
1410 1420 1430 1440 1450 1460
pF1KB0 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
2030 2040 2050 2060 2070 2080
1470 1480 1490 1500 1510 1520
pF1KB0 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
2090 2100 2110 2120 2130 2140
1530
pF1KB0 SRGDKEPGLPPPR
:::::::::::::
NP_542 SRGDKEPGLPPPR
2150
>>NP_004629 (OMIM: 142580) protein PRRC2A [Homo sapiens] (2157 aa)
initn: 6028 init1: 5978 opt: 6038 Z-score: 2087.0 bits: 399.4 E(85289): 1.6e-109
Smith-Waterman score: 6158; 63.8% identity (72.2% similar) in 1565 aa overlap (1-1532:1-1454)
10 20 30 40 50 60
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPLESQPLPASQTPASN
::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
NP_004 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPPESQPLPASQTPASN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 TPEKEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 TPETEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFR
:::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPP-------
790 800 810 820 830
850 860 870 880 890
pF1KB0 LDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGPPQAPQ-GPSPRPPTRYEPQRV
. : :. ... . . :: :: : :: . . . :: . :: .
NP_004 ---YLASYPGFPENGAPGPPISRFPLEEPG--PRPLPWPPGSDEVAKIQTPPPKKEPPKE
840 850 860 870 880
900 910 920 930 940 950
pF1KB0 NSGLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSG
... . : : .:::: :.: .: ::.:. : : : .:.
NP_004 ETAQLTGP--EAGRKPARGVG-----SGGQGPPPPRRESRT--------ETRWGPRPGSS
890 900 910 920 930
960 970 980 990 1000 1010
pF1KB0 FLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAG
: :: :: : : .: : .: :...: : .:.:. :
NP_004 RRGIPPEEPG--APPRRAG-----P----------IKKPPPPTKVEEL--PPKPLEQ--G
940 950 960 970
1020 1030 1040 1050 1060 1070
pF1KB0 TEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPP-
: . . :. . .:: ... :.:.:. : . .: . .. . :.:
NP_004 DETPKPPKPDPLKITKGKLGGP--KETPPNGNLSPAPR--LRRDYSYERVGPTSCRGRGR
980 990 1000 1010 1020
1080 1090 1100 1110 1120 1130
pF1KB0 GSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQF
: : : : . : . . . : : : : : :.: ::.
NP_004 GEYFARGRGFRGTYGGRGRGARSREFR-----SYREFRGDDGRGGGTGGPNH---PPAPR
1030 1040 1050 1060 1070 1080
1140 1150 1160 1170 1180 1190
pF1KB0 GTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCV
: . :. : .. . :. .:. ... .: :: . :. .: . .
NP_004 GRT--ASETRSEGSEYEEIPKRRRQRGSETGSETHESDLAPSDKEAPTPKEGTLTQVPLA
1090 1100 1110 1120 1130
1200 1210 1220 1230 1240 1250
pF1KB0 PEPSSSGQRLYPEVFYGSAG--------PSSSQISGGAMDSQLHPNSGGFRPGTPSLHPY
: : .. : : . .: :: .:: :. : :. : . :: :
NP_004 PPPPGAPPSPAPARFTARGGRVFTPRGVPSRRGRGGGRPPPQVCP---GWSPPAKSLAP-
1140 1150 1160 1170 1180 1190
1260 1270 1280 1290 1300
pF1KB0 RSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYP----PPSFLYS
..: : :: ::: :: ... ... :. ...: . : ..
NP_004 -KKP---PTGPLPPSKE----PLKEKLIPGPLSPVARGGSNGGSNVGMEDGERPRRRRHG
1200 1210 1220 1230 1240
1310 1320 1330 1340 1350 1360
pF1KB0 PAFCPSPLPD-TSLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLP
: . : : : :.. :. : : ::..::. . : :
NP_004 RAQQQDKPPRFRRLKQERENAARGSE--------GKPSLTLPASAPGPEEALTTV-----
1250 1260 1270 1280 1290
1370 1380 1390 1400 1410 1420
pF1KB0 VVNFGSLPPAPPPAP---PPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPARPFPASLG
.. ::: : : :: : . : . . : . : :
NP_004 -----TVAPAPRRAAAKSPDLSNQNSDQANEEWETASESSDFTSERRGDKEAPP------
1300 1310 1320 1330 1340
1430 1440 1450 1460 1470 1480
pF1KB0 RAELHPVELKPFQDYQKLSSNLGGPGSSRTPP-TGRSFSGLNSRLKATPSTYSGVFRTQR
:: : : : .. :: :.. .: .. : . :..: : : : : .::
NP_004 -----PVLLTP-----KAVGTPGGGGGGAVPGISAMSRGDLSQRAKDL-SKRS--FSSQR
1350 1360 1370 1380
1490 1500 1510 1520
pF1KB0 VDLYQQASPPDALRWIPKPWERTG-----PPPREGPSRRAEE----PGSRG----DKEPG
. .: : . .: : : ::.: .. : .:. .. ::
NP_004 PGMERQNRRPGPGGKAGSSGSSSGGGGGGPGGRTGPGRGDKRSWPSPKNRSRPPEERPPG
1390 1400 1410 1420 1430 1440
1530
pF1KB0 LP-PPR
:: ::
NP_004 LPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGLPQAPQG
1450 1460 1470 1480 1490 1500
>--
initn: 4960 init1: 4960 opt: 4960 Z-score: 1717.8 bits: 331.1 E(85289): 6.1e-89
Smith-Waterman score: 4960; 99.7% identity (99.9% similar) in 703 aa overlap (831-1533:1455-2157)
810 820 830 840 850 860
pF1KB0 AEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
::::::::::::::::::::::::::::::
NP_004 PGRGDKRSWPSPKNRSRPPEERPPGLPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
1430 1440 1450 1460 1470 1480
870 880 890 900 910 920
pF1KB0 SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
:::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
NP_004 SRQGSVTAPGGHPRHKPGLPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
1490 1500 1510 1520 1530 1540
930 940 950 960 970 980
pF1KB0 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
1550 1560 1570 1580 1590 1600
990 1000 1010 1020 1030 1040
pF1KB0 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
1610 1620 1630 1640 1650 1660
1050 1060 1070 1080 1090 1100
pF1KB0 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
1670 1680 1690 1700 1710 1720
1110 1120 1130 1140 1150 1160
pF1KB0 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
1730 1740 1750 1760 1770 1780
1170 1180 1190 1200 1210 1220
pF1KB0 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
1790 1800 1810 1820 1830 1840
1230 1240 1250 1260 1270 1280
pF1KB0 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDF
::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
NP_004 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGLALKGQFLDF
1850 1860 1870 1880 1890 1900
1290 1300 1310 1320 1330 1340
pF1KB0 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
1910 1920 1930 1940 1950 1960
1350 1360 1370 1380 1390 1400
pF1KB0 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
1970 1980 1990 2000 2010 2020
1410 1420 1430 1440 1450 1460
pF1KB0 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
2030 2040 2050 2060 2070 2080
1470 1480 1490 1500 1510 1520
pF1KB0 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
2090 2100 2110 2120 2130 2140
1530
pF1KB0 SRGDKEPGLPPPR
:::::::::::::
NP_004 SRGDKEPGLPPPR
2150
>>XP_011536691 (OMIM: 601234) PREDICTED: nascent polypep (2078 aa)
initn: 244 init1: 149 opt: 585 Z-score: 219.6 bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)
10 20 30 40 50
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
..: .:: .:: . .:: . :.
XP_011 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
450 460 470 480 490 500
60 70 80 90 100 110
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
: ::. :. : :. :: : :: .. : . . ..:. . . ::
XP_011 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
510 520 530 540 550 560
120 130 140 150 160
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
:. .:.: . ..:: :: : . . :. :. : :. :::. : .
XP_011 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
570 580 590 600 610
170 180 190 200 210 220
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
: . : . :: :.:. .:. . : . : .:. : .: .: .: ..
XP_011 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
620 630 640 650 660 670
230 240 250 260 270
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
. : .: . : .: . . : : : : . .: .:.
XP_011 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
680 690 700 710 720 730
280 290 300 310 320 330
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
:. : . : :. : . :. ... : : .. :: : .:: ..
XP_011 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
740 750 760 770 780
340 350 360 370 380 390
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
: . .: . : : .. .::: :. : ..: .. .: . .:
XP_011 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
790 800 810 820 830
400 410 420 430 440
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
.: :: .. .: . . : :: .: :. . : . :: . :.:
XP_011 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
840 850 860 870 880
450 460 470 480 490 500
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
: ..: . : . .. :. ..: :. .:
XP_011 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
890 900 910 920
510 520 530 540 550 560
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
:: : . :..:.: : :.:: :. :.:. : : : .::: . :.:
XP_011 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
930 940 950 960 970
570 580 590 600 610 620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
: :.:. .:. . ... : ...:. :. : : .: :: .:: : :. :::
XP_011 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
980 990 1000 1010 1020 1030
630 640 650 660 670
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
. :. ::: : : . : :. : . . .:. :::
XP_011 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
1040 1050 1060 1070 1080
680 690 700 710 720
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
.::.: :.:.:.. : :: : : :.:. :: : : : ::
XP_011 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
730 740 750 760 770 780
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
: . :: : :: :. . : .:: .. : . ::. .::
XP_011 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
1150 1160 1170 1180 1190 1200
790 800 810 820 830 840
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
: .:: . . ..:. : :: : . :: . :: . :: :... .
XP_011 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
1210 1220 1230 1240 1250 1260
850 860 870 880 890 900
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
. . ::. .: .:....: : :: .: : . :::. : .
XP_011 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
1270 1280 1290 1300
910 920 930 940 950 960
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
: . : :.: .: ::: .. .: :: :. : . : ...
XP_011 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
1310 1320 1330 1340 1350 1360
970 980 990 1000 1010 1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
:. ::: : : . : :.:: .: . : :. :.: : . :::: . . .:
XP_011 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
1370 1380 1390 1400 1410
1030 1040 1050 1060 1070
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
... ... .:: . . : : ...: .: .: : :. :. ..: ::.
XP_011 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
1420 1430 1440 1450 1460 1470
1080 1090 1100 1110 1120 1130
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
:..:: ::.. . :.. : :.:.:. . . . : :: : : .
XP_011 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
1480 1490 1500 1510 1520 1530
1140 1150 1160 1170 1180 1190
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
.: .: . :. ..: . : : :::. .. ::. .. : . . ..
XP_011 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
1540 1550 1560 1570 1580 1590
1200 1210 1220 1230 1240 1250
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
. .: :. . : : . ..:: .. . :..: : :::. :
XP_011 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
1600 1610 1620 1630 1640
1260 1270 1280 1290
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
. : : .:: :.: . : :: . : . ..: . :.
XP_011 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
1650 1660 1670 1680 1690 1700
1300 1310 1320 1330 1340 1350
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
: :: .::.: . : . :: .: :. : ... :.:
XP_011 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
1710 1720 1730 1740 1750 1760
1360 1370 1380 1390 1400
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
: .. :.. .. :: . .:. :: ::. ::. :: :.: : . . :
XP_011 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
1770 1780 1790 1800 1810
1410 1420 1430 1440 1450
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
.:. :: ::..:. : . :: : . .:.. .:.. :. : :. : :..
XP_011 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
1820 1830 1840 1850 1860 1870
1460 1470 1480 1490 1500 1510
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
.. :.. ..: :
XP_011 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
1880 1890 1900 1910 1920 1930
>>XP_006719475 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 244 init1: 149 opt: 585 Z-score: 219.6 bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)
10 20 30 40 50
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
..: .:: .:: . .:: . :.
XP_006 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
450 460 470 480 490 500
60 70 80 90 100 110
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
: ::. :. : :. :: : :: .. : . . ..:. . . ::
XP_006 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
510 520 530 540 550 560
120 130 140 150 160
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
:. .:.: . ..:: :: : . . :. :. : :. :::. : .
XP_006 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
570 580 590 600 610
170 180 190 200 210 220
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
: . : . :: :.:. .:. . : . : .:. : .: .: .: ..
XP_006 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
620 630 640 650 660 670
230 240 250 260 270
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
. : .: . : .: . . : : : : . .: .:.
XP_006 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
680 690 700 710 720 730
280 290 300 310 320 330
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
:. : . : :. : . :. ... : : .. :: : .:: ..
XP_006 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
740 750 760 770 780
340 350 360 370 380 390
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
: . .: . : : .. .::: :. : ..: .. .: . .:
XP_006 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
790 800 810 820 830
400 410 420 430 440
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
.: :: .. .: . . : :: .: :. . : . :: . :.:
XP_006 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
840 850 860 870 880
450 460 470 480 490 500
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
: ..: . : . .. :. ..: :. .:
XP_006 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
890 900 910 920
510 520 530 540 550 560
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
:: : . :..:.: : :.:: :. :.:. : : : .::: . :.:
XP_006 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
930 940 950 960 970
570 580 590 600 610 620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
: :.:. .:. . ... : ...:. :. : : .: :: .:: : :. :::
XP_006 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
980 990 1000 1010 1020 1030
630 640 650 660 670
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
. :. ::: : : . : :. : . . .:. :::
XP_006 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
1040 1050 1060 1070 1080
680 690 700 710 720
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
.::.: :.:.:.. : :: : : :.:. :: : : : ::
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
730 740 750 760 770 780
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
: . :: : :: :. . : .:: .. : . ::. .::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
1150 1160 1170 1180 1190 1200
790 800 810 820 830 840
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
: .:: . . ..:. : :: : . :: . :: . :: :... .
XP_006 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
1210 1220 1230 1240 1250 1260
850 860 870 880 890 900
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
. . ::. .: .:....: : :: .: : . :::. : .
XP_006 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
1270 1280 1290 1300
910 920 930 940 950 960
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
: . : :.: .: ::: .. .: :: :. : . : ...
XP_006 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
1310 1320 1330 1340 1350 1360
970 980 990 1000 1010 1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
:. ::: : : . : :.:: .: . : :. :.: : . :::: . . .:
XP_006 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
1370 1380 1390 1400 1410
1030 1040 1050 1060 1070
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
... ... .:: . . : : ...: .: .: : :. :. ..: ::.
XP_006 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
1420 1430 1440 1450 1460 1470
1080 1090 1100 1110 1120 1130
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
:..:: ::.. . :.. : :.:.:. . . . : :: : : .
XP_006 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
1480 1490 1500 1510 1520 1530
1140 1150 1160 1170 1180 1190
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
.: .: . :. ..: . : : :::. .. ::. .. : . . ..
XP_006 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
1540 1550 1560 1570 1580 1590
1200 1210 1220 1230 1240 1250
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
. .: :. . : : . ..:: .. . :..: : :::. :
XP_006 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
1600 1610 1620 1630 1640
1260 1270 1280 1290
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
. : : .:: :.: . : :: . : . ..: . :.
XP_006 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
1650 1660 1670 1680 1690 1700
1300 1310 1320 1330 1340 1350
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
: :: .::.: . : . :: .: :. : ... :.:
XP_006 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
1710 1720 1730 1740 1750 1760
1360 1370 1380 1390 1400
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
: .. :.. .. :: . .:. :: ::. ::. :: :.: : . . :
XP_006 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
1770 1780 1790 1800 1810
1410 1420 1430 1440 1450
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
.:. :: ::..:. : . :: : . .:.. .:.. :. : :. : :..
XP_006 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
1820 1830 1840 1850 1860 1870
1460 1470 1480 1490 1500 1510
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
.. :.. ..: :
XP_006 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
1880 1890 1900 1910 1920 1930
>>XP_006719476 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 244 init1: 149 opt: 585 Z-score: 219.6 bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)
10 20 30 40 50
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
..: .:: .:: . .:: . :.
XP_006 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
450 460 470 480 490 500
60 70 80 90 100 110
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
: ::. :. : :. :: : :: .. : . . ..:. . . ::
XP_006 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
510 520 530 540 550 560
120 130 140 150 160
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
:. .:.: . ..:: :: : . . :. :. : :. :::. : .
XP_006 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
570 580 590 600 610
170 180 190 200 210 220
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
: . : . :: :.:. .:. . : . : .:. : .: .: .: ..
XP_006 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
620 630 640 650 660 670
230 240 250 260 270
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
. : .: . : .: . . : : : : . .: .:.
XP_006 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
680 690 700 710 720 730
280 290 300 310 320 330
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
:. : . : :. : . :. ... : : .. :: : .:: ..
XP_006 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
740 750 760 770 780
340 350 360 370 380 390
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
: . .: . : : .. .::: :. : ..: .. .: . .:
XP_006 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
790 800 810 820 830
400 410 420 430 440
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
.: :: .. .: . . : :: .: :. . : . :: . :.:
XP_006 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
840 850 860 870 880
450 460 470 480 490 500
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
: ..: . : . .. :. ..: :. .:
XP_006 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
890 900 910 920
510 520 530 540 550 560
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
:: : . :..:.: : :.:: :. :.:. : : : .::: . :.:
XP_006 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
930 940 950 960 970
570 580 590 600 610 620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
: :.:. .:. . ... : ...:. :. : : .: :: .:: : :. :::
XP_006 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
980 990 1000 1010 1020 1030
630 640 650 660 670
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
. :. ::: : : . : :. : . . .:. :::
XP_006 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
1040 1050 1060 1070 1080
680 690 700 710 720
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
.::.: :.:.:.. : :: : : :.:. :: : : : ::
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
730 740 750 760 770 780
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
: . :: : :: :. . : .:: .. : . ::. .::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
1150 1160 1170 1180 1190 1200
790 800 810 820 830 840
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
: .:: . . ..:. : :: : . :: . :: . :: :... .
XP_006 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
1210 1220 1230 1240 1250 1260
850 860 870 880 890 900
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
. . ::. .: .:....: : :: .: : . :::. : .
XP_006 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
1270 1280 1290 1300
910 920 930 940 950 960
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
: . : :.: .: ::: .. .: :: :. : . : ...
XP_006 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
1310 1320 1330 1340 1350 1360
970 980 990 1000 1010 1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
:. ::: : : . : :.:: .: . : :. :.: : . :::: . . .:
XP_006 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
1370 1380 1390 1400 1410
1030 1040 1050 1060 1070
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
... ... .:: . . : : ...: .: .: : :. :. ..: ::.
XP_006 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
1420 1430 1440 1450 1460 1470
1080 1090 1100 1110 1120 1130
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
:..:: ::.. . :.. : :.:.:. . . . : :: : : .
XP_006 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
1480 1490 1500 1510 1520 1530
1140 1150 1160 1170 1180 1190
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
.: .: . :. ..: . : : :::. .. ::. .. : . . ..
XP_006 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
1540 1550 1560 1570 1580 1590
1200 1210 1220 1230 1240 1250
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
. .: :. . : : . ..:: .. . :..: : :::. :
XP_006 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
1600 1610 1620 1630 1640
1260 1270 1280 1290
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
. : : .:: :.: . : :: . : . ..: . :.
XP_006 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
1650 1660 1670 1680 1690 1700
1300 1310 1320 1330 1340 1350
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
: :: .::.: . : . :: .: :. : ... :.:
XP_006 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
1710 1720 1730 1740 1750 1760
1360 1370 1380 1390 1400
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
: .. :.. .. :: . .:. :: ::. ::. :: :.: : . . :
XP_006 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
1770 1780 1790 1800 1810
1410 1420 1430 1440 1450
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
.:. :: ::..:. : . :: : . .:.. .:.. :. : :. : :..
XP_006 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
1820 1830 1840 1850 1860 1870
1460 1470 1480 1490 1500 1510
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
.. :.. ..: :
XP_006 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
1880 1890 1900 1910 1920 1930
>>XP_006719477 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 244 init1: 149 opt: 585 Z-score: 219.6 bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)
10 20 30 40 50
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
..: .:: .:: . .:: . :.
XP_006 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
450 460 470 480 490 500
60 70 80 90 100 110
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
: ::. :. : :. :: : :: .. : . . ..:. . . ::
XP_006 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
510 520 530 540 550 560
120 130 140 150 160
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
:. .:.: . ..:: :: : . . :. :. : :. :::. : .
XP_006 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
570 580 590 600 610
170 180 190 200 210 220
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
: . : . :: :.:. .:. . : . : .:. : .: .: .: ..
XP_006 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
620 630 640 650 660 670
230 240 250 260 270
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
. : .: . : .: . . : : : : . .: .:.
XP_006 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
680 690 700 710 720 730
280 290 300 310 320 330
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
:. : . : :. : . :. ... : : .. :: : .:: ..
XP_006 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
740 750 760 770 780
340 350 360 370 380 390
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
: . .: . : : .. .::: :. : ..: .. .: . .:
XP_006 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
790 800 810 820 830
400 410 420 430 440
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
.: :: .. .: . . : :: .: :. . : . :: . :.:
XP_006 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
840 850 860 870 880
450 460 470 480 490 500
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
: ..: . : . .. :. ..: :. .:
XP_006 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
890 900 910 920
510 520 530 540 550 560
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
:: : . :..:.: : :.:: :. :.:. : : : .::: . :.:
XP_006 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
930 940 950 960 970
570 580 590 600 610 620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
: :.:. .:. . ... : ...:. :. : : .: :: .:: : :. :::
XP_006 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
980 990 1000 1010 1020 1030
630 640 650 660 670
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
. :. ::: : : . : :. : . . .:. :::
XP_006 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
1040 1050 1060 1070 1080
680 690 700 710 720
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
.::.: :.:.:.. : :: : : :.:. :: : : : ::
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
730 740 750 760 770 780
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
: . :: : :: :. . : .:: .. : . ::. .::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
1150 1160 1170 1180 1190 1200
790 800 810 820 830 840
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
: .:: . . ..:. : :: : . :: . :: . :: :... .
XP_006 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
1210 1220 1230 1240 1250 1260
850 860 870 880 890 900
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
. . ::. .: .:....: : :: .: : . :::. : .
XP_006 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
1270 1280 1290 1300
910 920 930 940 950 960
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
: . : :.: .: ::: .. .: :: :. : . : ...
XP_006 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
1310 1320 1330 1340 1350 1360
970 980 990 1000 1010 1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
:. ::: : : . : :.:: .: . : :. :.: : . :::: . . .:
XP_006 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
1370 1380 1390 1400 1410
1030 1040 1050 1060 1070
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
... ... .:: . . : : ...: .: .: : :. :. ..: ::.
XP_006 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
1420 1430 1440 1450 1460 1470
1080 1090 1100 1110 1120 1130
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
:..:: ::.. . :.. : :.:.:. . . . : :: : : .
XP_006 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
1480 1490 1500 1510 1520 1530
1140 1150 1160 1170 1180 1190
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
.: .: . :. ..: . : : :::. .. ::. .. : . . ..
XP_006 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
1540 1550 1560 1570 1580 1590
1200 1210 1220 1230 1240 1250
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
. .: :. . : : . ..:: .. . :..: : :::. :
XP_006 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
1600 1610 1620 1630 1640
1260 1270 1280 1290
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
. : : .:: :.: . : :: . : . ..: . :.
XP_006 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
1650 1660 1670 1680 1690 1700
1300 1310 1320 1330 1340 1350
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
: :: .::.: . : . :: .: :. : ... :.:
XP_006 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
1710 1720 1730 1740 1750 1760
1360 1370 1380 1390 1400
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
: .. :.. .. :: . .:. :: ::. ::. :: :.: : . . :
XP_006 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
1770 1780 1790 1800 1810
1410 1420 1430 1440 1450
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
.:. :: ::..:. : . :: : . .:.. .:.. :. : :. : :..
XP_006 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
1820 1830 1840 1850 1860 1870
1460 1470 1480 1490 1500 1510
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
.. :.. ..: :
XP_006 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
1880 1890 1900 1910 1920 1930
>>XP_011529151 (OMIM: 301050,303630) PREDICTED: collagen (1696 aa)
initn: 260 init1: 93 opt: 531 Z-score: 202.3 bits: 50.3 E(85289): 0.00016
Smith-Waterman score: 711; 25.5% identity (42.8% similar) in 1460 aa overlap (57-1405:211-1488)
30 40 50 60 70 80
pF1KB0 KGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPANLPSLKAENKGNDPNVSLVPKDGTGW
: : .::. ::: :: :
XP_011 PGPPGIQGLPGPTGIPGPIGPPGPPGLMGPPGPPGLPG----PKGNMGLNFQGPKGEKGE
190 200 210 220 230
90 100 110 120 130 140
pF1KB0 ASKQEQSDPKSSDASTAQPLESQPLPASQ-TPASNQPKRPPAAPENTPLVPSGVKSWAQA
. : : .. . .:.. . ..: :.. : ::. .. : :.: :.
XP_011 QGLQGPPGPPGQISEQKRPIDVEFQKGDQGLPGDRGPPGPPGI-RGPPGPPGGEKGEKGE
240 250 260 270 280 290
150 160 170 180 190
pF1KB0 SVTHGAHGDGGRASSLLSRFSREEFPTLQA-AGDQDKAAKERESAEQS-SGP-GPSL---
. : .: :. . . .. .: : . : . ... :..... .:: ::
XP_011 QGEPGKRGKPGKDG----ENGQPGIPGLPGDPGYPGEPGRDGEKGQKGDTGPPGPPGLVI
300 310 320 330 340 350
200 210 220 230 240
pF1KB0 -RPQNSTTWRDGGGRGPDELEG-------PDSKLHHG-HDPRGG--LQPSGPPQFPPYRG
:: .. : . :. : : : : . : : :. . : ::: :: ::
XP_011 PRPGTGITIGEKGNIGLPGLPGEKGERGFPGIQGPPGLPGPPGAAVMGPPGPPGFPGERG
360 370 380 390 400 410
250 260 270 280 290
pF1KB0 MM----PPFMY---PPYL---P----FPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPP
. :: . :: : : .: : :: ::. : : . : :: :: :
XP_011 QKGDEGPPGISIPGPPGLDGQPGAPGLPGPPGPAGPH-IPPSDEICE-PGPPGPPGS-PG
420 430 440 450 460
300 310 320 330 340 350
pF1KB0 MRLVEPVGRPSILKEDNLKEFDQLDQ--ENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDE
. .. :. .. . . :. . . : : .: : .. .. .
XP_011 DKGLQ--GEQGVKGDKGDTCFNCIGTGISGPPGQPGLPGLPGPPGSLGFPGQKG--EKGQ
470 480 490 500 510 520
360 370 380 390 400
pF1KB0 EGAEGHRDSQSASGEERPPEADGKKGNSPNSEP-PTPKTAWAETSRP--PETE--PGPPA
:: : . . : : :.::. . : : .: . : : :: :.
XP_011 AGATGPKGLPGIPGAPGAPGFPGSKGEPGDILTFPGMKGDKGELGSPGAPGLPGLPGTPG
530 540 550 560 570 580
410 420 430 440 450
pF1KB0 PK--PPLPPPH-----------RGPAGNWGPPGDYPDRG--GPP-CKPPAPEDEDEAWRQ
: :: :. ::: :: : :: . : ::: ::.: : :
XP_011 QDGLPGLPGPKGEPGGITFKGERGPPGNPGLPGLPGNIGPMGPPGFGPPGPVGEKGI--Q
590 600 610 620 630 640
460 470 480 490 500 510
pF1KB0 RRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAP-DKRLKAEPAA
. .. .. .. . . . . . . . : : : : : : ..:.
XP_011 GVAGNPGQPGIPGPKG-----DPGQTITQPGKPGLPGNPGR-DGDVGLPGDPGLPGQPGL
650 660 670 680 690
520 530 540 550 560
pF1KB0 P--------PAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEPAQAPPAQSTPTPG
: :. :. : : :: .:. :.:: : . :: . : .::. ::
XP_011 PGIPGSKGEPGIPGIGLPGPPGPKGFPGIPGPPGAPG-TPGRIGLEGPPGPPG----FPG
700 710 720 730 740 750
570 580 590 600 610
pF1KB0 VAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPPPTTPP-------VPK
. : .. : . : : . . ::. . : : :: .:
XP_011 PKGEPGFALPGPP----------GPPGLPGFKGALGPKGDRGFPGPPGPPGRTGLDGLPG
760 770 780 790 800
620 630 640 650 660 670
pF1KB0 VEPKGDGIGPTRQPPSQGL-GYPKYQKSLPPRFQRQQQEQLLKQQQQHQWQQHQQGSAPP
:::: .::. :: .: : : . :: . : : .. .::
XP_011 --PKGD-VGPNGQPGPMGPPGLPGIGVQGPP--GPPGIPGPIGQPGLHGIPGEKGDPGPP
810 820 830 840 850
680 690 700 710 720
pF1KB0 ---TPVPP----SPPQPVTLGAVPAPQAPPPPPKAL---YPGALGR----PPPMPPMNFD
.: :: :: : . : . : .: : :: .::. :. :: :: .
XP_011 GLDVPGPPGERGSPGIPGAPGPIGPPGSPGLPGKAGASGFPGTKGEMGMMGPPGPPGPLG
860 870 880 890 900 910
730 740 750 760 770
pF1KB0 -PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRE
: .: :::.: : :: :.: :. ::..:: :
XP_011 IPGRSGVPGLKGDDGLQGQPGL----PG--PTG----EK----GSKGEP---GLP-----
920 930 940 950
780 790 800 810 820 830
pF1KB0 RGTP-PVDPKLAWVGDV-FTATPAEPR-P-LTSPLRQAADEDDKGMR--SETPPVPPPPP
: : :.::.: .:. . :. : : ...: . : :. : : .: ::
XP_011 -GPPGPMDPNL--LGSKGEKGEPGLPGIPGVSGPKGYQGLPGDPGQPGLSGQPGLPGPPG
960 970 980 990 1000 1010
840 850 860 870 880 890
pF1KB0 SSSAVFRLDQVIHSNPAGIQQALAQLS--SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPP
.. : .: :.. ...... . :: : .: : : :: : .: :. .
XP_011 PKGNPGLPGQPGLIGPPGLKGTIGDMGFPGPQG-VEGPPG-PSGVPGQPGSPGLPGQKGD
1020 1030 1040 1050 1060
900 910 920 930 940
pF1KB0 TRYEPQRVNSGLSSDPHFE-EPGPMVRGVGGTP--RDSAGVSPFPPKRRERPPRKPELLQ
. .: . :: . : . ::: . : :.: . :.: .: : :
XP_011 -KGDPGISSIGLPGLPGPKGEPG--LPGYPGNPGIKGSVGDPGLPGL-----PGTPGAKG
1070 1080 1090 1100 1110 1120
950 960 970 980 990 1000
pF1KB0 EESLPPPHSSGFLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWM
. .:: :: :. : :::.. : :. .: : . . . .:.. :
XP_011 QPGLP-----GFPGT-PGPPGPKGISGPPGNPGL-PG-----EPGPVGGGGHPGQPGPPG
1130 1140 1150 1160
1010 1020 1030 1040 1050 1060
pF1KB0 EPLSPFED-VAGTEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSS
: .: .: . : .... : :. . : . .. :::: : : :: .
XP_011 EKGKPGQDGIPGPAGQKGEPGQPGFGNPGPPGLPGLSGQKGDGGLPGI----PGNPGLPG
1170 1180 1190 1200 1210 1220
1070 1080 1090 1100 1110 1120
pF1KB0 PLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIR
: . .: :: . : :: .: : : :. .: : :: : : : :::
XP_011 PKGEPGFHGFPGVQGPPGPPGSP--GPALEGPKGNPGPQGPPG--RPGPTGFQGLPGPEG
1230 1240 1250 1260 1270 1280
1130 1140 1150 1160 1170 1180
pF1KB0 PSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEP
: :: : . : .:.:: . : . ::. .. :
XP_011 P---PGLPGNGG---------------IKGEK--------GNPGQPGLPGLPGLKGDQGP
1290 1300 1310
1190 1200 1210 1220 1230 1240
pF1KB0 QSKNLDSGHCVPEPSSSGQRLYPEV-----FYGSAGPSSSQISGGAMDSQLHPNSGGFRP
. . . : .:. .:.. : . : : :::. :.: . .:. : :
XP_011 PGLQGNPG----RPGLNGMKGDPGLPGVPGFPGMKGPSGVPGSAG---PEGEPGLIG-PP
1320 1330 1340 1350 1360
1250 1260 1270 1280 1290 1300
pF1KB0 GTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYPPPS
: :.: :::. : ...: :: ::.
XP_011 GPPGL-----------PGPSGQSIIIKG---------------------DAG-----PPG
1370 1380 1390
1310 1320 1330 1340 1350 1360
pF1KB0 FLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG--GQSGFLPSGAPAQQMLLPMV
. .:.. : : : : ::.:. . : .:: : :: .:. . ::
XP_011 IPGQPGLKGLPGP-----QGPQGLPGPT---GPPGDPGRNGLPGFDGAGGRKGDPGLP--
1400 1410 1420 1430 1440
1370 1380 1390 1400 1410
pF1KB0 DSQLPVVNFGSLPPAP-----PPAPPPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPAR
.: : . . ::.: ::.:: : . : . : .. : :
XP_011 -GQ-PGTRGLDGPPGPDGLQGPPGPPGTSSVAHGFLITRHSQTTDAPQCPQGTLQVYEGF
1450 1460 1470 1480 1490
1420 1430 1440 1450 1460 1470
pF1KB0 PFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFSGLNSRLKATPSTYSG
XP_011 SLLYVQGNKRAHGQDLGTAGSCLRRFSTMPFMFCNINNVCNFASRNDYSYWLSTPEPMPM
1500 1510 1520 1530 1540 1550
>>XP_016884752 (OMIM: 301050,303630) PREDICTED: collagen (1136 aa)
initn: 248 init1: 103 opt: 492 Z-score: 191.4 bits: 47.7 E(85289): 0.00064
Smith-Waterman score: 576; 26.3% identity (42.1% similar) in 1154 aa overlap (187-1305:4-942)
160 170 180 190 200 210
pF1KB0 RASSLLSRFSREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPD
...: .: .:.: .: .:: :
XP_016 MKGDKGELGSPGAPGLPGLPGTPGQDGL---PG
10 20 30
220 230 240 250 260 270
pF1KB0 ELEGPDSKLHHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTP
: :: .. : .: : : : .: : . : : :: : :: :: :
XP_016 -LPGPKGE-PGGITFKGERGPPGNPGLPGLPGNIGP-MGPP--GFGPP-GPVGEKGIQGV
40 50 60 70 80
280 290 300 310 320 330
pF1KB0 DGPSRFPRVAGPRGSGPPMRLVEPVGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYT
: : . ::.:. : . ...: :.:. : . .. : . .: : :
XP_016 AGNPGQPGIPGPKGD-PGQTITQP-GKPG-LPGNPGRDGD-VGLPGDPGLPGQ----PGL
90 100 110 120 130
340 350 360 370 380 390
pF1KB0 EKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETS
. : : : . : : .. : :: : : : :: : .
XP_016 PGIPGSKGEPGIPG--IGLPGPPGPKGFPGIPGPPGAPGTPGRIGLEGPPGP------PG
140 150 160 170 180
400 410 420 430 440 450
pF1KB0 RP-PETEPGPPAPKPPLPPPHRGPAGNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQ
: :. ::: : :: :: : : :: :: :: : ::.:
XP_016 FPGPKGEPGFALPGPPGPPGLPGFKGALGPKGD---RGFPG--PPGPPG-----------
190 200 210 220 230
460 470 480 490 500 510
pF1KB0 SSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAP
:.. :: : : . . : . :.
XP_016 ---------------------------RTG-------LD---GLPGPKGDVGPNGQPG--
240 250
520 530 540 550 560
pF1KB0 STPAPPPAVPK-ELPAPPAPP----PASAPTPEKEPEEPAQ-APPAQSTP-TPGVAAAPT
: ::..: . .::.:: : . : . : : .. .::. ..: :: ..:
XP_016 --PMGPPGLPGIGVQGPPGPPGIPGPIGQPGLHGIPGEKGDPGPPGLDVPGPPGERGSPG
260 270 280 290 300 310
570 580 590 600 610 620
pF1KB0 LVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPPPTTPPVPKVEPKGDGIGPTRQ
. .. : . : : ::.: : . : .. . .::
XP_016 IPGAPGPIG---------PPGSPGLPGKAG-----------ASGFPGTKGEMGMMGPP-G
320 330 340 350
630 640 650 660 670 680
pF1KB0 PPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQQHQWQQHQQGSA--PPTPVPPSPPQPVT
::. :: : .: : .. .. :. : ..:: : : ::.: .:
XP_016 PPGP-LGIPG--RSGVPGLK---GDDGLQGQPGLPGPTGEKGSKGEPGLPGPPGPMDPNL
360 370 380 390 400
690 700 710 720 730 740
pF1KB0 LGAVPAPQAP--PPPPKALYP-GALGRP--PPMPPMNFDPRWMMIP-PYVDPRLLQGRPP
::. : : : . : : : : : .: .. .: : : .: : :.:
XP_016 LGSKGEKGEPGLPGIPGVSGPKGYQGLPGDPGQPGLSGQPGLPGPPGPKGNPGL-PGQPG
410 420 430 440 450 460
750 760 770 780 790
pF1KB0 LDFYPPGVHPS----GLV-PRERSDSGGSSSEPFDRHAPAMLRERGTPPVDPKLAWVGDV
: . :::.. . :. :. : :. : . .:.. ..: :: .. .:
XP_016 L-IGPPGLKGTIGDMGFPGPQGVEGPPGPSGVPGQPGSPGLPGQKGDKG-DPGISSIG--
470 480 490 500 510
800 810 820 830 840 850
pF1KB0 FTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQA
:. : : : :. : : : ...: ..:.
XP_016 ---LPGLPGPKGEP----------GL----PGYPGNPGIKGSV--------GDPG-----
520 530 540
860 870 880 890 900 910
pF1KB0 LAQLSSRQGSVTAPG--GHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPG
: : . :. :: : : :::: .:.: : :: : :: . :::
XP_016 LPGLPGTPGAKGQPGLPGFP-GTPGPP-GPKGISG-PPG-------NPGLPG-----EPG
550 560 570 580 590
920 930 940 950 960 970
pF1KB0 PMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEG-PGPQA
:. : :: : : .: :: .. .: . . : . :: . : : :: ..
XP_016 PV--GGGGHP----G-QPGPPGEKGKPGQDGIPGPAGQKGEPGQPGFGNPGPPGLPGLSG
600 610 620 630 640
980 990 1000 1010 1020
pF1KB0 ESRDTGTEALTPHIWNRLHTATSRKSYR--PSSMEPWMEPLSP---FEDVAGTEMSQSDS
.. : : .. . : .. ... :. . : : :: .: :. :.
XP_016 QKGDGGLPGIPGN--PGLPGPKGEPGFHGFPGVQGPPGPPGSPGPALEGPKGNPGPQGPP
650 660 670 680 690 700
1030 1040 1050 1060 1070 1080
pF1KB0 GVDLSGDSQVSSGPCSQRSSP-DGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEP-PRR
: : :: . . : .::.:: .: : .:: . . .:::: . : :
XP_016 GRPGPTGFQGLPGPEGPPGLPGNGGIKGE-KGNPGQPGLPGLPGLKGDQGPPGLQGNPGR
710 720 730 740 750 760
1090 1100 1110 1120 1130 1140
pF1KB0 PPPAPHDGDRKELPREQPLP--PGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDK
: :: :: .: :: :. : . : ::: : : :::: : : .
XP_016 PGLNGMKGD-PGLPGVPGFPGMKGPSGVPGSAGPE-G-EPGLIGP---PGPPGLPGPSGQ
770 780 790 800 810
1150 1160 1170 1180 1190 1200
pF1KB0 DSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSS
. .. ::. .:: . . ::. ::. . : : :..
XP_016 SI---IIKGDAG----------PPGIPGQPGLKGLPG------PQGPQGLPGPTGP-PGD
820 830 840 850
1210 1220 1230 1240 1250 1260
pF1KB0 SGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRPGTPSLH-PYRSQPLYLPPGPA
:. : : :..: ... :. : .::: .: : . : ::::
XP_016 PGRNGLPG-FDGAGGRKGD------------PGLPG-QPGTRGLDGPPGPDGLQGPPGPP
860 870 880 890 900
1270 1280 1290 1300 1310 1320
pF1KB0 PPSALLSGVALKGQFLDFSTMQATELGKLPAGGV-LYPPPSFLYSPAFCPSPLPDTSLLQ
:.. : :: :.:. . : : . .: :.::
XP_016 GTSSVAHG------FLITRHSQTTDAPQCPQGTLQVYEGFSLLYVQGNKRAHGQDLGTAG
910 920 930 940 950
1330 1340 1350 1360 1370 1380
pF1KB0 VRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPP
XP_016 SCLRRFSTMPFMFCNINNVCNFASRNDYSYWLSTPEPMPMSMQPLKGQSIQPFISRCAVC
960 970 980 990 1000 1010
>>NP_203699 (OMIM: 301050,303630) collagen alpha-5(IV) c (1691 aa)
initn: 315 init1: 103 opt: 496 Z-score: 190.4 bits: 48.1 E(85289): 0.00073
Smith-Waterman score: 666; 26.0% identity (42.3% similar) in 1288 aa overlap (211-1405:377-1483)
190 200 210 220 230 240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
: .:: : :: . : : ::
NP_203 PRPGTGITIGEKGNIGLPGLPGEKGERGFPGIQGPPGLPGPPGAAVMG--------PPGP
350 360 370 380 390
250 260 270 280
pF1KB0 PQFPPYRGMM----PPFMY---PPYL---P----FPPPYGPQGPYRYPTPDGPSRFPRVA
: :: ::. :: . :: : : .: : :: ::. : : . :
NP_203 PGFPGERGQKGDEGPPGISIPGPPGLDGQPGAPGLPGPPGPAGPH-IPPSDEICE-PGPP
400 410 420 430 440 450
290 300 310 320 330 340
pF1KB0 GPRGSGPPMRLVEPVGRPSILKEDNLKEFDQLDQ--ENDDGWAGAHEEVDYTEKLKFSDE
:: :: : . .. :. .. . . :. . . : : .: : .
NP_203 GPPGS-PGDKGLQ--GEQGVKGDKGDTCFNCIGTGISGPPGQPGLPGLPGPPGSLGFPGQ
460 470 480 490 500 510
350 360 370 380 390 400
pF1KB0 EDGRDSDEEGAEGHRDSQSASGEERPPEADGKKGNSPNSEP-PTPKTAWAETSRP--PET
. .. . :: : . . : : :.::. . : : .: . : :
NP_203 KG--EKGQAGATGPKGLPGIPGAPGAPGFPGSKGEPGDILTFPGMKGDKGELGSPGAPGL
520 530 540 550 560 570
410 420 430 440
pF1KB0 E--PGPPAPK--PPLPPPH-----------RGPAGNWGPPGDYPDRG--GPP-CKPPAPE
:: :. : :: :. ::: :: : :: . : ::: ::.:
NP_203 PGLPGTPGQDGLPGLPGPKGEPGGITFKGERGPPGNPGLPGLPGNIGPMGPPGFGPPGPV
580 590 600 610 620 630
450 460 470 480 490 500
pF1KB0 DEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAP-DK
: : . .. .. .. . . . . . . . : : : : :
NP_203 GEKGI--QGVAGNPGQPGIPGPKG-----DPGQTITQPGKPGLPGNPGR-DGDVGLPGDP
640 650 660 670 680
510 520 530 540 550
pF1KB0 RLKAEPAAP--------PAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEPAQAPP
: ..:. : :. :. : : :: .:. :.:: : . :: . : .::
NP_203 GLPGQPGLPGIPGSKGEPGIPGIGLPGPPGPKGFPGIPGPPGAPG-TPGRIGLEGPPGPP
690 700 710 720 730 740
560 570 580 590 600 610
pF1KB0 AQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPPPTTPP--
. :: . : .. : . : : . . ::. . : : ::
NP_203 G----FPGPKGEPGFALPGPP----------GPPGLPGFKGALGPKGDRGFPGPPGPPGR
750 760 770 780
620 630 640 650 660
pF1KB0 -----VPKVEPKGDGIGPTRQPPSQGL-GYPKYQKSLPPRFQRQQQEQLLKQQQQHQWQQ
.: :::: .::. :: .: : : . :: . : :
NP_203 TGLDGLPG--PKGD-VGPNGQPGPMGPPGLPGIGVQGPP--GPPGIPGPIGQPGLHGIPG
790 800 810 820 830 840
670 680 690 700 710
pF1KB0 HQQGSAPP---TPVPP----SPPQPVTLGAVPAPQAPPPPPKAL---YPGALGR----PP
.. .:: .: :: :: : . : . : .: : :: .::. :. :
NP_203 EKGDPGPPGLDVPGPPGERGSPGIPGAPGPIGPPGSPGLPGKAGASGFPGTKGEMGMMGP
850 860 870 880 890 900
720 730 740 750 760 770
pF1KB0 PMPPMNFD-PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDR
: :: . : .: :::.: : :: :.: :. ::..::
NP_203 PGPPGPLGIPGRSGVPGLKGDDGLQGQPGL----PG--PTG----EK----GSKGEP---
910 920 930 940
780 790 800 810 820
pF1KB0 HAPAMLRERGTP-PVDPKLAWVGDV-FTATPAEPR-P-LTSPLRQAADEDDKGMR--SET
: : : :.::.: .:. . :. : : ...: . : :. :
NP_203 GLP------GPPGPMDPNL--LGSKGEKGEPGLPGIPGVSGPKGYQGLPGDPGQPGLSGQ
950 960 970 980 990
830 840 850 860 870 880
pF1KB0 PPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS--SRQGSVTAPGGHPRHKPGPPQAP
: .: :: .. : .: :.. ...... . :: : .: : : :: : .:
NP_203 PGLPGPPGPKGNPGLPGQPGLIGPPGLKGTIGDMGFPGPQG-VEGPPG-PSGVPGQPGSP
1000 1010 1020 1030 1040 1050
890 900 910 920 930 940
pF1KB0 QGPSPRPPTRYEPQRVNSGLSSDPHFE-EPGPMVRGVGGTP--RDSAGVSPFPPKRRERP
:. . . .: . :: . : . ::: . : :.: . :.: .:
NP_203 GLPGQKGD-KGDPGISSIGLPGLPGPKGEPG--LPGYPGNPGIKGSVGDPGLPGL-----
1060 1070 1080 1090 1100
950 960 970 980 990 1000
pF1KB0 PRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYR
: : . .:: :: :. : :::.. : :. .: : . . . .
NP_203 PGTPGAKGQPGLP-----GFPGT-PGPPGPKGISGPPGNPGL-PG-----EPGPVGGGGH
1110 1120 1130 1140 1150
1010 1020 1030 1040 1050
pF1KB0 PSSMEPWMEPLSPFED-VAGTEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGP
:.. : : .: .: . : .... : :. . : . .. :::: :
NP_203 PGQPGPPGEKGKPGQDGIPGPAGQKGEPGQPGFGNPGPPGLPGLSGQKGDGGLPGI----
1160 1170 1180 1190 1200 1210
1060 1070 1080 1090 1100 1110
pF1KB0 PKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDR
: :: .: . .: :: . : :: .: : : :. .: : :: : : :
NP_203 PGNPGLPGPKGEPGFHGFPGVQGPPGPPGSP--GPALEGPKGNPGPQGPPG--RPGPTGF
1220 1230 1240 1250 1260
1120 1130 1140 1150 1160 1170
pF1KB0 GTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLP
::: : :: : . : .:.:: . : . ::
NP_203 QGLPGPEGP---PGLPGNGG---------------IKGEK--------GNPGQPGLPGLP
1270 1280 1290 1300
1180 1190 1200 1210 1220 1230
pF1KB0 SAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEV-----FYGSAGPSSSQISGGAMDSQLH
. .. : . . . :. :. .:.. : . : : :::. :.: . .
NP_203 GLKGDQGPPGLQGNPGR----PGLNGMKGDPGLPGVPGFPGMKGPSGVPGSAG---PEGE
1310 1320 1330 1340 1350
1240 1250 1260 1270 1280 1290
pF1KB0 PNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAG
:. : :: :.: :::. : ...: ::
NP_203 PGLIG-PPGPPGL-----------PGPSGQSIIIKG---------------------DAG
1360 1370 1380
1300 1310 1320 1330 1340 1350
pF1KB0 GVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG--GQSGFLPSGAPA
::.. .:.. : : : : ::.:. . : .:: : :: .:.
NP_203 -----PPGIPGQPGLKGLPGP-----QGPQGLPGPT---GPPGDPGRNGLPGFDGAGGRK
1390 1400 1410 1420
1360 1370 1380 1390 1400
pF1KB0 QQMLLPMVDSQLPVVNFGSLPPAP-----PPAPPPLSLLPVGPALQPPSLAVRPPPAPAT
. :: .: : . . ::.: ::.:: : . : . : .. : :
NP_203 GDPGLP---GQ-PGTRGLDGPPGPDGLQGPPGPPGTSSVAHGFLITRHSQTTDAPQCPQG
1430 1440 1450 1460 1470 1480
1410 1420 1430 1440 1450 1460
pF1KB0 RVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFSGLNSRLK
NP_203 TLQVYEGFSLLYVQGNKRAHGQDLGTAGSCLRRFSTMPFMFCNINNVCNFASRNDYSYWL
1490 1500 1510 1520 1530 1540
1533 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 11:36:29 2016 done: Thu Nov 3 11:36:33 2016
Total Scan time: 22.420 Total Display time: 1.090
Function used was FASTA [36.3.4 Apr, 2011]