FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB1499, 1321 aa
1>>>pF1KB1499 1321 - 1321 aa - 1321 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.7074+/-0.000535; mu= -11.1382+/- 0.033
mean_var=522.8724+/-104.774, 0's: 0 Z-trim(120.5): 272 B-trim: 188 in 1/59
Lambda= 0.056089
statistics sampled from 35586 (35881) to 35586 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.738), E-opt: 0.2 (0.421), width: 16
Scan time: 14.850
The best scores are: opt bits E(85289)
NP_004377 (OMIM: 600826) neurocan core protein pre (1321) 9266 766.1 0
NP_001157569 (OMIM: 118661,143200) versican core p (2409) 1376 127.9 8.4e-28
NP_004376 (OMIM: 118661,143200) versican core prot (3396) 1376 128.1 1.1e-27
NP_001119808 (OMIM: 118661,143200) versican core p ( 655) 1319 122.8 8.1e-27
NP_001157570 (OMIM: 118661,143200) versican core p (1642) 1327 123.8 1e-26
XP_006720482 (OMIM: 155760,165800,608361,612813) P (2568) 1323 123.7 1.7e-26
XP_011519615 (OMIM: 155760,165800,608361,612813) P (2530) 1212 114.7 8.6e-24
XP_016877475 (OMIM: 155760,165800,608361,612813) P (2553) 1209 114.4 1e-23
NP_001126 (OMIM: 155760,165800,608361,612813) aggr (2431) 1191 113.0 2.7e-23
XP_011519616 (OMIM: 155760,165800,608361,612813) P (2492) 1191 113.0 2.8e-23
XP_016877476 (OMIM: 155760,165800,608361,612813) P (2515) 1191 113.0 2.8e-23
NP_037359 (OMIM: 155760,165800,608361,612813) aggr (2530) 1191 113.0 2.8e-23
XP_016877474 (OMIM: 155760,165800,608361,612813) P (2553) 1191 113.0 2.8e-23
NP_940819 (OMIM: 600347) brevican core protein iso ( 671) 1144 108.6 1.5e-22
NP_068767 (OMIM: 600347) brevican core protein iso ( 911) 1144 108.7 1.9e-22
XP_011508168 (OMIM: 600347) PREDICTED: brevican co ( 911) 1144 108.7 1.9e-22
XP_016857536 (OMIM: 600347) PREDICTED: brevican co ( 956) 1144 108.8 2e-22
XP_016864543 (OMIM: 115435) PREDICTED: hyaluronan ( 353) 767 77.8 1.5e-13
XP_016864542 (OMIM: 115435) PREDICTED: hyaluronan ( 353) 767 77.8 1.5e-13
XP_016864540 (OMIM: 115435) PREDICTED: hyaluronan ( 354) 759 77.2 2.3e-13
XP_016864541 (OMIM: 115435) PREDICTED: hyaluronan ( 354) 759 77.2 2.3e-13
XP_011541470 (OMIM: 115435) PREDICTED: hyaluronan ( 354) 759 77.2 2.3e-13
NP_001875 (OMIM: 115435) hyaluronan and proteoglyc ( 354) 759 77.2 2.3e-13
XP_011523845 (OMIM: 612264) PREDICTED: C-type mann (1156) 429 51.0 5.8e-05
NP_006030 (OMIM: 612264) C-type mannose receptor 2 (1479) 429 51.1 7e-05
NP_002429 (OMIM: 153618) macrophage mannose recept (1456) 368 46.1 0.0021
NP_001193948 (OMIM: 151445) low affinity immunoglo ( 320) 341 43.3 0.0033
NP_001993 (OMIM: 151445) low affinity immunoglobul ( 321) 341 43.3 0.0033
XP_005272519 (OMIM: 151445) PREDICTED: low affinit ( 321) 341 43.3 0.0033
NP_001207429 (OMIM: 151445) low affinity immunoglo ( 321) 341 43.3 0.0033
XP_011524043 (OMIM: 607621) PREDICTED: collectin-1 ( 725) 349 44.3 0.0037
NP_569057 (OMIM: 607621) collectin-12 [Homo sapien ( 742) 348 44.2 0.004
NP_006335 (OMIM: 605999) C-type lectin domain fami ( 292) 332 42.6 0.005
XP_011521916 (OMIM: 605999) PREDICTED: C-type lect ( 319) 332 42.6 0.0054
XP_011521915 (OMIM: 605999) PREDICTED: C-type lect ( 319) 332 42.6 0.0054
NP_001186930 (OMIM: 102500,600275,610205) neurogen (1235) 348 44.5 0.0057
NP_001316999 (OMIM: 605999) C-type lectin domain f ( 289) 327 42.2 0.0066
NP_878910 (OMIM: 605999) C-type lectin domain fami ( 316) 327 42.2 0.0071
XP_011516860 (OMIM: 219730,609720,616220) PREDICTE (1220) 344 44.1 0.0071
XP_011516859 (OMIM: 219730,609720,616220) PREDICTE (1220) 344 44.1 0.0071
XP_011516858 (OMIM: 219730,609720,616220) PREDICTE (1276) 344 44.2 0.0074
NP_775960 (OMIM: 219730,609720,616220) protein cru (1285) 344 44.2 0.0074
XP_016856862 (OMIM: 102500,600275,610205) PREDICTE (2432) 348 44.7 0.0093
XP_005270958 (OMIM: 102500,600275,610205) PREDICTE (2432) 348 44.7 0.0093
XP_011539822 (OMIM: 102500,600275,610205) PREDICTE (2432) 348 44.7 0.0093
XP_016856861 (OMIM: 102500,600275,610205) PREDICTE (2455) 348 44.7 0.0094
XP_011539821 (OMIM: 102500,600275,610205) PREDICTE (2467) 348 44.7 0.0094
NP_077719 (OMIM: 102500,600275,610205) neurogenic (2471) 348 44.7 0.0094
>>NP_004377 (OMIM: 600826) neurocan core protein precurs (1321 aa)
initn: 9266 init1: 9266 opt: 9266 Z-score: 4073.9 bits: 766.1 E(85289): 0
Smith-Waterman score: 9266; 100.0% identity (100.0% similar) in 1321 aa overlap (1-1321:1-1321)
10 20 30 40 50 60
pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB1 FTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 FTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB1 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEEETLILE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEEETLILE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB1 EKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTDPMPRRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 EKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTDPMPRRR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB1 GRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSRSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSRSP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB1 WADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPSARPATP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 WADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPSARPATP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB1 DLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRVEAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 DLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRVEAH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB1 GEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB1 HSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 HSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQD
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB1 PWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB1 SGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 SGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB1 PEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB1 PVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB1 GTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSF
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB1 CEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 CEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGH
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB1 ENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPC
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB1 NYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 NYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRS
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB1 NGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 NGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNF
1270 1280 1290 1300 1310 1320
pF1KB1 C
:
NP_004 C
>>NP_001157569 (OMIM: 118661,143200) versican core prote (2409 aa)
initn: 2414 init1: 1237 opt: 1376 Z-score: 620.1 bits: 127.9 E(85289): 8.4e-28
Smith-Waterman score: 1386; 35.2% identity (62.7% similar) in 668 aa overlap (674-1304:1765-2409)
650 660 670 680 690 700
pF1KB1 LPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRA
: : .. : :. : ..: . ..:
NP_001 SSTLSDGQAIADQSEIIPTLGQFERTQEEYEDKKHAGP-SFQPEFSSGAEEALVDHTPYL
1740 1750 1760 1770 1780 1790
710 720 730 740 750 760
pF1KB1 DFRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVG-FVPTETATEPTGLRGIPGSESGV
.. : . : ..: . ..:. :. . . ..::. :. . : . : :::..
NP_001 SIATTHLMDQSVTEVPDVMEGSNPPYYT-DTTLAVSTFAKLSSQTPSSPLTIYSGSEASG
1800 1810 1820 1830 1840 1850
770 780 790 800 810
pF1KB1 FDTAESPTS--GLQATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLV--PKVTPN--L
.:.. :... . :..: : .. . : . . .. :...:. :
NP_001 HTEIPQPSALPGIDVG-SSVMSPQDSFKEIHVNIEATFKPSSEEYLHITEPPSLSPDTKL
1860 1870 1880 1890 1900 1910
820 830 840 850 860 870
pF1KB1 EPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTP-L
:: . :.: . . .:.. .. :...... .. : . ::. .. . : .
NP_001 EP--SEDDGKP--ELLEEMEASPTELIAV--EGTEILQDFQNKT-DGQVSGEAIKMFPTI
1920 1930 1940 1950 1960
880 890 900 910 920
pF1KB1 TTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVP---PHQSS-PL--GKPA
: : : . . : .... :: . : :. .. :: :. : : ..:
NP_001 KTPEAGTVITTADEIELEGATQWPHSTSASA--TYGVEAGVVPWLSPQTSERPTLSSSPE
1970 1980 1990 2000 2010 2020
930 940 950 960 970
pF1KB1 VPPGTPTAASVGESASVSSGEPTVPW-----DPSSTLLPVTLGIE----DFEL-EVLAGS
. : : .: :........: : . ..:. :: .. : : : :. .
NP_001 INPETQAALIRGQDSTIAASEQQVAARILDSNDQATVNPVEFNTEVATPPFSLLETSNET
2030 2040 2050 2060 2070 2080
980 990 1000 1010 1020 1030
pF1KB1 PGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQG
. .. :: . : ::: : : :. ::::.:::: . : : :.: :
NP_001 DFLIGINEESVEGTAIYLPG-P----------DRCKMNPCLNGGTCYPTETSYVCTCVPG
2090 2100 2110 2120 2130
1040 1050 1060 1070 1080 1090
pF1KB1 FAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQG
..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::
NP_001 YSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQG
2140 2150 2160 2170 2180 2190
1100 1110 1120 1130 1140 1150
pF1KB1 HCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQ
.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.
NP_001 QCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFR
2200 2210 2220 2230 2240 2250
1160 1170 1180 1190 1200 1210
pF1KB1 WTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGP
:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: ::
NP_001 WTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQ
2260 2270 2280 2290 2300 2310
1220 1230 1240 1250 1260 1270
pF1KB1 PPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---
::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .:
NP_001 PPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAY
2320 2330 2340 2350 2360 2370
1280 1290 1300 1310 1320
pF1KB1 RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
.:.. :. .. . . .: :. ::. : :.
NP_001 QRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
2380 2390 2400
>--
initn: 1110 init1: 1059 opt: 1173 Z-score: 531.3 bits: 111.5 E(85289): 7.4e-23
Smith-Waterman score: 1189; 29.6% identity (55.1% similar) in 1020 aa overlap (37-954:21-1015)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
NP_001 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
NP_001 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
NP_001 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
:: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.:
NP_001 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
: :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..:
NP_001 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
.:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. .
NP_001 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKRRM
300 310 320 330 340 350
370 380 390 400 410
pF1KB1 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE-PLVSSGEEETLIL
. : . : : : : ::..: . : ::. : : : :.:
NP_001 SDLSVIGHPIDSESKEDEPCSEETDPVHDLMAEILPE---FPDIIEIDLYHSEENEEEEE
360 370 380 390 400
420 430 440 450 460
pF1KB1 EEKQESQQTLSPT-------------PGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASS
: . .. : .:. : :: : :. . .:::: .... .. ...
NP_001 ECANATDVTTTPSVQYINGKHLVTTVPKDPEAAEARRGQ--FESVAPS-QNFSDSSESDT
410 420 430 440 450 460
470 480 490
pF1KB1 H----------TEVAPTD-------------P--MPRRRGRFKGLNGRYFQ----QQEPE
: : : :.. : .:. .:.: . : ..: :
NP_001 HPFVIAKTELSTAVQPNESTETTESLEVTWKPETYPETSEHFSGGEPDVFPTVPFHEEFE
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB1 PGL-QGGMEASAQPPTSEA-AVNQMEPPLAMAVTEMLG----SGQSRSPWADLTNEVDMP
: . : :. .. : . ... :... : : . .:.. ..:: .
NP_001 SGTAKKGAESVTERDTEVGHQAHEHTEPVSLFPEESSGEIAIDQESQKIAFARATEVTF-
530 540 550 560 570 580
560 570 580 590 600
pF1KB1 GAGSAGGKSSPEPWLWPPTMVPPSISGH-SRAPVLELEKAEGPSARPATPDLFW---SPL
: ::. . ::.:: : :.. :. .. : :. .: . : .:
NP_001 --GEEVEKSTSVTY--TPTIVPSSASAYVSEEEAVTLIGNPWPDDLLSTKES-WVEATPR
590 600 610 620 630
610 620 630 640 650 660
pF1KB1 EAT-VSAPSPAPW-EAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRV--EAHGEA
... .:. : : :. : . :..:. .. : :. ...:. :. :.
NP_001 QVVELSGSSSIPITEGSGEAEEDEDTMFTMVTDLSQRNTTD-TLITLDTSRIITESFFEV
640 650 660 670 680 690
670 680 690 700 710 720
pF1KB1 TATA--PPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAEH
::. : : .:: .: ... . .: . .: . .: : :. :
NP_001 PATTIYPVSEQPSAKV--VPTKFVSETDTSEWISSTTVEEKKRKEEEGTTGTA-------
700 710 720 730 740
730 740 750 760 770 780
pF1KB1 SSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDP
:. . :..:. . ..: : . .. . :.... : . .::.. . .: .
NP_001 STFEVYSSTQRSDQL-ILPFELESPNVATSSDSGTRKS-FMSLTTPTQSEREMTDSTPVF
750 760 770 780 790 800
790 800 810 820 830
pF1KB1 WPSVYSKGLDA-SSPSAPLGSPGVFLVPKVTPNLEPWVATDEGP---TVNPMDSTVTP--
. ..: : .. . . .::: . : : ..: ...: .::.
NP_001 TETNTLENLGAQTTEHSSIHQPGVQEGLTTLPRSPASVFMEQGSGEAAADPETTTVSSFS
810 820 830 840 850 860
840 850 860 870 880
pF1KB1 --------APSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQ----GDKVG
: ....: : .. .: : : ....: .. .: . ....:
NP_001 LNVEYAIQAEKEVAGTLSPHVETTFSTEPTGLVLSTVMDRVVAENITQTSREIVISERLG
870 880 890 900 910 920
890 900 910 920
pF1KB1 VPAMSTL--GSSSSQP----------------HP-EPEDQVETQGTSGASVPPHQSSPLG
: ... : :.. : :: :. : .:.. :. :.::
NP_001 EPNYGAEIRGFSTGFPLEEDFSGDFREYSTVSHPIAKEETVMMEGSGDAAFRDTQTSPST
930 940 950 960 970 980
930 940 950 960 970 980
pF1KB1 KPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFW
:. . . : : :... : . ::.
NP_001 VPTSVHISHISDSEGPSSTMVS-TSAFPWEEFTSSAEGSGEQLVTVSSSVVPVLPSAVQK
990 1000 1010 1020 1030 1040
>>NP_004376 (OMIM: 118661,143200) versican core protein (3396 aa)
initn: 2404 init1: 1237 opt: 1376 Z-score: 618.2 bits: 128.1 E(85289): 1.1e-27
Smith-Waterman score: 1386; 35.2% identity (62.7% similar) in 668 aa overlap (674-1304:2752-3396)
650 660 670 680 690 700
pF1KB1 LPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRA
: : .. : :. : ..: . ..:
NP_004 SSTLSDGQAIADQSEIIPTLGQFERTQEEYEDKKHAGP-SFQPEFSSGAEEALVDHTPYL
2730 2740 2750 2760 2770 2780
710 720 730 740 750 760
pF1KB1 DFRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVG-FVPTETATEPTGLRGIPGSESGV
.. : . : ..: . ..:. :. . . ..::. :. . : . : :::..
NP_004 SIATTHLMDQSVTEVPDVMEGSNPPYYT-DTTLAVSTFAKLSSQTPSSPLTIYSGSEASG
2790 2800 2810 2820 2830
770 780 790 800 810
pF1KB1 FDTAESPTS--GLQATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLV--PKVTPN--L
.:.. :... . :..: : .. . : . . .. :...:. :
NP_004 HTEIPQPSALPGIDVG-SSVMSPQDSFKEIHVNIEATFKPSSEEYLHITEPPSLSPDTKL
2840 2850 2860 2870 2880 2890
820 830 840 850 860 870
pF1KB1 EPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTP-L
:: . :.: . . .:.. .. :...... .. : . ::. .. . : .
NP_004 EP--SEDDGKP--ELLEEMEASPTELIAV--EGTEILQDFQNKT-DGQVSGEAIKMFPTI
2900 2910 2920 2930 2940 2950
880 890 900 910 920
pF1KB1 TTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVP---PHQSS-PL--GKPA
: : : . . : .... :: . : :. .. :: :. : : ..:
NP_004 KTPEAGTVITTADEIELEGATQWPHSTSASA--TYGVEAGVVPWLSPQTSERPTLSSSPE
2960 2970 2980 2990 3000
930 940 950 960 970
pF1KB1 VPPGTPTAASVGESASVSSGEPTVPW-----DPSSTLLPVTLGIE----DFEL-EVLAGS
. : : .: :........: : . ..:. :: .. : : : :. .
NP_004 INPETQAALIRGQDSTIAASEQQVAARILDSNDQATVNPVEFNTEVATPPFSLLETSNET
3010 3020 3030 3040 3050 3060
980 990 1000 1010 1020 1030
pF1KB1 PGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQG
. .. :: . : ::: : : :. ::::.:::: . : : :.: :
NP_004 DFLIGINEESVEGTAIYLPG-P----------DRCKMNPCLNGGTCYPTETSYVCTCVPG
3070 3080 3090 3100 3110
1040 1050 1060 1070 1080 1090
pF1KB1 FAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQG
..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::
NP_004 YSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQG
3120 3130 3140 3150 3160 3170
1100 1110 1120 1130 1140 1150
pF1KB1 HCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQ
.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.
NP_004 QCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFR
3180 3190 3200 3210 3220 3230
1160 1170 1180 1190 1200 1210
pF1KB1 WTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGP
:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: ::
NP_004 WTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQ
3240 3250 3260 3270 3280 3290
1220 1230 1240 1250 1260 1270
pF1KB1 PPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---
::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .:
NP_004 PPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAY
3300 3310 3320 3330 3340 3350
1280 1290 1300 1310 1320
pF1KB1 RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
.:.. :. .. . . .: :. ::. : :.
NP_004 QRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
3360 3370 3380 3390
>--
initn: 1100 init1: 1049 opt: 1202 Z-score: 542.1 bits: 114.0 E(85289): 1.9e-23
Smith-Waterman score: 1216; 30.2% identity (55.9% similar) in 1024 aa overlap (37-991:21-999)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
NP_004 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
NP_004 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
NP_004 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
:: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.:
NP_004 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
: :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..:
NP_004 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
.:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. ..
NP_004 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKE
300 310 320 330 340 350
370 380 390 400 410
pF1KB1 PT----SQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE--PLVSSGEE
: : .. .:: . : ...: . :. : ..: :. .: .:: ..
NP_004 ATTIDLSILAETASPSLSKEPQMVSDRTTPII---PLVDELPVIPTEFPPVGNIVSFEQK
360 370 380 390 400
420 430 440 450 460
pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASW-----------PTGEVWLSTVAPSPSDMGAGTA
:. . .: : ::: : : :.. .: . .. .:.
NP_004 ATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKE---EVLQSTT
410 420 430 440 450 460
470 480 490 500 510
pF1KB1 ASSHTEVAPTDPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAV------
. :: . : . . . .... ..: : : : .:: . :..: :
NP_004 GVSHYATDSWDGVVEDKQTQESVT--QIEQIEVGP-LVTSMEILKHIPSKEFPVTETPLV
470 480 490 500 510 520
520 530 540 550 560 570
pF1KB1 -------NQMEPPLAMAVTEMLGSGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPT
.. : .. .:.:.. .:. : .: : . ..:. : . :
NP_004 TARMILESKTEKKMVSTVSELVTTGHYGF---TLGEEDDEDRTLTVGSDESTLIFDQIPE
530 540 550 560 570
580 590 600 610 620
pF1KB1 MVPPSISGHSRAPV-LELEKAEGPSARPATPDLFWSPL-EATVSAPSPAPWEAFPVATSP
.. ..: :. . .:: :. :: .. ::: .. : :: ..
NP_004 VI--TVSKTSEDTIHTHLEDLESVSASTTV-----SPLIMPDNNGSSMDDWEERQTSGRI
580 590 600 610 620 630
630 640 650 660 670 680
pF1KB1 DLPMMAMLRGPKEWMLPHPTPIST---EANRVEAHGEATATAPPSPAAETKVYSLPLSLT
... . . : : : .... ..: .:. : . :. .:
NP_004 TEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTETLI
640 650 660 670 680 690
690 700 710 720
pF1KB1 P-------TGQGGEAMPTTPESPRADFR-------ETGETSPAQVNKA--EHSSSSPWPS
: : . : . .: ... . :. . : .:... : ..: .:.
NP_004 PEMRTDTYTDEIQEEITKSPFMGKTEEEVFSGMKLSTSLSEPIHVTESSVEMTKSFDFPT
700 710 720 730 740 750
730 740 750 760 770 780
pF1KB1 VNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQAT-VDEVQDPWPSVYSK
. .... :::. . . ::. . .: :. :. : : . :. : .:
NP_004 LITKLSAE--PTEVRDMEEDFTATPGTTK--YD--ENITTVLLAHGTLSVEAATVSKWSW
760 770 780 790 800
790 800 810 820 830 840
pF1KB1 GLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGS
: .. : :: : :... .: : . : : .: :. . :: . : :.
NP_004 DEDNTT-SKPLESTE----PSASSKLPPALLTTVG--MNGKDKDI---PS----FTEDGA
810 820 830 840 850
850 860 870 880 890 900
pF1KB1 QVFEEA-ESTTLSPQVALDTSIVTP---LTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ
. : .:: . . . : .:.. .. ..:. ::: .:... . : .
NP_004 DEFTLIPDSTQKQLEEVTDEDIAAHGKFTIRFQPTTSTGIAEKSTLRDSTTEEKVPPITS
860 870 880 890 900 910
910 920 930 940 950
pF1KB1 VETQ---GTSGASVPPHQSSPLGKPA--VPPGTPTAASVGES-ASVSSG-EPTVPWDPSS
.: : :... .. :.::. :: . :. : . .: :: :::. : :
NP_004 TEGQVYATMEGSALGEVEDVDLSKPVSTVPQFAHTSEVEGLAFVSYSSTQEPTTYVDSSH
920 930 940 950 960 970
960 970 980 990 1000 1010
pF1KB1 TLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPC
:. :... : . ::. :.: : :. . ::
NP_004 TI-PLSV-IPKTDWGVLV--PSVPS--EDEVLGEPSQDILVIDQTRLEATISPETMRTTK
980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KB1 LHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYG
NP_004 ITEGTTQEEFPWKEQTAEKPVPALSSTAWTPKEAVTPLDEQEGDGSAYTVSEDELLTGSE
1030 1040 1050 1060 1070 1080
>>NP_001119808 (OMIM: 118661,143200) versican core prote (655 aa)
initn: 2399 init1: 1237 opt: 1319 Z-score: 602.4 bits: 122.8 E(85289): 8.1e-27
Smith-Waterman score: 1325; 41.4% identity (66.7% similar) in 490 aa overlap (833-1304:178-655)
810 820 830 840 850 860
pF1KB1 GVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQ
: .: . . .: : ::. .. :. :
NP_001 DGVVFHYRAATSRYTLNFEAAQKACLDVGAVIATPEQLFAAYEDG---FEQCDAGWLADQ
150 160 170 180 190 200
870 880 890 900 910 920
pF1KB1 VALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVE-TQGTS-GASVPPHQS
. . : .: . :::.: .. : : : : . :. .: .:: . .
NP_001 T-VRYPIRAPRVGC-YGDKMGKAGVRTYGFRSPQETYDVYCYVDHLDGDVFHLTVPSKFT
210 220 230 240 250 260
930 940 950 960 970
pF1KB1 SPLGKPAVPPGTPTAASVGE-SASVSSG--EPTVPW-DPSSTLLPVTLGIEDFELEVLAG
. :.::: .:. .: . : . .:. :::.. . . .:
NP_001 FEEAAKECENQDARLATVGELQAAWRNGFDQCDYGWLSDASVRHPVTVA----RAQCGGG
270 280 290 300 310
980 990 1000 1010 1020 1030
pF1KB1 SPGVESFWE-EVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCD
::..... : .: : : . ..: . . : :. ::::.:::: . : : :.:
NP_001 LLGVRTLYRFENQTGFPP--PDSRFDAYCFK-RPDRCKMNPCLNGGTCYPTETSYVCTCV
320 330 340 350 360 370
1040 1050 1060 1070 1080 1090
pF1KB1 QGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKF
:..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::
NP_001 PGYSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKF
380 390 400 410 420 430
1100 1110 1120 1130 1140 1150
pF1KB1 QGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERD
::.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.:
NP_001 QGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHD
440 450 460 470 480 490
1160 1170 1180 1190 1200 1210
pF1KB1 FQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLC
:.:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :
NP_001 FRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVAC
500 510 520 530 540 550
1220 1230 1240 1250 1260 1270
pF1KB1 GPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP-
: ::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .:
NP_001 GQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPS
560 570 580 590 600 610
1280 1290 1300 1310 1320
pF1KB1 --RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
.:.. :. .. . . .: :. ::. : :.
NP_001 AYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
620 630 640 650
>--
initn: 356 init1: 325 opt: 408 Z-score: 204.0 bits: 49.1 E(85289): 0.00013
Smith-Waterman score: 408; 43.4% identity (74.3% similar) in 152 aa overlap (37-182:21-172)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
NP_001 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
NP_001 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
NP_001 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
::
NP_001 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
>>NP_001157570 (OMIM: 118661,143200) versican core prote (1642 aa)
initn: 2404 init1: 1237 opt: 1327 Z-score: 600.8 bits: 123.8 E(85289): 1e-26
Smith-Waterman score: 1369; 36.8% identity (60.3% similar) in 665 aa overlap (662-1304:1039-1642)
640 650 660 670 680
pF1KB1 MMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPT----
: :: : :: . ... ..::
NP_001 QTRLEATISPETMRTTKITEGTTQEEFPWKEQTAEKP-VPALSSTAWTPKEAVTPLDEQE
1010 1020 1030 1040 1050 1060
690 700 710 720 730 740
pF1KB1 GQGGEAMPTTPESPRADFR-ETGETSPAQVNKAEHSSSSPWPSVNRN-VAVGFVPTETAT
:.:. . : .. : . ::.: :.: .:: : : .:... : . : : :
NP_001 GDGSAYTVSEDELLTGSERVPVLETTP--VGKIDHSVSYPPGAVTEHKVKTDEVVTLTPR
1070 1080 1090 1100 1110 1120
750 760 770 780 790 800
pF1KB1 EPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLD--ASSPSAPLGSPG
. :: :. ..: : :.:. .... . ... . .: . ::: :
NP_001 IGPKVSLSPGPEQK-YETEGSSTTGFTSSLSPFSTHITQLMEETTTEKTSLEDIDLGS-G
1130 1140 1150 1160 1170 1180
810 820 830 840 850 860
pF1KB1 VFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQV
.: ::.: .: . . :: ::: . . :.: . .....:.
NP_001 LFEKPKATELIE----------FSTIKVTV---PSDITTAF---SSVDRLHTTSAFKPSS
1190 1200 1210 1220
870 880 890 900 910 920
pF1KB1 ALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEP-EDQV--ETQGTSGASVPPHQS
:. . :: : :... . : .: :.:. : :: : ::. .:
NP_001 AITKK--PPLIDREPGEET-TSDMVIIGESTSHVPPTTLEDIVAKETETDIDREYFTTSS
1230 1240 1250 1260 1270 1280
930 940 950 960 970 980
pF1KB1 SPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAGSPGV
: .:. :: . . : .: .:. .: :.:: . : .
NP_001 PPATQPTRPPTVEDKEAFGPQA-LSTPQP-----PASTKF----------------HPDI
1290 1300 1310 1320
990 1000 1010 1020 1030 1040
pF1KB1 ESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAG
. . :: :. . : : :. ::::.:::: . : : :.: :..:
NP_001 NVYIIEVR--ENKTGP-------------DRCKMNPCLNGGTCYPTETSYVCTCVPGYSG
1330 1340 1350 1360
1050 1060 1070 1080 1090 1100
pF1KB1 ENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCY
..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::.::
NP_001 DQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCY
1370 1380 1390 1400 1410 1420
1110 1120 1130 1140 1150 1160
pF1KB1 RYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTD
.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.:::
NP_001 KYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTD
1430 1440 1450 1460 1470 1480
1170 1180 1190 1200 1210 1220
pF1KB1 NTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPA
.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :: ::.
NP_001 GSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPV
1490 1500 1510 1520 1530 1540
1230 1240 1250 1260 1270
pF1KB1 VENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---RRS
::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .: .:.
NP_001 VENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRT
1550 1560 1570 1580 1590 1600
1280 1290 1300 1310 1320
pF1KB1 HRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
. :. .. . . .: :. ::. : :.
NP_001 YSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
1610 1620 1630 1640
>--
initn: 1085 init1: 1049 opt: 1202 Z-score: 546.1 bits: 113.7 E(85289): 1.1e-23
Smith-Waterman score: 1216; 30.2% identity (55.9% similar) in 1024 aa overlap (37-991:21-999)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
NP_001 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
NP_001 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
NP_001 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
:: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.:
NP_001 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
: :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..:
NP_001 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
.:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. ..
NP_001 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKE
300 310 320 330 340 350
370 380 390 400 410
pF1KB1 PT----SQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE--PLVSSGEE
: : .. .:: . : ...: . :. : ..: :. .: .:: ..
NP_001 ATTIDLSILAETASPSLSKEPQMVSDRTTPII---PLVDELPVIPTEFPPVGNIVSFEQK
360 370 380 390 400
420 430 440 450 460
pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASW-----------PTGEVWLSTVAPSPSDMGAGTA
:. . .: : ::: : : :.. .: . .. .:.
NP_001 ATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKE---EVLQSTT
410 420 430 440 450 460
470 480 490 500 510
pF1KB1 ASSHTEVAPTDPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAV------
. :: . : . . . .... ..: : : : .:: . :..: :
NP_001 GVSHYATDSWDGVVEDKQTQESVT--QIEQIEVGP-LVTSMEILKHIPSKEFPVTETPLV
470 480 490 500 510 520
520 530 540 550 560 570
pF1KB1 -------NQMEPPLAMAVTEMLGSGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPT
.. : .. .:.:.. .:. : .: : . ..:. : . :
NP_001 TARMILESKTEKKMVSTVSELVTTGHYGF---TLGEEDDEDRTLTVGSDESTLIFDQIPE
530 540 550 560 570
580 590 600 610 620
pF1KB1 MVPPSISGHSRAPV-LELEKAEGPSARPATPDLFWSPL-EATVSAPSPAPWEAFPVATSP
.. ..: :. . .:: :. :: .. ::: .. : :: ..
NP_001 VI--TVSKTSEDTIHTHLEDLESVSASTTV-----SPLIMPDNNGSSMDDWEERQTSGRI
580 590 600 610 620 630
630 640 650 660 670 680
pF1KB1 DLPMMAMLRGPKEWMLPHPTPIST---EANRVEAHGEATATAPPSPAAETKVYSLPLSLT
... . . : : : .... ..: .:. : . :. .:
NP_001 TEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTETLI
640 650 660 670 680 690
690 700 710 720
pF1KB1 P-------TGQGGEAMPTTPESPRADFR-------ETGETSPAQVNKA--EHSSSSPWPS
: : . : . .: ... . :. . : .:... : ..: .:.
NP_001 PEMRTDTYTDEIQEEITKSPFMGKTEEEVFSGMKLSTSLSEPIHVTESSVEMTKSFDFPT
700 710 720 730 740 750
730 740 750 760 770 780
pF1KB1 VNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQAT-VDEVQDPWPSVYSK
. .... :::. . . ::. . .: :. :. : : . :. : .:
NP_001 LITKLSAE--PTEVRDMEEDFTATPGTTK--YD--ENITTVLLAHGTLSVEAATVSKWSW
760 770 780 790 800
790 800 810 820 830 840
pF1KB1 GLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGS
: .. : :: : :... .: : . : : .: :. . :: . : :.
NP_001 DEDNTT-SKPLESTE----PSASSKLPPALLTTVG--MNGKDKDI---PS----FTEDGA
810 820 830 840 850
850 860 870 880 890 900
pF1KB1 QVFEEA-ESTTLSPQVALDTSIVTP---LTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ
. : .:: . . . : .:.. .. ..:. ::: .:... . : .
NP_001 DEFTLIPDSTQKQLEEVTDEDIAAHGKFTIRFQPTTSTGIAEKSTLRDSTTEEKVPPITS
860 870 880 890 900 910
910 920 930 940 950
pF1KB1 VETQ---GTSGASVPPHQSSPLGKPA--VPPGTPTAASVGES-ASVSSG-EPTVPWDPSS
.: : :... .. :.::. :: . :. : . .: :: :::. : :
NP_001 TEGQVYATMEGSALGEVEDVDLSKPVSTVPQFAHTSEVEGLAFVSYSSTQEPTTYVDSSH
920 930 940 950 960 970
960 970 980 990 1000 1010
pF1KB1 TLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPC
:. :... : . ::. :.: : :. . ::
NP_001 TI-PLSV-IPKTDWGVLV--PSVPS--EDEVLGEPSQDILVIDQTRLEATISPETMRTTK
980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KB1 LHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYG
NP_001 ITEGTTQEEFPWKEQTAEKPVPALSSTAWTPKEAVTPLDEQEGDGSAYTVSEDELLTGSE
1030 1040 1050 1060 1070 1080
>>XP_006720482 (OMIM: 155760,165800,608361,612813) PREDI (2568 aa)
initn: 2463 init1: 1219 opt: 1323 Z-score: 596.6 bits: 123.7 E(85289): 1.7e-26
Smith-Waterman score: 1388; 31.3% identity (56.6% similar) in 1068 aa overlap (338-1296:1542-2568)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
XP_006 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
XP_006 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
XP_006 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
XP_006 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
XP_006 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
XP_006 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEAN--RVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPES---
:: .. : . :: : .. : : . : .: : ..: .. :::
XP_006 APTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQ--TPEFSGL
1840 1850 1860 1870 1880 1890
710 720 730 740
pF1KB1 PRADFRETGETSPAQVNK-----AEHSSSSP--WPSV---NRNVAVGFVPTETATE----
: . . .::.: :.... : ..:..: .:.: .:... . . . :: :
XP_006 PSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAGEG
1900 1910 1920 1930 1940 1950
750 760 770 780 790
pF1KB1 PTGLRGIPGSESGVFDTAESPT-----SGLQA-TVDEVQDPWPSVYSKGLDASSP-----
:.:. . :..::. : . . ::::. .. .: . : .: ::.
XP_006 PSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSGDFASTTNVSGE
1960 1970 1980 1990 2000 2010
800 810 820 830
pF1KB1 -SAPLGSPG-VFLVPKVT--------PNLEPWVATDEG--PTVN--PM---DSTVTPAPS
:. .:. : . .:.:: :: .. . : : :. :. .: . . .
XP_006 SSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESSGKVSTAG
2020 2030 2040 2050 2060 2070
840 850 860 870 880 890
pF1KB1 DASGIWE--PGS-----QVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLG
: :: ::: .: : . :. :.... .: ..: .. :.. : : .:
XP_006 DISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGAS-AAPEASREDS---GSPDLSETT
2080 2090 2100 2110 2120 2130
900 910 920 930
pF1KB1 SSSSQPHPEPEDQVETQGTS-----G-ASVPPHQS------SPLGK--PAVPPGTPTAAS
:. . . : . . ..:.. : ::. :. : : .: :..: .::::.
XP_006 SAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGLPSATPTAS-
2140 2150 2160 2170 2180 2190
940 950 960 970 980
pF1KB1 VGESASVS---SGEPTVPWDPSSTLLPVTLGIEDFE------LEVLAGS---PGVESFWE
:. . .: ::. . :: .: . .. . ::. ..: : :.
XP_006 -GDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESSSLLYSGEETHTV
2200 2210 2220 2230 2240 2250
990 1000 1010 1020 1030 1040
pF1KB1 EVASGEEPA-LPGTP-MNAGAEEVHSDP---CENNPCLHGGTCNANGTMYGCSCDQGFAG
:.:.. : .:..: . .: . . : : ..:: .:::. . : : :..:
XP_006 ETATSPTDASIPASPEWKRESESTAAAPARSCAEEPC-GAGTCKETEGHVICLCPPGYTG
2260 2270 2280 2290 2300 2310
1050 1060 1070 1080 1090 1100
pF1KB1 ENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCY
:.:.::::.:: ::: ::.::.: ...:.::::::: :..:: : : :..::.:.:::::
XP_006 EHCNIDIDECLSSPCLNGATCVDAIDSFTCLCLPSYEGDLCEIDQEVCEEGWNKYQGHCY
2320 2330 2340 2350 2360 2370
1110 1120 1130 1140 1150 1160
pF1KB1 RYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTD
:.: :..: :::. ::....::.:. .:::. :.:. ... ::::::: .: ::.:.:
XP_006 RHFPDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSD
2380 2390 2400 2410 2420 2430
1170 1180 1190 1200 1210 1220
pF1KB1 NTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPA
. .:::::: ::::::::.:::::::. ::.:.::::::::.::..:::::: :: ::.
XP_006 GHPMQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPV
2440 2450 2460 2470 2480 2490
1230 1240 1250 1260 1270
pF1KB1 VENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHR-
::.: .: .: .:.... :::::.:::.:.:. ::::. .:.:..:::.:: : .:
XP_006 VEHARTFGQKKDRYEINSLVRYQCTEGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRR
2500 2510 2520 2530 2540 2550
1280 1290 1300 1310 1320
pF1KB1 -MRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNFC
..: .: .. . :
XP_006 LQKRSSRHPRRSRPSTAH
2560
>--
initn: 1132 init1: 1047 opt: 1208 Z-score: 546.3 bits: 114.4 E(85289): 1.1e-23
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
XP_006 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
XP_006 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
XP_006 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
XP_006 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
XP_006 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
XP_006 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
XP_006 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
XP_006 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
XP_006 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
XP_006 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
XP_006 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
XP_006 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
XP_006 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
XP_006 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
XP_006 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
XP_006 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
XP_006 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
XP_006 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
XP_006 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>>XP_011519615 (OMIM: 155760,165800,608361,612813) PREDI (2530 aa)
initn: 2389 init1: 1139 opt: 1212 Z-score: 548.1 bits: 114.7 E(85289): 8.6e-24
Smith-Waterman score: 1305; 30.4% identity (56.1% similar) in 1043 aa overlap (338-1296:1542-2530)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
XP_011 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
XP_011 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
XP_011 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
XP_011 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
XP_011 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
XP_011 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEAN--RVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPES---
:: .. : . :: : .. : : . : .: : ..: .. :::
XP_011 APTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQ--TPEFSGL
1840 1850 1860 1870 1880 1890
710 720 730 740
pF1KB1 PRADFRETGETSPAQVNK-----AEHSSSSP--WPSV---NRNVAVGFVPTETATE----
: . . .::.: :.... : ..:..: .:.: .:... . . . :: :
XP_011 PSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAGEG
1900 1910 1920 1930 1940 1950
750 760 770 780 790
pF1KB1 PTGLRGIPGSESGVFDTAESPT-----SGLQA-TVDEVQDPWPSVYSKGLDASSP-----
:.:. . :..::. : . . ::::. .. .: . : .: ::.
XP_011 PSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSGDFASTTNVSGE
1960 1970 1980 1990 2000 2010
800 810 820 830
pF1KB1 -SAPLGSPG-VFLVPKVT--------PNLEPWVATDEG--PTVN--PM---DSTVTPAPS
:. .:. : . .:.:: :: .. . : : :. :. .: . . .
XP_011 SSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESSGKVSTAG
2020 2030 2040 2050 2060 2070
840 850 860 870 880 890
pF1KB1 DASGIWE--PGS-----QVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLG
: :: ::: .: : . :. :.... .: ..: .. :.. : : .:
XP_011 DISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGAS-AAPEASREDS---GSPDLS---
2080 2090 2100 2110 2120 2130
900 910 920 930 940 950
pF1KB1 SSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVG-ESASVSSGEPT
..: : .. :.::... ... . : : . :...:: :. .. :. ::
XP_011 ETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGLPSATPT
2140 2150 2160 2170 2180 2190
960 970 980 990 1000
pF1KB1 VPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPA-----LPGTPMNAGAE
. : : . :. . .: :. .. :: : . . ..:: . .. . ..:
XP_011 ASGD--RTEISGDLSGHTSQLGVVISTSIPESEWTQ--QTQRPAETHLEIESSSLLYSGE
2200 2210 2220 2230 2240
1010 1020 1030 1040 1050 1060
pF1KB1 EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEV
:.:. ..: .:. : . .:. :::.:: ::: ::.::.: .
XP_011 ETHTVETATSPT------DAS---IPASPEWKRESESTAADIDECLSSPCLNGATCVDAI
2250 2260 2270 2280 2290
1070 1080 1090 1100 1110 1120
pF1KB1 NGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTS
..:.::::::: :..:: : : :..::.:.::::::.: :..: :::. ::....::.:
XP_011 DSFTCLCLPSYEGDLCEIDQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSHLSS
2300 2310 2320 2330 2340 2350
1130 1140 1150 1160 1170 1180
pF1KB1 VHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCV
. .:::. :.:. ... ::::::: .: ::.:.:. .:::::: ::::::::.:::::
XP_011 IVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNFFAAGEDCV
2360 2370 2380 2390 2400 2410
1190 1200 1210 1220 1230 1240
pF1KB1 VMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCN
::. ::.:.::::::::.::..:::::: :: ::.::.: .: .: .:.... :::::.
XP_011 VMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEINSLVRYQCT
2420 2430 2440 2450 2460 2470
1250 1260 1270 1280 1290 1300
pF1KB1 EGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHR--MRRHHHHHQHHHQHHHHKSRKERR
:::.:.:. ::::. .:.:..:::.:: : .: ..: .: .. . :
XP_011 EGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRRLQKRSSRHPRRSRPSTAH
2480 2490 2500 2510 2520 2530
1310 1320
pF1KB1 KHKKHPTEDWEKDEGNFC
>--
initn: 1132 init1: 1047 opt: 1208 Z-score: 546.4 bits: 114.3 E(85289): 1.1e-23
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
XP_011 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
XP_011 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
XP_011 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
XP_011 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
XP_011 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
XP_011 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
XP_011 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
XP_011 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
XP_011 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
XP_011 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
XP_011 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
XP_011 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
XP_011 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
XP_011 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
XP_011 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
XP_011 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
XP_011 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
XP_011 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
XP_011 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>>XP_016877475 (OMIM: 155760,165800,608361,612813) PREDI (2553 aa)
initn: 2267 init1: 1131 opt: 1209 Z-score: 546.7 bits: 114.4 E(85289): 1e-23
Smith-Waterman score: 1302; 30.6% identity (56.0% similar) in 1037 aa overlap (338-1292:1542-2517)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
XP_016 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
XP_016 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
XP_016 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
XP_016 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
XP_016 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
XP_016 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEAN--RVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPES---
:: .. : . :: : .. : : . : .: : ..: .. :::
XP_016 APTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQ--TPEFSGL
1840 1850 1860 1870 1880 1890
710 720 730 740
pF1KB1 PRADFRETGETSPAQVNK-----AEHSSSSP--WPSV---NRNVAVGFVPTETATE----
: . . .::.: :.... : ..:..: .:.: .:... . . . :: :
XP_016 PSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAGEG
1900 1910 1920 1930 1940 1950
750 760 770 780 790
pF1KB1 PTGLRGIPGSESGVFDTAESPT-----SGLQA-TVDEVQDPWPSVYSKGLDASSP-----
:.:. . :..::. : . . ::::. .. .: . : .: ::.
XP_016 PSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSGDFASTTNVSGE
1960 1970 1980 1990 2000 2010
800 810 820 830
pF1KB1 -SAPLGSPG-VFLVPKVT--------PNLEPWVATDEG--PTVN--PM---DSTVTPAPS
:. .:. : . .:.:: :: .. . : : :. :. .: . . .
XP_016 SSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESSGKVSTAG
2020 2030 2040 2050 2060 2070
840 850 860 870 880 890
pF1KB1 DASGIWE--PGS-----QVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLG
: :: ::: .: : . :. :.... .: ..: .. :.. : : .:
XP_016 DISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGAS-AAPEASREDS---GSPDLS---
2080 2090 2100 2110 2120 2130
900 910 920 930 940 950
pF1KB1 SSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVG-ESASVSSGEPT
..: : .. :.::... ... . : : . :...:: :. .. :. ::
XP_016 ETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGLPSATPT
2140 2150 2160 2170 2180 2190
960 970 980 990 1000
pF1KB1 VPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPA-----LPGTPMNAGAE
. : : . :. . .: :. .. :: : . . ..:: . .. . ..:
XP_016 ASGD--RTEISGDLSGHTSQLGVVISTSIPESEWTQ--QTQRPAETHLEIESSSLLYSGE
2200 2210 2220 2230 2240
1010 1020 1030 1040 1050 1060
pF1KB1 EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEV
:.:. ..: .:. : . .:. :::.:: ::: ::.::.: .
XP_016 ETHTVETATSPT------DAS---IPASPEWKRESESTAADIDECLSSPCLNGATCVDAI
2250 2260 2270 2280 2290
1070 1080 1090 1100 1110 1120
pF1KB1 NGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTS
..:.::::::: :..:: : : :..::.:.::::::.: :..: :::. ::....::.:
XP_016 DSFTCLCLPSYEGDLCEIDQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSHLSS
2300 2310 2320 2330 2340 2350
1130 1140 1150 1160 1170 1180
pF1KB1 VHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCV
. .:::. :.:. ... ::::::: .: ::.:.:. .:::::: ::::::::.:::::
XP_016 IVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNFFAAGEDCV
2360 2370 2380 2390 2400 2410
1190 1200 1210 1220 1230 1240
pF1KB1 VMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCN
::. ::.:.::::::::.::..:::::: :: ::.::.: .: .: .:.... :::::.
XP_016 VMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEINSLVRYQCT
2420 2430 2440 2450 2460 2470
1250 1260 1270 1280 1290 1300
pF1KB1 EGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKH
:::.:.:. ::::. .:.:..:::.:: :.:: : .:.
XP_016 EGFVQRHMPTIRCQPSGHWEEPQITCTD-------REHHPGHLAEHRVRFCQHSLPPVPS
2480 2490 2500 2510 2520 2530
1310 1320
pF1KB1 KKHPTEDWEKDEGNFC
XP_016 PGDPTPSTGLSKGREVGGLLSHK
2540 2550
>--
initn: 1132 init1: 1047 opt: 1208 Z-score: 546.3 bits: 114.4 E(85289): 1.1e-23
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
XP_016 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
XP_016 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
XP_016 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
XP_016 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
XP_016 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
XP_016 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
XP_016 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
XP_016 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
XP_016 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
XP_016 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
XP_016 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
XP_016 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
XP_016 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
XP_016 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
XP_016 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
XP_016 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
XP_016 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
XP_016 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
XP_016 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>>NP_001126 (OMIM: 155760,165800,608361,612813) aggrecan (2431 aa)
initn: 1796 init1: 1047 opt: 1191 Z-score: 539.1 bits: 113.0 E(85289): 2.7e-23
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
NP_001 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
NP_001 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
NP_001 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
NP_001 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
NP_001 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
NP_001 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
NP_001 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
NP_001 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
NP_001 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
NP_001 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
NP_001 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
NP_001 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
NP_001 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
NP_001 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
NP_001 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
NP_001 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
NP_001 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
NP_001 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
NP_001 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>--
initn: 822 init1: 660 opt: 761 Z-score: 351.1 bits: 78.2 E(85289): 8.1e-13
Smith-Waterman score: 765; 27.4% identity (52.6% similar) in 919 aa overlap (338-1212:1542-2406)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
NP_001 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
NP_001 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
NP_001 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
NP_001 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
NP_001 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
NP_001 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGG-EAMPTTPESPRAD
:: .. : :. : . .. :: :. . : .... .: .. : ..:. .
NP_001 APTTFKEE----EGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPEFS
1840 1850 1860 1870 1880 1890
710 720 730 740 750 760
pF1KB1 FRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFD
.: :.: .. ..:: .:: : . . . . :: . .. : .... . .. .
NP_001 GLPSGIAEVS-GESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQ-E
1900 1910 1920 1930 1940 1950
770 780 790 800 810 820
pF1KB1 TAESPTSGLQATVDEVQDPWPSVYSKG-LDASSPSAPLGSPGVFLVPKVTPNLEPWVATD
..:.:.. :. . . : : .: :: : : . .. :. : :. . :
NP_001 AGEGPSGILELSGAHSGAPDMSGEHSGFLDLS------GLQSGLIEPSGEPPGTPYFSGD
1960 1970 1980 1990 2000
830 840 850 860 870
pF1KB1 EGPTVN-PMDSTVTPAPS-DASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQG
. :.: .:.:. . : .:::. : . : .:..: : .. . . :.: :
NP_001 FASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVT-EPTISQELGQRPPVTHTPQL
2010 2020 2030 2040 2050 2060
880 890 900 910 920 930
pF1KB1 -DKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTA--A
.. : .:: :. :. : . ::. .::: .: . : . :. .: :
NP_001 FESSG--KVSTAGDISGATPVLPGSGVEV-----SSVPESSSETSAYPEAGFGASAAPEA
2070 2080 2090 2100 2110
940 950 960 970 980 990
pF1KB1 SVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAG----SPGV--ESFWEEVASG
: .:.: . .: : . .. ::. : : .: : :: ..
NP_001 SREDSGSPDLSETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGT
2120 2130 2140 2150 2160 2170
1000 1010 1020 1030 1040
pF1KB1 EEPALPG-TPMNAGAE-EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDID
: :.::. :: .: . :. .: .. : .. . : : . ::. .
NP_001 EAPGLPSATPTASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESS
2180 2190 2200 2210 2220 2230
1050 1060 1070 1080 1090 1100
pF1KB1 DCLCSPCENGGTCIDEVNGFVCLCLPSYG-----GSFCEKDTEGCDRGWHKFQGHCYRYF
. : : :. .. ... . .:. . : : :..::.:.::::::.:
NP_001 SLLYSGEETH--TVETATSPTDASIPASPEWKRESESTAADQEVCEEGWNKYQGHCYRHF
2240 2250 2260 2270 2280 2290
1110 1120 1130 1140 1150 1160
pF1KB1 AHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTG
:..: :::. ::....::.:. .:::. :.:. ... ::::::: .: ::.:.:.
NP_001 PDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHP
2300 2310 2320 2330 2340 2350
1170 1180 1190 1200 1210 1220
pF1KB1 LQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVEN
.:::::: ::::::::.:::::::. ::.:.::::::::.::..:::::
NP_001 MQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTATTYKRRLQKR
2360 2370 2380 2390 2400 2410
1230 1240 1250 1260 1270 1280
pF1KB1 ASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRH
NP_001 SSRHPRRSRPSTAH
2420 2430
>>XP_011519616 (OMIM: 155760,165800,608361,612813) PREDI (2492 aa)
initn: 2047 init1: 1047 opt: 1191 Z-score: 539.0 bits: 113.0 E(85289): 2.8e-23
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
XP_011 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
XP_011 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
XP_011 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
XP_011 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
XP_011 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
XP_011 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
XP_011 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
XP_011 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
XP_011 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
XP_011 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
XP_011 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
XP_011 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
XP_011 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
XP_011 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
XP_011 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
XP_011 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
XP_011 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
XP_011 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
XP_011 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>--
initn: 1073 init1: 911 opt: 1042 Z-score: 473.9 bits: 100.9 E(85289): 1.2e-19
Smith-Waterman score: 1046; 28.8% identity (54.3% similar) in 1005 aa overlap (338-1296:1542-2492)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
XP_011 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
XP_011 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
XP_011 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
XP_011 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
XP_011 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
XP_011 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGG-EAMPTTPESPRAD
:: .. : :. : . .. :: :. . : .... .: .. : ..:. .
XP_011 APTTFKEE----EGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPEFS
1840 1850 1860 1870 1880 1890
710 720 730 740 750 760
pF1KB1 FRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFD
.: :.: .. ..:: .:: : . . . . :: . .. : .... . .. .
XP_011 GLPSGIAEVS-GESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQ-E
1900 1910 1920 1930 1940 1950
770 780 790 800 810 820
pF1KB1 TAESPTSGLQATVDEVQDPWPSVYSKG-LDASSPSAPLGSPGVFLVPKVTPNLEPWVATD
..:.:.. :. . . : : .: :: : : . .. :. : :. . :
XP_011 AGEGPSGILELSGAHSGAPDMSGEHSGFLDLS------GLQSGLIEPSGEPPGTPYFSGD
1960 1970 1980 1990 2000
830 840 850 860 870
pF1KB1 EGPTVN-PMDSTVTPAPS-DASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQG
. :.: .:.:. . : .:::. : . : .:..: : .. . . :.: :
XP_011 FASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVT-EPTISQELGQRPPVTHTPQL
2010 2020 2030 2040 2050 2060
880 890 900 910 920 930
pF1KB1 -DKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTA--A
.. : .:: :. :. : . ::. .::: .: . : . :. .: :
XP_011 FESSG--KVSTAGDISGATPVLPGSGVEV-----SSVPESSSETSAYPEAGFGASAAPEA
2070 2080 2090 2100 2110
940 950 960 970 980 990
pF1KB1 SVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAG----SPGV--ESFWEEVASG
: .:.: . .: : . .. ::. : : .: : :: ..
XP_011 SREDSGSPDLSETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGT
2120 2130 2140 2150 2160 2170
1000 1010 1020 1030 1040
pF1KB1 EEPALPG-TPMNAGAE-EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDID
: :.::. :: .: . :. .: .. : .. . : : . ::. .
XP_011 EAPGLPSATPTASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESS
2180 2190 2200 2210 2220 2230
1050 1060 1070 1080 1090 1100
pF1KB1 DCLCSPCENGGTCIDEVNGFVCLCLPSYG-----GSFCEKDTEGCDRGWHKFQGHCYRYF
. : : :. .. ... . .:. . : : :..::.:.::::::.:
XP_011 SLLYSGEET--HTVETATSPTDASIPASPEWKRESESTAADQEVCEEGWNKYQGHCYRHF
2240 2250 2260 2270 2280 2290
1110 1120 1130 1140 1150 1160
pF1KB1 AHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTG
:..: :::. ::....::.:. .:::. :.:. ... ::::::: .: ::.:.:.
XP_011 PDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHP
2300 2310 2320 2330 2340 2350
1170 1180 1190 1200 1210 1220
pF1KB1 LQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVEN
.:::::: ::::::::.:::::::. ::.:.::::::::.::..:::::: :: ::.::.
XP_011 MQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEH
2360 2370 2380 2390 2400 2410
1230 1240 1250 1260 1270 1280
pF1KB1 ASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHR--MR
: .: .: .:.... :::::.:::.:.:. ::::. .:.:..:::.:: : .: ..
XP_011 ARTFGQKKDRYEINSLVRYQCTEGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRRLQK
2420 2430 2440 2450 2460 2470
1290 1300 1310 1320
pF1KB1 RHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNFC
: .: .. . :
XP_011 RSSRHPRRSRPSTAH
2480 2490
1321 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 11:56:13 2016 done: Thu Nov 3 11:56:15 2016
Total Scan time: 14.850 Total Display time: 0.790
Function used was FASTA [36.3.4 Apr, 2011]