FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB1499, 1321 aa
1>>>pF1KB1499 1321 - 1321 aa - 1321 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.5200+/-0.00117; mu= 1.4860+/- 0.070
mean_var=424.9245+/-84.930, 0's: 0 Z-trim(113.1): 136 B-trim: 53 in 1/53
Lambda= 0.062218
statistics sampled from 13661 (13795) to 13661 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.736), E-opt: 0.2 (0.424), width: 16
Scan time: 6.360
The best scores are: opt bits E(32554)
CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 9266 847.6 0
CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 1376 139.7 9.2e-32
CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 1376 139.9 1.1e-31
CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 1319 133.9 1.4e-30
CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 1327 135.1 1.5e-30
CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 1191 123.1 9.2e-27
CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 1191 123.1 9.4e-27
CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 1144 118.2 7.4e-26
CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 1144 118.4 9e-26
CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 827 89.5 1.8e-17
CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 827 89.6 2e-17
CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 766 84.0 7.7e-16
CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 759 83.4 1.2e-15
>>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa)
initn: 9266 init1: 9266 opt: 9266 Z-score: 4514.4 bits: 847.6 E(32554): 0
Smith-Waterman score: 9266; 100.0% identity (100.0% similar) in 1321 aa overlap (1-1321:1-1321)
10 20 30 40 50 60
pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB1 FTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB1 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEEETLILE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEEETLILE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB1 EKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTDPMPRRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTDPMPRRR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB1 GRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSRSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSRSP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB1 WADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPSARPATP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 WADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPSARPATP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB1 DLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRVEAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRVEAH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB1 GEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB1 HSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 HSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQD
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB1 PWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB1 SGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB1 PEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB1 PVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB1 GTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSF
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB1 CEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGH
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB1 ENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPC
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB1 NYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 NYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRS
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB1 NGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 NGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNF
1270 1280 1290 1300 1310 1320
pF1KB1 C
:
CCDS12 C
>>CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409 aa)
initn: 2414 init1: 1237 opt: 1376 Z-score: 683.8 bits: 139.7 E(32554): 9.2e-32
Smith-Waterman score: 1386; 35.2% identity (62.7% similar) in 668 aa overlap (674-1304:1765-2409)
650 660 670 680 690 700
pF1KB1 LPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRA
: : .. : :. : ..: . ..:
CCDS54 SSTLSDGQAIADQSEIIPTLGQFERTQEEYEDKKHAGP-SFQPEFSSGAEEALVDHTPYL
1740 1750 1760 1770 1780 1790
710 720 730 740 750 760
pF1KB1 DFRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVG-FVPTETATEPTGLRGIPGSESGV
.. : . : ..: . ..:. :. . . ..::. :. . : . : :::..
CCDS54 SIATTHLMDQSVTEVPDVMEGSNPPYYT-DTTLAVSTFAKLSSQTPSSPLTIYSGSEASG
1800 1810 1820 1830 1840 1850
770 780 790 800 810
pF1KB1 FDTAESPTS--GLQATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLV--PKVTPN--L
.:.. :... . :..: : .. . : . . .. :...:. :
CCDS54 HTEIPQPSALPGIDVG-SSVMSPQDSFKEIHVNIEATFKPSSEEYLHITEPPSLSPDTKL
1860 1870 1880 1890 1900 1910
820 830 840 850 860 870
pF1KB1 EPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTP-L
:: . :.: . . .:.. .. :...... .. : . ::. .. . : .
CCDS54 EP--SEDDGKP--ELLEEMEASPTELIAV--EGTEILQDFQNKT-DGQVSGEAIKMFPTI
1920 1930 1940 1950 1960
880 890 900 910 920
pF1KB1 TTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVP---PHQSS-PL--GKPA
: : : . . : .... :: . : :. .. :: :. : : ..:
CCDS54 KTPEAGTVITTADEIELEGATQWPHSTSASA--TYGVEAGVVPWLSPQTSERPTLSSSPE
1970 1980 1990 2000 2010 2020
930 940 950 960 970
pF1KB1 VPPGTPTAASVGESASVSSGEPTVPW-----DPSSTLLPVTLGIE----DFEL-EVLAGS
. : : .: :........: : . ..:. :: .. : : : :. .
CCDS54 INPETQAALIRGQDSTIAASEQQVAARILDSNDQATVNPVEFNTEVATPPFSLLETSNET
2030 2040 2050 2060 2070 2080
980 990 1000 1010 1020 1030
pF1KB1 PGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQG
. .. :: . : ::: : : :. ::::.:::: . : : :.: :
CCDS54 DFLIGINEESVEGTAIYLPG-P----------DRCKMNPCLNGGTCYPTETSYVCTCVPG
2090 2100 2110 2120 2130
1040 1050 1060 1070 1080 1090
pF1KB1 FAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQG
..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::
CCDS54 YSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQG
2140 2150 2160 2170 2180 2190
1100 1110 1120 1130 1140 1150
pF1KB1 HCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQ
.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.
CCDS54 QCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFR
2200 2210 2220 2230 2240 2250
1160 1170 1180 1190 1200 1210
pF1KB1 WTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGP
:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: ::
CCDS54 WTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQ
2260 2270 2280 2290 2300 2310
1220 1230 1240 1250 1260 1270
pF1KB1 PPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---
::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .:
CCDS54 PPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAY
2320 2330 2340 2350 2360 2370
1280 1290 1300 1310 1320
pF1KB1 RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
.:.. :. .. . . .: :. ::. : :.
CCDS54 QRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
2380 2390 2400
>--
initn: 1110 init1: 1059 opt: 1173 Z-score: 585.3 bits: 121.5 E(32554): 2.8e-26
Smith-Waterman score: 1189; 29.6% identity (55.1% similar) in 1020 aa overlap (37-954:21-1015)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
CCDS54 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
CCDS54 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
:: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.:
CCDS54 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
: :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..:
CCDS54 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
.:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. .
CCDS54 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKRRM
300 310 320 330 340 350
370 380 390 400 410
pF1KB1 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE-PLVSSGEEETLIL
. : . : : : : ::..: . : ::. : : : :.:
CCDS54 SDLSVIGHPIDSESKEDEPCSEETDPVHDLMAEILPE---FPDIIEIDLYHSEENEEEEE
360 370 380 390 400
420 430 440 450 460
pF1KB1 EEKQESQQTLSPT-------------PGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASS
: . .. : .:. : :: : :. . .:::: .... .. ...
CCDS54 ECANATDVTTTPSVQYINGKHLVTTVPKDPEAAEARRGQ--FESVAPS-QNFSDSSESDT
410 420 430 440 450 460
470 480 490
pF1KB1 H----------TEVAPTD-------------P--MPRRRGRFKGLNGRYFQ----QQEPE
: : : :.. : .:. .:.: . : ..: :
CCDS54 HPFVIAKTELSTAVQPNESTETTESLEVTWKPETYPETSEHFSGGEPDVFPTVPFHEEFE
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB1 PGL-QGGMEASAQPPTSEA-AVNQMEPPLAMAVTEMLG----SGQSRSPWADLTNEVDMP
: . : :. .. : . ... :... : : . .:.. ..:: .
CCDS54 SGTAKKGAESVTERDTEVGHQAHEHTEPVSLFPEESSGEIAIDQESQKIAFARATEVTF-
530 540 550 560 570 580
560 570 580 590 600
pF1KB1 GAGSAGGKSSPEPWLWPPTMVPPSISGH-SRAPVLELEKAEGPSARPATPDLFW---SPL
: ::. . ::.:: : :.. :. .. : :. .: . : .:
CCDS54 --GEEVEKSTSVTY--TPTIVPSSASAYVSEEEAVTLIGNPWPDDLLSTKES-WVEATPR
590 600 610 620 630
610 620 630 640 650 660
pF1KB1 EAT-VSAPSPAPW-EAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRV--EAHGEA
... .:. : : :. : . :..:. .. : :. ...:. :. :.
CCDS54 QVVELSGSSSIPITEGSGEAEEDEDTMFTMVTDLSQRNTTD-TLITLDTSRIITESFFEV
640 650 660 670 680 690
670 680 690 700 710 720
pF1KB1 TATA--PPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAEH
::. : : .:: .: ... . .: . .: . .: : :. :
CCDS54 PATTIYPVSEQPSAKV--VPTKFVSETDTSEWISSTTVEEKKRKEEEGTTGTA-------
700 710 720 730 740
730 740 750 760 770 780
pF1KB1 SSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDP
:. . :..:. . ..: : . .. . :.... : . .::.. . .: .
CCDS54 STFEVYSSTQRSDQL-ILPFELESPNVATSSDSGTRKS-FMSLTTPTQSEREMTDSTPVF
750 760 770 780 790 800
790 800 810 820 830
pF1KB1 WPSVYSKGLDA-SSPSAPLGSPGVFLVPKVTPNLEPWVATDEGP---TVNPMDSTVTP--
. ..: : .. . . .::: . : : ..: ...: .::.
CCDS54 TETNTLENLGAQTTEHSSIHQPGVQEGLTTLPRSPASVFMEQGSGEAAADPETTTVSSFS
810 820 830 840 850 860
840 850 860 870 880
pF1KB1 --------APSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQ----GDKVG
: ....: : .. .: : : ....: .. .: . ....:
CCDS54 LNVEYAIQAEKEVAGTLSPHVETTFSTEPTGLVLSTVMDRVVAENITQTSREIVISERLG
870 880 890 900 910 920
890 900 910 920
pF1KB1 VPAMSTL--GSSSSQP----------------HP-EPEDQVETQGTSGASVPPHQSSPLG
: ... : :.. : :: :. : .:.. :. :.::
CCDS54 EPNYGAEIRGFSTGFPLEEDFSGDFREYSTVSHPIAKEETVMMEGSGDAAFRDTQTSPST
930 940 950 960 970 980
930 940 950 960 970 980
pF1KB1 KPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFW
:. . . : : :... : . ::.
CCDS54 VPTSVHISHISDSEGPSSTMVS-TSAFPWEEFTSSAEGSGEQLVTVSSSVVPVLPSAVQK
990 1000 1010 1020 1030 1040
>>CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396 aa)
initn: 2404 init1: 1237 opt: 1376 Z-score: 682.0 bits: 139.9 E(32554): 1.1e-31
Smith-Waterman score: 1386; 35.2% identity (62.7% similar) in 668 aa overlap (674-1304:2752-3396)
650 660 670 680 690 700
pF1KB1 LPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRA
: : .. : :. : ..: . ..:
CCDS40 SSTLSDGQAIADQSEIIPTLGQFERTQEEYEDKKHAGP-SFQPEFSSGAEEALVDHTPYL
2730 2740 2750 2760 2770 2780
710 720 730 740 750 760
pF1KB1 DFRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVG-FVPTETATEPTGLRGIPGSESGV
.. : . : ..: . ..:. :. . . ..::. :. . : . : :::..
CCDS40 SIATTHLMDQSVTEVPDVMEGSNPPYYT-DTTLAVSTFAKLSSQTPSSPLTIYSGSEASG
2790 2800 2810 2820 2830
770 780 790 800 810
pF1KB1 FDTAESPTS--GLQATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLV--PKVTPN--L
.:.. :... . :..: : .. . : . . .. :...:. :
CCDS40 HTEIPQPSALPGIDVG-SSVMSPQDSFKEIHVNIEATFKPSSEEYLHITEPPSLSPDTKL
2840 2850 2860 2870 2880 2890
820 830 840 850 860 870
pF1KB1 EPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTP-L
:: . :.: . . .:.. .. :...... .. : . ::. .. . : .
CCDS40 EP--SEDDGKP--ELLEEMEASPTELIAV--EGTEILQDFQNKT-DGQVSGEAIKMFPTI
2900 2910 2920 2930 2940 2950
880 890 900 910 920
pF1KB1 TTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVP---PHQSS-PL--GKPA
: : : . . : .... :: . : :. .. :: :. : : ..:
CCDS40 KTPEAGTVITTADEIELEGATQWPHSTSASA--TYGVEAGVVPWLSPQTSERPTLSSSPE
2960 2970 2980 2990 3000
930 940 950 960 970
pF1KB1 VPPGTPTAASVGESASVSSGEPTVPW-----DPSSTLLPVTLGIE----DFEL-EVLAGS
. : : .: :........: : . ..:. :: .. : : : :. .
CCDS40 INPETQAALIRGQDSTIAASEQQVAARILDSNDQATVNPVEFNTEVATPPFSLLETSNET
3010 3020 3030 3040 3050 3060
980 990 1000 1010 1020 1030
pF1KB1 PGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQG
. .. :: . : ::: : : :. ::::.:::: . : : :.: :
CCDS40 DFLIGINEESVEGTAIYLPG-P----------DRCKMNPCLNGGTCYPTETSYVCTCVPG
3070 3080 3090 3100 3110
1040 1050 1060 1070 1080 1090
pF1KB1 FAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQG
..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::
CCDS40 YSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQG
3120 3130 3140 3150 3160 3170
1100 1110 1120 1130 1140 1150
pF1KB1 HCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQ
.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.
CCDS40 QCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFR
3180 3190 3200 3210 3220 3230
1160 1170 1180 1190 1200 1210
pF1KB1 WTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGP
:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: ::
CCDS40 WTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQ
3240 3250 3260 3270 3280 3290
1220 1230 1240 1250 1260 1270
pF1KB1 PPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---
::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .:
CCDS40 PPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAY
3300 3310 3320 3330 3340 3350
1280 1290 1300 1310 1320
pF1KB1 RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
.:.. :. .. . . .: :. ::. : :.
CCDS40 QRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
3360 3370 3380 3390
>--
initn: 1100 init1: 1049 opt: 1202 Z-score: 597.6 bits: 124.3 E(32554): 5.8e-27
Smith-Waterman score: 1216; 30.2% identity (55.9% similar) in 1024 aa overlap (37-991:21-999)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
CCDS40 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
CCDS40 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
CCDS40 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
:: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.:
CCDS40 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
: :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..:
CCDS40 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
.:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. ..
CCDS40 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKE
300 310 320 330 340 350
370 380 390 400 410
pF1KB1 PT----SQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE--PLVSSGEE
: : .. .:: . : ...: . :. : ..: :. .: .:: ..
CCDS40 ATTIDLSILAETASPSLSKEPQMVSDRTTPII---PLVDELPVIPTEFPPVGNIVSFEQK
360 370 380 390 400
420 430 440 450 460
pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASW-----------PTGEVWLSTVAPSPSDMGAGTA
:. . .: : ::: : : :.. .: . .. .:.
CCDS40 ATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKE---EVLQSTT
410 420 430 440 450 460
470 480 490 500 510
pF1KB1 ASSHTEVAPTDPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAV------
. :: . : . . . .... ..: : : : .:: . :..: :
CCDS40 GVSHYATDSWDGVVEDKQTQESVT--QIEQIEVGP-LVTSMEILKHIPSKEFPVTETPLV
470 480 490 500 510 520
520 530 540 550 560 570
pF1KB1 -------NQMEPPLAMAVTEMLGSGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPT
.. : .. .:.:.. .:. : .: : . ..:. : . :
CCDS40 TARMILESKTEKKMVSTVSELVTTGHYGF---TLGEEDDEDRTLTVGSDESTLIFDQIPE
530 540 550 560 570
580 590 600 610 620
pF1KB1 MVPPSISGHSRAPV-LELEKAEGPSARPATPDLFWSPL-EATVSAPSPAPWEAFPVATSP
.. ..: :. . .:: :. :: .. ::: .. : :: ..
CCDS40 VI--TVSKTSEDTIHTHLEDLESVSASTTV-----SPLIMPDNNGSSMDDWEERQTSGRI
580 590 600 610 620 630
630 640 650 660 670 680
pF1KB1 DLPMMAMLRGPKEWMLPHPTPIST---EANRVEAHGEATATAPPSPAAETKVYSLPLSLT
... . . : : : .... ..: .:. : . :. .:
CCDS40 TEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTETLI
640 650 660 670 680 690
690 700 710 720
pF1KB1 P-------TGQGGEAMPTTPESPRADFR-------ETGETSPAQVNKA--EHSSSSPWPS
: : . : . .: ... . :. . : .:... : ..: .:.
CCDS40 PEMRTDTYTDEIQEEITKSPFMGKTEEEVFSGMKLSTSLSEPIHVTESSVEMTKSFDFPT
700 710 720 730 740 750
730 740 750 760 770 780
pF1KB1 VNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQAT-VDEVQDPWPSVYSK
. .... :::. . . ::. . .: :. :. : : . :. : .:
CCDS40 LITKLSAE--PTEVRDMEEDFTATPGTTK--YD--ENITTVLLAHGTLSVEAATVSKWSW
760 770 780 790 800
790 800 810 820 830 840
pF1KB1 GLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGS
: .. : :: : :... .: : . : : .: :. . :: . : :.
CCDS40 DEDNTT-SKPLESTE----PSASSKLPPALLTTVG--MNGKDKDI---PS----FTEDGA
810 820 830 840 850
850 860 870 880 890 900
pF1KB1 QVFEEA-ESTTLSPQVALDTSIVTP---LTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ
. : .:: . . . : .:.. .. ..:. ::: .:... . : .
CCDS40 DEFTLIPDSTQKQLEEVTDEDIAAHGKFTIRFQPTTSTGIAEKSTLRDSTTEEKVPPITS
860 870 880 890 900 910
910 920 930 940 950
pF1KB1 VETQ---GTSGASVPPHQSSPLGKPA--VPPGTPTAASVGES-ASVSSG-EPTVPWDPSS
.: : :... .. :.::. :: . :. : . .: :: :::. : :
CCDS40 TEGQVYATMEGSALGEVEDVDLSKPVSTVPQFAHTSEVEGLAFVSYSSTQEPTTYVDSSH
920 930 940 950 960 970
960 970 980 990 1000 1010
pF1KB1 TLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPC
:. :... : . ::. :.: : :. . ::
CCDS40 TI-PLSV-IPKTDWGVLV--PSVPS--EDEVLGEPSQDILVIDQTRLEATISPETMRTTK
980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KB1 LHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYG
CCDS40 ITEGTTQEEFPWKEQTAEKPVPALSSTAWTPKEAVTPLDEQEGDGSAYTVSEDELLTGSE
1030 1040 1050 1060 1070 1080
>>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa)
initn: 2399 init1: 1237 opt: 1319 Z-score: 662.7 bits: 133.9 E(32554): 1.4e-30
Smith-Waterman score: 1325; 41.4% identity (66.7% similar) in 490 aa overlap (833-1304:178-655)
810 820 830 840 850 860
pF1KB1 GVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQ
: .: . . .: : ::. .. :. :
CCDS47 DGVVFHYRAATSRYTLNFEAAQKACLDVGAVIATPEQLFAAYEDG---FEQCDAGWLADQ
150 160 170 180 190 200
870 880 890 900 910 920
pF1KB1 VALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVE-TQGTS-GASVPPHQS
. . : .: . :::.: .. : : : : . :. .: .:: . .
CCDS47 T-VRYPIRAPRVGC-YGDKMGKAGVRTYGFRSPQETYDVYCYVDHLDGDVFHLTVPSKFT
210 220 230 240 250 260
930 940 950 960 970
pF1KB1 SPLGKPAVPPGTPTAASVGE-SASVSSG--EPTVPW-DPSSTLLPVTLGIEDFELEVLAG
. :.::: .:. .: . : . .:. :::.. . . .:
CCDS47 FEEAAKECENQDARLATVGELQAAWRNGFDQCDYGWLSDASVRHPVTVA----RAQCGGG
270 280 290 300 310
980 990 1000 1010 1020 1030
pF1KB1 SPGVESFWE-EVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCD
::..... : .: : : . ..: . . : :. ::::.:::: . : : :.:
CCDS47 LLGVRTLYRFENQTGFPP--PDSRFDAYCFK-RPDRCKMNPCLNGGTCYPTETSYVCTCV
320 330 340 350 360 370
1040 1050 1060 1070 1080 1090
pF1KB1 QGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKF
:..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::
CCDS47 PGYSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKF
380 390 400 410 420 430
1100 1110 1120 1130 1140 1150
pF1KB1 QGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERD
::.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.:
CCDS47 QGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHD
440 450 460 470 480 490
1160 1170 1180 1190 1200 1210
pF1KB1 FQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLC
:.:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :
CCDS47 FRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVAC
500 510 520 530 540 550
1220 1230 1240 1250 1260 1270
pF1KB1 GPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP-
: ::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .:
CCDS47 GQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPS
560 570 580 590 600 610
1280 1290 1300 1310 1320
pF1KB1 --RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
.:.. :. .. . . .: :. ::. : :.
CCDS47 AYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
620 630 640 650
>>CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642 aa)
initn: 2404 init1: 1237 opt: 1327 Z-score: 661.9 bits: 135.1 E(32554): 1.5e-30
Smith-Waterman score: 1369; 36.8% identity (60.3% similar) in 665 aa overlap (662-1304:1039-1642)
640 650 660 670 680
pF1KB1 MMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPT----
: :: : :: . ... ..::
CCDS54 QTRLEATISPETMRTTKITEGTTQEEFPWKEQTAEKP-VPALSSTAWTPKEAVTPLDEQE
1010 1020 1030 1040 1050 1060
690 700 710 720 730 740
pF1KB1 GQGGEAMPTTPESPRADFR-ETGETSPAQVNKAEHSSSSPWPSVNRN-VAVGFVPTETAT
:.:. . : .. : . ::.: :.: .:: : : .:... : . : : :
CCDS54 GDGSAYTVSEDELLTGSERVPVLETTP--VGKIDHSVSYPPGAVTEHKVKTDEVVTLTPR
1070 1080 1090 1100 1110 1120
750 760 770 780 790 800
pF1KB1 EPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLD--ASSPSAPLGSPG
. :: :. ..: : :.:. .... . ... . .: . ::: :
CCDS54 IGPKVSLSPGPEQK-YETEGSSTTGFTSSLSPFSTHITQLMEETTTEKTSLEDIDLGS-G
1130 1140 1150 1160 1170 1180
810 820 830 840 850 860
pF1KB1 VFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQV
.: ::.: .: . . :: ::: . . :.: . .....:.
CCDS54 LFEKPKATELIE----------FSTIKVTV---PSDITTAF---SSVDRLHTTSAFKPSS
1190 1200 1210 1220
870 880 890 900 910 920
pF1KB1 ALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEP-EDQV--ETQGTSGASVPPHQS
:. . :: : :... . : .: :.:. : :: : ::. .:
CCDS54 AITKK--PPLIDREPGEET-TSDMVIIGESTSHVPPTTLEDIVAKETETDIDREYFTTSS
1230 1240 1250 1260 1270 1280
930 940 950 960 970 980
pF1KB1 SPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAGSPGV
: .:. :: . . : .: .:. .: :.:: . : .
CCDS54 PPATQPTRPPTVEDKEAFGPQA-LSTPQP-----PASTKF----------------HPDI
1290 1300 1310 1320
990 1000 1010 1020 1030 1040
pF1KB1 ESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAG
. . :: :. . : : :. ::::.:::: . : : :.: :..:
CCDS54 NVYIIEVR--ENKTGP-------------DRCKMNPCLNGGTCYPTETSYVCTCVPGYSG
1330 1340 1350 1360
1050 1060 1070 1080 1090 1100
pF1KB1 ENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCY
..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::.::
CCDS54 DQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCY
1370 1380 1390 1400 1410 1420
1110 1120 1130 1140 1150 1160
pF1KB1 RYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTD
.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.:::
CCDS54 KYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTD
1430 1440 1450 1460 1470 1480
1170 1180 1190 1200 1210 1220
pF1KB1 NTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPA
.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :: ::.
CCDS54 GSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPV
1490 1500 1510 1520 1530 1540
1230 1240 1250 1260 1270
pF1KB1 VENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---RRS
::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .: .:.
CCDS54 VENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRT
1550 1560 1570 1580 1590 1600
1280 1290 1300 1310 1320
pF1KB1 HRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC
. :. .. . . .: :. ::. : :.
CCDS54 YSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
1610 1620 1630 1640
>--
initn: 1085 init1: 1049 opt: 1202 Z-score: 601.3 bits: 123.9 E(32554): 3.6e-27
Smith-Waterman score: 1216; 30.2% identity (55.9% similar) in 1024 aa overlap (37-991:21-999)
10 20 30 40 50 60
pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP
:: :.: : :...:. :.::: :. .:
CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP
10 20 30 40 50
70 80 90 100 110 120
pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR
:: . . ::::.:... .. . .. .:::... ........::::.:..:.
CCDS54 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE
..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::.
CCDS54 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY
:: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.:
CCDS54 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG
: :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..:
CCDS54 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH
.:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. ..
CCDS54 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKE
300 310 320 330 340 350
370 380 390 400 410
pF1KB1 PT----SQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE--PLVSSGEE
: : .. .:: . : ...: . :. : ..: :. .: .:: ..
CCDS54 ATTIDLSILAETASPSLSKEPQMVSDRTTPII---PLVDELPVIPTEFPPVGNIVSFEQK
360 370 380 390 400
420 430 440 450 460
pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASW-----------PTGEVWLSTVAPSPSDMGAGTA
:. . .: : ::: : : :.. .: . .. .:.
CCDS54 ATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKE---EVLQSTT
410 420 430 440 450 460
470 480 490 500 510
pF1KB1 ASSHTEVAPTDPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAV------
. :: . : . . . .... ..: : : : .:: . :..: :
CCDS54 GVSHYATDSWDGVVEDKQTQESVT--QIEQIEVGP-LVTSMEILKHIPSKEFPVTETPLV
470 480 490 500 510 520
520 530 540 550 560 570
pF1KB1 -------NQMEPPLAMAVTEMLGSGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPT
.. : .. .:.:.. .:. : .: : . ..:. : . :
CCDS54 TARMILESKTEKKMVSTVSELVTTGHYGF---TLGEEDDEDRTLTVGSDESTLIFDQIPE
530 540 550 560 570
580 590 600 610 620
pF1KB1 MVPPSISGHSRAPV-LELEKAEGPSARPATPDLFWSPL-EATVSAPSPAPWEAFPVATSP
.. ..: :. . .:: :. :: .. ::: .. : :: ..
CCDS54 VI--TVSKTSEDTIHTHLEDLESVSASTTV-----SPLIMPDNNGSSMDDWEERQTSGRI
580 590 600 610 620 630
630 640 650 660 670 680
pF1KB1 DLPMMAMLRGPKEWMLPHPTPIST---EANRVEAHGEATATAPPSPAAETKVYSLPLSLT
... . . : : : .... ..: .:. : . :. .:
CCDS54 TEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTETLI
640 650 660 670 680 690
690 700 710 720
pF1KB1 P-------TGQGGEAMPTTPESPRADFR-------ETGETSPAQVNKA--EHSSSSPWPS
: : . : . .: ... . :. . : .:... : ..: .:.
CCDS54 PEMRTDTYTDEIQEEITKSPFMGKTEEEVFSGMKLSTSLSEPIHVTESSVEMTKSFDFPT
700 710 720 730 740 750
730 740 750 760 770 780
pF1KB1 VNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQAT-VDEVQDPWPSVYSK
. .... :::. . . ::. . .: :. :. : : . :. : .:
CCDS54 LITKLSAE--PTEVRDMEEDFTATPGTTK--YD--ENITTVLLAHGTLSVEAATVSKWSW
760 770 780 790 800
790 800 810 820 830 840
pF1KB1 GLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGS
: .. : :: : :... .: : . : : .: :. . :: . : :.
CCDS54 DEDNTT-SKPLESTE----PSASSKLPPALLTTVG--MNGKDKDI---PS----FTEDGA
810 820 830 840 850
850 860 870 880 890 900
pF1KB1 QVFEEA-ESTTLSPQVALDTSIVTP---LTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ
. : .:: . . . : .:.. .. ..:. ::: .:... . : .
CCDS54 DEFTLIPDSTQKQLEEVTDEDIAAHGKFTIRFQPTTSTGIAEKSTLRDSTTEEKVPPITS
860 870 880 890 900 910
910 920 930 940 950
pF1KB1 VETQ---GTSGASVPPHQSSPLGKPA--VPPGTPTAASVGES-ASVSSG-EPTVPWDPSS
.: : :... .. :.::. :: . :. : . .: :: :::. : :
CCDS54 TEGQVYATMEGSALGEVEDVDLSKPVSTVPQFAHTSEVEGLAFVSYSSTQEPTTYVDSSH
920 930 940 950 960 970
960 970 980 990 1000 1010
pF1KB1 TLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPC
:. :... : . ::. :.: : :. . ::
CCDS54 TI-PLSV-IPKTDWGVLV--PSVPS--EDEVLGEPSQDILVIDQTRLEATISPETMRTTK
980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KB1 LHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYG
CCDS54 ITEGTTQEEFPWKEQTAEKPVPALSSTAWTPKEAVTPLDEQEGDGSAYTVSEDELLTGSE
1030 1040 1050 1060 1070 1080
>>CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431 aa)
initn: 1796 init1: 1047 opt: 1191 Z-score: 594.0 bits: 123.1 E(32554): 9.2e-27
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
CCDS53 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
CCDS53 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
CCDS53 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
CCDS53 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
CCDS53 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
CCDS53 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
CCDS53 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
CCDS53 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
CCDS53 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
CCDS53 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
CCDS53 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
CCDS53 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
CCDS53 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
CCDS53 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
CCDS53 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
CCDS53 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
CCDS53 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
CCDS53 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
CCDS53 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>--
initn: 822 init1: 660 opt: 761 Z-score: 385.4 bits: 84.5 E(32554): 3.8e-15
Smith-Waterman score: 765; 27.4% identity (52.6% similar) in 919 aa overlap (338-1212:1542-2406)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
CCDS53 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
CCDS53 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
CCDS53 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
CCDS53 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
CCDS53 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
CCDS53 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGG-EAMPTTPESPRAD
:: .. : :. : . .. :: :. . : .... .: .. : ..:. .
CCDS53 APTTFKEE----EGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPEFS
1840 1850 1860 1870 1880 1890
710 720 730 740 750 760
pF1KB1 FRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFD
.: :.: .. ..:: .:: : . . . . :: . .. : .... . .. .
CCDS53 GLPSGIAEVS-GESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQ-E
1900 1910 1920 1930 1940 1950
770 780 790 800 810 820
pF1KB1 TAESPTSGLQATVDEVQDPWPSVYSKG-LDASSPSAPLGSPGVFLVPKVTPNLEPWVATD
..:.:.. :. . . : : .: :: : : . .. :. : :. . :
CCDS53 AGEGPSGILELSGAHSGAPDMSGEHSGFLDLS------GLQSGLIEPSGEPPGTPYFSGD
1960 1970 1980 1990 2000
830 840 850 860 870
pF1KB1 EGPTVN-PMDSTVTPAPS-DASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQG
. :.: .:.:. . : .:::. : . : .:..: : .. . . :.: :
CCDS53 FASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVT-EPTISQELGQRPPVTHTPQL
2010 2020 2030 2040 2050 2060
880 890 900 910 920 930
pF1KB1 -DKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTA--A
.. : .:: :. :. : . ::. .::: .: . : . :. .: :
CCDS53 FESSG--KVSTAGDISGATPVLPGSGVEV-----SSVPESSSETSAYPEAGFGASAAPEA
2070 2080 2090 2100 2110
940 950 960 970 980 990
pF1KB1 SVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAG----SPGV--ESFWEEVASG
: .:.: . .: : . .. ::. : : .: : :: ..
CCDS53 SREDSGSPDLSETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGT
2120 2130 2140 2150 2160 2170
1000 1010 1020 1030 1040
pF1KB1 EEPALPG-TPMNAGAE-EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDID
: :.::. :: .: . :. .: .. : .. . : : . ::. .
CCDS53 EAPGLPSATPTASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESS
2180 2190 2200 2210 2220 2230
1050 1060 1070 1080 1090 1100
pF1KB1 DCLCSPCENGGTCIDEVNGFVCLCLPSYG-----GSFCEKDTEGCDRGWHKFQGHCYRYF
. : : :. .. ... . .:. . : : :..::.:.::::::.:
CCDS53 SLLYSGEETH--TVETATSPTDASIPASPEWKRESESTAADQEVCEEGWNKYQGHCYRHF
2240 2250 2260 2270 2280 2290
1110 1120 1130 1140 1150 1160
pF1KB1 AHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTG
:..: :::. ::....::.:. .:::. :.:. ... ::::::: .: ::.:.:.
CCDS53 PDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHP
2300 2310 2320 2330 2340 2350
1170 1180 1190 1200 1210 1220
pF1KB1 LQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVEN
.:::::: ::::::::.:::::::. ::.:.::::::::.::..:::::
CCDS53 MQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTATTYKRRLQKR
2360 2370 2380 2390 2400 2410
1230 1240 1250 1260 1270 1280
pF1KB1 ASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRH
CCDS53 SSRHPRRSRPSTAH
2420 2430
>>CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530 aa)
initn: 2152 init1: 1047 opt: 1191 Z-score: 593.8 bits: 123.1 E(32554): 9.4e-27
Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051)
30 40 50 60 70
pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR
:. ...:: : ..: ::.: :::
CCDS53 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS
:::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..::
CCDS53 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS
80 90 100 110 120
140 150 160 170 180 190
pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL
:.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..:
CCDS53 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA
:::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: :::::::
CCDS53 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR
.:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: :::
CCDS53 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD
:::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. :
CCDS53 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP
:: . . :. ::.. :: .. :: . ..:: : . . ::
CCDS53 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP
370 380 390 400 410
440 450 460 470
pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR
: .:. . : . .. : :.:. .: .:: .:. :. . .:
CCDS53 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP-
420 430 440 450 460
480 490 500 510 520 530
pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR
:. . .: :. . : : . :: .... : .:. : : :
CCDS53 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD
470 480 490 500 510 520
540 550 560 570 580
pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV
. : : : . . : . .: : ::: . : : . .: :
CCDS53 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR
530 540 550 560 570 580
590 600 610 620 630
pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM
:: :: :. .: :: ... .. : : : .:..: :
CCDS53 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC
590 600 610 620 630 640
640 650 660 670 680
pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG---
. : . .. :. : . .: .: .: :::. : . : : :.:
CCDS53 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE
650 660 670 680 690
690 700 710 720 730 740
pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT
: :.:. :. . .:::. .: ... : . ..:.
CCDS53 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV
700 710 720 730 740
750 760 770 780 790 800
pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG
:. : : : . ... ...:.:.. ...: .: :: . ::: :.
CCDS53 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF-
750 760 770 780 790 800
810 820 830 840 850
pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT
:.: :.: :. ::. . . .:. .: : .:: : . ::. .
CCDS53 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD
810 820 830 840 850 860
860 870 880 890 900
pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED
.: . . :.: .. .::.. :.:. ::.::. :. : . :.
CCDS53 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE
870 880 890 900 910 920
910 920 930 940
pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P
..: .: ::: . ..: .: ..: : .:..::. ... :::
CCDS53 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET
930 940 950 960 970 980
950 960 970 980 990
pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL
:.: : ::. .: .: :.::. ::: . ::::.. . ::: : .
CCDS53 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA
990 1000 1010 1020 1030 1040
1000 1010 1020 1030 1040 1050
pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC
::. .:
CCDS53 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV
1050 1060 1070 1080 1090 1100
>--
initn: 1269 init1: 1016 opt: 1125 Z-score: 561.7 bits: 117.2 E(32554): 5.7e-25
Smith-Waterman score: 1188; 29.1% identity (55.0% similar) in 1043 aa overlap (338-1296:1542-2530)
310 320 330 340 350 360
pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG-
:.. .:.:: .: ... .:. :
CCDS53 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT
1520 1530 1540 1550 1560
370 380 390 400 410
pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI
:: :: :: :: : :. .:. : .. :.. . :: ::
CCDS53 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG
1570 1580 1590 1600 1610 1620
420 430 440 450 460 470
pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
: .. . .: : : ... :.: . ::. : . ..::. .:.
CCDS53 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR
1630 1640 1650 1660 1670 1680
480 490 500 510 520 530
pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML
. :...:: . .. . :: .: : :.: : : .. . ..
CCDS53 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF
1690 1700 1710 1720 1730
540 550 560 570 580 590
pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE
: ::: : . : ..:.. :. .: :: .: .:::.. . . .
CCDS53 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF
1740 1750 1760 1770 1780
600 610 620 630 640
pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP
: . ..::: .: : . .: : .: . .:: . .. .
CCDS53 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV
1790 1800 1810 1820 1830
650 660 670 680 690 700
pF1KB1 HPTPISTEAN--RVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPES---
:: .. : . :: : .. : : . : .: : ..: .. :::
CCDS53 APTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQ--TPEFSGL
1840 1850 1860 1870 1880 1890
710 720 730 740
pF1KB1 PRADFRETGETSPAQVNK-----AEHSSSSP--WPSV---NRNVAVGFVPTETATE----
: . . .::.: :.... : ..:..: .:.: .:... . . . :: :
CCDS53 PSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAGEG
1900 1910 1920 1930 1940 1950
750 760 770 780 790
pF1KB1 PTGLRGIPGSESGVFDTAESPT-----SGLQA-TVDEVQDPWPSVYSKGLDASSP-----
:.:. . :..::. : . . ::::. .. .: . : .: ::.
CCDS53 PSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSGDFASTTNVSGE
1960 1970 1980 1990 2000 2010
800 810 820 830
pF1KB1 -SAPLGSPG-VFLVPKVT--------PNLEPWVATDEG--PTVN--PM---DSTVTPAPS
:. .:. : . .:.:: :: .. . : : :. :. .: . . .
CCDS53 SSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESSGKVSTAG
2020 2030 2040 2050 2060 2070
840 850 860 870 880 890
pF1KB1 DASGIWE--PGS-----QVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLG
: :: ::: .: : . :. :.... .: ..: .. :.. : : .:
CCDS53 DISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGAS-AAPEASREDS---GSPDLS---
2080 2090 2100 2110 2120 2130
900 910 920 930 940 950
pF1KB1 SSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVG-ESASVSSGEPT
..: : .. :.::... ... . : : . :...:: :. .. :. ::
CCDS53 ETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGLPSATPT
2140 2150 2160 2170 2180 2190
960 970 980 990 1000
pF1KB1 VPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPA-----LPGTPMNAGAE
. : : . :. . .: :. .. :: : . . ..:: . .. . ..:
CCDS53 ASGD--RTEISGDLSGHTSQLGVVISTSIPESEWTQ--QTQRPAETHLEIESSSLLYSGE
2200 2210 2220 2230 2240
1010 1020 1030 1040 1050 1060
pF1KB1 EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEV
:.:. ..: ..... . . . . .: :: ..::: .
CCDS53 ETHTVETATSP--------TDASIPASPEWKRESESTAAAPARSCAEEPC-GAGTCKETE
2250 2260 2270 2280 2290
1070 1080 1090 1100 1110 1120
pF1KB1 NGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTS
. .::: :.: : :. : : :..::.:.::::::.: :..: :::. ::....::.:
CCDS53 GHVICLCPPGYTGEHCNIDQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSHLSS
2300 2310 2320 2330 2340 2350
1130 1140 1150 1160 1170 1180
pF1KB1 VHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCV
. .:::. :.:. ... ::::::: .: ::.:.:. .:::::: ::::::::.:::::
CCDS53 IVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNFFAAGEDCV
2360 2370 2380 2390 2400 2410
1190 1200 1210 1220 1230 1240
pF1KB1 VMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCN
::. ::.:.::::::::.::..:::::: :: ::.::.: .: .: .:.... :::::.
CCDS53 VMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEINSLVRYQCT
2420 2430 2440 2450 2460 2470
1250 1260 1270 1280 1290 1300
pF1KB1 EGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHR--MRRHHHHHQHHHQHHHHKSRKERR
:::.:.:. ::::. .:.:..:::.:: : .: ..: .: .. . :
CCDS53 EGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRRLQKRSSRHPRRSRPSTAH
2480 2490 2500 2510 2520 2530
1310 1320
pF1KB1 KHKKHPTEDWEKDEGNFC
>>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa)
initn: 1072 init1: 1037 opt: 1144 Z-score: 577.7 bits: 118.2 E(32554): 7.4e-26
Smith-Waterman score: 1168; 36.2% identity (60.0% similar) in 660 aa overlap (9-638:4-639)
10 20 30 40 50
pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDIT--DASE-RGLHMQKLGSGSVQAALAELVAL
: : .: :... . . :. :.:: :..... :.. .:..:. ...
CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTI
10 20 30 40 50
60 70 80 90 100 110
pF1KB1 PC-LFTLQPRPS--AARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLP
:: . :.: :: :. .::.::: . . :.. . .:::. :.: .... ::.::
CCDS11 PCHVHYLRPPPSRRAVLGSPRVKWTFL--SRGREAE--VLVARGVRVKVNEAYRFRVALP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB1 SYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALT
.:: ....: :. :: .:::.:::.: .::.: .: : ..: :::: :: . :::..
CCDS11 AYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB1 FAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSL
:. ::::: .: ::.:..: ::. :...::::::::.:::::: : .:::: ...
CCDS11 FSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB1 PGVRSYGRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLH
::::.:: .:..::::::.:..:.::.: : ..::: ::: :...:: .:..:::.
CCDS11 PGVRNYGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLY
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB1 LAWHEGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAY
:: :::.:.::::::::::::: :: .:::: :::.:.. : :.::::. ::..:
CCDS11 AAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVY
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB1 CFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEE
::: : . .:.:. .. : : . . :::: .. :. : :
CCDS11 CFRDSAQPSAIPEASNPASNPASDGLEA----IVTVTETLEELQL--PQEATESESRGAI
360 370 380 390 400
420 430 440 450 460 470
pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTD
.. . : . : :: :: : : ....: :. .. . . . : :
CCDS11 YSIPIMEDGGGG---SSTPEDPAEAPRTLLEFETQSMVP-PTGFSEEEGKALEEEEKYED
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB1 PMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMA-VTEMLG
... . . : . : ::: :: :: .: :..: . .:
CCDS11 EEEKEEEEEEEEVEDEALWAWPSELSSPGPEASL--PTEPAA---QEESLSQAPARAVLQ
470 480 490 500 510
540 550 560 570
pF1KB1 SGQSRSPWADLTNEVDMPG-AGSAGGKSSPEPWLW------PPTMVP----------PSI
: : : : .:.. : . . .. : : : :.: : .
CCDS11 PGAS--PLPDGESEASRPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATGGPEL
520 530 540 550 560 570
580 590 600 610 620 630
pF1KB1 SGHSRAPVLELEKAEG-PSARPAT--PD---LFWSPLEATVSAPSPAPWEAFPVATSPDL
:: :. : ..:: :: ::: :. . .: : . . .:: . : ..: :
CCDS11 SGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPA---GTSVQAQPVL
580 590 600 610 620 630
640 650 660 670 680 690
pF1KB1 PMMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQG
: . ::
CCDS11 PTDSASRGGVAVVPASGNSAQGSTALSILLLFFPLQLWVT
640 650 660 670
>>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa)
initn: 2021 init1: 1037 opt: 1144 Z-score: 576.2 bits: 118.4 E(32554): 9e-26
Smith-Waterman score: 1609; 31.1% identity (49.0% similar) in 1281 aa overlap (9-1279:4-878)
10 20 30 40 50
pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDIT--DASE-RGLHMQKLGSGSVQAALAELVAL
: : .: :... . . :. :.:: :..... :.. .:..:. ...
CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTI
10 20 30 40 50
60 70 80 90 100 110
pF1KB1 PC-LFTLQPRPS--AARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLP
:: . :.: :: :. .::.::: . . :.. . .:::. :.: .... ::.::
CCDS11 PCHVHYLRPPPSRRAVLGSPRVKWTFL--SRGREAE--VLVARGVRVKVNEAYRFRVALP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB1 SYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALT
.:: ....: :. :: .:::.:::.: .::.: .: : ..: :::: :: . :::..
CCDS11 AYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB1 FAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSL
:. ::::: .: ::.:..: ::. :...::::::::.:::::: : .:::: ...
CCDS11 FSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB1 PGVRSYGRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLH
::::.:: .:..::::::.:..:.::.: : ..::: ::: :...:: .:..:::.
CCDS11 PGVRNYGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLY
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB1 LAWHEGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAY
:: :::.:.::::::::::::: :: .:::: :::.:.. : :.::::. ::..:
CCDS11 AAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVY
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB1 CFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEE
::: : . .:.:. .. : : . . :::: .: :
CCDS11 CFRDSAQPSAIPEASNPASNPASDGLEA----IVTVTETLEE-------LQLP-------
360 370 380 390
420 430 440 450 460 470
pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTD
::. .. : : .. : : :.:... : :
CCDS11 --------QEATESES------------RGAIY---SIPIMEDGGGGSST-------PED
400 410 420
480 490 500 510 520 530
pF1KB1 PMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGS
: : .. :. : : :::. . : :. : .
CCDS11 PAEAPRTLLE------FETQ------------SMVPPTGFSE----EEGKALEEEEKYED
430 440 450 460
540 550 560 570 580 590
pF1KB1 GQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPS
. . . .::. . : :: . : ::
CCDS11 EEEKEE-EEEEEEVE-----------DEALWAWPSELSSP-----------------GP-
470 480 490
600 610 620 630 640 650
pF1KB1 ARPATPDLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEA
::.. . : :.. : : :.:. : .:.
CCDS11 -------------EASLPTEPAAQEESLSQA-----PARAVLQ-------PGASPLPD--
500 510 520
660 670 680 690 700 710
pF1KB1 NRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPA
::. :. :: .:.. : :..:: ::
CCDS11 ------GESEASRPP------RVHGPPT---------ETLPT----PR------------
530 540
720 730 740 750 760 770
pF1KB1 QVNKAEHSSSSPWPSVNRNVAVGFVPTETATEPTG---LRGIPGSESGVFDTAESPTSGL
:.. .:: ::. .: .. . : :: : :.: .:: ..:. : :
CCDS11 -----ERNLASPSPST-------LVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLL
550 560 570 580 590
780 790 800 810 820 830
pF1KB1 QATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDS
:: :: : : .::
CCDS11 PAT---------------------RAPEG----------TRELE----------------
600
840 850 860 870 880 890
pF1KB1 TVTPAPS-DASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTL
::: : :: :
CCDS11 ----APSEDNSGRTAP--------------------------------------------
610 620
900 910 920 930 940 950
pF1KB1 GSSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPT
.:.:: :..:. :: .::: .: .
CCDS11 --------------------AGTSV---QAQPV--------LPT-----DSAS-RGGVAV
630 640
960 970 980 990 1000 1010
pF1KB1 VPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSD
:: :::
CCDS11 VP-----------------------------------ASG--------------------
1020 1030 1040 1050 1060 1070
pF1KB1 PCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVC
::. :::.:::::..: .: :
CCDS11 --------------------------------------DCVPSPCHNGGTCLEEEEGVRC
650 660 670
1080 1090 1100 1110 1120 1130
pF1KB1 LCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPE
::::.:::..:. . :. :: ::: ::..:. ::.::.:: .:: ..::.:. .::
CCDS11 LCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLASISTPE
680 690 700 710 720 730
1140 1150 1160 1170 1180 1190
pF1KB1 EHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAH
:..:::. .: ::::::: .: :: :.:.. : .::: .:::..: .::.::::: :
CCDS11 EQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCVVMVWH
740 750 760 770 780 790
1200 1210 1220 1230 1240 1250
pF1KB1 ESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQ
..:.:.::::::.: :.:: : : ::::: . :...: . .:.: ...::.: ::.::
CCDS11 DQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCREGLAQ
800 810 820 830 840 850
1260 1270 1280 1290 1300 1310
pF1KB1 HHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPT
... :::. ::.:. ::: :. ::: :
CCDS11 RNLPLIRCQENGRWEAPQISCV-PRRPARALHPEEDPEGRQGRLLGRWKALLIPPSSPMP
860 870 880 890 900
>>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa)
initn: 652 init1: 475 opt: 827 Z-score: 427.1 bits: 89.5 E(32554): 1.8e-17
Smith-Waterman score: 828; 39.9% identity (62.5% similar) in 373 aa overlap (9-359:1-360)
10 20 30 40
pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQG---------TQDITDASERGLHMQKLGSGS---VQ
.:::.: ::.. : : ... .: . . : . : .: :.
CCDS10 MGLLLLVPLLLLPGSYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVE
10 20 30 40 50
50 60 70 80 90 100
pF1KB1 AALAEL-------VALPCLFTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVV
. : : ::: . .: . : . :.:: :. .. ..: .:::
CCDS10 TPEETLFTYQGASVILPCRYRYEPALVSPRRV-RVKWWKLSENGAPEKD--VLVAIGLRH
60 70 80 90 100
110 120 130 140 150 160
pF1KB1 RVAKSWQGRVSLPSYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVV
: ..:::: : .. ...: . :: : : :::.:. :.:::. :: ::. :::
CCDS10 RSFGDYQGRVHL--RQDKEHDVSLEIQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVV
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB1 FHYRSARDRYALTFAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPIT
: :.: :: ..: :.:..: ..:..:. ..: :.:.:.: :.::::.: ::.:::
CCDS10 FPYQSPNGRYQFNFHEGQQVCAEQAAVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIM
170 180 190 200 210 220
230 240 250 260 270 280
pF1KB1 QSRPGCYGDRSSLPGVRSYGRRNPQ-ELYDVYCFARELGGEVFYVGPARRLTLAGARAQC
: : : . ::::::: :. . . :::.::: : :.:.:. ..:::. :: :
CCDS10 LPRQPC-GGPGLAPGVRSYGPRHRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREAC
230 240 250 260 270 280
290 300 310 320 330
pF1KB1 RRQGAALASVGQLHLAWH-EGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFA
... :..:.:::: ::. .:::.:: :::::::::::. :. :: : ::::.
CCDS10 QEDDATIAKVGQLFAAWKFHGLDRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSF----
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB1 NRTGFPSPAER-FDAYCFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEE
:::.: : . .::.: :
CCDS10 ---GFPDPQSRLYGVYCYRQH
350 360
1321 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 11:56:11 2016 done: Thu Nov 3 11:56:12 2016
Total Scan time: 6.360 Total Display time: 0.750
Function used was FASTA [36.3.4 Apr, 2011]