FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5645, 1170 aa
1>>>pF1KB5645 1170 - 1170 aa - 1170 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.5360+/-0.00136; mu= 18.2411+/- 0.081
mean_var=209.1887+/-39.679, 0's: 0 Z-trim(108.2): 193 B-trim: 0 in 0/51
Lambda= 0.088676
statistics sampled from 9842 (10052) to 9842 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.309), width: 16
Scan time: 5.010
The best scores are: opt bits E(32554)
CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170) 8531 1106.1 0
CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172) 5578 728.3 2.6e-209
CCDS12385.1 COMP gene_id:1311|Hs108|chr19 ( 757) 2502 334.5 5.9e-91
CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 ( 836) 2422 324.3 7.5e-88
CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 ( 947) 2422 324.4 8e-88
CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 ( 956) 2422 324.4 8.1e-88
CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 ( 870) 2364 316.9 1.3e-85
CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 ( 961) 2364 317.0 1.4e-85
CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635) 705 105.8 3e-21
CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584) 601 91.7 1.5e-17
CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522) 568 87.5 2.7e-16
CCDS14282.1 CFP gene_id:5199|Hs108|chrX ( 469) 543 83.6 1.2e-15
CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551) 540 83.9 3.2e-15
CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584) 540 83.9 3.3e-15
CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074) 474 75.3 9e-13
CCDS74995.1 SEMA5B gene_id:54437|Hs108|chr3 (1057) 460 73.5 3.1e-12
CCDS35491.1 SEMA5B gene_id:54437|Hs108|chr3 (1151) 459 73.4 3.6e-12
CCDS58848.1 SEMA5B gene_id:54437|Hs108|chr3 (1205) 459 73.4 3.7e-12
>>CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170 aa)
initn: 8531 init1: 8531 opt: 8531 Z-score: 5913.0 bits: 1106.1 E(32554): 0
Smith-Waterman score: 8531; 99.9% identity (100.0% similar) in 1170 aa overlap (1-1170:1-1170)
10 20 30 40 50 60
pF1KB5 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 VPIQSVFTRDLASIARLRIAKGGVNDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VPIQSVFTRDLASIARLRIAKGGVNDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVLL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 TLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 TLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 VTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 ATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 RTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 TKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 TKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 CNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 CNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACF
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 NHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKN
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 AKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHCKKDNCPN
:::::::::::::::::::::::::::::::::::::::.::::::::::::::::::::
CCDS32 AKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHCKKDNCPN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB5 LPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYN
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB5 HNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 HNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEH
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB5 NPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDN
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB5 DGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRF
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB5 QMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDD
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB5 DYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNAL
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB5 WHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 WHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYD
1090 1100 1110 1120 1130 1140
1150 1160 1170
pF1KB5 KTYAGGRLGLFVFSQEMVFFSDLKYECRDP
::::::::::::::::::::::::::::::
CCDS32 KTYAGGRLGLFVFSQEMVFFSDLKYECRDP
1150 1160 1170
>>CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172 aa)
initn: 5432 init1: 4955 opt: 5578 Z-score: 3871.3 bits: 728.3 E(32554): 2.6e-209
Smith-Waterman score: 5612; 61.6% identity (83.0% similar) in 1176 aa overlap (3-1169:1-1171)
10 20 30 40 50 60
pF1KB5 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR
..: : ::. . : ... .. :.. ::.: ... :: : . .::::. ::.:
CCDS34 MVWRL-VLLALWVWPSTQAGHQDKDTT-FDLFSISNINRKTIGAKQFRGPDPGVPAYR
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV
. . :::: : .. .. .: ..::.: :.:.: :.:::::::: : . : .:
CCDS34 FVRFDYIPPVNADDLSKITKIMRQKEGFFLTAQLKQDGKSRGTLLALEGPGLSQRQFEIV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB5 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD
::: : ::::. ..: .::::.:.. :: .:::..:. : . .:.. :. ... ::
CCDS34 SNGPADTLDLTYWIDGTRHVVSLEDVGLADSQWKNVTVQVAGETYSLHVGCDLIDSFALD
120 130 140 150 160 170
190 200 210 220 230
pF1KB5 VPIQSVFTRDLASIARLRIAKGGVNDN-FQGVLQNVRFVFGTTPEDILRNKGCSSSTSVL
:. . . : .:. .:::.. .. :.:.::::..:: .. :::: .:::... ..
CCDS34 EPF---YEHLQAEKSRMYVAKGSARESHFRGLLQNVHLVFENSVEDILSKKGCQQGQGAE
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 LTL--DNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDS
.. .:. . .: . :.:.: ... .: ::.::..:: :: ::...:. :...
CCDS34 INAISENTETLRLGPHVTTEYVGPSSERRPEVCERSCEELGNMVQELSGLHVLVNQLSEN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB5 IRKVTEENKELANELRRPP------LCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKV
...:...:. : . . :: :...: . .:: :.::::: : :.. :::...
CCDS34 LKRVSNDNQFLWELIGGPPKTRNMSACWQDGRFFAENETWVVDSCTTCTCKKFKTICHQI
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB5 SCPIMPCSNATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNN
.:: :.. . .::::: : : ....:::::.:::.::..::.: :::::::: .:
CCDS34 TCPPATCASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSCDVTSN
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB5 RCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNG
: : :.:::.: ...:: :..::::::::::::::::::: : :::::::::: :::.:
CCDS34 TCLGPSIQTRACSLSKCDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSPVPQMGG
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB5 KPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDC
: :.: .::::::. :::.: :.:::::. :.:::.::...:.:.::.: ::.::: :
CCDS34 KNCKGSGRETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQYGGKAC
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB5 VGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDE
:::: : :.:::..::.::::::::: :..:.:.:::::.::.:: :. ::: .: :.::
CCDS34 VGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCPVGFLGNGTHCEDLDE
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB5 CKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCT
: ::: ::. . :: ::.::..:::::::. :.:: : :.: : ..::::.:.:::
CCDS34 CALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQVCEPENPCK
600 610 620 630 640 650
660 670 680 690 700 710
pF1KB5 DGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPSENLVCVANATY
: ::.:.:.:.: ::::.:::::.:::. ::::.:.:::::.::::::. ::::..::::
CCDS34 DKTHNCHKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATY
660 670 680 690 700 710
720 730 740 750 760 770
pF1KB5 HCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVG
:: :::::.::::::::.:::::::::::::::: . :..::: . .:: : :::.:.::
CCDS34 HCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVG
720 730 740 750 760 770
780 790 800 810 820 830
pF1KB5 DRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGD
:::::::: ::: : :::::::::::..::::: ..:::::: ::::.:::::: :::::
CCDS34 DRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGD
780 790 800 810 820 830
840 850 860 870 880 890
pF1KB5 QCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKG
.:::::: ::::: : :.: .:: ::::.:::.:::::: :::::. ::::::::.::.:
CCDS34 HCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQG
840 850 860 870 880 890
900 910 920 930 940 950
pF1KB5 DACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD
:::: ::::::.:::.:::::: ::::.: ::::::: ::::::.:..:::::.::::
CCDS34 DACDPDDDNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNA
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KB5 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT
::::::: :::.:::::::.: :::::.::::::::::.: :::.:::.:::..::::::
CCDS34 ISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGT
960 970 980 990 1000 1010
1020 1030 1040 1050 1060 1070
pF1KB5 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG
:..::.::::::::::::::::::::::::::::.::. .:::: ::::.:.::::::::
CCDS34 FYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTG
1020 1030 1040 1050 1060 1070
1080 1090 1100 1110 1120 1130
pF1KB5 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI
::::::::::::::::::::::::::.:::::.:::::.:.::::::.:::...:::..
CCDS34 TGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQV
1080 1090 1100 1110 1120 1130
1140 1150 1160 1170
pF1KB5 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
:::::::::.:::::::::::::::::.::::::::::
CCDS34 MADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
1140 1150 1160 1170
>>CCDS12385.1 COMP gene_id:1311|Hs108|chr19 (757 aa)
initn: 2573 init1: 2171 opt: 2502 Z-score: 1746.5 bits: 334.5 E(32554): 5.9e-91
Smith-Waterman score: 2620; 53.6% identity (71.6% similar) in 666 aa overlap (547-1169:87-743)
520 530 540 550 560 570
pF1KB5 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP
:. : . :: :: : . .:. .:: ::
CCDS12 REITFLKNTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGA-RCGPCP
60 70 80 90 100 110
580 590 600 610 620 630
pF1KB5 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH
:..::: .::::.::. : :: . :: ::.::. : ::: ..: : :.
CCDS12 AGFTGNGSHCTDVNECNAHP--CFPRV---RCINTSPGFRCEACPPGYSGPTHQGVGLAF
120 130 140 150 160 170
640 650 660 670
pF1KB5 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS-------------------------
: :::::: : : : :.: :. : : : ..
CCDS12 AKANKQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCP
180 190 200 210 220 230
680 690 700 710
pF1KB5 -----------------DPMYRCECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHC
: : : :.:::::.::.::::::.:.:.: : .:
CCDS12 DGSPSECHEHADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRC---PERQC
240 250 260 270 280
720 730 740 750 760 770
pF1KB5 KKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDR
.:::: ..::::::: :.:::::::: : :.: .:...::::. :: : . :.: ::
CCDS12 RKDNCVTVPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDA
290 300 310 320 330 340
780 790 800 810 820 830
pF1KB5 CDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQC
:::: ..: :: :::..:.:::: ::::: : :. ::: : : ::.:.: ::.:: :
CCDS12 CDNCRSQKNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDAC
350 360 370 380 390 400
840 850 860 870 880 890
pF1KB5 DNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDA
:::: . :::: : : : .::.::..:: : ::::.. :::: :::. : : :.::.:::
CCDS12 DNCPQKSNPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDA
410 420 430 440 450 460
900 910 920 930 940 950
pF1KB5 CDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDIS
:: ::::::.::..::::::::: :.:.: :: ::.:.:::: :.: : :.::::....
CCDS12 CDDDDDNDGVPDSRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVT
470 480 490 500 510 520
960 970 980 990 1000 1010
pF1KB5 ETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFF
:::: :: . :::.: .: :::::: .::.:.:::.: :::::::: ::.::: :::
CCDS12 LTDFRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFH
530 540 550 560 570 580
1020 1030 1040 1050 1060 1070
pF1KB5 INTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPG
.:: :::::::.::::.:: ::::::::. :.::..:: :: . :...:.:.:.::::
CCDS12 VNTVTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPG
590 600 610 620 630 640
1080 1090 1100 1110 1120 1130
pF1KB5 EHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMA
:.:::::::::.: .::: ::.:::..:::: .::: :.:::..:.::: .::: ...:
CCDS12 EQLRNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVA
650 660 670 680 690 700
1140 1150 1160 1170
pF1KB5 DSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
::. . : :. :::::.: :::: .....:.:.: :
CCDS12 DSNVVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA
710 720 730 740 750
>>CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 (836 aa)
initn: 2130 init1: 1253 opt: 2422 Z-score: 1690.7 bits: 324.3 E(32554): 7.5e-88
Smith-Waterman score: 2575; 52.3% identity (71.4% similar) in 682 aa overlap (535-1169:143-818)
510 520 530 540 550 560
pF1KB5 SVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTS
. : :.:. .. . : :::: :: :
CCDS58 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHE-QRSHCSPNPCFRGVDCME
120 130 140 150 160 170
570 580 590 600 610 620
pF1KB5 -YPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPR
: ...:: :::: .::: .:.:..:: .. : :: .. : :: ::..: ::
CCDS58 VYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEACPRG
180 190 200 210 220
630 640 650 660
pF1KB5 FTGSQPFGQGVEHATANKQVCKPRNPCTDGTHD-CNKNAKCN--------------YLGH
. :.: : :...: :.::::. . :.::.. :. :. :. .::.
CCDS58 YKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGN
230 240 250 260 270 280
670 680 690 700
pF1KB5 YSD----------PMYR-----------------CECKPGYAGNGIICGEDTDLDGWPSE
:. : . :.:. :.:::: .:: :::.::.:..
CCDS58 QSQGCLPARTCHSPAHSPCHIHAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQ
290 300 310 320 330 340
710 720 730 740 750 760
pF1KB5 NLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPA
: :. : . :::.::: ::::::: :.::.:: :::: :.: : . .::: . :
CCDS58 ALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKD
350 360 370 380 390 400
770 780 790 800 810 820
pF1KB5 QYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQ
: . : :. :: ::::: : :: :::.::::::: :.::::: : ::: : : :
CCDS58 QQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQ
410 420 430 440 450 460
830 840 850 860 870 880
pF1KB5 RDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNAN
: : ::::: ::.:: :: : :.::: .::.::.:.: : ::::.. :::: .::..
CCDS58 TDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSS
470 480 490 500 510 520
890 900 910 920 930
pF1KB5 QADHDKDGKGDACDHDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHD
: : :.:: :: :: ::::::::: :::::::::.::::::.: ::.:.::::.:
CCDS58 QLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDND
530 540 550 560 570 580
940 950 960 970 980 990
pF1KB5 SVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLA
.: : :.:::..... :::: .: . :::.: .: :::::: .:: :.:::.: :::::
CCDS58 AVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLA
590 600 610 620 630 640
1000 1010 1020 1030 1040 1050
pF1KB5 VGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQG
::: ::.::: ::: .:: :::::::.:.::.:.:::::::::. :.::...: :: .
CCDS58 VGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVA
650 660 670 680 690 700
1060 1070 1080 1090 1100 1110
pF1KB5 YSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPK
::..:.:.:..::::::::::::::.:: ::: :: :::..::.: :.:::.: :::.
CCDS58 QPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQ
710 720 730 740 750 760
1120 1130 1140 1150 1160 1170
pF1KB5 TGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
.:.::: .::: ...:::: : : .. :::::.: :::: ...:.:.:.: :
CCDS58 VGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEP
770 780 790 800 810 820
CCDS58 FRRQLLQGRV
830
>>CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 (947 aa)
initn: 2130 init1: 1253 opt: 2422 Z-score: 1690.2 bits: 324.4 E(32554): 8e-88
Smith-Waterman score: 2575; 52.3% identity (71.4% similar) in 682 aa overlap (535-1169:254-929)
510 520 530 540 550 560
pF1KB5 SVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTS
. : :.:. .. . : :::: :: :
CCDS72 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHE-QRSHCSPNPCFRGVDCME
230 240 250 260 270 280
570 580 590 600 610 620
pF1KB5 -YPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPR
: ...:: :::: .::: .:.:..:: .. : :: .. : :: ::..: ::
CCDS72 VYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEACPRG
290 300 310 320 330
630 640 650 660
pF1KB5 FTGSQPFGQGVEHATANKQVCKPRNPCTDGTHD-CNKNAKCN--------------YLGH
. :.: : :...: :.::::. . :.::.. :. :. :. .::.
CCDS72 YKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGN
340 350 360 370 380 390
670 680 690 700
pF1KB5 YSD----------PMYR-----------------CECKPGYAGNGIICGEDTDLDGWPSE
:. : . :.:. :.:::: .:: :::.::.:..
CCDS72 QSQGCLPARTCHSPAHSPCHIHAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQ
400 410 420 430 440 450
710 720 730 740 750 760
pF1KB5 NLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPA
: :. : . :::.::: ::::::: :.::.:: :::: :.: : . .::: . :
CCDS72 ALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKD
460 470 480 490 500 510
770 780 790 800 810 820
pF1KB5 QYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQ
: . : :. :: ::::: : :: :::.::::::: :.::::: : ::: : : :
CCDS72 QQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQ
520 530 540 550 560 570
830 840 850 860 870 880
pF1KB5 RDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNAN
: : ::::: ::.:: :: : :.::: .::.::.:.: : ::::.. :::: .::..
CCDS72 TDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSS
580 590 600 610 620 630
890 900 910 920 930
pF1KB5 QADHDKDGKGDACDHDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHD
: : :.:: :: :: ::::::::: :::::::::.::::::.: ::.:.::::.:
CCDS72 QLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDND
640 650 660 670 680 690
940 950 960 970 980 990
pF1KB5 SVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLA
.: : :.:::..... :::: .: . :::.: .: :::::: .:: :.:::.: :::::
CCDS72 AVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLA
700 710 720 730 740 750
1000 1010 1020 1030 1040 1050
pF1KB5 VGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQG
::: ::.::: ::: .:: :::::::.:.::.:.:::::::::. :.::...: :: .
CCDS72 VGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVA
760 770 780 790 800 810
1060 1070 1080 1090 1100 1110
pF1KB5 YSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPK
::..:.:.:..::::::::::::::.:: ::: :: :::..::.: :.:::.: :::.
CCDS72 QPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQ
820 830 840 850 860 870
1120 1130 1140 1150 1160 1170
pF1KB5 TGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
.:.::: .::: ...:::: : : .. :::::.: :::: ...:.:.:.: :
CCDS72 VGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEP
880 890 900 910 920 930
CCDS72 FRRQLLQGRV
940
>>CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 (956 aa)
initn: 2130 init1: 1253 opt: 2422 Z-score: 1690.1 bits: 324.4 E(32554): 8.1e-88
Smith-Waterman score: 2575; 52.3% identity (71.4% similar) in 682 aa overlap (535-1169:263-938)
510 520 530 540 550 560
pF1KB5 SVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTS
. : :.:. .. . : :::: :: :
CCDS10 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHE-QRSHCSPNPCFRGVDCME
240 250 260 270 280 290
570 580 590 600 610 620
pF1KB5 -YPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPR
: ...:: :::: .::: .:.:..:: .. : :: .. : :: ::..: ::
CCDS10 VYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEACPRG
300 310 320 330 340
630 640 650 660
pF1KB5 FTGSQPFGQGVEHATANKQVCKPRNPCTDGTHD-CNKNAKCN--------------YLGH
. :.: : :...: :.::::. . :.::.. :. :. :. .::.
CCDS10 YKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGN
350 360 370 380 390 400
670 680 690 700
pF1KB5 YSD----------PMYR-----------------CECKPGYAGNGIICGEDTDLDGWPSE
:. : . :.:. :.:::: .:: :::.::.:..
CCDS10 QSQGCLPARTCHSPAHSPCHIHAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQ
410 420 430 440 450 460
710 720 730 740 750 760
pF1KB5 NLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPA
: :. : . :::.::: ::::::: :.::.:: :::: :.: : . .::: . :
CCDS10 ALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKD
470 480 490 500 510 520
770 780 790 800 810 820
pF1KB5 QYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQ
: . : :. :: ::::: : :: :::.::::::: :.::::: : ::: : : :
CCDS10 QQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQ
530 540 550 560 570 580
830 840 850 860 870 880
pF1KB5 RDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNAN
: : ::::: ::.:: :: : :.::: .::.::.:.: : ::::.. :::: .::..
CCDS10 TDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSS
590 600 610 620 630 640
890 900 910 920 930
pF1KB5 QADHDKDGKGDACDHDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHD
: : :.:: :: :: ::::::::: :::::::::.::::::.: ::.:.::::.:
CCDS10 QLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDND
650 660 670 680 690 700
940 950 960 970 980 990
pF1KB5 SVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLA
.: : :.:::..... :::: .: . :::.: .: :::::: .:: :.:::.: :::::
CCDS10 AVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLA
710 720 730 740 750 760
1000 1010 1020 1030 1040 1050
pF1KB5 VGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQG
::: ::.::: ::: .:: :::::::.:.::.:.:::::::::. :.::...: :: .
CCDS10 VGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVA
770 780 790 800 810 820
1060 1070 1080 1090 1100 1110
pF1KB5 YSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPK
::..:.:.:..::::::::::::::.:: ::: :: :::..::.: :.:::.: :::.
CCDS10 QPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQ
830 840 850 860 870 880
1120 1130 1140 1150 1160 1170
pF1KB5 TGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
.:.::: .::: ...:::: : : .. :::::.: :::: ...:.:.:.: :
CCDS10 VGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEP
890 900 910 920 930 940
CCDS10 FRRQLLQGRV
950
>>CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 (870 aa)
initn: 2483 init1: 1214 opt: 2364 Z-score: 1650.4 bits: 316.9 E(32554): 1.3e-85
Smith-Waterman score: 2510; 53.9% identity (69.9% similar) in 668 aa overlap (547-1169:195-851)
520 530 540 550 560 570
pF1KB5 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP
: : ::::: ::.::. :: ..:: ::
CCDS78 AECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDG-FQCGPCP
170 180 190 200 210 220
580 590 600 610 620 630
pF1KB5 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH
::.:::: : :::::: : :. : : : : .::. : :: ::: . : :.
CCDS78 EGYTGNGITCIDVDECKYHP--CYP--GVH-CINLSPGFRCDACPVGFTGPMVQGVGISF
230 240 250 260 270
640 650 660 670
pF1KB5 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS----DPMYR----------------
: .::::: . : .:. : :. : : :: : : :
CCDS78 AKSNKQVCTDIDECRNGA--CVPNSICVNTLGSYRCGPCKPGYTGDQIRGCKAERNCRNP
280 290 300 310 320 330
680 690 700 710
pF1KB5 --------------------CECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHCKK
: : :.::.: :::.:.:.:..:.:.: : : .:::
CCDS78 ELNPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSA---RNCKK
340 350 360 370 380 390
720 730 740 750 760 770
pF1KB5 DNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCD
::: .::::::: :.::::::::.: :.: : ...::: . .: : . :.: :: ::
CCDS78 DNCKYVPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACD
400 410 420 430 440 450
780 790 800 810 820 830
pF1KB5 NCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDN
:: : :: :::..:.:::: :.::::: : ::: : :::: : ::::: ::.
CCDS78 NCLSVLNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDS
460 470 480 490 500 510
840 850 860 870 880 890
pF1KB5 CPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACD
:: ::.: : :.: .::.::.::: : ::::.. :::: : :. : : :::: :: ::
CCDS78 CPDVSNPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECD
520 530 540 550 560 570
900 910 920 930 940 950
pF1KB5 HDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD
::::::::: ::::::::: :.::..:: :: :..:::.:.: : :.::::..
CCDS78 DDDDNDGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAE
580 590 600 610 620 630
960 970 980 990 1000 1010
pF1KB5 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT
.. :::: .: . :::.: .: :::::: .:: :.:::.: :::::::: ::.::: ::
CCDS78 VTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGT
640 650 660 670 680 690
1020 1030 1040 1050 1060 1070
pF1KB5 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG
: .::. :::::::.::::.:: ::::::::. :.::...: :: . :...:.:.: ::
CCDS78 FHVNTQTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTG
700 710 720 730 740 750
1080 1090 1100 1110 1120 1130
pF1KB5 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI
:::::::.:::::.: ::: ::.: :..:::: ..::: :.:::..:.::: .:::...
CCDS78 PGEHLRNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSEL
760 770 780 790 800 810
1140 1150 1160 1170
pF1KB5 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
.:::: : :. :::::.: :::: ...:.:::.: :
CCDS78 VADSGVTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN
820 830 840 850 860 870
>>CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 (961 aa)
initn: 2483 init1: 1214 opt: 2364 Z-score: 1650.0 bits: 317.0 E(32554): 1.4e-85
Smith-Waterman score: 2510; 53.9% identity (69.9% similar) in 668 aa overlap (547-1169:286-942)
520 530 540 550 560 570
pF1KB5 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP
: : ::::: ::.::. :: ..:: ::
CCDS40 AECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDG-FQCGPCP
260 270 280 290 300 310
580 590 600 610 620 630
pF1KB5 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH
::.:::: : :::::: : :. : : : : .::. : :: ::: . : :.
CCDS40 EGYTGNGITCIDVDECKYHP--CYP--GVH-CINLSPGFRCDACPVGFTGPMVQGVGISF
320 330 340 350 360
640 650 660 670
pF1KB5 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS----DPMYR----------------
: .::::: . : .:. : :. : : :: : : :
CCDS40 AKSNKQVCTDIDECRNGA--CVPNSICVNTLGSYRCGPCKPGYTGDQIRGCKAERNCRNP
370 380 390 400 410 420
680 690 700 710
pF1KB5 --------------------CECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHCKK
: : :.::.: :::.:.:.:..:.:.: : : .:::
CCDS40 ELNPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSA---RNCKK
430 440 450 460 470 480
720 730 740 750 760 770
pF1KB5 DNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCD
::: .::::::: :.::::::::.: :.: : ...::: . .: : . :.: :: ::
CCDS40 DNCKYVPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACD
490 500 510 520 530 540
780 790 800 810 820 830
pF1KB5 NCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDN
:: : :: :::..:.:::: :.::::: : ::: : :::: : ::::: ::.
CCDS40 NCLSVLNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDS
550 560 570 580 590 600
840 850 860 870 880 890
pF1KB5 CPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACD
:: ::.: : :.: .::.::.::: : ::::.. :::: : :. : : :::: :: ::
CCDS40 CPDVSNPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECD
610 620 630 640 650 660
900 910 920 930 940 950
pF1KB5 HDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD
::::::::: ::::::::: :.::..:: :: :..:::.:.: : :.::::..
CCDS40 DDDDNDGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAE
670 680 690 700 710 720
960 970 980 990 1000 1010
pF1KB5 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT
.. :::: .: . :::.: .: :::::: .:: :.:::.: :::::::: ::.::: ::
CCDS40 VTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGT
730 740 750 760 770 780
1020 1030 1040 1050 1060 1070
pF1KB5 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG
: .::. :::::::.::::.:: ::::::::. :.::...: :: . :...:.:.: ::
CCDS40 FHVNTQTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTG
790 800 810 820 830 840
1080 1090 1100 1110 1120 1130
pF1KB5 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI
:::::::.:::::.: ::: ::.: :..:::: ..::: :.:::..:.::: .:::...
CCDS40 PGEHLRNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSEL
850 860 870 880 890 900
1140 1150 1160 1170
pF1KB5 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
.:::: : :. :::::.: :::: ...:.:::.: :
CCDS40 VADSGVTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN
910 920 930 940 950 960
>>CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635 aa)
initn: 1339 init1: 525 opt: 705 Z-score: 495.0 bits: 105.8 E(32554): 3e-21
Smith-Waterman score: 726; 26.7% identity (50.7% similar) in 716 aa overlap (62-725:4182-4849)
40 50 60 70 80 90
pF1KB5 DIFELTGAARKGSGRRLVKGPDPSSPAFRIEDANLIPPVPDDKFQDLVDAVRAEKGFLLL
:... : : : . . :. .: .::
CCDS30 NVAGSSSTSTKLTVHVPPRIRSTEGHYTVNENSQAILPCVADGIP--TPAINWKKDNVLL
4160 4170 4180 4190 4200
100 110 120 130 140
pF1KB5 ASL--RQMKKTRGTLLALERKDHSGQVFSVVSNGKAG--TLDLSLTVQGKQHVVSVEEAL
:.: . . : :. . ... .. :.:. :: : .:::: ::. . :
CCDS30 ANLLGKYTAEPYGELILENVVLEDSGFYTCVANNAAGEDTHTVSLTV----HVLPTFTEL
4210 4220 4230 4240 4250 4260
150 160 170 180 190 200
pF1KB5 ---LATGQWKSITLFVQEDRAQLYIDCEKMENAELDVPIQSVFTRDLASIARLRIAKGGV
.. .. ... : . : ..: . . ..:: .. : :. .:.
CCDS30 PGDVSLNKGEQLRLSCKATGIPLPKLTWTFNNNIIPAHFDSVNGHSELVIERVSKEDSGT
4270 4280 4290 4300 4310 4320
210 220 230 240 250
pF1KB5 ----NDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVL---LTLDNNVVNGSSPAIRTN
.: : .. . ::. : .... :. : :. .: . .:.:. :
CCDS30 YVCTAENSVGFVKAIGFVYVKEPP-VFKGDYPSNWIEPLGGNAILNCEVKGDPTPTIQWN
4330 4340 4350 4360 4370 4380
260 270 280 290 300
pF1KB5 YIG------HKTKDLQ----AICG-ISCD--ELSSMVLELRGL--RTIVTTLQDSIRKVT
: :. ..: :: : .. : . . .. . :. :.. :::. .
CCDS30 RKGVDIEISHRIRQLGNGSLAIYGTVNEDAGDYTCVATNEAGVVERSMSLTLQSPPIITL
4390 4400 4410 4420 4430 4440
310 320 330 340 350 360
pF1KB5 EENKELANELRRPPL-CYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSNA
: . . : . : : .: . . . :. .. . .. :.. .. : : ..
CCDS30 EPVETVINAGGKIILNCQATG-EPQPTITWSRQGHSISW-DDRVNVLSNNSLYIADAQKE
4450 4460 4470 4480 4490 4500
370 380 390 400
pF1KB5 TVPDGECCPRCWPSD---------SADDGWSPWSEWTSCSTSCGNGIQQRGRSCD-----
. . :: : .. .. :.: :: : .::..::.:::.:.: :.
CCDS30 DTSEFECVARNLMGSVLVRVPVIVQVHGGFSQWSAWRACSVTCGKGIQKRSRLCNQPLPA
4510 4520 4530 4540 4550 4560
410 420 430 440 450 460
pF1KB5 SLNNRCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSP
. .. :.::... :.:. . : ::.::.:: : :. .:: : :: : ::.::
CCDS30 NGGKPCQGSDLEMRNCQNKPCPV----DGSWSEWSLWEECTRSCGRGNQTRTRTCNNPSV
4570 4580 4590 4600 4610
470 480 490 500 510 520
pF1KB5 QMNGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFG
: .:.::::.: : :. ::..:.:. :.:: :: .:: :.: :.:::::: : ::
CCDS30 QHGGRPCEGNAVEIIMCNIRPCPVHGAWSAWQPWGTCSESCGKGTQTRARLCNNPPPAFG
4620 4630 4640 4650 4660 4670
530 540 550 560 570 580
pF1KB5 GKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWK-CG-ACPPGYSGNGIQ
:. : : :. :.::...::: : : ... .::. :. .: :
CCDS30 GSYCDGAETQMQVCNERNCPIHG----------KWATW--ASWSACSVSCGGGARQRTRG
4680 4690 4700 4710 4720
590 600 610 620 630 640
pF1KB5 CTDVDECKEVPDACFNHNGEHRCENTDPGY---NCLPCPPRFTGSQPFGQGVEHATANKQ
:.: :: . : ..::..: : ::: . . : : :. : :
CCDS30 CSD-----PVP-----QYGGRKCEGSDVQSDFCNSDPCPTHGNWSPWSGWGTCSRTCNGG
4730 4740 4750 4760 4770
650 660 670 680 690 700
pF1KB5 VCKPRNPCTDGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPSEN
. : :. : . : : .. . :: : .: : . .: : .
CCDS30 QMRRYRTC-DNPPPSNGGRAC---GGPDSQIQRC--------NTDMCPVDGSWGSWHSWS
4780 4790 4800 4810 4820
710 720 730 740 750
pF1KB5 LVCVAN--ATYHCKKDNCPN-LPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYN
: :. . . .: : . .: .:
CCDS30 Q-CSASCGGGEKTRKRLCDHPVPVKGGRPCPGDTTQVTRCNVQACPGGPQRARGSVIGNI
4830 4840 4850 4860 4870 4880
>>CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584 aa)
initn: 536 init1: 253 opt: 601 Z-score: 428.8 bits: 91.7 E(32554): 1.5e-17
Smith-Waterman score: 601; 35.2% identity (55.3% similar) in 273 aa overlap (329-591:358-620)
300 310 320 330 340 350
pF1KB5 RKVTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHC----QNSVTICKKVSCP
:::. : : :. . .: . :
CCDS64 RSTDARRREELGDELQQFGFPAPQTGDPAAEEWSPWSVCSSTCGEGWQTRTRFCVSSSYS
330 340 350 360 370 380
360 370 380 390 400 410
pF1KB5 IMPCSNATVPDGECCPR--CWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLN--
. ::. . : : : .: :. :: :. ::..:: :...: :.: .
CCDS64 TQ-CSGPLREQRLCNNSAVC-PVHGA---WDEWSPWSLCSSTCGRGFRDRTRTCRPPQFG
390 400 410 420 430 440
420 430 440 450 460
pF1KB5 -NRCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQM
: ::: ::. :.: : : ::.:..:: ::.::..:..: : : ::.:: .
CCDS64 GNPCEGPEKQTKFCNIALCPGR-AVDGNWNEWSSWSACSASCSQGRQQRTRECNGPS--Y
450 460 470 480 490
470 480 490 500 510 520
pF1KB5 NGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGK
.: :.:. ::. : . ::..: : :. : ::::::.: :.: :.:..: :::
CCDS64 GGAECQGHWVETRDCFLQQCPVDGKWQAWASWGSCSVTCGAGSQRRERVCSGPF--FGGA
500 510 520 530 540 550
530 540 550 560 570 580
pF1KB5 DCVGDVTENQICNKQDCPIDGCLSNP-CFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTD
: : : . :. : :: . . :..: : : :: . .: .. .
CCDS64 ACQGPQDEYRQCGTQRCPEPHEICDEDNFGAVIWKETPAGEVAAVRCPRNATGLILRRCE
560 570 580 590 600 610
590 600 610 620 630 640
pF1KB5 VDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRN
.::
CCDS64 LDEEGIAYWEPPTYIRCVSIDYRNIQMMTREHLAKAQRGLPGEGVSEVIQTLVEISQDGT
620 630 640 650 660 670
1170 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 22:44:20 2016 done: Thu Nov 3 22:44:21 2016
Total Scan time: 5.010 Total Display time: 0.390
Function used was FASTA [36.3.4 Apr, 2011]