FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4505, 1172 aa
1>>>pF1KB4505 1172 - 1172 aa - 1172 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.2505+/-0.00137; mu= 19.4679+/- 0.082
mean_var=192.2287+/-35.756, 0's: 0 Z-trim(107.7): 191 B-trim: 0 in 0/51
Lambda= 0.092505
statistics sampled from 9542 (9762) to 9542 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.649), E-opt: 0.2 (0.3), width: 16
Scan time: 3.670
The best scores are: opt bits E(32554)
CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172) 8548 1155.3 0
CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170) 5584 759.7 9.1e-219
CCDS12385.1 COMP gene_id:1311|Hs108|chr19 ( 757) 2464 343.0 1.6e-93
CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 ( 836) 2422 337.5 8.1e-92
CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 ( 947) 2422 337.6 8.7e-92
CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 ( 956) 2422 337.6 8.7e-92
CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 ( 870) 2403 335.0 4.8e-91
CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 ( 961) 2403 335.0 5.1e-91
CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584) 610 96.1 7.3e-19
CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522) 587 93.0 6e-18
CCDS14282.1 CFP gene_id:5199|Hs108|chrX ( 469) 539 85.8 2.6e-16
CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551) 539 86.6 5.1e-16
CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584) 539 86.6 5.2e-16
CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635) 541 87.6 9e-16
CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074) 468 76.9 3e-13
CCDS35491.1 SEMA5B gene_id:54437|Hs108|chr3 (1151) 432 72.1 8.6e-12
CCDS58848.1 SEMA5B gene_id:54437|Hs108|chr3 (1205) 432 72.1 8.9e-12
>>CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172 aa)
initn: 8548 init1: 8548 opt: 8548 Z-score: 6178.8 bits: 1155.3 E(32554): 0
Smith-Waterman score: 8548; 100.0% identity (100.0% similar) in 1172 aa overlap (1-1172:1-1172)
10 20 30 40 50 60
pF1KB4 MVWRLVLLALWVWPSTQAGHQDKDTTFDLFSISNINRKTIGAKQFRGPDPGVPAYRFVRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MVWRLVLLALWVWPSTQAGHQDKDTTFDLFSISNINRKTIGAKQFRGPDPGVPAYRFVRF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 DYIPPVNADDLSKITKIMRQKEGFFLTAQLKQDGKSRGTLLALEGPGLSQRQFEIVSNGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DYIPPVNADDLSKITKIMRQKEGFFLTAQLKQDGKSRGTLLALEGPGLSQRQFEIVSNGP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 ADTLDLTYWIDGTRHVVSLEDVGLADSQWKNVTVQVAGETYSLHVGCDLIDSFALDEPFY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ADTLDLTYWIDGTRHVVSLEDVGLADSQWKNVTVQVAGETYSLHVGCDLIDSFALDEPFY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 EHLQAEKSRMYVAKGSARESHFRGLLQNVHLVFENSVEDILSKKGCQQGQGAEINAISEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EHLQAEKSRMYVAKGSARESHFRGLLQNVHLVFENSVEDILSKKGCQQGQGAEINAISEN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 TETLRLGPHVTTEYVGPSSERRPEVCERSCEELGNMVQELSGLHVLVNQLSENLKRVSND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TETLRLGPHVTTEYVGPSSERRPEVCERSCEELGNMVQELSGLHVLVNQLSENLKRVSND
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 NQFLWELIGGPPKTRNMSACWQDGRFFAENETWVVDSCTTCTCKKFKTICHQITCPPATC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NQFLWELIGGPPKTRNMSACWQDGRFFAENETWVVDSCTTCTCKKFKTICHQITCPPATC
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 ASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSCDVTSNTCLGPSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSCDVTSNTCLGPSI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 QTRACSLSKCDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSPVPQMGGKNCKGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QTRACSLSKCDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSPVPQMGGKNCKGSG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 RETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQYGGKACVGDVQER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQYGGKACVGDVQER
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 QMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCPVGFLGNGTHCEDLDECALVPDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCPVGFLGNGTHCEDLDECALVPDI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 CFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQVCEPENPCKDKTHNCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 CFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQVCEPENPCKDKTHNCH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 KHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATYHCIKDNC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATYHCIKDNC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 PHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVGDRCDNCP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVGDRCDNCP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 YVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGDHCDNCPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGDHCDNCPL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 VHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQGDACDPDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQGDACDPDD
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 DNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNAISETDFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNAISETDFR
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 NFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGTFYVNTDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGTFYVNTDR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB4 DDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTGTGEHLRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTGTGEHLRN
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB4 ALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQVMADSGPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQVMADSGPI
1090 1100 1110 1120 1130 1140
1150 1160 1170
pF1KB4 YDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
::::::::::::::::::::::::::::::::
CCDS34 YDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
1150 1160 1170
>>CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170 aa)
initn: 5438 init1: 4961 opt: 5584 Z-score: 4041.0 bits: 759.7 E(32554): 9.1e-219
Smith-Waterman score: 5618; 61.7% identity (83.0% similar) in 1176 aa overlap (1-1171:3-1169)
10 20 30 40 50
pF1KB4 MVWRL-VLLALWVWPSTQAGHQDKDTT-FDLFSISNINRKTIGAKQFRGPDPGVPAYR
..: : ::. . : ... .. :.. ::.: ... :: : . .::::. ::.:
CCDS32 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 FVRFDYIPPVNADDLSKITKIMRQKEGFFLTAQLKQDGKSRGTLLALEGPGLSQRQFEIV
. . :::: : .. .. .: ..::.: :.:.: :.:::::::: : . : .:
CCDS32 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB4 SNGPADTLDLTYWIDGTRHVVSLEDVGLADSQWKNVTVQVAGETYSLHVGCDLIDSFALD
::: : ::::. ..: .::::.:.. :: .:::..:. : . .:.. :. ... ::
CCDS32 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB4 EPF---YEHLQAEKSRMYVAKGSARESHFRGLLQNVHLVFENSVEDILSKKGCQQGQGAE
:. . . : .:. .:::.. .. :.:.::::..:: .. :::: .:::... ..
CCDS32 VPIQSVFTRDLASIARLRIAKGGVNDN-FQGVLQNVRFVFGTTPEDILRNKGCSSSTSVL
190 200 210 220 230
240 250 260 270 280 290
pF1KB4 INAISENTETLRLGPHVTTEYVGPSSERRPEVCERSCEELGNMVQELSGLHVLVNQLSEN
.. .:. . .: . :.:.: ... .: ::.::..:: :: ::...:. :...
CCDS32 LTL--DNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 LKRVSNDNQFLWELIGGPPKTRNMSACWQDGRFFAENETWVVDSCTTCTCKKFKTICHQI
...:...:. : . . :: :...: . .:: :.::::: : :.. :::...
CCDS32 IRKVTEENKELANELRRPP------LCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 TCPPATCASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSCDVTSN
.:: :.. . .::::: : : ....:::::.:::.::..::.: :::::::: .:
CCDS32 SCPIMPCSNATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNN
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB4 TCLGPSIQTRACSLSKCDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSPVPQMGG
: : :.:::.: ...:: :..::::::::::::::::::: : :::::::::: :::.:
CCDS32 RCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNG
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB4 KNCKGSGRETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQYGGKAC
: :.: .::::::. :::.: :.:::::. :.:::.::...:.:.::.: ::.::: :
CCDS32 KPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDC
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB4 VGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCPVGFLGNGTHCEDLDE
:::: : :.:::..::.::::::::: :..:.:.:::::.::.:: :. ::: .: :.::
CCDS32 VGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDE
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB4 CALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQVCEPENPCK
: ::: ::. . :: ::.::..:::::::. :.:: : :.: : ..::::.:.:::
CCDS32 CKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCT
600 610 620 630 640 650
660 670 680 690 700 710
pF1KB4 DKTHNCHKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATY
: ::.:.:.:.: ::::.:::::.:::. ::::.:.:::::.::::::: ::::..::::
CCDS32 DGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATY
660 670 680 690 700 710
720 730 740 750 760 770
pF1KB4 HCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVG
:: :::::.::::::::.:::::::::::::::: . :..::: . .:: : :::.:.::
CCDS32 HCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVG
720 730 740 750 760 770
780 790 800 810 820 830
pF1KB4 DRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGD
:::::::: ::: : :::::::::::..::::: ..:::::: ::::.:::::: :::::
CCDS32 DRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGD
780 790 800 810 820 830
840 850 860 870 880 890
pF1KB4 HCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQG
.:::::: ::::: : :.: .:: ::::.:::.:::::: :::::. ::::::::.::.:
CCDS32 QCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKG
840 850 860 870 880 890
900 910 920 930 940 950
pF1KB4 DACDPDDDNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNA
:::: ::::::.:::.:::::: ::::.: ::::::: ::::::.:..:::::.::::
CCDS32 DACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KB4 ISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGT
::::::: :::.:::::::.: :::::.::::::::::.: :::.:::.:::..::::::
CCDS32 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT
960 970 980 990 1000 1010
1020 1030 1040 1050 1060 1070
pF1KB4 FYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTG
:..::.::::::::::::::::::::::::::::.::. .:::: ::::.:.::::::::
CCDS32 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG
1020 1030 1040 1050 1060 1070
1080 1090 1100 1110 1120 1130
pF1KB4 TGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQV
::::::::::::::::::::::::::.:::::.:::::.:.::::::.:::...:::..
CCDS32 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI
1080 1090 1100 1110 1120 1130
1140 1150 1160 1170
pF1KB4 MADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
:::::::::.:::::::::::::::::.::::::::::
CCDS32 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
1140 1150 1160 1170
>>CCDS12385.1 COMP gene_id:1311|Hs108|chr19 (757 aa)
initn: 3056 init1: 2182 opt: 2464 Z-score: 1792.6 bits: 343.0 E(32554): 1.6e-93
Smith-Waterman score: 2632; 54.3% identity (71.3% similar) in 669 aa overlap (549-1171:87-743)
520 530 540 550 560 570
pF1KB4 RVCNSPEPQYGGKACVGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCP
:. : . ::::. : . .:. :: ::
CCDS12 REITFLKNTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGA-RCGPCP
60 70 80 90 100 110
580 590 600 610 620 630
pF1KB4 VGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEA
.:: :::.:: :..:: : :: .: ::.::.:::.: ::: : : ::::
CCDS12 AGFTGNGSHCTDVNECNAHP--CFP--RV-RCINTSPGFRCEACPPGYSGPTHQGVGLAF
120 130 140 150 160 170
640 650
pF1KB4 AKTEKQVCEPENPCKDKTHNC---------------------------------------
::..:::: : :. :::
CCDS12 AKANKQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCP
180 190 200 210 220 230
660 670 680 690 700 710
pF1KB4 -------HKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNAT
:.::.:. : .: : .:.::.:..::.:.::::.:. .: :
CCDS12 DGSPSECHEHADCVLE---RDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPE---
240 250 260 270 280
720 730 740 750 760 770
pF1KB4 YHCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEV
.: :::: .::::::: :.:::::::: : :.::: .::::: :. :: : . :.:.
CCDS12 RQCRKDNCVTVPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKW
290 300 310 320 330 340
780 790 800 810 820 830
pF1KB4 GDRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVG
:: :::: .: : :::..:.::::. ::::: . :. :::: : :.::.:.::::.:
CCDS12 GDACDNCRSQKNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIG
350 360 370 380 390 400
840 850 860 870 880 890
pF1KB4 DHCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQ
: ::::: ::::.:::.:.::: ::...: : ::::...:::: . :. : : :.:::
CCDS12 DACDNCPQKSNPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQ
410 420 430 440 450 460
900 910 920 930 940 950
pF1KB4 GDACDPDDDNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENN
::::: :::::::::.::::::: :: ::: : :: ::.:.:::: :.. : ::::::
CCDS12 GDACDDDDDNDGVPDSRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENA
470 480 490 500 510 520
960 970 980 990 1000 1010
pF1KB4 AISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSG
.. :::: :: : :::.: .:::::::. .::.:.::: :::::.:::. :..::: :
CCDS12 EVTLTDFRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEG
530 540 550 560 570 580
1020 1030 1040 1050 1060 1070
pF1KB4 TFYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTT
::.::: :::::::.::::.:: ::::::::. ::::. .: :: . :..::.:.:.:
CCDS12 TFHVNTVTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSST
590 600 610 620 630 640
1080 1090 1100 1110 1120 1130
pF1KB4 GTGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQ
: ::.:::::::::.: .::: ::.::::.:::: .::: : :::..::::: .:: .
CCDS12 GPGEQLRNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPE
650 660 670 680 690 700
1140 1150 1160 1170
pF1KB4 VMADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
..:::. . : :. :::::.: :::: . ...:.:.: :
CCDS12 LVADSNVVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA
710 720 730 740 750
>>CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 (836 aa)
initn: 2137 init1: 1243 opt: 2422 Z-score: 1761.9 bits: 337.5 E(32554): 8.1e-92
Smith-Waterman score: 2562; 52.2% identity (69.9% similar) in 688 aa overlap (537-1171:143-818)
510 520 530 540 550 560
pF1KB4 TVTCAGGIRERTRVCNSPEPQYGGKACVGDVQERQMCN---KRSCPVDGCLSNPCFPGAQ
..: :.:. .:: : :::: :..
CCDS58 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHEQRS----HCSPNPCFRGVD
120 130 140 150 160
570 580 590 600 610 620
pF1KB4 CSS-FPDGSWSCGSCPVGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPC
: . .. :: :: :. :::::: :..::: . : :: :. :.::.::::: :
CCDS58 CMEVYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEAC
170 180 190 200 210 220
630 640
pF1KB4 PPRYRGNQPVGVGLEAAKTEKQVCE-----------------------------------
: :.:.: :::.. :.. ::::.
CCDS58 PRGYKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGF
230 240 250 260 270 280
650 660 670 680 690
pF1KB4 ---------PENPCKDKTHN-CHKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDL
: :.. .:. :: ::.:.. . .:.:..:.::.: .:: :.:.
CCDS58 LGNQSQGCLPARTCHSPAHSPCHIHAHCLFE---RNGAVSCQCNVGWAGNGNVCGTDTDI
290 300 310 320 330 340
700 710 720 730 740 750
pF1KB4 DGWPNLNLVCATNATYHCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQ
::.:. : : : . :: .::: ::::::: :.::.:: :::: :.::. . .:::.
CCDS58 DGYPDQALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCR
350 360 370 380 390 400
760 770 780 790 800 810
pF1KB4 LLFNPRQADYDKDEVGDRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPY
:. : : . : : :: ::::: : : : :::.:::::::. :.::: . : ::::
CCDS58 LFPNKDQQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPK
410 420 430 440 450 460
820 830 840 850 860 870
pF1KB4 VYNTDQRDTDGDGVGDHCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCP
: : : : : ::::: ::.:: . :: :::.:.::::: ::.::: : ::::...::::
CCDS58 VPNPLQTDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCP
470 480 490 500 510 520
880 890 900 910 920 930
pF1KB4 YISNANQADHDRDGQGDACDPDDDNDGVPD----DRDNCRLVFNPDQEDLDGDGRGDICK
. :..: : : :: :: :: ::::::.:: :::::: ::.:.: ::.: ::.:.
CCDS58 QLPNSSQLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCE
530 540 550 560 570 580
940 950 960 970 980 990
pF1KB4 DDFDNDNIPDIDDVCPENNAISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTAN
:::::: . : :::::. .. :::: .: : :::.: .:::::::. .:: :.::: :
CCDS58 DDFDNDAVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMN
590 600 610 620 630 640
1000 1010 1020 1030 1040 1050
pF1KB4 SDPGIAVGFDEFGSVDFSGTFYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQ
::::.:::. :..::: :::.::: :::::::.:.::.:.:::::::::. ::::.
CCDS58 SDPGLAVGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQAT
650 660 670 680 690 700
1060 1070 1080 1090 1100 1110
pF1KB4 PTRAYGYSGVSLKVVNSTTGTGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWH
: :: . :..::.:.:..: ::::::::::::.:: ::: :: ::::.::.: :.:::.
CCDS58 PFRAVAQPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQ
710 720 730 740 750 760
1120 1130 1140 1150 1160 1170
pF1KB4 LTHRPKTGYIRVLVHEGKQVMADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
: :::..::::: ..:: :..:::: : : .. :::::.: :::: . .:.:.:.: :
CCDS58 LLHRPQVGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTV
770 780 790 800 810 820
CCDS58 PEDFEPFRRQLLQGRV
830
>>CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 (947 aa)
initn: 2137 init1: 1243 opt: 2422 Z-score: 1761.3 bits: 337.6 E(32554): 8.7e-92
Smith-Waterman score: 2562; 52.2% identity (69.9% similar) in 688 aa overlap (537-1171:254-929)
510 520 530 540 550 560
pF1KB4 TVTCAGGIRERTRVCNSPEPQYGGKACVGDVQERQMCN---KRSCPVDGCLSNPCFPGAQ
..: :.:. .:: : :::: :..
CCDS72 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHEQRS----HCSPNPCFRGVD
230 240 250 260 270
570 580 590 600 610 620
pF1KB4 CSS-FPDGSWSCGSCPVGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPC
: . .. :: :: :. :::::: :..::: . : :: :. :.::.::::: :
CCDS72 CMEVYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEAC
280 290 300 310 320 330
630 640
pF1KB4 PPRYRGNQPVGVGLEAAKTEKQVCE-----------------------------------
: :.:.: :::.. :.. ::::.
CCDS72 PRGYKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGF
340 350 360 370 380 390
650 660 670 680 690
pF1KB4 ---------PENPCKDKTHN-CHKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDL
: :.. .:. :: ::.:.. . .:.:..:.::.: .:: :.:.
CCDS72 LGNQSQGCLPARTCHSPAHSPCHIHAHCLFE---RNGAVSCQCNVGWAGNGNVCGTDTDI
400 410 420 430 440 450
700 710 720 730 740 750
pF1KB4 DGWPNLNLVCATNATYHCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQ
::.:. : : : . :: .::: ::::::: :.::.:: :::: :.::. . .:::.
CCDS72 DGYPDQALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCR
460 470 480 490 500 510
760 770 780 790 800 810
pF1KB4 LLFNPRQADYDKDEVGDRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPY
:. : : . : : :: ::::: : : : :::.:::::::. :.::: . : ::::
CCDS72 LFPNKDQQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPK
520 530 540 550 560 570
820 830 840 850 860 870
pF1KB4 VYNTDQRDTDGDGVGDHCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCP
: : : : : ::::: ::.:: . :: :::.:.::::: ::.::: : ::::...::::
CCDS72 VPNPLQTDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCP
580 590 600 610 620 630
880 890 900 910 920 930
pF1KB4 YISNANQADHDRDGQGDACDPDDDNDGVPD----DRDNCRLVFNPDQEDLDGDGRGDICK
. :..: : : :: :: :: ::::::.:: :::::: ::.:.: ::.: ::.:.
CCDS72 QLPNSSQLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCE
640 650 660 670 680 690
940 950 960 970 980 990
pF1KB4 DDFDNDNIPDIDDVCPENNAISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTAN
:::::: . : :::::. .. :::: .: : :::.: .:::::::. .:: :.::: :
CCDS72 DDFDNDAVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMN
700 710 720 730 740 750
1000 1010 1020 1030 1040 1050
pF1KB4 SDPGIAVGFDEFGSVDFSGTFYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQ
::::.:::. :..::: :::.::: :::::::.:.::.:.:::::::::. ::::.
CCDS72 SDPGLAVGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQAT
760 770 780 790 800 810
1060 1070 1080 1090 1100 1110
pF1KB4 PTRAYGYSGVSLKVVNSTTGTGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWH
: :: . :..::.:.:..: ::::::::::::.:: ::: :: ::::.::.: :.:::.
CCDS72 PFRAVAQPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQ
820 830 840 850 860 870
1120 1130 1140 1150 1160 1170
pF1KB4 LTHRPKTGYIRVLVHEGKQVMADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
: :::..::::: ..:: :..:::: : : .. :::::.: :::: . .:.:.:.: :
CCDS72 LLHRPQVGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTV
880 890 900 910 920 930
CCDS72 PEDFEPFRRQLLQGRV
940
>>CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 (956 aa)
initn: 2137 init1: 1243 opt: 2422 Z-score: 1761.3 bits: 337.6 E(32554): 8.7e-92
Smith-Waterman score: 2562; 52.2% identity (69.9% similar) in 688 aa overlap (537-1171:263-938)
510 520 530 540 550 560
pF1KB4 TVTCAGGIRERTRVCNSPEPQYGGKACVGDVQERQMCN---KRSCPVDGCLSNPCFPGAQ
..: :.:. .:: : :::: :..
CCDS10 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHEQRS----HCSPNPCFRGVD
240 250 260 270 280
570 580 590 600 610 620
pF1KB4 CSS-FPDGSWSCGSCPVGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPC
: . .. :: :: :. :::::: :..::: . : :: :. :.::.::::: :
CCDS10 CMEVYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEAC
290 300 310 320 330 340
630 640
pF1KB4 PPRYRGNQPVGVGLEAAKTEKQVCE-----------------------------------
: :.:.: :::.. :.. ::::.
CCDS10 PRGYKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGF
350 360 370 380 390 400
650 660 670 680 690
pF1KB4 ---------PENPCKDKTHN-CHKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDL
: :.. .:. :: ::.:.. . .:.:..:.::.: .:: :.:.
CCDS10 LGNQSQGCLPARTCHSPAHSPCHIHAHCLFE---RNGAVSCQCNVGWAGNGNVCGTDTDI
410 420 430 440 450 460
700 710 720 730 740 750
pF1KB4 DGWPNLNLVCATNATYHCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQ
::.:. : : : . :: .::: ::::::: :.::.:: :::: :.::. . .:::.
CCDS10 DGYPDQALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCR
470 480 490 500 510 520
760 770 780 790 800 810
pF1KB4 LLFNPRQADYDKDEVGDRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPY
:. : : . : : :: ::::: : : : :::.:::::::. :.::: . : ::::
CCDS10 LFPNKDQQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPK
530 540 550 560 570 580
820 830 840 850 860 870
pF1KB4 VYNTDQRDTDGDGVGDHCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCP
: : : : : ::::: ::.:: . :: :::.:.::::: ::.::: : ::::...::::
CCDS10 VPNPLQTDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCP
590 600 610 620 630 640
880 890 900 910 920 930
pF1KB4 YISNANQADHDRDGQGDACDPDDDNDGVPD----DRDNCRLVFNPDQEDLDGDGRGDICK
. :..: : : :: :: :: ::::::.:: :::::: ::.:.: ::.: ::.:.
CCDS10 QLPNSSQLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCE
650 660 670 680 690 700
940 950 960 970 980 990
pF1KB4 DDFDNDNIPDIDDVCPENNAISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTAN
:::::: . : :::::. .. :::: .: : :::.: .:::::::. .:: :.::: :
CCDS10 DDFDNDAVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMN
710 720 730 740 750 760
1000 1010 1020 1030 1040 1050
pF1KB4 SDPGIAVGFDEFGSVDFSGTFYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQ
::::.:::. :..::: :::.::: :::::::.:.::.:.:::::::::. ::::.
CCDS10 SDPGLAVGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQAT
770 780 790 800 810 820
1060 1070 1080 1090 1100 1110
pF1KB4 PTRAYGYSGVSLKVVNSTTGTGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWH
: :: . :..::.:.:..: ::::::::::::.:: ::: :: ::::.::.: :.:::.
CCDS10 PFRAVAQPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQ
830 840 850 860 870 880
1120 1130 1140 1150 1160 1170
pF1KB4 LTHRPKTGYIRVLVHEGKQVMADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
: :::..::::: ..:: :..:::: : : .. :::::.: :::: . .:.:.:.: :
CCDS10 LLHRPQVGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTV
890 900 910 920 930 940
CCDS10 PEDFEPFRRQLLQGRV
950
>>CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 (870 aa)
initn: 2501 init1: 1212 opt: 2403 Z-score: 1748.0 bits: 335.0 E(32554): 4.8e-91
Smith-Waterman score: 2492; 53.3% identity (70.6% similar) in 666 aa overlap (549-1171:195-851)
520 530 540 550 560 570
pF1KB4 RVCNSPEPQYGGKACVGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCP
: : ::::: :.::.. :: ..:: ::
CCDS78 AECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDG-FQCGPCP
170 180 190 200 210 220
580 590 600 610 620 630
pF1KB4 VGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEA
:. ::: : :.::: : :. . :.: .:::.: :: . : . :::.
CCDS78 EGYTGNGITCIDVDECKYHP--CYPGVH---CINLSPGFRCDACPVGFTGPMVQGVGISF
230 240 250 260 270
640 650 660
pF1KB4 AKTEKQVCE-----------PEN------------PCK-----DKTHNCHKHAEC--IYL
::..:::: :.. ::: :. ..:. . .: :
CCDS78 AKSNKQVCTDIDECRNGACVPNSICVNTLGSYRCGPCKPGYTGDQIRGCKAERNCRNPEL
280 290 300 310 320 330
670 680 690 700 710
pF1KB4 GHFS---------DPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATYHCIKDN
. : . : : .:.:::: :::.: :.:..:. .: :.. .: :::
CCDS78 NPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSA---RNCKKDN
340 350 360 370 380 390
720 730 740 750 760 770
pF1KB4 CPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVGDRCDNC
: ..::::::: :.::::::::.: :.::. .:.::: :. : : . ::: :: ::::
CCDS78 CKYVPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACDNC
400 410 420 430 440 450
780 790 800 810 820 830
pF1KB4 PYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGDHCDNCP
: : : :::..:.::::. :.::: . : :::: : :::: ::::::: ::.::
CCDS78 LSVLNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDSCP
460 470 480 490 500 510
840 850 860 870 880 890
pF1KB4 LVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQGDACDPD
: ::.:.:::::::::.::.:.: : ::::.. :::: . :. : : :.:: :: :: :
CCDS78 DVSNPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECDDD
520 530 540 550 560 570
900 910 920 930 940 950
pF1KB4 DDNDGVPD----DRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNAIS
:::::.:: :::::: :: ::: ..:: ::::..:::.:.. : :::::: ..
CCDS78 DDNDGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAEVT
580 590 600 610 620 630
960 970 980 990 1000 1010
pF1KB4 ETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGTFY
:::: .: : :::.: .:::::::. .:: :.::: :::::.:::. :..::: :::.
CCDS78 LTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFH
640 650 660 670 680 690
1020 1030 1040 1050 1060 1070
pF1KB4 VNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTGTG
:::. :::::::.::::.:: ::::::::. ::::. : :: . :..::.:.: :: :
CCDS78 VNTQTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTGPG
700 710 720 730 740 750
1080 1090 1100 1110 1120 1130
pF1KB4 EHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQVMA
:::::.:::::.: ::: ::.: ::.:::: ..::: : :::..::::: .::....:
CCDS78 EHLRNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSELVA
760 770 780 790 800 810
1140 1150 1160 1170
pF1KB4 DSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
::: : :. :::::.: :::: . .:.:::.: :
CCDS78 DSGVTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN
820 830 840 850 860 870
>>CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 (961 aa)
initn: 2501 init1: 1212 opt: 2403 Z-score: 1747.6 bits: 335.0 E(32554): 5.1e-91
Smith-Waterman score: 2492; 53.3% identity (70.6% similar) in 666 aa overlap (549-1171:286-942)
520 530 540 550 560 570
pF1KB4 RVCNSPEPQYGGKACVGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCP
: : ::::: :.::.. :: ..:: ::
CCDS40 AECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDG-FQCGPCP
260 270 280 290 300 310
580 590 600 610 620 630
pF1KB4 VGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEA
:. ::: : :.::: : :. . :.: .:::.: :: . : . :::.
CCDS40 EGYTGNGITCIDVDECKYHP--CYPGVH---CINLSPGFRCDACPVGFTGPMVQGVGISF
320 330 340 350 360
640 650 660
pF1KB4 AKTEKQVCE-----------PEN------------PCK-----DKTHNCHKHAEC--IYL
::..:::: :.. ::: :. ..:. . .: :
CCDS40 AKSNKQVCTDIDECRNGACVPNSICVNTLGSYRCGPCKPGYTGDQIRGCKAERNCRNPEL
370 380 390 400 410 420
670 680 690 700 710
pF1KB4 GHFS---------DPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATYHCIKDN
. : . : : .:.:::: :::.: :.:..:. .: :.. .: :::
CCDS40 NPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSA---RNCKKDN
430 440 450 460 470 480
720 730 740 750 760 770
pF1KB4 CPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVGDRCDNC
: ..::::::: :.::::::::.: :.::. .:.::: :. : : . ::: :: ::::
CCDS40 CKYVPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACDNC
490 500 510 520 530 540
780 790 800 810 820 830
pF1KB4 PYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGDHCDNCP
: : : :::..:.::::. :.::: . : :::: : :::: ::::::: ::.::
CCDS40 LSVLNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDSCP
550 560 570 580 590 600
840 850 860 870 880 890
pF1KB4 LVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQGDACDPD
: ::.:.:::::::::.::.:.: : ::::.. :::: . :. : : :.:: :: :: :
CCDS40 DVSNPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECDDD
610 620 630 640 650 660
900 910 920 930 940 950
pF1KB4 DDNDGVPD----DRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNAIS
:::::.:: :::::: :: ::: ..:: ::::..:::.:.. : :::::: ..
CCDS40 DDNDGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAEVT
670 680 690 700 710 720
960 970 980 990 1000 1010
pF1KB4 ETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGTFY
:::: .: : :::.: .:::::::. .:: :.::: :::::.:::. :..::: :::.
CCDS40 LTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFH
730 740 750 760 770 780
1020 1030 1040 1050 1060 1070
pF1KB4 VNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTGTG
:::. :::::::.::::.:: ::::::::. ::::. : :: . :..::.:.: :: :
CCDS40 VNTQTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTGPG
790 800 810 820 830 840
1080 1090 1100 1110 1120 1130
pF1KB4 EHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQVMA
:::::.:::::.: ::: ::.: ::.:::: ..::: : :::..::::: .::....:
CCDS40 EHLRNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSELVA
850 860 870 880 890 900
1140 1150 1160 1170
pF1KB4 DSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI
::: : :. :::::.: :::: . .:.:::.: :
CCDS40 DSGVTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN
910 920 930 940 950 960
>>CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584 aa)
initn: 367 init1: 233 opt: 610 Z-score: 452.1 bits: 96.1 E(32554): 7.3e-19
Smith-Waterman score: 610; 33.6% identity (56.2% similar) in 336 aa overlap (266-593:299-620)
240 250 260 270 280 290
pF1KB4 AISENTETLRLGPHVTTEYVGPSSERRPEVCERSCEELGNMVQELSGLHVLVNQLSENLK
:: :: . .: : ... :..:.
CCDS64 LWGECTRDCGGGLQTRTRTCLPAPGVEGGGCEGVLEEGRQCNREACGPAGRTSSRSQSLR
270 280 290 300 310 320
300 310 320 330 340 350
pF1KB4 RVSNDNQFLWELIGGPPKTRNMSACWQDGRFFAENET-WVVDSCTTCTCKKFKT-ICHQI
:.: . :: : . .. : : : ::. . : : : : . .: .: .
CCDS64 --STDARRREEL-GDELQQFGFPAP-QTGDPAAEEWSPWSVCSSTCGEGWQTRTRFC--V
330 340 350 360 370 380
360 370 380 390 400
pF1KB4 TCPPAT-CASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSC---D
. .: :..: . : : . : : .:. :. :. :: ::: : ..: :.: .
CCDS64 SSSYSTQCSGPLREQRLCNNSAVCPVHG--AWDEWSPWSLCSSTCGRGFRDRTRTCRPPQ
390 400 410 420 430 440
410 420 430 440 450 460
pF1KB4 VTSNTCLGPSIQTRACSLSKCDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSPVP
.: : :: ::. :... : : ::.:..:: ::.::..:. : : : ::.:
CCDS64 FGGNPCEGPEKQTKFCNIALCPGRAV-DGNWNEWSSWSACSASCSQGRQQRTRECNGP--
450 460 470 480 490
470 480 490 500 510 520
pF1KB4 QMGGKNCKGSGRETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQYG
..:: .:.: ::. : ::.::.:. :. :..:.:::..: ..: :::..: .:
CCDS64 SYGGAECQGHWVETRDCFLQQCPVDGKWQAWASWGSCSVTCGAGSQRRERVCSGPF--FG
500 510 520 530 540 550
530 540 550 560 570 580
pF1KB4 GKACVGDVQERQMCNKRSCPVDGCLSNPCFPGAQC-SSFPDGSWSCGSCPVGFLG-NGTH
: :: : .: ..:. . :: . . :: . : : . :: . : .
CCDS64 GAACQGPQDEYRQCGTQRCPEPHEICDEDNFGAVIWKETPAGEVAAVRCPRNATGLILRR
560 570 580 590 600 610
590 600 610 620 630 640
pF1KB4 CEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQVCE
:: :::
CCDS64 CE-LDEEGIAYWEPPTYIRCVSIDYRNIQMMTREHLAKAQRGLPGEGVSEVIQTLVEISQ
620 630 640 650 660 670
>>CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522 aa)
initn: 308 init1: 236 opt: 587 Z-score: 435.7 bits: 93.0 E(32554): 6e-18
Smith-Waterman score: 587; 39.9% identity (61.0% similar) in 218 aa overlap (380-593:290-497)
350 360 370 380 390 400
pF1KB4 CHQITCPPATCASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSCD
:: : :..:. ::::::.:.: : :.:
CCDS49 HTIKSQRPRSVHEKRVPQEQADAAKFMAQTGESGVEEWSQWSTCSVTCGQGSQVRTRTCV
260 270 280 290 300 310
410 420 430 440 450 460
pF1KB4 VTSNT-CLGPSIQTRACSLSK-CDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSP
.: : :: ..:.:. . : .. : : .::::: :: ::: :. :: : : .:
CCDS49 SPYGTHCSGPLRESRVCNNTALCPVH----GVWEEWSPWSLCSFTCGRGQRTRTRSC-TP
320 330 340 350 360 370
470 480 490 500 510 520
pF1KB4 VPQMGGKNCKGSGRETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQ
::.::. :.: . : :. : ::.::.:. :: :: :.:::..: ..:.: :..
CCDS49 -PQYGGRPCEGPETHHKPCNIALCPVDGQWQEWSSWSQCSVTCSNGTQQRSRQCTAAA--
380 390 400 410 420 430
530 540 550 560 570 580
pF1KB4 YGGKACVGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWS--CGSCPVGFLGNG
.::. : : : . : . : ..: : . ::. ::.: .: : . .:
CCDS49 HGGSECRGPWAESRECYNPECTANGQW-NQWGHWSGCSKSCDGGWERRIRTCQ-GAVITG
440 450 460 470 480
590 600 610 620 630 640
pF1KB4 THCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQV
.:: :
CCDS49 QQCEGTGEEVRRCNEQRCPAPYEICPEDYLMSMVWKRTPAGDLAFNQCPLNATGTTSRRC
490 500 510 520 530 540
1172 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 21:35:47 2016 done: Thu Nov 3 21:35:47 2016
Total Scan time: 3.670 Total Display time: 0.310
Function used was FASTA [36.3.4 Apr, 2011]