FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4569, 724 aa 1>>>pF1KE4569 724 - 724 aa - 724 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.5750+/-0.00117; mu= 10.2314+/- 0.070 mean_var=204.7047+/-39.998, 0's: 0 Z-trim(109.9): 148 B-trim: 31 in 2/49 Lambda= 0.089642 statistics sampled from 11082 (11243) to 11082 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.694), E-opt: 0.2 (0.345), width: 16 Scan time: 2.430 The best scores are: opt bits E(32554) CCDS12385.1 COMP gene_id:1311|Hs108|chr19 ( 757) 5311 700.5 2.5e-201 CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 ( 870) 3754 499.2 1.1e-140 CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 ( 961) 3754 499.2 1.2e-140 CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 ( 836) 3609 480.4 4.8e-135 CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 ( 947) 3609 480.5 5.2e-135 CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 ( 956) 3609 480.5 5.3e-135 CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170) 2504 337.6 6.3e-92 CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172) 2464 332.5 2.3e-90 >>CCDS12385.1 COMP gene_id:1311|Hs108|chr19 (757 aa) initn: 5311 init1: 5311 opt: 5311 Z-score: 3728.1 bits: 700.5 E(32554): 2.5e-201 Smith-Waterman score: 5311; 100.0% identity (100.0% similar) in 724 aa overlap (1-724:34-757) 10 20 30 pF1KE4 MLRELQETNAALQDVRELLRQQVREITFLK :::::::::::::::::::::::::::::: CCDS12 DTACVLLLTLAALGASGQGQSPLGSDLGPQMLRELQETNAALQDVRELLRQQVREITFLK 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 NTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGARCGPCPAGFTGNGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGARCGPCPAGFTGNGS 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 HCTDVNECNAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKANKQVCTDINE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HCTDVNECNAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKANKQVCTDINE 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE4 CETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSPSECHEHADC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSPSECHEHADC 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE4 VLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPERQCRKDNCVTVPNSGQEDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPERQCRKDNCVTVPNSGQEDV 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE4 DRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQKNDDQKDTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQKNDDQKDTD 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE4 QDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKSNPDQADVDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKSNPDQADVDH 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE4 DFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDNDGVPDSRDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDNDGVPDSRDN 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE4 CRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTDFRAFQTVVLDPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTDFRAFQTVVLDPEG 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE4 DAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTDDDYAGFIFGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTDDDYAGFIFGY 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE4 QDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQLRNALWHTGDTESQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQLRNALWHTGDTESQ 610 620 630 640 650 660 640 650 660 670 680 690 pF1KE4 VRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSNVVLDTTMRGGRLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSNVVLDTTMRGGRLG 670 680 690 700 710 720 700 710 720 pF1KE4 VFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA :::::::::::::::::::::::::::::::::: CCDS12 VFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA 730 740 750 >>CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 (870 aa) initn: 3653 init1: 2124 opt: 3754 Z-score: 2639.1 bits: 499.2 E(32554): 1.1e-140 Smith-Waterman score: 3866; 70.3% identity (86.2% similar) in 733 aa overlap (2-720:133-861) 10 20 30 pF1KE4 MLRELQETNAALQDVRELLRQQVREITFLKN : .. . : : .:..::::::.: .::.: CCDS78 LFQVASLQDCFLQQSEPLAATGTGDFNRQFLGQMTQLNQLLGEVKDLLRQQVKETSFLRN 110 120 130 140 150 160 40 50 60 70 80 pF1KE4 TVMECDACG---MQQSVRTGL-------PSVRPLLHCAPGFCFPGVACIQTESGARCGPC :. ::.::: .:. . . . : .:: .: . :: :: : ....: .:::: CCDS78 TIAECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDGFQCGPC 170 180 190 200 210 220 90 100 110 120 130 140 pF1KE4 PAGFTGNGSHCTDVNECNAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKAN : :.:::: : ::.::. :::.: :.::: ::::::.::: :..:: ::::..:::.: CCDS78 PEGYTGNGITCIDVDECKYHPCYPGVHCINLSPGFRCDACPVGFTGPMVQGVGISFAKSN 230 240 250 260 270 280 150 160 170 180 190 200 pF1KE4 KQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSP :::::::.::..: :::::.:.:: ::..::::.::..::: :: .:.: : . CCDS78 KQVCTDIDECRNGA--CVPNSICVNTLGSYRCGPCKPGYTGDQIRGC--KAERNCRNPEL 290 300 310 320 330 210 220 230 240 250 260 pF1KE4 SECHEHADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPERQCRKDNCVT . : .:.:. ::.:. .:::.:::::.: .::.:.:.:..:::.: : :.:.:::: CCDS78 NPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSARNCKKDNCKY 340 350 360 370 380 390 270 280 290 300 310 320 pF1KE4 VPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQ ::::::::.:::::::::: ::::::. ::.::: :..: ::::.:.: .::::::: : CCDS78 VPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACDNCLSV 400 410 420 430 440 450 330 340 350 360 370 380 pF1KE4 KNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKS :.:::::: ::::::::::.::: :.: ::::. :: ::.:.::::.:::::.::. : CCDS78 LNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDSCPDVS 460 470 480 490 500 510 390 400 410 420 430 440 pF1KE4 NPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDN ::.:.:::.:.:::.::..::.:::::::: :::::: :::: :.:.:: :: ::::::: CCDS78 NPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECDDDDDN 520 530 540 550 560 570 450 460 470 480 490 pF1KE4 DGVPD----SRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTD ::.:: . :::::::::.:::.. :::::.:..::: :.:.:.:::::::::::::: CCDS78 DGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAEVTLTD 580 590 600 610 620 630 500 510 520 530 540 550 pF1KE4 FRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNT :::.::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS78 FRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNT 640 650 660 670 680 690 560 570 580 590 600 610 pF1KE4 VTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQL ::::::::::::::::::::::::: :::::::.:::::::::::::::::.:::::.: CCDS78 QTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTGPGEHL 700 710 720 730 740 750 620 630 640 650 660 670 pF1KE4 RNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSN ::.::::::: .:::::::: :::::::: :::::::::::::::::::::: ::::::. CCDS78 RNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSELVADSG 760 770 780 790 800 810 680 690 700 710 720 pF1KE4 VVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA :..:::::::::::::::::::::.::.::::::::::.. : CCDS78 VTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN 820 830 840 850 860 870 >>CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 (961 aa) initn: 3653 init1: 2124 opt: 3754 Z-score: 2638.6 bits: 499.2 E(32554): 1.2e-140 Smith-Waterman score: 3866; 70.3% identity (86.2% similar) in 733 aa overlap (2-720:224-952) 10 20 30 pF1KE4 MLRELQETNAALQDVRELLRQQVREITFLKN : .. . : : .:..::::::.: .::.: CCDS40 LFQVASLQDCFLQQSEPLAATGTGDFNRQFLGQMTQLNQLLGEVKDLLRQQVKETSFLRN 200 210 220 230 240 250 40 50 60 70 80 pF1KE4 TVMECDACG---MQQSVRTGL-------PSVRPLLHCAPGFCFPGVACIQTESGARCGPC :. ::.::: .:. . . . : .:: .: . :: :: : ....: .:::: CCDS40 TIAECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDGFQCGPC 260 270 280 290 300 310 90 100 110 120 130 140 pF1KE4 PAGFTGNGSHCTDVNECNAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKAN : :.:::: : ::.::. :::.: :.::: ::::::.::: :..:: ::::..:::.: CCDS40 PEGYTGNGITCIDVDECKYHPCYPGVHCINLSPGFRCDACPVGFTGPMVQGVGISFAKSN 320 330 340 350 360 370 150 160 170 180 190 200 pF1KE4 KQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSP :::::::.::..: :::::.:.:: ::..::::.::..::: :: .:.: : . CCDS40 KQVCTDIDECRNGA--CVPNSICVNTLGSYRCGPCKPGYTGDQIRGC--KAERNCRNPEL 380 390 400 410 420 210 220 230 240 250 260 pF1KE4 SECHEHADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPERQCRKDNCVT . : .:.:. ::.:. .:::.:::::.: .::.:.:.:..:::.: : :.:.:::: CCDS40 NPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSARNCKKDNCKY 430 440 450 460 470 480 270 280 290 300 310 320 pF1KE4 VPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQ ::::::::.:::::::::: ::::::. ::.::: :..: ::::.:.: .::::::: : CCDS40 VPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACDNCLSV 490 500 510 520 530 540 330 340 350 360 370 380 pF1KE4 KNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKS :.:::::: ::::::::::.::: :.: ::::. :: ::.:.::::.:::::.::. : CCDS40 LNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDSCPDVS 550 560 570 580 590 600 390 400 410 420 430 440 pF1KE4 NPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDN ::.:.:::.:.:::.::..::.:::::::: :::::: :::: :.:.:: :: ::::::: CCDS40 NPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECDDDDDN 610 620 630 640 650 660 450 460 470 480 490 pF1KE4 DGVPD----SRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTD ::.:: . :::::::::.:::.. :::::.:..::: :.:.:.:::::::::::::: CCDS40 DGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAEVTLTD 670 680 690 700 710 720 500 510 520 530 540 550 pF1KE4 FRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNT :::.::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS40 FRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNT 730 740 750 760 770 780 560 570 580 590 600 610 pF1KE4 VTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQL ::::::::::::::::::::::::: :::::::.:::::::::::::::::.:::::.: CCDS40 QTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTGPGEHL 790 800 810 820 830 840 620 630 640 650 660 670 pF1KE4 RNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSN ::.::::::: .:::::::: :::::::: :::::::::::::::::::::: ::::::. CCDS40 RNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSELVADSG 850 860 870 880 890 900 680 690 700 710 720 pF1KE4 VVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA :..:::::::::::::::::::::.::.::::::::::.. : CCDS40 VTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN 910 920 930 940 950 960 >>CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 (836 aa) initn: 2852 init1: 1679 opt: 3609 Z-score: 2538.0 bits: 480.4 E(32554): 4.8e-135 Smith-Waterman score: 3609; 65.3% identity (83.4% similar) in 733 aa overlap (1-723:111-830) 10 20 30 pF1KE4 MLRELQETNAALQDVRELLRQQVREITFLK .. .: : : ..:. .:.::.:..... CCDS58 NTRWLEASVVGKINKVTNALHSILGEQTKALVTQLTLFNQILVELRDDIRDQVKEMSLIR 90 100 110 120 130 140 40 50 60 70 80 pF1KE4 NTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTES--GARCGPCPAGFTGN ::.:::..::.... :. ::.:. :: :: :... : :::::: :. :: CCDS58 NTIMECQVCGFHEQ-RS---------HCSPNPCFRGVDCMEVYEYPGYRCGPCPPGLQGN 150 160 170 180 190 90 100 110 120 130 140 pF1KE4 GSHCTDVNEC-NAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKANKQVCTD :.::.:.::: .: :::: :::: :::.::::: ::.: .:::. .:.:.::::.: CCDS58 GTHCSDINECAHADPCFPGSSCINTMPGFHCEACPRGYKGTQVSGVGIDYARASKQVCND 200 210 220 230 240 250 150 160 170 180 190 200 pF1KE4 INECETGQHN-CVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSPSECHE :.::. :... : :::.: :: :::.::::. ::.:.:..:: : : . . : :: CCDS58 IDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGNQSQGCL--PARTCHSPAHSPCHI 260 270 280 290 300 210 220 230 240 250 260 pF1KE4 HADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPE--RQCRKDNCVTVPN :: :..::.:. :: : ::::::: .:: :::.::.::. : : . ..:..:::. .:: CCDS58 HAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQALPCMDNNKHCKQDNCLLTPN 310 320 330 340 350 360 270 280 290 300 310 320 pF1KE4 SGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQKND :::::.: ::.:: :: ::::::. : .::: : : ::.:.: :..::::::: . :. CCDS58 SGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKDQQNSDTDSFGDACDNCPNVPNN 370 380 390 400 410 420 330 340 350 360 370 380 pF1KE4 DQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKSNPD :::::: .:.:::::.:.::: : : ::::.::: : : : ::.:::::.::. ::: CCDS58 DQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQTDRDEDGVGDACDSCPEMSNPT 430 440 450 460 470 480 390 400 410 420 430 440 pF1KE4 QADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDNDGV :.:.: :.:::.::...:.:::::::..:::: .:::.: :::.:: :: :: ::::::. CCDS58 QTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSSQLDSDNDGLGDECDGDDDNDGI 490 500 510 520 530 540 450 460 470 480 490 500 pF1KE4 PD----SRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTDFRA :: . :::::::::.:.:.: .::::::.:::: : ::: .:::::.:::::::::: CCDS58 PDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDNDAVVDPLDVCPESAEVTLTDFRA 550 560 570 580 590 600 510 520 530 540 550 560 pF1KE4 FQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTD .::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS58 YQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTD 610 620 630 640 650 660 570 580 590 600 610 620 pF1KE4 DDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQLRNA ::::::.:.::::. :::::::: :::::::.::::::.::.::::: : .::::.:::: CCDS58 DDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVAQPGLQLKAVTSVSGPGEHLRNA 670 680 690 700 710 720 630 640 650 660 670 680 pF1KE4 LWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSNVVL ::::: : .:::::: :::::::.:: :::: : ::::::::::..::::.:::::.:.. CCDS58 LWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQVGYIRVKLYEGPQLVADSGVII 730 740 750 760 770 780 690 700 710 720 pF1KE4 DTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA ::.::::::::::::::::::.::.::::::.:::.: . :: CCDS58 DTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEPFR-RQLLQGRV 790 800 810 820 830 >>CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 (947 aa) initn: 2852 init1: 1679 opt: 3609 Z-score: 2537.3 bits: 480.5 E(32554): 5.2e-135 Smith-Waterman score: 3609; 65.3% identity (83.4% similar) in 733 aa overlap (1-723:222-941) 10 20 30 pF1KE4 MLRELQETNAALQDVRELLRQQVREITFLK .. .: : : ..:. .:.::.:..... CCDS72 GGSMARVGALSECPFQGDESIHSAGEQTKALVTQLTLFNQILVELRDDIRDQVKEMSLIR 200 210 220 230 240 250 40 50 60 70 80 pF1KE4 NTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTES--GARCGPCPAGFTGN ::.:::..::.... :. ::.:. :: :: :... : :::::: :. :: CCDS72 NTIMECQVCGFHEQ-RS---------HCSPNPCFRGVDCMEVYEYPGYRCGPCPPGLQGN 260 270 280 290 300 90 100 110 120 130 140 pF1KE4 GSHCTDVNEC-NAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKANKQVCTD :.::.:.::: .: :::: :::: :::.::::: ::.: .:::. .:.:.::::.: CCDS72 GTHCSDINECAHADPCFPGSSCINTMPGFHCEACPRGYKGTQVSGVGIDYARASKQVCND 310 320 330 340 350 360 150 160 170 180 190 200 pF1KE4 INECETGQHN-CVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSPSECHE :.::. :... : :::.: :: :::.::::. ::.:.:..:: : : . . : :: CCDS72 IDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGNQSQGCL--PARTCHSPAHSPCHI 370 380 390 400 410 210 220 230 240 250 260 pF1KE4 HADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPE--RQCRKDNCVTVPN :: :..::.:. :: : ::::::: .:: :::.::.::. : : . ..:..:::. .:: CCDS72 HAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQALPCMDNNKHCKQDNCLLTPN 420 430 440 450 460 470 270 280 290 300 310 320 pF1KE4 SGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQKND :::::.: ::.:: :: ::::::. : .::: : : ::.:.: :..::::::: . :. CCDS72 SGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKDQQNSDTDSFGDACDNCPNVPNN 480 490 500 510 520 530 330 340 350 360 370 380 pF1KE4 DQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKSNPD :::::: .:.:::::.:.::: : : ::::.::: : : : ::.:::::.::. ::: CCDS72 DQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQTDRDEDGVGDACDSCPEMSNPT 540 550 560 570 580 590 390 400 410 420 430 440 pF1KE4 QADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDNDGV :.:.: :.:::.::...:.:::::::..:::: .:::.: :::.:: :: :: ::::::. CCDS72 QTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSSQLDSDNDGLGDECDGDDDNDGI 600 610 620 630 640 650 450 460 470 480 490 500 pF1KE4 PD----SRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTDFRA :: . :::::::::.:.:.: .::::::.:::: : ::: .:::::.:::::::::: CCDS72 PDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDNDAVVDPLDVCPESAEVTLTDFRA 660 670 680 690 700 710 510 520 530 540 550 560 pF1KE4 FQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTD .::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS72 YQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTD 720 730 740 750 760 770 570 580 590 600 610 620 pF1KE4 DDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQLRNA ::::::.:.::::. :::::::: :::::::.::::::.::.::::: : .::::.:::: CCDS72 DDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVAQPGLQLKAVTSVSGPGEHLRNA 780 790 800 810 820 830 630 640 650 660 670 680 pF1KE4 LWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSNVVL ::::: : .:::::: :::::::.:: :::: : ::::::::::..::::.:::::.:.. CCDS72 LWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQVGYIRVKLYEGPQLVADSGVII 840 850 860 870 880 890 690 700 710 720 pF1KE4 DTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA ::.::::::::::::::::::.::.::::::.:::.: . :: CCDS72 DTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEPFR-RQLLQGRV 900 910 920 930 940 >>CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 (956 aa) initn: 2852 init1: 1679 opt: 3609 Z-score: 2537.3 bits: 480.5 E(32554): 5.3e-135 Smith-Waterman score: 3609; 65.3% identity (83.4% similar) in 733 aa overlap (1-723:231-950) 10 20 30 pF1KE4 MLRELQETNAALQDVRELLRQQVREITFLK .. .: : : ..:. .:.::.:..... CCDS10 LSECPFQGDESIHSAVTNALHSILGEQTKALVTQLTLFNQILVELRDDIRDQVKEMSLIR 210 220 230 240 250 260 40 50 60 70 80 pF1KE4 NTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTES--GARCGPCPAGFTGN ::.:::..::.... :. ::.:. :: :: :... : :::::: :. :: CCDS10 NTIMECQVCGFHEQ-RS---------HCSPNPCFRGVDCMEVYEYPGYRCGPCPPGLQGN 270 280 290 300 310 90 100 110 120 130 140 pF1KE4 GSHCTDVNEC-NAHPCFPRVRCINTSPGFRCEACPPGYSGPTHQGVGLAFAKANKQVCTD :.::.:.::: .: :::: :::: :::.::::: ::.: .:::. .:.:.::::.: CCDS10 GTHCSDINECAHADPCFPGSSCINTMPGFHCEACPRGYKGTQVSGVGIDYARASKQVCND 320 330 340 350 360 370 150 160 170 180 190 200 pF1KE4 INECETGQHN-CVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCPDGSPSECHE :.::. :... : :::.: :: :::.::::. ::.:.:..:: : : . . : :: CCDS10 IDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGNQSQGCL--PARTCHSPAHSPCHI 380 390 400 410 420 210 220 230 240 250 260 pF1KE4 HADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPE--RQCRKDNCVTVPN :: :..::.:. :: : ::::::: .:: :::.::.::. : : . ..:..:::. .:: CCDS10 HAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQALPCMDNNKHCKQDNCLLTPN 430 440 450 460 470 480 270 280 290 300 310 320 pF1KE4 SGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQKND :::::.: ::.:: :: ::::::. : .::: : : ::.:.: :..::::::: . :. CCDS10 SGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKDQQNSDTDSFGDACDNCPNVPNN 490 500 510 520 530 540 330 340 350 360 370 380 pF1KE4 DQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKSNPD :::::: .:.:::::.:.::: : : ::::.::: : : : ::.:::::.::. ::: CCDS10 DQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQTDRDEDGVGDACDSCPEMSNPT 550 560 570 580 590 600 390 400 410 420 430 440 pF1KE4 QADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDNDGV :.:.: :.:::.::...:.:::::::..:::: .:::.: :::.:: :: :: ::::::. CCDS10 QTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSSQLDSDNDGLGDECDGDDDNDGI 610 620 630 640 650 660 450 460 470 480 490 500 pF1KE4 PD----SRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTDFRA :: . :::::::::.:.:.: .::::::.:::: : ::: .:::::.:::::::::: CCDS10 PDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDNDAVVDPLDVCPESAEVTLTDFRA 670 680 690 700 710 720 510 520 530 540 550 560 pF1KE4 FQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTD .::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS10 YQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTD 730 740 750 760 770 780 570 580 590 600 610 620 pF1KE4 DDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQLRNA ::::::.:.::::. :::::::: :::::::.::::::.::.::::: : .::::.:::: CCDS10 DDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVAQPGLQLKAVTSVSGPGEHLRNA 790 800 810 820 830 840 630 640 650 660 670 680 pF1KE4 LWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSNVVL ::::: : .:::::: :::::::.:: :::: : ::::::::::..::::.:::::.:.. CCDS10 LWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQVGYIRVKLYEGPQLVADSGVII 850 860 870 880 890 900 690 700 710 720 pF1KE4 DTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA ::.::::::::::::::::::.::.::::::.:::.: . :: CCDS10 DTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEPFR-RQLLQGRV 910 920 930 940 950 >>CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170 aa) initn: 2573 init1: 2171 opt: 2504 Z-score: 1763.9 bits: 337.6 E(32554): 6.3e-92 Smith-Waterman score: 2622; 53.6% identity (71.6% similar) in 666 aa overlap (54-710:547-1169) 30 40 50 60 70 80 pF1KE4 REITFLKNTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGA-RCGPCP :. : . :: :: : . .:. .:: :: CCDS32 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP 520 530 540 550 560 570 90 100 110 120 130 pF1KE4 AGFTGNGSHCTDVNECNAHP--CFPRV---RCINTSPGFRCEACPPGYSGPTHQGVGLAF :..::: .::::.::. : :: . :: ::.::. : ::: ..: : :. CCDS32 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH 580 590 600 610 620 630 140 150 160 170 180 190 pF1KE4 AKANKQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCP : :::::: : : : :.: :. : : : .. CCDS32 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS------------------------- 640 650 660 670 200 210 220 230 240 250 pF1KE4 DGSPSECHEHADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRC---PERQC : : : :.:::::.::.::::::.:.:.: : .: CCDS32 -----------------DPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHC 680 690 700 710 260 270 280 290 300 310 pF1KE4 RKDNCVTVPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDA .:::: ..::::::: :.:::::::: : :.: .:...::::. :: : . :.: :: CCDS32 KKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDR 720 730 740 750 760 770 320 330 340 350 360 370 pF1KE4 CDNCRSQKNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDAC :::: ..: :: :::..:.:::: ::::: : :. ::: : : ::.:.: ::.:: : CCDS32 CDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQC 780 790 800 810 820 830 380 390 400 410 420 430 pF1KE4 DNCPQKSNPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDA :::: . :::: : : : .::.::..:: : ::::.. :::: :::. : : :.::.::: CCDS32 DNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDA 840 850 860 870 880 890 440 450 460 470 480 490 pF1KE4 CDDDDDNDGVPDSRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVT :: ::::::.::..::::::::: :.:.: :: ::.:.:::: :.: : :.::::.... CCDS32 CDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDIS 900 910 920 930 940 950 500 510 520 530 540 550 pF1KE4 LTDFRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFH :::: :: . :::.: .: :::::: .::.:.:::.: :::::::: ::.::: ::: CCDS32 ETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFF 960 970 980 990 1000 1010 560 570 580 590 600 610 pF1KE4 VNTVTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPG .:: :::::::.::::.:: ::::::::. :.::..:: :: . :...:.:.:.:::: CCDS32 INTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPG 1020 1030 1040 1050 1060 1070 620 630 640 650 660 670 pF1KE4 EQLRNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVA :.:::::::::.: .::: ::.:::..:::: .::: :.:::..:.::: .::: ...: CCDS32 EHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMA 1080 1090 1100 1110 1120 1130 680 690 700 710 720 pF1KE4 DSNVVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA ::. . : :. :::::.: :::: .....:.:.: : CCDS32 DSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP 1140 1150 1160 1170 >>CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172 aa) initn: 2769 init1: 2182 opt: 2464 Z-score: 1735.9 bits: 332.5 E(32554): 2.3e-90 Smith-Waterman score: 2632; 54.3% identity (71.3% similar) in 669 aa overlap (54-710:549-1171) 30 40 50 60 70 80 pF1KE4 REITFLKNTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGA-RCGPCP :. : . ::::. : . .:. :: :: CCDS34 RVCNSPEPQYGGKACVGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCP 520 530 540 550 560 570 90 100 110 120 130 pF1KE4 AGFTGNGSHCTDVNECNAHP--CFP--RV-RCINTSPGFRCEACPPGYSGPTHQGVGLAF .:: :::.:: :..:: : :: .: ::.::.:::.: ::: : : :::: CCDS34 VGFLGNGTHCEDLDECALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEA 580 590 600 610 620 630 140 150 160 170 180 190 pF1KE4 AKANKQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCP ::..:::: : :. ::: CCDS34 AKTEKQVCEPENPCKDKTHNC--------------------------------------- 640 650 200 210 220 230 240 250 pF1KE4 DGSPSECHEHADCVLE---RDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPER-- :.::.:. : .: : .:.::.:..::.:.::::.:. .: : CCDS34 -------HKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNAT 660 670 680 690 700 710 260 270 280 290 300 310 pF1KE4 -QCRKDNCVTVPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKW .: :::: .::::::: :.:::::::: : :.::: .::::: :. :: : . :.:. CCDS34 YHCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEV 720 730 740 750 760 770 320 330 340 350 360 370 pF1KE4 GDACDNCRSQKNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIG :: :::: .: : :::..:.::::. ::::: . :. :::: : :.::.:.::::.: CCDS34 GDRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVG 780 790 800 810 820 830 380 390 400 410 420 430 pF1KE4 DACDNCPQKSNPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQ : ::::: ::::.:::.:.::: ::...: : ::::...:::: . :. : : :.::: CCDS34 DHCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQ 840 850 860 870 880 890 440 450 460 470 480 490 pF1KE4 GDACDDDDDNDGVPDSRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENA ::::: :::::::::.::::::: :: ::: : :: ::.:.:::: :.. : :::::: CCDS34 GDACDPDDDNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENN 900 910 920 930 940 950 500 510 520 530 540 550 pF1KE4 EVTLTDFRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEG .. :::: :: : :::.: .:::::::. .::.:.::: :::::.:::. :..::: : CCDS34 AISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSG 960 970 980 990 1000 1010 560 570 580 590 600 610 pF1KE4 TFHVNTVTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSST ::.::: :::::::.::::.:: ::::::::. ::::. .: :: . :..::.:.:.: CCDS34 TFYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTT 1020 1030 1040 1050 1060 1070 620 630 640 650 660 670 pF1KE4 GPGEQLRNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPE : ::.:::::::::.: .::: ::.::::.:::: .::: : :::..::::: .:: . CCDS34 GTGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQ 1080 1090 1100 1110 1120 1130 680 690 700 710 720 pF1KE4 LVADSNVVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA ..:::. . : :. :::::.: :::: . ...:.:.: : CCDS34 VMADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI 1140 1150 1160 1170 724 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:37:06 2016 done: Mon Nov 7 18:37:06 2016 Total Scan time: 2.430 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]