FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2053, 688 aa 1>>>pF1KE2053 688 - 688 aa - 688 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7461+/-0.00109; mu= 17.5540+/- 0.065 mean_var=128.5566+/-25.272, 0's: 0 Z-trim(106.7): 224 B-trim: 2 in 1/48 Lambda= 0.113117 statistics sampled from 8862 (9118) to 8862 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.646), E-opt: 0.2 (0.28), width: 16 Scan time: 3.380 The best scores are: opt bits E(32554) CCDS31735.1 C1S gene_id:716|Hs108|chr12 ( 688) 4868 807.0 0 CCDS123.1 MASP2 gene_id:10747|Hs108|chr1 ( 686) 1656 282.8 1.2e-75 CCDS33907.1 MASP1 gene_id:5648|Hs108|chr3 ( 699) 1466 251.8 2.5e-66 CCDS33908.1 MASP1 gene_id:5648|Hs108|chr3 ( 728) 1280 221.4 3.6e-57 CCDS33909.1 MASP1 gene_id:5648|Hs108|chr3 ( 380) 996 174.8 2.1e-43 CCDS124.1 MASP2 gene_id:10747|Hs108|chr1 ( 185) 479 90.0 3.3e-18 CCDS45524.1 HP gene_id:3240|Hs108|chr16 ( 406) 480 90.6 4.9e-18 CCDS45525.1 HP gene_id:3240|Hs108|chr16 ( 347) 476 89.9 6.9e-18 CCDS82010.1 HP gene_id:3240|Hs108|chr16 ( 347) 475 89.7 7.7e-18 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 476 90.0 7.8e-18 CCDS42193.1 HPR gene_id:3250|Hs108|chr16 ( 348) 460 87.3 4.2e-17 CCDS31476.1 F2 gene_id:2147|Hs108|chr11 ( 622) 456 86.9 9.7e-17 CCDS2145.1 PROC gene_id:5624|Hs108|chr2 ( 461) 451 85.9 1.4e-16 CCDS9529.1 F7 gene_id:2155|Hs108|chr13 ( 444) 425 81.7 2.6e-15 CCDS9528.1 F7 gene_id:2155|Hs108|chr13 ( 466) 425 81.7 2.7e-15 CCDS73602.1 F7 gene_id:2155|Hs108|chr13 ( 382) 422 81.1 3.3e-15 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 419 80.4 3.7e-15 CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 411 79.2 1e-14 CCDS7449.1 TLL2 gene_id:7093|Hs108|chr10 (1015) 414 80.3 1.5e-14 CCDS34856.1 BMP1 gene_id:649|Hs108|chr8 ( 730) 400 77.8 6.1e-14 CCDS6026.1 BMP1 gene_id:649|Hs108|chr8 ( 986) 400 78.0 7.4e-14 CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 387 75.3 1.6e-13 CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 ( 290) 383 74.6 2.3e-13 CCDS83291.1 PLAT gene_id:5327|Hs108|chr8 ( 473) 383 74.8 3.1e-13 CCDS9530.1 F10 gene_id:2159|Hs108|chr13 ( 488) 382 74.7 3.6e-13 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 376 73.4 4.8e-13 CCDS58452.1 PRSS36 gene_id:146547|Hs108|chr16 ( 752) 381 74.8 5.3e-13 CCDS58453.1 PRSS36 gene_id:146547|Hs108|chr16 ( 850) 381 74.8 5.7e-13 CCDS32436.1 PRSS36 gene_id:146547|Hs108|chr16 ( 855) 381 74.8 5.8e-13 CCDS6127.1 PLAT gene_id:5327|Hs108|chr8 ( 516) 374 73.4 9.2e-13 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 371 72.9 1.2e-12 CCDS34302.1 F12 gene_id:2161|Hs108|chr5 ( 615) 372 73.2 1.3e-12 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 371 72.9 1.3e-12 CCDS6126.1 PLAT gene_id:5327|Hs108|chr8 ( 562) 371 73.0 1.4e-12 CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 370 72.8 1.5e-12 CCDS3709.1 PRSS12 gene_id:8492|Hs108|chr4 ( 875) 372 73.4 1.6e-12 CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 ( 314) 362 71.2 2.6e-12 CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 357 70.3 4.2e-12 CCDS3369.1 HGFAC gene_id:3083|Hs108|chr4 ( 655) 352 69.9 1.3e-11 CCDS75098.1 HGFAC gene_id:3083|Hs108|chr4 ( 662) 352 70.0 1.3e-11 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 347 69.1 2.1e-11 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 346 68.9 2.2e-11 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 343 68.1 2.2e-11 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 346 68.9 2.3e-11 CCDS14101.1 ACR gene_id:49|Hs108|chr22 ( 421) 338 67.4 4.7e-11 CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 ( 317) 336 67.0 4.9e-11 >>CCDS31735.1 C1S gene_id:716|Hs108|chr12 (688 aa) initn: 4868 init1: 4868 opt: 4868 Z-score: 4304.7 bits: 807.0 E(32554): 0 Smith-Waterman score: 4868; 100.0% identity (100.0% similar) in 688 aa overlap (1-688:1-688) 10 20 30 40 50 60 pF1KE2 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHLYFTHLDIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHLYFTHLDIE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKSDFSNEERF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKSDFSNEERF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 TGFAAYYVATDINECTDFVDVPCSHFCNNFIGGYFCSCPPEYFLHDDMKNCGVNCSGDVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TGFAAYYVATDINECTDFVDVPCSHFCNNFIGGYFCSCPPEYFLHDDMKNCGVNCSGDVF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 TALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRREDFDVEAADSAGNCLDSLVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRREDFDVEAADSAGNCLDSLVF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 VAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTGQKKGWKLRYHGDPMPCPKEDTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTGQKKGWKLRYHGDPMPCPKEDTP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 NSVWEPAKAKYVFRDVVQITCLDGFEVVEGRVGATSFYSTCQSNGKWSNSKLKCQPVDCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NSVWEPAKAKYVFRDVVQITCLDGFEVVEGRVGATSFYSTCQSNGKWSNSKLKCQPVDCG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 IPESIENGKVEDPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAGNGSWVNEVLGPELPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IPESIENGKVEDPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAGNGSWVNEVLGPELPK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 CVPVCGVPREPFEEKQRIIGGSDADIKNFPWQVFFDNPWAGGALINEYWVLTAAHVVEGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CVPVCGVPREPFEEKQRIIGGSDADIKNFPWQVFFDNPWAGGALINEYWVLTAAHVVEGN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 REPTMYVGSTSVQTSRLAKSKMLTPEHVFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 REPTMYVGSTSVQTSRLAKSKMLTPEHVFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 MGPTVSPICLPGTSSDYNLMDGDLGLISGWGRTEKRDRAVRLKAARLPVAPLRKCKEVKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MGPTVSPICLPGTSSDYNLMDGDLGLISGWGRTEKRDRAVRLKAARLPVAPLRKCKEVKV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 EKPTADAEAYVFTPNMICAGGEKGMDSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EKPTADAEAYVFTPNMICAGGEKGMDSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQCG 610 620 630 640 650 660 670 680 pF1KE2 TYGLYTRVKNYVDWIMKTMQENSTPRED :::::::::::::::::::::::::::: CCDS31 TYGLYTRVKNYVDWIMKTMQENSTPRED 670 680 >>CCDS123.1 MASP2 gene_id:10747|Hs108|chr1 (686 aa) initn: 825 init1: 370 opt: 1656 Z-score: 1471.9 bits: 282.8 E(32554): 1.2e-75 Smith-Waterman score: 1656; 38.2% identity (65.2% similar) in 701 aa overlap (1-681:9-685) 10 20 30 40 50 pF1KE2 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHL . : . . :. . :: ..:.. ::..: : .. :. : . .: :: ..: CCDS12 MRLLTLLGLLCGSVATPLGPKWPEP-VFGRLASPGFPGEYANDQERRWTLTAPPGYRLRL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 YFTHLDIELSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKS ::::.:.:::. : :: :.. :: . ::::.:... ..: . : ..:.. :.: CCDS12 YFTHFDLELSHLCEYDFVKLSSGAKVLATLCGQESTDTERAPGKDTFYSLGSSLDITFRS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 DFSNEERFTGFAAYYVATDINEC-TDFVDVP-CSHFCNNFIGGYFCSCPPEYFLHDDMKN :.:::. :::: :.:.: ::.:: . ..: :.: :.: .::..::: : :: . .. CCDS12 DYSNEKPFTGFEAFYAAEDIDECQVAPGEAPTCDHHCHNHLGGFYCSCRAGYVLHRNKRT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 CGVNCSGDVFTALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRREDFDVEAADS :.. :::.::: ::..::.::.:::. : : :.: ::.::.:.. . :.::::. CCDS12 CSALCSGQVFTQRSGELSSPEYPRPYPKLSSCTYSISLEEGFSVILDFV-ESFDVETHPE 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 AGNCLDSLVFVAGDRQ-FGPYCGHGFPGPLNIETKSNALDIIFQTDLTGQKKGWKLRYHG . : ... . ::. ::.::. .: ::::::.. : : :: .:.. :::..: . CCDS12 TL-CPYDFLKIQTDREEHGPFCGKTLPH--RIETKSNTVTITFVTDESGDHTGWKIHYTS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 DPMPCPKE-DTPNSVWEPAKAKYVFRDVVQITCLDGFEVVEGRVGATSFYSTCQSNGKWS .::: ::. :..:::...: .: : :.:...:.. :: ..::..:.:. CCDS12 TAQPCPYPMAPPNGHVSPVQAKYILKDSFSIFCETGYELLQGHLPLKSFTAVCQKDGSWD 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 NSKLKCQPVDCGIPESIENGKVE---DPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAG :. :::: :... .:.:: : : . .::.:.::: .: :. . : .: : . CCDS12 RPMPACSIVDCGPPDDLPSGRVEYITGPGVTTYKAVIQYSCEETFYTMKVNDG-KYVCEA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 NGSWVNEVLGPELPKCVPVCGVPREPFEEKQRIIGGSDADIKNFPWQVF-FDNPWAGGAL .: :.. :: : ::::. . :: ::. : .:::::. . . :.::: CCDS12 DGFWTSSKGEKSLPVCEPVCGLSAR--TTGGRIYGGQKAKPGDFPWQVLILGGTTAAGAL 420 430 440 450 460 470 470 480 490 500 510 pF1KE2 INEYWVLTAAHVVEGNREPTMYVGSTSVQTSRLAKSKMLTP-------EHVFIHPGWKLL . . :::::::.: ... ..:. :.. : :.: : :::: :. CCDS12 LYDNWVLTAAHAVYEQKH------DASALDIRMGTLKRLSPHYTQAWSEAVFIHEGY--- 480 490 500 510 520 520 530 540 550 560 570 pF1KE2 EVPEGRTNFDNDIALVRLKDPVKMGPTVSPICLPGTSSDYNLMDGDLGLISGWGRTEKRD ..:::::::..:.. : .. ...::::: .. . :.: :::: :.. CCDS12 ---THDAGFDNDIALIKLNNKVVINSNITPICLPRKEAESFMRTDDIGTASGWGLTQRGF 530 540 550 560 570 580 580 590 600 610 620 630 pF1KE2 RAVRLKAARLPVAPLRKCKEVKVEKPTADAEAYVFTPNMICAGGEKG-MDSCKGDSGGAF : : . .:.. .:: . ::: . : ::.::: :.: :::.::::::. CCDS12 LARNLMYVDIPIVDHQKCT-AAYEKPPYPRGSV--TANMLCAGLESGGKDSCRGDSGGAL 590 600 610 620 630 640 650 660 670 680 pF1KE2 AVQDPNDKTKFYAAGLVSWGPQ-CGT---YGLYTRVKNYVDWIMKTMQENSTPRED . : .. .....:.:::: . :: ::.::.: ::. :: . ... CCDS12 VFLD-SETERWFVGGIVSWGSMNCGEAGQYGVYTKVINYIPWIENIISDF 640 650 660 670 680 >>CCDS33907.1 MASP1 gene_id:5648|Hs108|chr3 (699 aa) initn: 836 init1: 424 opt: 1466 Z-score: 1304.2 bits: 251.8 E(32554): 2.5e-66 Smith-Waterman score: 1599; 36.8% identity (64.4% similar) in 699 aa overlap (3-677:11-693) 10 20 30 40 50 pF1KE2 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHL :. : . : . .:.:.: ::.::..:::. : .:.: ::.:. :.: CCDS33 MRWLLLYYALCFSLSKASAHTVELNNMFGQIQSPGYPDSYPSDSEVTWNITVPDGFRIKL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 YFTHLDIELSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKS :: :...: : : :: :.. . : . .::...... ..: : : . ... :.: CCDS33 YFMHFNLESSYLCEYDYVKVETEDQVLATFCGRETTDTEQTPGQEVVLSPGSFMSITFRS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 DFSNEERFTGFAAYYVATDINECTDFVD--VPCSHFCNNFIGGYFCSCPPEYFLHDDMKN ::::::::::: :.:.:.:..:: . : . :.:.:.:.::::.::: :.:: : .. CCDS33 DFSNEERFTGFDAHYMAVDVDECKEREDEELSCDHYCHNYIGGYYCSCRFGYILHTDNRT 130 140 150 160 170 180 180 190 200 210 220 pF1KE2 CGVNCSGDVFTALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRRED-FDVEAAD : :.:: ..:: : :.::..:.:::..:.: : :.::.:: .:.:. :: ::.: CCDS33 CRVECSDNLFTQRTGVITSPDFPNPYPKSSECLYTIELEEGF--MVNLQFEDIFDIEDHP 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 SAGNCLDSLVFVAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTGQKKGWKLRYHG . : . . .: . .::.::. : : : :.:... :.:..: .:...::.: :.. CCDS33 EVPCPYDYIKIKVGPKVLGPFCGEKAPEP--ISTQSHSVLILFHSDNSGENRGWRLSYRA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 DPMPCPKEDTP-NSVWEPAKAKYVFRDVVQITCLDGFEVVEGRVGATSFYSTCQSNGKWS ::. . : .. ::..::: :.: : ..: :..:.. : .: : ..: :: CCDS33 AGNECPELQPPVHGKIEPSQAKYFFKDQVLVSCDTGYKVLKDNVEMDTFQIECLKDGTWS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 NSKLKCQPVDCGIPESIENGKVE---DPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAG :. :. ::: : .:.: . . : . : :.:.:.:::: : :.. : : :.. CCDS33 NKIPTCKIVDCRAPGELEHGLITFSTRNNLTTYKSEIKYSCQEPYYKMLNNNTGIYTCSA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 NGSWVNEVLGPELPKCVPVCGVPREPFEEKQRIIGGSDADIKNFPWQVFFDN----PWAG .: :.:.::: :: :.::::.:. . ::..: :. . :: ..... :. : CCDS33 QGVWMNKVLGRSLPTCLPVCGLPKFSRKLMARIFNGRPAQKGTTPWIAMLSHLNGQPFCG 420 430 440 450 460 470 470 480 490 500 510 pF1KE2 GALINEYWVLTAAHVVEGN---REPTMY---VGSTSVQTSRLAKSKMLTPEHVFIHPGWK :.:.. :..:::: .. . ..::. . : : :.: : .. : : : CCDS33 GSLLGSSWIVTAAHCLHQSLDPEDPTLRDSDLLSPSDFKIILGKHWRLRSDENEQHLGVK 480 490 500 510 520 530 520 530 540 550 560 570 pF1KE2 LLEV-PEGRTN-FDNDIALVRL-KDPVKMGPTVSPICLPGTSSDYNLMDGDLGLISGWGR . :. : :.::.:::.: ..:: .. : ::::: . ..: . ..::::. CCDS33 HTTLHPQYDPNTFENDVALVELLESPV-LNAFVMPICLP----EGPQQEGAMVIVSGWGK 540 550 560 570 580 590 580 590 600 610 620 630 pF1KE2 TEKRDRAVRLKAARLPVAPLRKCKEVKVEKPTADAEAYVFTPNMICAG-GEKGMDSCKGD . : ..:.. :. : : . : : .::::: : : :.: :: CCDS33 QFLQRFPETLMEIEIPIVDHSTCQ-----KAYAPLKKKV-TRDMICAGEKEGGKDACAGD 600 610 620 630 640 640 650 660 670 680 pF1KE2 SGGAFAVQDPNDKTKFYAAGLVSWGPQCGT---YGLYTRVKNYVDWIMKTMQENSTPRED ::: ... . .. ..: .: :::: .:: ::.:. ... :::.. CCDS33 SGGPMVTLN-RERGQWYLVGTVSWGDDCGKKDRYGVYSYIHHNKDWIQRVTGVRN 650 660 670 680 690 >>CCDS33908.1 MASP1 gene_id:5648|Hs108|chr3 (728 aa) initn: 908 init1: 424 opt: 1280 Z-score: 1140.0 bits: 221.4 E(32554): 3.6e-57 Smith-Waterman score: 1711; 38.1% identity (65.3% similar) in 724 aa overlap (3-679:11-715) 10 20 30 40 50 pF1KE2 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHL :. : . : . .:.:.: ::.::..:::. : .:.: ::.:. :.: CCDS33 MRWLLLYYALCFSLSKASAHTVELNNMFGQIQSPGYPDSYPSDSEVTWNITVPDGFRIKL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 YFTHLDIELSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKS :: :...: : : :: :.. . : . .::...... ..: : : . ... :.: CCDS33 YFMHFNLESSYLCEYDYVKVETEDQVLATFCGRETTDTEQTPGQEVVLSPGSFMSITFRS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 DFSNEERFTGFAAYYVATDINECTDFVD--VPCSHFCNNFIGGYFCSCPPEYFLHDDMKN ::::::::::: :.:.:.:..:: . : . :.:.:.:.::::.::: :.:: : .. CCDS33 DFSNEERFTGFDAHYMAVDVDECKEREDEELSCDHYCHNYIGGYYCSCRFGYILHTDNRT 130 140 150 160 170 180 180 190 200 210 220 pF1KE2 CGVNCSGDVFTALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRRED-FDVEAAD : :.:: ..:: : :.::..:.:::..:.: : :.::.:: .:.:. :: ::.: CCDS33 CRVECSDNLFTQRTGVITSPDFPNPYPKSSECLYTIELEEGF--MVNLQFEDIFDIEDHP 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 SAGNCLDSLVFVAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTGQKKGWKLRYHG . : . . .: . .::.::. : : : :.:... :.:..: .:...::.: :.. CCDS33 EVPCPYDYIKIKVGPKVLGPFCGEKAPEP--ISTQSHSVLILFHSDNSGENRGWRLSYRA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 DPMPCPKEDTP-NSVWEPAKAKYVFRDVVQITCLDGFEVVEGRVGATSFYSTCQSNGKWS ::. . : .. ::..::: :.: : ..: :..:.. : .: : ..: :: CCDS33 AGNECPELQPPVHGKIEPSQAKYFFKDQVLVSCDTGYKVLKDNVEMDTFQIECLKDGTWS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 NSKLKCQPVDCGIPESIENGKVE---DPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAG :. :. ::: : .:.: . . : . : :.:.:.:::: : :.. : : :.. CCDS33 NKIPTCKIVDCRAPGELEHGLITFSTRNNLTTYKSEIKYSCQEPYYKMLNNNTGIYTCSA 360 370 380 390 400 410 410 420 430 440 450 pF1KE2 NGSWVNEVLGPELPKCVPVCGVPREPFEEK-QRIIGGSDADIKNFPWQVFF--------- .: :.:.::: :: :.: :: : . . .::::: .:. ::::... CCDS33 QGVWMNKVLGRSLPTCLPECGQPSRSLPSLVKRIIGGRNAEPGLFPWQALIVVEDTSRVP 420 430 440 450 460 470 460 470 480 490 500 pF1KE2 DNPWAG-GALINEYWVLTAAHVVEGNRE-----P------TMYVGSTSVQTSRLAKSKML .. : : :::.. :.::::::....:. : :.:.: .:. . : .. CCDS33 NDKWFGSGALLSASWILTAAHVLRSQRRDTTVIPVSKEHVTVYLGLHDVRDKSGAVNS-- 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE2 TPEHVFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPICLPGTSSDYNLMDGD . .: .:: ... :...:::::.:..:: .:: : :.::: . . CCDS33 SAARVVLHPDFNI-------QNYNHDIALVQLQEPVPLGPHVMPVCLPRLEPE-GPAPHM 540 550 560 570 580 570 580 590 600 610 pF1KE2 LGLISGWGRTEKR---DRAVR---------LKAARLPVAPLRKCKEVKVEKPTADAEAYV :::..::: .. :. . :. ..:::.: .:: .. :. ... : CCDS33 LGLVAGWGISNPNVTVDEIISSGTRTLSDVLQYVKLPVVPHAECK-TSYESRSGN---YS 590 600 610 620 630 640 620 630 640 650 660 pF1KE2 FTPNMICAGG-EKGMDSCKGDSGGAFAVQDPNDKTKFYAAGLVSWG-PQ-CGT---YGLY : ::.::: : : :.: :::::::.. : . . .. . :::::: :. ::. ::.: CCDS33 VTENMFCAGYYEGGKDTCLGDSGGAFVIFD-DLSQRWVVQGLVSWGGPEECGSKQVYGVY 650 660 670 680 690 700 670 680 pF1KE2 TRVKNYVDWIMKTMQENSTPRED :.:.:::::. . : CCDS33 TKVSNYVDWVWEQMGLPQSVVEPQVER 710 720 >>CCDS33909.1 MASP1 gene_id:5648|Hs108|chr3 (380 aa) initn: 493 init1: 396 opt: 996 Z-score: 892.8 bits: 174.8 E(32554): 2.1e-43 Smith-Waterman score: 996; 38.0% identity (68.4% similar) in 374 aa overlap (3-372:11-380) 10 20 30 40 50 pF1KE2 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHL :. : . : . .:.:.: ::.::..:::. : .:.: ::.:. :.: CCDS33 MRWLLLYYALCFSLSKASAHTVELNNMFGQIQSPGYPDSYPSDSEVTWNITVPDGFRIKL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 YFTHLDIELSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKS :: :...: : : :: :.. . : . .::...... ..: : : . ... :.: CCDS33 YFMHFNLESSYLCEYDYVKVETEDQVLATFCGRETTDTEQTPGQEVVLSPGSFMSITFRS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 DFSNEERFTGFAAYYVATDINECTDFVD--VPCSHFCNNFIGGYFCSCPPEYFLHDDMKN ::::::::::: :.:.:.:..:: . : . :.:.:.:.::::.::: :.:: : .. CCDS33 DFSNEERFTGFDAHYMAVDVDECKEREDEELSCDHYCHNYIGGYYCSCRFGYILHTDNRT 130 140 150 160 170 180 180 190 200 210 220 pF1KE2 CGVNCSGDVFTALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRRED-FDVEAAD : :.:: ..:: : :.::..:.:::..:.: : :.::.:: .:.:. :: ::.: CCDS33 CRVECSDNLFTQRTGVITSPDFPNPYPKSSECLYTIELEEGF--MVNLQFEDIFDIEDHP 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 SAGNCLDSLVFVAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTGQKKGWKLRYHG . : . . .: . .::.::. : : : :.:... :.:..: .:...::.: :.. CCDS33 EVPCPYDYIKIKVGPKVLGPFCGEKAPEP--ISTQSHSVLILFHSDNSGENRGWRLSYRA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 DPMPCPKEDTP-NSVWEPAKAKYVFRDVVQITCLDGFEVVEGRVGATSFYSTCQSNGKWS ::. . : .. ::..::: :.: : ..: :..:.. : .: : ..: :: CCDS33 AGNECPELQPPVHGKIEPSQAKYFFKDQVLVSCDTGYKVLKDNVEMDTFQIECLKDGTWS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 NSKLKCQPVDCGIPESIENGKVEDPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAGNGS :. :. . . ... .: . CCDS33 NKIPTCKKNEIDLESELKSEQVTE 360 370 380 >>CCDS124.1 MASP2 gene_id:10747|Hs108|chr1 (185 aa) initn: 436 init1: 366 opt: 479 Z-score: 440.4 bits: 90.0 E(32554): 3.3e-18 Smith-Waterman score: 479; 39.3% identity (69.4% similar) in 173 aa overlap (1-171:9-180) 10 20 30 40 50 pF1KE2 MWCIVLFSLLAWVYAEPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHL . : . . :. . :: ..:.. ::..: : .. :. : . .: :: ..: CCDS12 MRLLTLLGLLCGSVATPLGPKWPEP-VFGRLASPGFPGEYANDQERRWTLTAPPGYRLRL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 YFTHLDIELSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKS ::::.:.:::. : :: :.. :: . ::::.:... ..: . : ..:.. :.: CCDS12 YFTHFDLELSHLCEYDFVKLSSGAKVLATLCGQESTDTERAPGKDTFYSLGSSLDITFRS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 DFSNEERFTGFAAYYVATDINEC-TDFVDVP-CSHFCNNFIGGYFCSCPPEYFLHDDMKN :.:::. :::: :.:.: ::.:: . ..: :.: :.: .::..::: : :: . .. CCDS12 DYSNEKPFTGFEAFYAAEDIDECQVAPGEAPTCDHHCHNHLGGFYCSCRAGYVLHRNKRT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 CGVNCSGDVFTALIGEIASPNYPKPYPENSRCEYQIRLEKGFQVVVTLRREDFDVEAADS : CCDS12 CSEQSL 180 >>CCDS45524.1 HP gene_id:3240|Hs108|chr16 (406 aa) initn: 405 init1: 191 opt: 480 Z-score: 437.3 bits: 90.6 E(32554): 4.9e-18 Smith-Waterman score: 610; 32.5% identity (59.7% similar) in 409 aa overlap (294-682:33-406) 270 280 290 300 310 320 pF1KE2 KSNALDIIFQTDLTGQKKGWKLRYHGDPMPCPKEDTPNSVWEPAKAKYVFRDVVQITCLD ::: : : :. . :. : . CCDS45 ALGAVIALLLWGQLFAVDSGNDVTDIADDGCPK---P-----PEIAHGYVEHSVRYQCKN 10 20 30 40 50 330 340 350 360 370 380 pF1KE2 GFEV-VEGRVGATSFYSTCQSNGKWSNSKL-KCQPVD-CGIPESIENGKVEDPESTLFGS ... .:: :. .. . : .: ..:: .:. : : : : .: :: CCDS45 YYKLRTEGD-GVYTLNDKKQWINKAVGDKLPECEADDGCPKPPEIAHGYVEHS------- 60 70 80 90 100 390 400 410 420 430 440 pF1KE2 VIRYTCEEPYYYMENGGGGEYHCAGNGSWVNEVLGPELPKCVPVCGVPREPFEEKQRIIG .:: :.. :: ... : : : .. .:.:...: .::.: ::: :..: . :::.: CCDS45 -VRYQCKN-YYKLRTEGDGVYTLNNEKQWINKAVGDKLPECEAVCGKPKNPANPVQRILG 110 120 130 140 150 160 450 460 470 480 490 pF1KE2 GSDADIK-NFPWQ---VFFDNPWAGGALINEYWVLTAAHVVEGNREPTMYVGSTS-VQTS : : : .:::: : : .:..:::: :.::.:. . :. . . . . . : CCDS45 GH-LDAKGSFPWQAKMVSHHNLTTGATLINEQWLLTTAKNLFLNHSENATAKDIAPTLTL 170 180 190 200 210 220 500 510 520 530 540 550 pF1KE2 RLAKSKMLTPEHVFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPICLPGTSS ..:.... :.: .::... . ::.:..::. :... : ::::: :. CCDS45 YVGKKQLVEIEKVVLHPNYSQV-----------DIGLIKLKQKVSVNERVMPICLP--SK 230 240 250 260 270 560 570 580 590 600 pF1KE2 DYNLMDGDLGLISGWGRTEKRDRAVRLKAARLPVAPLRKC---------KEVKVEKPTAD :: . : .: .:::::. . . .:: . :::: .: : :. : . CCDS45 DYAEV-GRVGYVSGWGRNANFKFTDHLKYVMLPVADQDQCIRHYEGSTVPEKKTPKSPVG 280 290 300 310 320 610 620 630 640 650 660 pF1KE2 AEAYVFTPNMICAGGEKGM-DSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQCGT--YG .. ... . .::: : . :.: ::.:.::::.: .. : .::.:..:. .:.. :: CCDS45 VQP-ILNEHTFCAGMSKYQEDTCYGDAGSAFAVHDLEEDT-WYATGILSFDKSCAVAEYG 330 340 350 360 370 380 670 680 pF1KE2 LYTRVKNYVDWIMKTMQENSTPRED .:..: . ::..::. :: CCDS45 VYVKVTSIQDWVQKTIAEN 390 400 >>CCDS45525.1 HP gene_id:3240|Hs108|chr16 (347 aa) initn: 414 init1: 191 opt: 476 Z-score: 434.6 bits: 89.9 E(32554): 6.9e-18 Smith-Waterman score: 587; 34.0% identity (61.6% similar) in 341 aa overlap (359-682:33-347) 330 340 350 360 370 380 pF1KE2 EGRVGATSFYSTCQSNGKWSNSKLKCQPVDCGIPESIENGKVEDPESTLFGSVIRYTCEE : : : .: :: .:: :.. CCDS45 ALGAVIALLLWGQLFAVDSGNDVTDIADDGCPKPPEIAHGYVEHS--------VRYQCKN 10 20 30 40 50 390 400 410 420 430 440 pF1KE2 PYYYMENGGGGEYHCAGNGSWVNEVLGPELPKCVPVCGVPREPFEEKQRIIGGSDADIK- :: ... : : : .. .:.:...: .::.: ::: :..: . :::.:: : : CCDS45 -YYKLRTEGDGVYTLNNEKQWINKAVGDKLPECEAVCGKPKNPANPVQRILGGH-LDAKG 60 70 80 90 100 110 450 460 470 480 490 500 pF1KE2 NFPWQ---VFFDNPWAGGALINEYWVLTAAHVVEGNREPTMYVGSTS-VQTSRLAKSKML .:::: : : .:..:::: :.::.:. . :. . . . . . : ..:.... CCDS45 SFPWQAKMVSHHNLTTGATLINEQWLLTTAKNLFLNHSENATAKDIAPTLTLYVGKKQLV 120 130 140 150 160 170 510 520 530 540 550 560 pF1KE2 TPEHVFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPICLPGTSSDYNLMDGD :.: .::... . ::.:..::. :... : ::::: :.:: . : CCDS45 EIEKVVLHPNYSQV-----------DIGLIKLKQKVSVNERVMPICLP--SKDYAEV-GR 180 190 200 210 570 580 590 600 610 pF1KE2 LGLISGWGRTEKRDRAVRLKAARLPVAPLRKC---------KEVKVEKPTADAEAYVFTP .: .:::::. . . .:: . :::: .: : :. : . .. ... CCDS45 VGYVSGWGRNANFKFTDHLKYVMLPVADQDQCIRHYEGSTVPEKKTPKSPVGVQP-ILNE 220 230 240 250 260 270 620 630 640 650 660 670 pF1KE2 NMICAGGEKGM-DSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQCGT--YGLYTRVKNY . .::: : . :.: ::.:.::::.: .. : .::.:..:. .:.. ::.:..: . CCDS45 HTFCAGMSKYQEDTCYGDAGSAFAVHDLEEDT-WYATGILSFDKSCAVAEYGVYVKVTSI 280 290 300 310 320 330 680 pF1KE2 VDWIMKTMQENSTPRED ::..::. :: CCDS45 QDWVQKTIAEN 340 >>CCDS82010.1 HP gene_id:3240|Hs108|chr16 (347 aa) initn: 413 init1: 190 opt: 475 Z-score: 433.7 bits: 89.7 E(32554): 7.7e-18 Smith-Waterman score: 586; 34.0% identity (61.3% similar) in 341 aa overlap (359-682:33-347) 330 340 350 360 370 380 pF1KE2 EGRVGATSFYSTCQSNGKWSNSKLKCQPVDCGIPESIENGKVEDPESTLFGSVIRYTCEE : : : .: :: .:: :.. CCDS82 ALGAVIALLLWGQLFAVDSGNDVTDIADDGCPKPPEIAHGYVEHS--------VRYQCKN 10 20 30 40 50 390 400 410 420 430 440 pF1KE2 PYYYMENGGGGEYHCAGNGSWVNEVLGPELPKCVPVCGVPREPFEEKQRIIGGSDADIK- :: ... : : : . .:.:...: .::.: ::: :..: . :::.:: : : CCDS82 -YYKLRTEGDGVYTLNDKKQWINKAVGDKLPECEAVCGKPKNPANPVQRILGGH-LDAKG 60 70 80 90 100 110 450 460 470 480 490 500 pF1KE2 NFPWQ---VFFDNPWAGGALINEYWVLTAAHVVEGNREPTMYVGSTS-VQTSRLAKSKML .:::: : : .:..:::: :.::.:. . :. . . . . . : ..:.... CCDS82 SFPWQAKMVSHHNLTTGATLINEQWLLTTAKNLFLNHSENATAKDIAPTLTLYVGKKQLV 120 130 140 150 160 170 510 520 530 540 550 560 pF1KE2 TPEHVFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPICLPGTSSDYNLMDGD :.: .::... . ::.:..::. :... : ::::: :.:: . : CCDS82 EIEKVVLHPNYSQV-----------DIGLIKLKQKVSVNERVMPICLP--SKDYAEV-GR 180 190 200 210 570 580 590 600 610 pF1KE2 LGLISGWGRTEKRDRAVRLKAARLPVAPLRKC---------KEVKVEKPTADAEAYVFTP .: .:::::. . . .:: . :::: .: : :. : . .. ... CCDS82 VGYVSGWGRNANFKFTDHLKYVMLPVADQDQCIRHYEGSTVPEKKTPKSPVGVQP-ILNE 220 230 240 250 260 270 620 630 640 650 660 670 pF1KE2 NMICAGGEKGM-DSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQCGT--YGLYTRVKNY . .::: : . :.: ::.:.::::.: .. : .::.:..:. .:.. ::.:..: . CCDS82 HTFCAGMSKYQEDTCYGDAGSAFAVHDLEEDT-WYATGILSFDKSCAVAEYGVYVKVTSI 280 290 300 310 320 330 680 pF1KE2 VDWIMKTMQENSTPRED ::..::. :: CCDS82 QDWVQKTIAEN 340 >>CCDS32993.1 HPN gene_id:3249|Hs108|chr19 (417 aa) initn: 310 init1: 120 opt: 476 Z-score: 433.7 bits: 90.0 E(32554): 7.8e-18 Smith-Waterman score: 476; 33.8% identity (62.5% similar) in 272 aa overlap (425-683:153-408) 400 410 420 430 440 450 pF1KE2 NGGGGEYHCAGNGSWVNEVLGPELPKCVPVCGVPREPFEEKQRIIGGSDADIKNFPWQVF :: . : . ::.:: :... .:::: CCDS32 GRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKLPVD---RIVGGRDTSLGRWPWQVS 130 140 150 160 170 460 470 480 490 500 pF1KE2 FDNPWA---GGALINEYWVLTAAHVV-EGNREPT---MYVGSTSVQTSRLAKSKMLTPEH . : ::.:.. ::::::: : :: . ...:... :.: .. .: . CCDS32 LRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVFAGAVA-QAS--PHGLQLGVQA 180 190 200 210 220 230 510 520 530 540 550 560 pF1KE2 VFIHPGWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPICLPGTSSDYNLMDGDLGLI : : :. .. :... : .::::::.:..:. . ..:.::: .. :.:: . . CCDS32 VVYHGGYLPFRDPNSEEN-SNDIALVHLSSPLPLTEYIQPVCLP--AAGQALVDGKICTV 240 250 260 270 280 290 570 580 590 600 610 620 pF1KE2 SGWGRTEKR-DRAVRLKAARLPVAPLRKCKEVKVEKPTADAEAYVFTPNMICAG-GEKGM .::: :. ..: :. ::.:. :. :: . . :.:.::: : :. CCDS32 TGWGNTQYYGQQAGVLQEARVPIISNDVCN-------GADFYGNQIKPKMFCAGYPEGGI 300 310 320 330 340 630 640 650 660 670 680 pF1KE2 DSCKGDSGGAFAVQDPNDKT-KFYAAGLVSWGPQCGTY---GLYTRVKNYVDWIMKTMQE :.:.::::: :. .: ..: .. :.:::: :. :.::.:... .::..... CCDS32 DACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKT 350 360 370 380 390 400 pF1KE2 NSTPRED .: CCDS32 HSEASGMVTQL 410 688 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 12:31:50 2016 done: Sun Nov 6 12:31:51 2016 Total Scan time: 3.380 Total Display time: 0.130 Function used was FASTA [36.3.4 Apr, 2011]