FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2478, 971 aa 1>>>pF1KE2478 971 - 971 aa - 971 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9710+/-0.00123; mu= 15.2322+/- 0.074 mean_var=216.3848+/-43.304, 0's: 0 Z-trim(109.9): 210 B-trim: 253 in 1/49 Lambda= 0.087189 statistics sampled from 10955 (11196) to 10955 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.682), E-opt: 0.2 (0.344), width: 16 Scan time: 4.430 The best scores are: opt bits E(32554) CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 ( 971) 7002 895.0 0 CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 999) 3638 471.9 2.8e-132 CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 807) 3352 435.8 1.6e-121 CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 ( 993) 2265 299.2 2.7e-80 CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 ( 988) 1931 257.2 1.2e-67 CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 659 97.8 3.4e-19 CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 653 97.0 5.6e-19 CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 634 94.6 2.9e-18 CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 ( 937) 580 87.2 1.7e-16 CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 ( 956) 580 87.2 1.7e-16 CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 572 86.6 5e-16 CCDS83309.1 MATN2 gene_id:4147|Hs108|chr8 ( 915) 559 84.6 1e-15 CCDS46762.1 FBLN2 gene_id:2199|Hs108|chr3 (1184) 534 81.6 1.1e-14 CCDS46761.1 FBLN2 gene_id:2199|Hs108|chr3 (1231) 534 81.6 1.1e-14 CCDS14067.1 FBLN1 gene_id:2192|Hs108|chr22 ( 703) 508 78.0 7.4e-14 CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 512 78.9 8.4e-14 CCDS14069.1 FBLN1 gene_id:2192|Hs108|chr22 ( 683) 505 77.6 9.5e-14 CCDS43028.1 FBLN1 gene_id:2192|Hs108|chr22 ( 566) 503 77.2 1e-13 CCDS14068.1 FBLN1 gene_id:2192|Hs108|chr22 ( 601) 503 77.3 1e-13 CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 506 78.4 1.9e-13 CCDS8116.1 EFEMP2 gene_id:30008|Hs108|chr11 ( 443) 483 74.6 4.9e-13 CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342) 483 75.2 9.7e-13 CCDS33178.2 LTBP1 gene_id:4052|Hs108|chr2 (1395) 483 75.2 9.9e-13 CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 486 76.0 1.1e-12 CCDS33177.2 LTBP1 gene_id:4052|Hs108|chr2 (1721) 483 75.4 1.1e-12 CCDS46226.1 MATN3 gene_id:4148|Hs108|chr2 ( 486) 470 73.0 1.6e-12 CCDS44647.1 LTBP3 gene_id:4054|Hs108|chr11 (1303) 468 73.3 3.5e-12 CCDS2923.1 PROS1 gene_id:5627|Hs108|chr3 ( 676) 459 71.8 5.2e-12 CCDS8002.1 VWCE gene_id:220001|Hs108|chr11 ( 955) 456 71.6 8.3e-12 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 450 71.1 1.9e-11 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 450 71.2 1.9e-11 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 450 71.2 1.9e-11 >>CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 (971 aa) initn: 7002 init1: 7002 opt: 7002 Z-score: 4775.4 bits: 895.0 E(32554): 0 Smith-Waterman score: 7002; 100.0% identity (100.0% similar) in 971 aa overlap (1-971:1-971) 10 20 30 40 50 60 pF1KE2 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 TVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIHL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 SSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLKNAELFPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLKNAELFPEG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 LRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMFITVEFELETNQKEVTAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMFITVEFELETNQKEVTAS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAESCGVGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAESCGVGQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 GHAENQCGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSFQDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 GHAENQCGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSFQDC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 ETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCKNRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCKNRR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 CGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 CGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVM 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 RKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDYQEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDYQEL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 IEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIRLLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 IEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIRLLR 910 920 930 940 950 960 970 pF1KE2 SKVSRFLRPYK ::::::::::: CCDS77 SKVSRFLRPYK 970 >>CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 (999 aa) initn: 5762 init1: 3630 opt: 3638 Z-score: 2488.4 bits: 471.9 E(32554): 2.8e-132 Smith-Waterman score: 6617; 91.6% identity (91.6% similar) in 1028 aa overlap (1-971:1-999) 10 20 30 40 50 60 pF1KE2 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 TVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 TVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIHL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 SSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLKNAELFPEG :: ::::::::::::::::::::::::::::: CCDS81 SS-----------------------------DVTTIRTSVTFKLNEGKCSLKNAELFPEG 490 500 510 550 560 570 580 590 600 pF1KE2 LRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMFITVEFELETNQKEVTAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMFITVEFELETNQKEVTAS 520 530 540 550 560 570 610 620 630 640 650 660 pF1KE2 CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAESCGVGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAESCGVGQ 580 590 600 610 620 630 pF1KE2 GHAENQC----------------------------------------------------- ::::::: CCDS81 GHAENQCVSCRAGTYYDGARERCILCPNGTFQNEEGQMTCEPCPRPGNSGALKTPEAWNM 640 650 660 670 680 690 670 680 690 700 710 720 pF1KE2 ----GLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSFQDCETR :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SECGGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSFQDCETR 700 710 720 730 740 750 730 740 750 760 770 780 pF1KE2 VQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCKNRRCGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 VQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCKNRRCGG 760 770 780 790 800 810 790 800 810 820 830 840 pF1KE2 ELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVMRKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVMRKT 820 830 840 850 860 870 850 860 870 880 890 900 pF1KE2 SSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDYQELIED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDYQELIED 880 890 900 910 920 930 910 920 930 940 950 960 pF1KE2 IVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIRLLRSKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 IVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIRLLRSKV 940 950 960 970 980 990 970 pF1KE2 SRFLRPYK :::::::: CCDS81 SRFLRPYK >>CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 (807 aa) initn: 4986 init1: 3352 opt: 3352 Z-score: 2295.0 bits: 435.8 E(32554): 1.6e-121 Smith-Waterman score: 4894; 72.9% identity (73.0% similar) in 1028 aa overlap (1-971:1-807) 10 20 30 40 50 60 pF1KE2 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 TVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIHL ::::::::::::::::::::::: CCDS53 TVGSYECQCHPGYKLHWNKKDCV------------------------------------- 430 440 490 500 510 520 530 540 pF1KE2 SSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLKNAELFPEG CCDS53 ------------------------------------------------------------ 550 560 570 580 590 600 pF1KE2 LRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMFITVEFELETNQKEVTAS :: CCDS53 ----------------------------------------------------------AS 610 620 630 640 650 660 pF1KE2 CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAESCGVGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAESCGVGQ 450 460 470 480 490 500 pF1KE2 GHAENQC----------------------------------------------------- ::::::: CCDS53 GHAENQCVSCRAGTYYDGARERCILCPNGTFQNEEGQMTCEPCPRPGNSGALKTPEAWNM 510 520 530 540 550 560 670 680 690 700 710 720 pF1KE2 ----GLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSFQDCETR :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SECGGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSFQDCETR 570 580 590 600 610 620 730 740 750 760 770 780 pF1KE2 VQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCKNRRCGG :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCK------ 630 640 650 660 670 790 800 810 820 830 840 pF1KE2 ELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVMRKT CCDS53 ------------------------------------------------------------ 850 860 870 880 890 900 pF1KE2 SSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDYQELIED .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDYQELIED 680 690 700 710 720 730 910 920 930 940 950 960 pF1KE2 IVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIRLLRSKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIRLLRSKV 740 750 760 770 780 790 970 pF1KE2 SRFLRPYK :::::::: CCDS53 SRFLRPYK 800 >>CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 (993 aa) initn: 3958 init1: 1632 opt: 2265 Z-score: 1555.0 bits: 299.2 E(32554): 2.7e-80 Smith-Waterman score: 4181; 56.3% identity (75.2% similar) in 1019 aa overlap (22-971:6-993) 10 20 30 40 50 60 pF1KE2 MGVAGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADA .: : ::. : .. . .:::::..: :.:: :: CCDS48 MGSGRVPGLCLLVLLVHARAAQYSKAAQDVDECVEGTDNCHIDA 10 20 30 40 70 80 90 100 110 120 pF1KE2 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLA .::::: :::: :: :: :.:..:.:.::: : :.::::::.::::::::::.::: :: CCDS48 ICQNTPRSYKCICKSGYTGDGKHCKDVDECEREDNAGCVHDCVNIPGNYRCTCYDGFHLA 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE2 HDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNK :::::::::::: :.:::::..:::.:::::: :.:::::::::::::.: :::..:::: CCDS48 HDGHNCLDVDECAEGNGGCQQSCVNMMGSYECHCREGFFLSDNQHTCIQRPEEGMNCMNK 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE2 DHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSCH .:::.:::.:.:.:..::::::::::.:::::: ::::.:::::::.:::: .::.:.:: CCDS48 NHGCAHICRETPKGGIACECRPGFELTKNQRDCKLTCNYGNGGCQHTCDDTEQGPRCGCH 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE2 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT .. .::::..:.: :::::::::: :.:. CCDS48 IKFVLHTDGKTCIE------------------------------TCAVNNGGCDSKCHDA 230 240 250 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK .:::::.::::: :: : :::::::::. ::::::.:.: ::::.:.::::.::: .:. CCDS48 ATGVHCTCPVGFMLQPDRKTCKDIDECRLNNGGCDHICRNTVGSFECSCKKGYKLLINER 260 270 280 290 300 310 370 380 390 400 410 420 pF1KE2 SCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCVN .:::.::::.:::::: :.: ::.: : :.::: :::.:::::..::::: :::. :.: CCDS48 NCQDIDECSFDRTCDHICVNTPGSFQCLCHRGYLLYGITHCGDVDECSINRGGCRFGCIN 320 330 340 350 360 370 430 440 450 460 470 pF1KE2 TVGSYECQCHPGY-KLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIH : :::.: : : .:::: :::.: . . .. : :..:: : : : : : . CCDS48 TPGSYQCTCPAGQGRLHWNGKDCTEPLKCQGSPGASKAMLSCNRSGKKDTCALTCPSRAR 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE2 LSSGLQGAYSVTCGSSSPL--------RNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSL . .....:.::. :: ... .:: . : .:. ..::....:: : CCDS48 FLPESENGFTVSCGTPSPRAAPARAGHNGNSTNSNHCHEAAVLSIKQRASFKIKDAKCRL 440 450 460 470 480 490 540 550 560 570 580 pF1KE2 --KNAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMF-ITVEF .: :. : . : . . ...: :.:... : .: ::. .:.:. CCDS48 HLRNKGKTEEAGRITGPGGAPCSECQVTFIHLKCDSSRKGKGRRARTPPGKEVTRLTLEL 500 510 520 530 540 550 590 600 610 620 630 640 pF1KE2 ELETNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRT : :. .:.:::: : :. .: :.::. ... :::......: :.:.:.. ..:.:: . CCDS48 EAEVRAEETTASCGLPCLRQRMERRLKGSLKMLRKSINQDRFLLRLAGLDYELAHKPGLV 560 570 580 590 600 610 650 660 pF1KE2 SERQAE---SCGVGQGHAENQC-------------------------------------- . ..:: :: :: .: ..: CCDS48 AGERAEPMESCRPGQHRAGTKCVSCPQGTYYHGQTEQCVPCPAGTFQEREGQLSCDLCPG 620 630 640 650 660 670 670 680 690 700 710 pF1KE2 ----------------GLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKH : : ::..:.::: ::: : ::.::::::: ::::::::.::: CCDS48 SDAHGPLGATNVTTCAGQCPPGQHSVDGFKPCQPCPRGTYQPEAGRTLCFPCGGGLTTKH 680 690 700 710 720 730 720 730 740 750 760 770 pF1KE2 QGATSFQDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGST .:: :::::.:.:::::::.:::. :::::: .:.:::.: .: : :::::.::::::: CCDS48 EGAISFQDCDTKVQCSPGHYYNTSIHRCIRCAMGSYQPDFRQNFCSRCPGNTSTDFDGST 740 750 760 770 780 790 780 790 800 810 820 830 pF1KE2 NITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIE ...:::::.::::::.::::::::::::::::..:: :.:::::::.::::::::::: : CCDS48 SVAQCKNRQCGGELGEFTGYIESPNYPGNYPAGVECIWNINPPPKRKILIVVPEIFLPSE 800 810 820 830 840 850 840 850 860 870 880 890 pF1KE2 DDCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYV :.::: :::::.:: .:.::::::::::::::::.::.::::.::..:.:::::::.::: CCDS48 DECGDVLVMRKNSSPSSITTYETCQTYERPIAFTARSRKLWINFKTSEANSARGFQIPYV 860 870 880 890 900 910 900 910 920 930 940 950 pF1KE2 TYDEDYQELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMF ::::::..:.:::::::::::::::::::::::::::.:.:::::::::::: .. .::. CCDS48 TYDEDYEQLVEDIVRDGRLYASENHQEILKDKKLIKAFFEVLAHPQNYFKYT-EKHKEML 920 930 940 950 960 970 960 970 pF1KE2 PRSFIRLLRSKVSRFLRPYK :.:::.::::::: :::::: CCDS48 PKSFIKLLRSKVSSFLRPYK 980 990 >>CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 (988 aa) initn: 3212 init1: 1909 opt: 1931 Z-score: 1328.0 bits: 257.2 E(32554): 1.2e-67 Smith-Waterman score: 4520; 62.3% identity (78.2% similar) in 1009 aa overlap (36-971:19-988) 10 20 30 40 50 60 pF1KE2 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA ::: :: : :::::..: :::: :: CCDS14 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA 10 20 30 40 70 80 90 100 110 pF1KE2 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML .::::: :::: :::::.:::.:::::::: :. ::::::.:.:::::::::::::::: CCDS14 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE2 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN ::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..::: CCDS14 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE2 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC :::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.: CCDS14 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE2 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD : .: .:.:::.:.: ::::::::::::::: CCDS14 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD 230 240 250 300 310 320 330 340 350 pF1KE2 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE :.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.:::::: CCDS14 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE 260 270 280 290 300 310 360 370 380 390 400 410 pF1KE2 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV ..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: :: CCDS14 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV 320 330 340 350 360 370 420 430 440 450 460 470 pF1KE2 NTVGSYECQCHPGYKLHWNKKDCVEV-KGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGI :: ::::: : :: .:::: :::::. : : ...:::..: :.:.:: ..::: : . CCDS14 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE2 HLSSGLQGAYSVTCGSSSPLRNKQQKSNDSAFG--------DVTTIRTSVTFKLNEGKCS . ...: ..:: .: . :: : .. : .: :. .. ::. ..:: CCDS14 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH 440 450 460 470 480 490 540 550 560 570 580 pF1KE2 LK---NAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEM-FITV :. .:. . .: : . : . .:.: :.:.:. :: : ::. ::. CCDS14 LRPHSQARAKETARQPLLDHCHVT------FVTLKCDSSKKR--RRGRKSPSKEVSHITA 500 510 520 530 540 550 590 600 610 620 630 640 pF1KE2 EFELETNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPP :::.::...:.. .:. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..: CCDS14 EFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPA 560 570 580 590 600 610 650 660 pF1KE2 RTSERQAESCGVGQ----------------GHAENQC----------------------- .. : :. .::.:: : .:: CCDS14 KALEGQG-ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCPSS 620 630 640 650 660 670 680 690 700 710 pF1KE2 ---------------GLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQ : :.:: .::::: ::: : .::.::: :::.:::::::: :::. CCDS14 DGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHE 670 680 690 700 710 720 720 730 740 750 760 770 pF1KE2 GATSFQDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTN :.:::::::..:.::::: :::::::::::::::::::::.:.:..:::::.:::::::: CCDS14 GTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTN 730 740 750 760 770 780 780 790 800 810 820 830 pF1KE2 ITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIED .:.:::..:::::::.:::::::::::.::::.::.: : :::::::::::::::::::: CCDS14 VTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIED 790 800 810 820 830 840 840 850 860 870 880 890 pF1KE2 DCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVT .::: :::::..: .:.:::::::::::::::::::.:::::::::::::..:::::::: CCDS14 ECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVPYVT 850 860 870 880 890 900 900 910 920 930 940 950 pF1KE2 YDEDYQELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFP ::::::.::::::::::::::::::::::::::::::::::::::::::::::::.:::: CCDS14 YDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKEMFP 910 920 930 940 950 960 960 970 pF1KE2 RSFIRLLRSKVSRFLRPYK ::::.:::::::::::::: CCDS14 RSFIKLLRSKVSRFLRPYK 970 980 >>CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912 aa) initn: 731 init1: 401 opt: 659 Z-score: 458.2 bits: 97.8 E(32554): 3.4e-19 Smith-Waterman score: 824; 31.4% identity (54.7% similar) in 503 aa overlap (35-492:473-953) 10 20 30 40 50 pF1KE2 GRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDE----CAQGLDDC-HAD : : .:: : . : .: : : CCDS34 APSGNGNGYGPGGTGFIPIPGGNGFSPGVGGAGVGAGGQGPIITGLTILNQTIDICKHHA 450 460 470 480 490 500 60 70 80 90 100 110 pF1KE2 ALCQN---TPT--SYKCSCKPGY-QGEGRQCEDIDEC-GNELNGGCVHDCLNIPGNYRCT :: : :: ::.: :. :: : . .: :.::: .: ..: ::.: ::.: : CCDS34 NLCLNGRCIPTVSSYRCECNMGYKQDANGDCIDVDECTSNPCTNG---DCVNTPGSYYCK 510 520 530 540 550 120 130 140 150 160 170 pF1KE2 CFDGFMLAHDGHNCLDVDECLENNGGCQH-TCVNVMGSYECCCKEGFFLSDNQHTCIHRS : ::. . . :.:.:::..:. :.. :::. ::..: :. :: :. . ..:. .. CCDS34 CHAGFQRTPTKQACIDIDECIQNGVLCKNGRCVNTDGSFQCICNAGFELTTDGKNCVDHD 560 570 580 590 600 610 180 190 200 210 220 pF1KE2 EEGLSCMNKDHGCSHICKEAPRGSVACECRPGFELAKNQRDC--ILTCNHGNGGCQHS-C : : . . . .: . :: : :.::: :: : : : . : . : :... : CCDS34 E----CTTTNMCLNGMCINED-GSFKCICKPGFVLAPNGRYCTDVDEC-QTPGICMNGHC 620 630 640 650 660 670 230 240 250 260 270 280 pF1KE2 DDTADGPECSCHPQYKMHTDGRSCLE---REDTVLEVTESNTTSVVDGDKRVKRRLLMET .. . .:.: : . ::: :.. : . .. . : : . : CCDS34 INSEGSFRCDCPPGLAVGMDGRVCVDTHMRSTCYGGIKKGVCVRPFPG--AVTKS---EC 680 690 700 710 720 290 300 310 320 330 pF1KE2 CAVN-NGGCDRTCKD----TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGC-DHFCK : .: . : . :. .:. : : : . .::. ::.:: : . .:. CCDS34 CCANPDYGFGEPCQPCPAKNSAEFHGLCSSGVGITVDGR---DINECALDPDICANGICE 730 740 750 760 770 780 340 350 360 370 380 390 pF1KE2 NIVGSFDCGCKKGFKLLTDEKSCQDVDECSLDRT-CDHS-CINHPGTFACACNRGYTLYG :. ::. :.:..:.. .. ..: :.::: ..: ::.. : : ::...:.: ::.. CCDS34 NLRGSYRCNCNSGYEPDASGRNCIDIDECLVNRLLCDNGLCRNTPGSYSCTCPPGYVFRT 790 800 810 820 830 840 400 410 420 430 440 450 pF1KE2 FTH-CGDTNECSIN---NGGCQQVCVNTVGSYECQCHPGYKLHWNKKDCVE-VKGLLPTS :. : : ::: : ::.:. :..::..:.: :: :: . :.. .:: . CCDS34 ETETCEDINECESNPCVNGACR----NNLGSFNCECSPGSKLSSTGLICIDSLKGTCWLN 850 860 870 880 890 900 460 470 480 490 pF1KE2 VSP---RVSLH--------CGKSGG--GDGCFLRCHSGIHLSSGLQGAYSVTCGSSSPLR .. .:... :. :. :. : ::. :: .::: CCDS34 IQDSRCEVNINGATLKSECCATLGAAWGSPCE-RCELDTACPRGLARIKGVTCEDVNECE 910 920 930 940 950 960 500 510 520 530 540 550 pF1KE2 NKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLKNAELFPEGLRPALPEKHSSVKESFRYV CCDS34 VFPGVCPNGRCVNSKGSFHCECPEGLTLDGTGRVCLDIRMEQCYLKWDEDECIHPVPGKF 970 980 990 1000 1010 1020 >-- initn: 731 init1: 401 opt: 672 Z-score: 467.0 bits: 99.4 E(32554): 1.1e-19 Smith-Waterman score: 832; 26.0% identity (46.4% similar) in 877 aa overlap (45-813:1449-2261) 20 30 40 50 60 70 pF1KE2 VLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADALCQNTPTSYKCSCK ::::::.... :. .. : :.: .:.: :. CCDS34 CSINAQCVNTPGSYRCACSEGFTGDGFTCSDVDECAENINLCE-NGQCLNVPGAYRCECE 1420 1430 1440 1450 1460 1470 80 90 100 110 120 130 pF1KE2 PGYQ--GEGRQCEDIDECGNELNGGCVHD-CLNIPGNYRCTCFDGFMLAHDGHNCLDVDE :. ...:.:.:::::. ... :: : :.:: ..: : ::. : . : :: :.:: CCDS34 MGFTPASDSRSCQDIDECS--FQNICVFGTCNNLPGMFHCICDDGYELDRTGGNCTDIDE 1480 1490 1500 1510 1520 1530 140 150 160 170 pF1KE2 CLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIH------------RSEEGLSC-- : . . . :::. : ::: : : :. . :. :.. .::: CCDS34 CADPINCVNGLCVNTPGRYECNCPPDFQLNPTGVGCVDNRVGNCYLKFGPRGDGSLSCNT 1540 1550 1560 1570 1580 1590 180 pF1KE2 --------------MNKDHG-----CSHI-----------------------------CK ..: : : . :. CCDS34 EIGVGVSRSSCCCSLGKAWGNPCETCPPVNSTEYYTLCPGGEGFRPNPITIILEDIDECQ 1600 1610 1620 1630 1640 1650 190 200 210 220 230 pF1KE2 EAPR-----------GSVACECRPGFELAKNQRDC--ILTCNHGNGGC-QHSCDDTADGP : : :: ::: :. :... : : : : : : .: .: . CCDS34 ELPGLCQGGNCINTFGSFQCECPQGYYLSEDTRICEDIDECFAHPGVCGPGTCYNTLGNY 1660 1670 1680 1690 1700 1710 240 250 260 270 280 290 pF1KE2 ECSCHPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGC-D : : :.: . . :..:.. . . . ..:: . : .: : :. : : . CCDS34 TCICPPEYMQVNGGHNCMDMRKSFCYRSYNGTTCENELPFNVTKR--MCCCTYNVGKAWN 1720 1730 1740 1750 1760 1770 300 310 320 330 340 pF1KE2 RTCKDTST-GVH-----CSCPVGFTLQLDGKTCKDIDECQTRNGGC-DHFCKNIVGSFDC . :. : :. :. :::... :::::. : : . : : .::: : CCDS34 KPCEPCPTPGTADFKTICGNIPGFTFDIHTGKAVDIDECKEIPGICANGVCINQIGSFRC 1780 1790 1800 1810 1820 1830 350 360 370 380 390 400 pF1KE2 GCKKGFKLLTDEKSCQDVDECSL-DRTCDHS--CINHPGTFACACNRGYTLYGFTHCGDT : ::. :.:.:::: : :... ::: ::.. : : :. : : : CCDS34 ECPTGFSYNDLLLVCEDIDECSNGDNLCQRNADCINSPGSYRCECAAGFKLSPNGACVDR 1840 1850 1860 1870 1880 1890 410 420 430 440 450 460 pF1KE2 NEC-SINNGGCQQVCVNTVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGK ::: : : . .::. :::.: :: :.: .. :..: : . : . CCDS34 NECLEIPNVCSHGLCVDLQGSYQCICHNGFKASQDQTMCMDVD---ECERHPCGNGTCKN 1900 1910 1920 1930 1940 1950 470 480 490 500 510 520 pF1KE2 SGGGDGCFLRCHSGIHLSSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTTIRTSVT-- . :. .:. :. :..:. . . :.: : : :... ... . CCDS34 TVGSYNCL--CYPGFELTHNNDCLDIDECSSFF----GQVCRNGRCFNEIGSFKCLCNEG 1960 1970 1980 1990 2000 530 540 550 560 570 pF1KE2 FKLN-EGKCSLKNAEL--FPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPST ..:. .:: . . : .: . :. . ... ::: . : : .: . CCDS34 YELTPDGKNCIDTNECVALPGSCSPGTCQ---NLEGSFRCI---CPPGYEVKS------- 2010 2020 2030 2040 2050 580 590 600 610 620 630 pF1KE2 PKEMFITVEFELETNQKEVTASCD-----LSCIVKRTEKRLRKAIRTLRKAVHREQFHLQ : : .. : . . .:: ..:. .. : . :..: . CCDS34 --ENCIDINECDEDPNICLFGSCTNTPGGFQCLCPPGFVLSDNGRRCFDT---RQSFCFT 2060 2070 2080 2090 2100 640 650 660 670 680 690 pF1KE2 LSGMNLDVAK-KPPRTSERQAESCGVGQGHAENQCGLCQPGEYSADGFAPCQLCALGTFQ :.. .: . :.. . .: : .::: .: ::.:: . CCDS34 ----NFENGKCSVPKAFNTTKAKC----------CCSKMPGEGWGD---PCELCPK---D 2110 2120 2130 2140 700 710 720 730 740 pF1KE2 PEAGRTSCFPCGGG-LATKHQGATSFQDC-ETRVQCSPGHFYNTT-THRCIRCPVGTYQP :.. . : : : . . :. . ..: :. :: :. :: . :: .::.: :. CCDS34 DEVAFQDLCPYGHGTVPSLHDTREDVNECLESPGICSNGQCINTDGSFRC-ECPMG-YNL 2150 2160 2170 2180 2190 2200 750 760 770 780 790 800 pF1KE2 EFGKNNCVSCPGNTTTDFDGSTNITQCKNRRCGGELGDFTGYIESPNYPG---NYPANTE .. :: : : . . : : : . .:.: . :: : .: CCDS34 DYTGVRCV--------DTDECSIGNPCGNGTCTNVIGSFECNCNEGFEPGPMMNCEDINE 2210 2220 2230 2240 2250 810 820 830 840 850 860 pF1KE2 CTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTS :. :: CCDS34 CAQ--NPLLCAFRCMNTFGSYECTCPIGYALREDQKMCKDLDECAEGLHDCESRGMMCKN 2260 2270 2280 2290 2300 2310 >-- initn: 505 init1: 270 opt: 487 Z-score: 341.2 bits: 76.2 E(32554): 1.1e-12 Smith-Waterman score: 832; 35.2% identity (55.9% similar) in 392 aa overlap (62-433:1089-1440) 40 50 60 70 80 pF1KE2 VPPGRGRAAGPQEDVDECAQGLDDCHADALCQNTPTSYKCSCKPGY--QGEGRQCEDIDE :.:: :.:: :. :. . : :.: :::: CCDS34 ANRGDVLTGRPFYKDINECKAFPGMCTYGKCRNTIGSFKCRCNSGFALDMEERNCTDIDE 1060 1070 1080 1090 1100 1110 90 100 110 120 130 140 pF1KE2 C--GNELNGGCVHDCLNIPGNYRCTCFDG----FMLAHDGHNCLDVDECLENNGGCQH-T : . .: :. . :.: ::...: ::.: ::. . ::.:.::: .: :. : CCDS34 CRISPDLCGSGI--CVNTPGSFECECFEGYESGFMMMK---NCMDIDECERNPLLCRGGT 1120 1130 1140 1150 1160 1170 150 160 170 180 190 200 pF1KE2 CVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLS-CMNKDHGCSHICKEAPRGSVACECR :::. ::..: : : :: ... :. .: .:: . .. : .. :. : : CCDS34 CVNTEGSFQCDCPLGHELSPSREDCVDINECSLSDNLCRNGKCVNMI-----GTYQCSCN 1180 1190 1200 1210 1220 210 220 230 240 250 pF1KE2 PGFELAKNQRDC--ILTCNHGNGGCQHSCDDTADGPECSCHPQYKMHTDGRSCLEREDTV ::.. . ... : : : ::::. .: .. . :::: : . ::::: CCDS34 PGYQATPDRQGCTDIDECMIMNGGCDTQCTNSEGSYECSCSEGYALMPDGRSC------- 1230 1240 1250 1260 1270 1280 260 270 280 290 300 310 pF1KE2 LEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDR-TCKDTSTGVHCSCPVGFTLQLDG .: :. : : :: : . .: : :: ..: CCDS34 -----------ADIDE----------CENNPDICDGGQCTNIPGEYRCLCYDGFMASMDM 1290 1300 1310 1320 320 330 340 350 360 370 pF1KE2 KTCKDIDECQTRNGGCDHF--CKNIVGSFDCGCKKGFKLLTDEKSCQDVDECSLD-RTCD ::: :..::. .. : : :.: ::: : :. :... .: ::::: . ..:: CCDS34 KTCIDVNECDLNSNIC-MFGECENTKGSFICHCQLGYSVKKGTTGCTDVDECEIGAHNCD 1330 1340 1350 1360 1370 380 390 400 410 420 430 pF1KE2 -H-SCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQ--QVCVNTVGSYECQCHP : ::.: ::.: :.: .:. :. .: : .::: .. :. :::: :::.: : CCDS34 MHASCLNIPGSFKCSCREGWIGNGI-KCIDLDECSNGTHQCSINAQCVNTPGSYRCACSE 1380 1390 1400 1410 1420 1430 440 450 460 470 480 490 pF1KE2 GYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGIHLSSGLQGAYSVT :. CCDS34 GFTGDGFTCSDVDECAENINLCENGQCLNVPGAYRCECEMGFTPASDSRSCQDIDECSFQ 1440 1450 1460 1470 1480 1490 >>CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871 aa) initn: 883 init1: 387 opt: 653 Z-score: 454.1 bits: 97.0 E(32554): 5.6e-19 Smith-Waterman score: 836; 26.5% identity (48.3% similar) in 857 aa overlap (45-799:1404-2199) 20 30 40 50 60 70 pF1KE2 VLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADALCQNTPTSYKCSCK :.:::...:. : ... : :.: .:.: : CCDS32 CSQHADCKNTMGSYRCLCKEGYTGDGFTCTDLDECSENLNLC-GNGQCLNAPGGYRCECD 1380 1390 1400 1410 1420 1430 80 90 100 110 120 130 pF1KE2 PGY--QGEGRQCEDIDECGNELNGGCVHD-CLNIPGNYRCTCFDGFMLAHDGHNCLDVDE :. ...:. :::::::. : . :: : :.:: .:: : :. : ..: :: ::.: CCDS32 MGFVPSADGKACEDIDECS--LPNICVFGTCHNLPGLFRCECEIGYELDRSGGNCTDVNE 1440 1450 1460 1470 1480 1490 140 150 160 170 pF1KE2 CLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIH------------RSEEG----- ::. . . .:::. ::: : : : :. .. :. :...: CCDS32 CLDPTTCISGNCVNTPGSYICDCPPDFELNPTRVGCVDTRSGNCYLDIRPRGDNGDTACS 1500 1510 1520 1530 1540 1550 180 pF1KE2 ---------LSC---MNKDHG-----CSHI-----------------------------C :: ..: : : . : CCDS32 NEIGVGVSKASCCCSLGKAWGTPCEMCPAVNTSEYKILCPGGEGFRPNPITVILEDIDEC 1560 1570 1580 1590 1600 1610 190 200 210 220 230 pF1KE2 KEAPR-----------GSVACECRPGFELAKNQRDC--ILTCNHGNGGC-QHSCDDTADG .: : :: :.: :. : .. : : . :. : : .: .:. . CCDS32 QELPGLCQGGKCINTFGSFQCRCPTGYYLNEDTRVCDDVNECETP-GICGPGTCYNTVGN 1620 1630 1640 1650 1660 240 250 260 270 280 290 pF1KE2 PECSCHPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNG--- : : :.: . . : .:.. . .. . ... ::. . : :. : : CCDS32 YTCICPPDYMQVNGGNNCMDMRRSLCYRNYYADNQTCDGELLFNMTKKMCCCSYNIGRAW 1670 1680 1690 1700 1710 1720 300 310 320 330 340 pF1KE2 --GCDRTCKDTST---GVHC-SCPVGFTLQLDGKTCKDIDECQTRNGGCDH-FCKNIVGS :.. : :: .. : : ::.... :::::. : :.. : :.::: CCDS32 NKPCEQ-CPIPSTDEFATLCGSQRPGFVIDIYTGLPVDIDECREIPGVCENGVCINMVGS 1730 1740 1750 1760 1770 1780 350 360 370 380 390 400 pF1KE2 FDCGCKKGFKLLTDEKSCQDVDECSLDRTCDHS--CINHPGTFACACNRGYTLYGFTHCG : : : :: :.:.:::. .:... ::: :.. : :. :: . . .:. CCDS32 FRCECPVGFFYNDKLLVCEDIDECQNGPVCQRNAECINTAGSYRCDCKPGYRFTSTGQCN 1790 1800 1810 1820 1830 1840 410 420 430 440 450 460 pF1KE2 DTNECSINNGGCQQ-VCVNTVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHC : :::. . :.. :..::::. : :: :.: . .. :.... . . . : CCDS32 DRNECQEIPNICSHGQCIDTVGSFYCLCHTGFKTNDDQTMCLDINECERDACGNGT---C 1850 1860 1870 1880 1890 1900 470 480 490 500 510 pF1KE2 GKSGGGDGCFLRCHSGIHLSSGLQGAYSVTC--GSSSPLRNKQQKSNDSAFGDVTTIRTS .. :. .: ::. :. :: . . : :... :: : ..:. : CCDS32 RNTIGSFNC--RCNHGFILSHNNDCIDVDECASGNGNLCRNGQC---------INTV-GS 1910 1920 1930 1940 1950 520 530 540 550 560 570 pF1KE2 VTFKLNEGKCSLKNAELFPEGLRPALPEKHSSVKESFRYVNLTCSS--GKQVPGAPGRPS . ::: :. :.: : . . . . : . . ::.. :. : : CCDS32 FQCQCNEGY------EVAPDG-RTCV-DINECLLEPRKCAPGTCQNLDGSYRCICPPGYS 1960 1970 1980 1990 2000 580 590 600 610 620 630 pF1KE2 TPKEMFITVEFELETNQKEVTASCDL-SCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSG .: .. .: . :. : : .: . :: . : . : : :. :: CCDS32 LQNEKCEDIDECVE--EPEI---CALGTC--SNTEGSF--------KCLCPEGFSLSSSG 2010 2020 2030 2040 2050 640 650 660 670 680 690 pF1KE2 MNLDVAKKPPRTSERQAESCGV--GQGHAENQCGLCQPGEYSADGFAPCQLCALGTFQPE . . .. .. .:. ...:....: :: .: ::.:: : : CCDS32 RRCQDLRMSYCYAKFEGGKCSSPKSRNHSKQECCCALKGEGWGD---PCELCP--TEPDE 2060 2070 2080 2090 2100 700 710 720 730 740 750 pF1KE2 AGRTSCFPCGGGLAT-KHQGATSFQDCETRVQCSPGHFYNTT-THRCIRCPVGTYQPEFG : : : : :.:. . ..:.....:. :. :. :: ..:: .:: : .. CCDS32 AFRQIC-PYGSGIIVGPDDSAVDMDECKEPDVCKHGQCINTDGSYRC-ECPFGYI---LA 2110 2120 2130 2140 2150 2160 760 770 780 790 800 810 pF1KE2 KNNCVSCPGNTTTDFDGSTNITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTIN :.:: : : . . : : : . .: : : :: CCDS32 GNECV--------DTDECSVGNPCGNGTCKNVIGGFECTCEEGFEPGPMMTCEDINECAQ 2170 2180 2190 2200 2210 820 830 840 850 860 870 pF1KE2 PPPKRRILIVVPEIFLPIEDDCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLW CCDS32 NPLLCAFRCVNTYGSYECKCPVGYVLREDRRMCKDEDECEEGKHDCTEKQMECKNLIGTY 2220 2230 2240 2250 2260 2270 >-- initn: 548 init1: 274 opt: 489 Z-score: 342.7 bits: 76.4 E(32554): 9.1e-13 Smith-Waterman score: 794; 26.3% identity (47.3% similar) in 819 aa overlap (45-808:490-1237) 20 30 40 50 60 70 pF1KE2 VLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADALCQNTPTSYKCSCK ::::: . . : : . : :. :: :.:. CCDS32 CQNGRCIPTPGSYRCECNKGFQLDLRGECIDVDECEK--NPC-AGGECINNQGSYTCQCR 460 470 480 490 500 510 80 90 100 110 120 pF1KE2 PGYQGE--GRQCEDIDEC---GNELNGGCVHDCLNIPGNYRCTCFDGFMLAHDGHNCLDV :::. .:.::::: : :.: :.: :...:.: :: ...::.:: :. CCDS32 AGYQSTLTRTECRDIDECLQNGRICNNG---RCINTDGSFHCVCNAGFHVTRDGKNCEDM 520 530 540 550 560 570 130 140 150 160 170 180 pF1KE2 DECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTC--IHRSEEGLSCMNKDHGCSHI ::: : . :.: ::..: :: :: :... . : :.. : ::: : . CCDS32 DECSIRNMCLNGMCINEDGSFKCICKPGFQLASDGRYCKDINECETPGICMNGR--CVNT 580 590 600 610 620 630 190 200 210 220 230 pF1KE2 CKEAPRGSVACECRPGFELAKNQRDCI-----LTCNHG--NGGCQHSCDDTADGPECSC- :: ::: ::. .. . : :. :: : : : . .. :: : CCDS32 -----DGSYRCECFPGLAVGLDGRVCVDTHMRSTCYGGYKRGQCIKPLFGAVTKSECCCA 640 650 660 670 680 240 250 260 270 280 290 pF1KE2 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGC-DRTCK .: . . : .... .. :. ..... . ... ::.. : . :. CCDS32 STEYAFGEPCQPCPAQNSAEYQALCSSGPGMTSAGSDINE------CALDPDICPNGICE 690 700 710 720 730 740 300 310 320 330 340 350 pF1KE2 DTSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHF-CKNIVGSFDCGCKKGFKLLT . .: : :. .. ::.: ::.:: . ::. :.: ::: : : ::: CCDS32 NLRGTYKCICNSGYEVDSTGKNCVDINECVLNSLLCDNGQCRNTPGSFVCTCPKGFIYKP 750 760 770 780 790 800 360 370 380 390 400 410 pF1KE2 DEKSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGF-THCGDT--NEC--SINNG : :.:.:.::: . . : : ::.: : :. :: : : .: . : .. .: CCDS32 DLKTCEDIDECESSPCINGVCKNSPGSFICECSSESTLDPTKTICIETIKGTCWQTVIDG 810 820 830 840 850 860 420 430 440 450 460 470 pF1KE2 GCQQVCVNTVG-SYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCF :. .: : . . :: . :.. :. . . : . .. . : : CCDS32 RCE---ININGATLKSQCCSSLGAAWGSP-CTLCQ-VDPICGKGYSRIKGTQCEDIDECE 870 880 890 900 910 480 490 500 510 520 pF1KE2 LR---CHSGIHLSSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTT-IRTSVTF-KLNE . :..:. ... .:... : :. : .: : . :: . : . .. CCDS32 VFPGVCKNGLCVNT--RGSFKCQCPSGMTL---------DATGRICLDIRLETCFLRYED 920 930 940 950 960 530 540 550 560 570 pF1KE2 GKCSLK-------NAELFPEGLRPALPE-KHSSVKESFRYVNLTCSSGKQVPGAPGRPST .:.: .: : . : .. .... .: .: : : .:: . CCDS32 EECTLPIAGRHRMDACCCSVGAAWGTEECEECPMRNTPEYEEL-C------PRGPGFAT- 970 980 990 1000 1010 580 590 600 610 620 630 pF1KE2 PKEMFITVEFELETNQ-KEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGM ::. : . :. : . . : :. . :..: ... ::. CCDS32 -KEITNGKPFFKDINECKMIPSLC--------THGKCRNTIGSFKCRCD--------SGF 1020 1030 1040 1050 640 650 660 670 680 690 pF1KE2 NLDVAKKPPRTSER---QAESCGVGQGHAENQCGLCQPGEYSADGFAPCQLCALGTFQPE :: .. .. . . :: :: :. : .:: . : : CCDS32 ALDSEERNCTDIDECRISPDLCGRGQCVNTPGDFECKCDEGYESGFMMMKNCMD---IDE 1060 1070 1080 1090 1100 1110 700 710 720 730 740 pF1KE2 AGRTSCFPCGGGLATKHQGATSFQDCETRVQCSPGHFYNTTTHRCIR----------CPV : . : ::. . .: :.. :: : ::: . . :: :: CCDS32 CQRDPLL-CRGGVCHNTEG--SYR-CE----CPPGHQLSPNISACIDINECELSAHLCPN 1120 1130 1140 1150 1160 750 760 770 780 790 800 pF1KE2 GTYQPEFGKNNCVSCPG-NTTTDFDGSTNITQCK--NRRCGGELGDFTGYIESPNYPGN- : .:: .:. :: ..: : ..: .:. : : . : : :: CCDS32 GRCVNLIGKYQCACNPGYHSTPDRLFCVDIDECSIMNGGCETFCTNSEGSYECSCQPGFA 1170 1180 1190 1200 1210 1220 810 820 830 840 850 pF1KE2 -YPANTECTWTINPPPKRRILIVVPEIFLPIEDDCGDYLVMRKTSSSNSVTTYETCQTYE .: . :: CCDS32 LMPDQRSCTDIDECEDNPNICDGGQCTNIPGEYRCLCYDGFMASEDMKTCVDVNECDLNP 1230 1240 1250 1260 1270 1280 >>CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809 aa) initn: 755 init1: 310 opt: 634 Z-score: 441.3 bits: 94.6 E(32554): 2.9e-18 Smith-Waterman score: 802; 32.2% identity (54.5% similar) in 475 aa overlap (44-497:2165-2620) 20 30 40 50 60 70 pF1KE2 AVLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADALCQNTPTSYKCSC ::.:::. :. :.:: :: :.: CCDS12 PCGQGTCTNVIGGFECACADGFEPGLMMTCEDIDECS--LNPLLCAFRCHNTEGSYLCTC 2140 2150 2160 2170 2180 2190 80 90 100 110 120 pF1KE2 KPGY--QGEGRQCEDIDEC--GNELNGGCVHDCLNIPGNYRCTCFDGFM-LAHDGHNCLD :: . .: .:.:.::: :.. . .: :. :.. :.: :. : .:..: : CCDS12 PAGYTLREDGAMCRDVDECADGQQDCHARGMECKNLIGTFACVCPPGMRPLPGSGEGCTD 2200 2210 2220 2230 2240 2250 130 140 150 160 170 180 pF1KE2 VDECLENNGGCQH-TCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNKDHGCSHI .:: . : . :::. ::..: : ::: : . : : ..: :. . . . CCDS12 DNECHAQPDLCVNGRCVNTAGSFRCDCDEGFQPSPTLTEC-HDIRQG-PCFAE--VLQTM 2260 2270 2280 2290 2300 190 200 210 220 230 240 pF1KE2 CKEAPRGSVA-----CECRPGFELAKNQRDCILTCNHGNGG-CQHSCDDTADGPECS-CH :. .: : : : : . . : : . . : :. ::.: . . :. CCDS12 CRSLSSSSEAVTRAECCCGGGRGWGPRCELCPLPGTSAYRKLCPHGSGYTAEGRDVDECR 2310 2320 2330 2340 2350 2360 250 260 270 280 290 300 pF1KE2 PQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKDT .. . :. :.. . ... : : . : :. :. : ::.: CCDS12 MLAHLCAHGE-CINSLGSFRCHCQAGYTP----DATATTCLDMDECSQVPKPCTFLCKNT 2370 2380 2390 2400 2410 2420 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK . . :::: :. :. ::.::::.::: .:. .:. .: : ::.: : : :: .. CCDS12 KGSFLCSCPRGYLLEEDGRTCKDLDECTSRQHNCQFLCVNTVGAFTCRCPPGF--TQHHQ 2430 2440 2450 2460 2470 2480 370 380 390 400 410 pF1KE2 SCQDVDECSLDR-TCD-HS-CINHPGTFACACNRGYTLYGFTH-CGDTNECSINNGGCQQ .: : :::: . : :. : : ::.: : :..:.:: . : : :.:::. . ::. CCDS12 ACFDNDECSAQPGPCGAHGHCHNTPGSFRCECHQGFTLVSSGHGCEDVNECD-GPHRCQH 2490 2500 2510 2520 2530 2540 420 430 440 450 460 470 pF1KE2 VCVNTVGSYECQCHPGYKLHWNKKDCVEVK--GLLPTSVSPRVSLHCGKSGGGDGCFLRC : : .:.:.:.: :. : . .::. . .: : . . : : .. :: : : CCDS12 GCQNQLGGYRCSCPQGFTQHSQWAQCVDENECALSPPTCG---SASCRNTLGGFRCV--C 2550 2560 2570 2580 2590 480 490 500 510 520 530 pF1KE2 HSGIHLSSGLQGAYSVT-C-GSSSPLRNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLK ::. ....: : : : : .: CCDS12 PSGFDFDQALGGCQEVDECAGRRGPCSYSCANTPGGFLCGCPQGYFRAGQGHCVSGLGFS 2600 2610 2620 2630 2640 2650 >-- initn: 431 init1: 250 opt: 732 Z-score: 508.0 bits: 106.9 E(32554): 5.7e-22 Smith-Waterman score: 832; 31.4% identity (55.9% similar) in 494 aa overlap (34-492:395-867) 10 20 30 40 50 60 pF1KE2 AGRNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGR--AAGPQEDVDECAQGLDDCHADAL :: . .: .. .: : . . : .. CCDS12 GFGSNGMGPPLGPARLNPHGSDARGIPSLGPGNSNIGTATLNQTIDICRHFTNLC-LNGR 370 380 390 400 410 420 70 80 90 100 110 pF1KE2 CQNTPTSYKCSCKPGYQGEGR-QCEDIDECGNELNGGCVH-DCLNIPGNYRCTCFDGFML : ::.::.: :. :: . : .: :.::: .. : : ::.::::.:.: :. ::. CCDS12 CLPTPSSYRCECNVGYTQDVRGECIDVDEC---TSSPCHHGDCVNIPGTYHCRCYPGFQA 430 440 450 460 470 480 120 130 140 150 160 170 pF1KE2 AHDGHNCLDVDECLENNGGCQ-HTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCM . . :.:::::. ..: :. :::. ::..: :. :: :: . ..:. ..: . : : CCDS12 TPTRQACVDVDECIVSGGLCHLGRCVNTEGSFQCVCNAGFELSPDGKNCVDHNECATSTM 490 500 510 520 530 540 180 190 200 210 220 230 pF1KE2 NKDHGCSH-ICKEAPRGSVACECRPGFELAKNQRDC--ILTCNHGNGGCQHS-CDDTADG : . .: . :: .: :.::: :: . . : : : . : : .. : .: . CCDS12 -----CVNGVCLNED-GSFSCLCKPGFLLAPGGHYCMDIDEC-QTPGICVNGHCTNTEGS 550 560 570 580 590 240 250 260 270 280 290 pF1KE2 PECSCHPQYKMHTDGRSCLE---REDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVN-N .:.: . :::: :.. : . ... . : : . : : .: . CCDS12 FRCQCLGGLAVGTDGRVCVDTHVRSTCYGAIEKGSCARPFPGT--VTKS---ECCCANPD 600 610 620 630 640 300 310 320 330 340 pF1KE2 GGCDRTCK----DTSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGC-DHFCKNIVGSF : . :. :. . : :. . ::. ::.:: : . :.:. ::. CCDS12 HGFGEPCQLCPAKDSAEFQALCSSGLGITTDGR---DINECALDPEVCANGVCENLRGSY 650 660 670 680 690 700 350 360 370 380 390 400 pF1KE2 DCGCKKGFKLLTDEKSCQDVDECSLDRT-CDHS-CINHPGTFACACNRGYTLYGFTH-CG : :. :.. .. :.: :::::.:. ::.. : : ::...:.: :. .. :. : CCDS12 RCVCNLGYEAGASGKDCTDVDECALNSLLCDNGWCQNSPGSYSCSCPPGFHFWQDTEICK 710 720 730 740 750 760 410 420 430 440 450 pF1KE2 DTNECSINNGGCQQVCVNTVGSYECQCHPGYKLHWNKKDCVE-VKGLLPTSVSP---RVS :..:: ... . :: : .::: :.: :: .: . :.. .:: ... .:. CCDS12 DVDEC-LSSPCVSGVCRNLAGSYTCKCGPGSRLDPSGTFCLDSTKGTCWLKIQESRCEVN 770 780 790 800 810 820 460 470 480 490 500 pF1KE2 LH--------CGKSGG--GDGCFLRCHSGIHLSSGLQGAYSVTCGSSSPLRNKQQKSNDS :. :. :. :. : ::. . :. .::: CCDS12 LQGASLRSECCATLGAAWGSPCE-RCEIDPACARGFARMTGVTCDDVNECESFPGVCPNG 830 840 850 860 870 880 510 520 530 540 550 560 pF1KE2 AFGDVTTIRTSVTFKLNEGKCSLKNAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQ CCDS12 RCVNTAGSFRCECPEGLMLDASGRLCVDVRLEPCFLRWDEDECGVTLPGKYRMDVCCCSI 890 900 910 920 930 940 >-- initn: 755 init1: 310 opt: 649 Z-score: 451.5 bits: 96.5 E(32554): 7.9e-19 Smith-Waterman score: 833; 26.4% identity (47.8% similar) in 799 aa overlap (45-796:1280-2005) 20 30 40 50 60 70 pF1KE2 VLLLLLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDCHADALCQNTPTSYKCSCK ::::: : .: . : : : : :..: : CCDS12 LHGDCENTKGSFVCHCQLGYMVRKGATGCSDVDECEVGGHNCDSHASCLNIPGSFSCRCL 1250 1260 1270 1280 1290 1300 80 90 100 110 120 130 pF1KE2 PGYQGEGRQCEDIDEC-GNELNGGCVHDCLNIPGNYRCTCFDGFMLAHDGHNCLDVDECL ::. :.: .:.:.::: ..: . ::::.::.::::: .:: : :: : : ::: CCDS12 PGWVGDGFECHDLDECVSQEHRCSPRGDCLNVPGSYRCTCRQGF--AGDGFFCEDRDECA 1310 1320 1330 1340 1350 1360 140 150 160 170 180 190 pF1KE2 ENNGGCQH-TCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNKDHGCSHICKEAP :: :.. :.:. :.:.: :. :: ......: .: : . . :.. : CCDS12 ENVDLCDNGQCLNAPGGYRCECEMGFDPTEDHRACQDVDE----CAQGNLCAFGSCENLP 1370 1380 1390 1400 1410 1420 200 210 220 230 240 250 pF1KE2 RGSVACECRPGFELAKNQRDC--ILTCNHGNGGCQHSCDDTADGPECSCHPQYKMHTDGR : : : :.:: .. .: : : . . : .: . ::: ..... .: CCDS12 -GMFRCICNGGYELDRGGGNCTDINECADPVNCINGVCINTPGSYLCSCPQDFELNPSGV 1430 1440 1450 1460 1470 1480 260 270 280 290 300 pF1KE2 SCLE-REDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNG---G--CDRTCKDTSTGV .:.. : . . :.. : .. . .. . .: . : : :. ..: CCDS12 GCVDTRAGNCFLETHDRGDSGISCSAEIGVGVTRASCCCSLGRAWGNPCELCPMANTTEY 1490 1500 1510 1520 1530 1540 310 320 330 340 350 360 pF1KE2 HCSCPVGFTLQLDGKTC--KDIDECQTRNGGCDHF-CKNIVGSFDCGCKKGFKLLTDEKS . :: : .: . : .:::::: : :. : : :::.: : :..: . CCDS12 RTLCPGGEGFQPNRITVILEDIDECQELPGLCQGGDCVNTFGSFQCECPPGYHLSEHTRI 1550 1560 1570 1580 1590 1600 370 380 390 400 410 pF1KE2 CQDVDECSLDR-TCDH-SCINHPGTFACACNRGYT-LYGFTHCGDTNE--CSIN-NGGCQ :.:.:::: : .: : :...:.: : . : ..: : . : . :: :: CCDS12 CEDIDECSTHSGICGPGTCYNTLGNYTCVCPAEYLQVNGGNNCMDMRKSVCFRHYNGTCQ 1610 1620 1630 1640 1650 1660 420 430 440 450 460 470 pF1KE2 QVCVNTVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLR-C . . .: : : . ::. : :: .:: .. ::... : :: CCDS12 NELAFNVTRKMCCCSYNIGQAWNRP-CEAC----PTPISPDYQILCGNQAPG---FLTDI 1670 1680 1690 1700 1710 480 490 500 510 520 530 pF1KE2 HSGIHLSSGLQGAYSVTCGSSSPLRNKQQKSNDSAFGDVTTIRTSVTFKLNEGKCSLKNA :.: :. : . : .: .... ..: .: .. : CCDS12 HTGKPLDIDECGEIPAIC------------ANGICINQIGSFRCECPAGFNYNSILLACE 1720 1730 1740 1750 1760 540 550 560 570 580 590 pF1KE2 ELFPEGLRPALPEKHS---SVKESFRYVNLTCSSGKQVPGAPGRPSTPKEMFITVEFELE .. : : . .... .. :.: :. : .. .:: . .. CCDS12 DVDECGSRESPCQQNADCINIPGSYR---CKCTRGYKL--SPGGACVGRN---------- 1770 1780 1790 1800 600 610 620 630 640 650 pF1KE2 TNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSER . .:. :. . . . . : .. .. : :..: . : CCDS12 -ECREIPNVCSHGDCMDTEGSYMCLCHRGFQASAD------QTLCMDIDECDRQP----- 1810 1820 1830 1840 1850 660 670 680 690 pF1KE2 QAESCGVGQGHAENQCG----LCQPG---EYSAD--GFAPC-----QLCALGTFQPEAGR :: .: .: : :: :: ...: : : :.: .: :: CCDS12 ----CG--NGTCKNIIGSYNCLCFPGFVVTHNGDCVDFDECTTLVGQVCRFGHCLNTAGS 1860 1870 1880 1890 1900 700 710 720 730 740 750 pF1KE2 TSCFPCGGGLATKHQGATSFQ--DCETRV-QCSPGHFYNTT-THRCIRCPVGTYQPEFGK :. : :. .: . . .: . . : :: : . ::: :: : .: . . CCDS12 FHCL-CQDGFELTADGKNCVDTNECLSLAGTCLPGTCQNLEGSFRCI-CPPG-FQVQ--S 1910 1920 1930 1940 1950 1960 760 770 780 790 800 pF1KE2 NNCVSCPGNTTTDFDG-STNITQCKNRRCGGELGDFT-----GYIESPNYPGNYPANTEC ..:. :.: : . . : : . :.: :.. : : CCDS12 DHCI--------DIDECSEEPNLCLFGTCTNSPGSFQCLCPPGFVLSDNGHRCFDTRQSF 1970 1980 1990 2000 2010 810 820 830 840 850 860 pF1KE2 TWTINPPPKRRILIVVPEIFLPIEDDCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSR CCDS12 CFTRFEAGKCSVPKAFNTTKTRCCCSKRPGEGWGDPCELCPQEGSAAFQELCPFGHGAVP 2020 2030 2040 2050 2060 2070 >-- initn: 512 init1: 272 opt: 508 Z-score: 355.7 bits: 78.8 E(32554): 1.7e-13 Smith-Waterman score: 640; 34.0% identity (53.1% similar) in 318 aa overlap (98-401:997-1278) 70 80 90 100 110 120 pF1KE2 SYKCSCKPGYQGEGRQCEDIDECGNELNGGCVHD-CLNIPGNYRCTCFDGFMLAHDGHNC :.: : : :...:.: :: : . .:: CCDS12 PRGLGFASRDFLSGRPFYKDVNECKVFPGLCTHGTCRNTVGSFHCACAGGFALDAQERNC 970 980 990 1000 1010 1020 130 140 150 160 170 180 pF1KE2 LDVDECLENNGGC-QHTCVNVMGSYECCC----KEGFFLSDNQHTCIHRSEEGLSCMNKD :.::: . : : ::::. ::.:: : . ::.: : :. .: : CCDS12 TDIDECRISPDLCGQGTCVNTPGSFECECFPGYESGFMLMKN---CMDVDE----CARDP 1030 1040 1050 1060 1070 190 200 210 220 230 pF1KE2 HGC-SHICKEAPRGSVACECRPGFELAKNQRDC--ILTCNHGNGGCQHS-CDDTADGPEC : . : .. :: :.: :: ::. . : : :. ..: : :. : .. . .: CCDS12 LLCRGGTCTNTD-GSYKCQCPPGHELTAKGTACEDIDECSLSDGLCPHGQCVNVIGAFQC 1080 1090 1100 1110 1120 1130 240 250 260 270 280 290 pF1KE2 SCHPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTC ::: .. : ..:.. .. : :.::::: : CCDS12 SCHAGFQSTPDRQGCVD----------------------------INECRVQNGGCDVHC 1140 1150 1160 1170 300 310 320 330 340 350 pF1KE2 KDTSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDH-FCKNIVGSFDCGCKKGFKLL .: . .::: :..:. ::..: :.:::. ::. : :. :. : : :: CCDS12 INTEGSYRCSCGQGYSLMPDGRACADVDECEENPRVCDQGHCTNMPGGHRCLCYDGFMAT 1180 1190 1200 1210 1220 1230 360 370 380 390 400 410 pF1KE2 TDEKSCQDVDECSLD-RTCDHS-CINHPGTFACACNRGYTLY-GFTHCGDTNECSINNGG : ..: :::::.:. . : :. : : :.:.: :. :: . : : : CCDS12 PDMRTCVDVDECDLNPHICLHGDCENTKGSFVCHCQLGYMVRKGATGCSDVDECEVGGHN 1240 1250 1260 1270 1280 1290 420 430 440 450 460 470 pF1KE2 CQQVCVNTVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLR CCDS12 CDSHASCLNIPGSFSCRCLPGWVGDGFECHDLDECVSQEHRCSPRGDCLNVPGSYRCTCR 1300 1310 1320 1330 1340 1350 >>CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 (937 aa) initn: 789 init1: 293 opt: 580 Z-score: 409.8 bits: 87.2 E(32554): 1.7e-16 Smith-Waterman score: 965; 32.9% identity (58.7% similar) in 414 aa overlap (49-442:242-646) 20 30 40 50 60 70 pF1KE2 LLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDC-HADALCQNTPTSYKCSCKPGY :. .: : .: : : :: : :: :: CCDS55 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCAH---FCINIPGSYVCRCKQGY 220 230 240 250 260 80 90 100 110 120 130 pF1KE2 QGEGRQ--CEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLAHDGHNCLDVDECLEN .. : :. : :. : . .: . :.:.::.. : :..:. ::.::. :. :: : . CCDS55 ILNSDQTTCRIQDLCAME-DHNCEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCASE 270 280 290 300 310 320 140 150 160 170 180 190 pF1KE2 NGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNKDHGCSHICKEAPRGS : ::.: :::. ::: : :.::: :. ...:: . . : ...:::.: : .. : CCDS55 NHGCEHECVNADGSYLCQCHEGFALNPDKKTCTKIDY----CASSNHGCQHECVNTD-DS 330 340 350 360 370 380 200 210 220 230 240 250 pF1KE2 VACECRPGFELAKNQRDC--ILTCNHGNGGCQHSCDDTADGPECSCHPQYKMHTDGRSCL .:.: :: : ... : : : .. ::.: : . .. : :: : . .:..: CCDS55 YSCHCLKGFTLNPDKKTCRRINYCALNKPGCEHECVNMEESYYCRCHRGYTLDPNGKTCS 390 400 410 420 430 440 260 270 280 290 300 pF1KE2 ER----------EDTVLEVTESNTTSVVDG---DKRVKRRLLMETCAVNNGGCDRTCKDT . :. :.. .: . . .: .. .: .. : ... ::. .: . CCDS55 RVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCSRVDYCLLSDHGCEYSCVNM 450 460 470 480 490 500 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK . . :.:: : .:. ::::: .: : . ::.: : . :: : : .:. : : : CCDS55 DRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSSEDSFVCQCFEGYILREDGK 510 520 530 540 550 560 370 380 390 400 410 pF1KE2 SCQDVDEC-SLDRTCDHSCINHPGTFACACNRGYTLY-GFTHCGDTNECSINNGGCQQVC .:. : : ..:. :.: :.: ...: : .:. : .: . :. .. ::...: CCDS55 TCRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGKRCRRKDVCKSTHHGCEHIC 570 580 590 600 610 620 420 430 440 450 460 470 pF1KE2 VNTVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGI ::. .:: :.: :. : . . : CCDS55 VNNGNSYICKCSEGFVLAEDGRRCKKCTEGPIDLVFVIDGSKSLGEENFEVVKQFVTGII 630 640 650 660 670 680 >>CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 (956 aa) initn: 789 init1: 293 opt: 580 Z-score: 409.7 bits: 87.2 E(32554): 1.7e-16 Smith-Waterman score: 965; 32.9% identity (58.7% similar) in 414 aa overlap (49-442:242-646) 20 30 40 50 60 70 pF1KE2 LLLLPPLLLLAGAVPPGRGRAAGPQEDVDECAQGLDDC-HADALCQNTPTSYKCSCKPGY :. .: : .: : : :: : :: :: CCDS55 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCAH---FCINIPGSYVCRCKQGY 220 230 240 250 260 80 90 100 110 120 130 pF1KE2 QGEGRQ--CEDIDECGNELNGGCVHDCLNIPGNYRCTCFDGFMLAHDGHNCLDVDECLEN .. : :. : :. : . .: . :.:.::.. : :..:. ::.::. :. :: : . CCDS55 ILNSDQTTCRIQDLCAME-DHNCEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCASE 270 280 290 300 310 320 140 150 160 170 180 190 pF1KE2 NGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMNKDHGCSHICKEAPRGS : ::.: :::. ::: : :.::: :. ...:: . . : ...:::.: : .. : CCDS55 NHGCEHECVNADGSYLCQCHEGFALNPDKKTCTKIDY----CASSNHGCQHECVNTD-DS 330 340 350 360 370 380 200 210 220 230 240 250 pF1KE2 VACECRPGFELAKNQRDC--ILTCNHGNGGCQHSCDDTADGPECSCHPQYKMHTDGRSCL .:.: :: : ... : : : .. ::.: : . .. : :: : . .:..: CCDS55 YSCHCLKGFTLNPDKKTCRRINYCALNKPGCEHECVNMEESYYCRCHRGYTLDPNGKTCS 390 400 410 420 430 440 260 270 280 290 300 pF1KE2 ER----------EDTVLEVTESNTTSVVDG---DKRVKRRLLMETCAVNNGGCDRTCKDT . :. :.. .: . . .: .. .: .. : ... ::. .: . CCDS55 RVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCSRVDYCLLSDHGCEYSCVNM 450 460 470 480 490 500 310 320 330 340 350 360 pF1KE2 STGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDEK . . :.:: : .:. ::::: .: : . ::.: : . :: : : .:. : : : CCDS55 DRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSSEDSFVCQCFEGYILREDGK 510 520 530 540 550 560 370 380 390 400 410 pF1KE2 SCQDVDEC-SLDRTCDHSCINHPGTFACACNRGYTLY-GFTHCGDTNECSINNGGCQQVC .:. : : ..:. :.: :.: ...: : .:. : .: . :. .. ::...: CCDS55 TCRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGKRCRRKDVCKSTHHGCEHIC 570 580 590 600 610 620 420 430 440 450 460 470 pF1KE2 VNTVGSYECQCHPGYKLHWNKKDCVEVKGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGI ::. .:: :.: :. : . . : CCDS55 VNNGNSYICKCSEGFVLAEDGRRCKKCTEGPIDLVFVIDGSKSLGEENFEVVKQFVTGII 630 640 650 660 670 680 971 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 20:38:35 2016 done: Mon Nov 7 20:38:36 2016 Total Scan time: 4.430 Total Display time: 0.470 Function used was FASTA [36.3.4 Apr, 2011]