FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1065, 988 aa 1>>>pF1KE1065 988 - 988 aa - 988 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.6196+/-0.00128; mu= 17.6602+/- 0.076 mean_var=253.9400+/-50.395, 0's: 0 Z-trim(109.0): 212 B-trim: 221 in 1/53 Lambda= 0.080484 statistics sampled from 10373 (10617) to 10373 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.674), E-opt: 0.2 (0.326), width: 16 Scan time: 3.950 The best scores are: opt bits E(32554) CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 ( 988) 7230 854.5 0 CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 999) 3736 448.8 2.5e-125 CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 ( 993) 3137 379.2 2.2e-104 CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 ( 971) 1931 239.2 3.1e-62 CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 807) 1402 177.7 8.6e-44 CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 ( 937) 1046 136.4 2.6e-31 CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 ( 956) 1046 136.4 2.6e-31 CCDS83309.1 MATN2 gene_id:4147|Hs108|chr8 ( 915) 974 128.0 8.4e-29 CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 817 110.2 3.4e-23 CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342) 759 103.3 3.4e-21 CCDS54344.1 LTBP1 gene_id:4052|Hs108|chr2 (1353) 759 103.3 3.4e-21 CCDS33178.2 LTBP1 gene_id:4052|Hs108|chr2 (1395) 759 103.4 3.5e-21 CCDS33177.2 LTBP1 gene_id:4052|Hs108|chr2 (1721) 759 103.5 3.9e-21 CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 748 102.6 1.2e-20 CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 743 102.0 1.9e-20 CCDS8103.1 LTBP3 gene_id:4054|Hs108|chr11 (1256) 728 99.7 4e-20 CCDS44647.1 LTBP3 gene_id:4054|Hs108|chr11 (1303) 728 99.7 4e-20 CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 728 100.2 6.1e-20 CCDS46762.1 FBLN2 gene_id:2199|Hs108|chr3 (1184) 613 86.3 4e-16 CCDS46761.1 FBLN2 gene_id:2199|Hs108|chr3 (1231) 613 86.3 4.1e-16 CCDS9898.1 FBLN5 gene_id:10516|Hs108|chr14 ( 448) 568 80.4 8.9e-15 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 564 80.8 2.4e-14 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 564 80.8 2.4e-14 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 564 80.8 2.5e-14 CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 531 77.5 5.3e-13 CCDS8002.1 VWCE gene_id:220001|Hs108|chr11 ( 955) 509 74.1 1.5e-12 CCDS1857.1 EFEMP1 gene_id:2202|Hs108|chr2 ( 493) 502 72.8 1.9e-12 CCDS8116.1 EFEMP2 gene_id:30008|Hs108|chr11 ( 443) 490 71.4 4.7e-12 CCDS43028.1 FBLN1 gene_id:2192|Hs108|chr22 ( 566) 491 71.6 5e-12 CCDS14068.1 FBLN1 gene_id:2192|Hs108|chr22 ( 601) 491 71.7 5.1e-12 CCDS14069.1 FBLN1 gene_id:2192|Hs108|chr22 ( 683) 491 71.8 5.5e-12 CCDS14067.1 FBLN1 gene_id:2192|Hs108|chr22 ( 703) 491 71.8 5.6e-12 CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 494 72.5 5.8e-12 CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 494 72.5 5.9e-12 CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 494 72.8 7.3e-12 CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 480 71.5 3e-11 CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 480 71.5 3e-11 CCDS13149.1 CD93 gene_id:22918|Hs108|chr20 ( 652) 457 67.8 8.3e-11 CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 460 68.5 9.1e-11 >>CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 (988 aa) initn: 7230 init1: 7230 opt: 7230 Z-score: 4556.1 bits: 854.5 E(32554): 0 Smith-Waterman score: 7230; 100.0% identity (100.0% similar) in 988 aa overlap (1-988:1-988) 10 20 30 40 50 60 pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 CKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 CQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRET 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 PKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 CIETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CIETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 VGSFECGCRKGYKLLTDERTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VGSFECGCRKGYKLLTDERTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 GDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 CSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 TTPIKQKARFKIRDAKCHLRPHSQARAKETARQPLLDHCHVTFVTLKCDSSKKRRRGRKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TTPIKQKARFKIRDAKCHLRPHSQARAKETARQPLLDHCHVTFVTLKCDSSKKRRRGRKS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE1 PSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 TEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE1 LSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE1 GGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNT 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE1 STDFDGSTNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 STDFDGSTNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE1 PEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSG 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE1 KGFQVPYVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KGFQVPYVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYT 910 920 930 940 950 960 970 980 pF1KE1 AQESKEMFPRSFIKLLRSKVSRFLRPYK :::::::::::::::::::::::::::: CCDS14 AQESKEMFPRSFIKLLRSKVSRFLRPYK 970 980 >>CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 (999 aa) initn: 2673 init1: 2673 opt: 3736 Z-score: 2363.4 bits: 448.8 E(32554): 2.5e-125 Smith-Waterman score: 4733; 64.3% identity (80.5% similar) in 1012 aa overlap (19-988:36-999) 10 20 30 40 pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA ::: :: : :::::..: :::: :: CCDS81 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML .::::: :::: :::::.:::.:::::::: :. ::::::.:.:::::::::::::::: CCDS81 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN ::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..::: CCDS81 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC :::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.: CCDS81 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC 180 190 200 210 220 230 230 240 250 pF1KE1 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD : .: .:.:::.:.: ::::::::::::::: CCDS81 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE1 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE :.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.:::::: CCDS81 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE1 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV ..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: :: CCDS81 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE1 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT :: ::::: : :: .:::: :::::. : : ...:::..: :.:.:: ..::: : : CCDS81 NTVGSYECQCHPGYKLHWNKKDCVEV-KGLLPTSVSPRVSLHCGKSGGGDGCFLRC--H- 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE1 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH ::. : :: .: :. .. ::. ..:: CCDS81 -------------------------------SGIHLS-SD--VTTIRTSVTFKLNEGKCS 480 490 500 500 510 520 530 540 550 pF1KE1 LRPHSQARAKETARQPLLDHCHVT------FVTLKCDSSKKR--RRGRKSPSKEVSHITA :. .:. . .: : . : . .:.: :.:.:. :: : ::. ::. CCDS81 LK---NAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEM-FITV 510 520 530 540 550 560 570 580 590 600 610 pF1KE1 EFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPA :::.::...:.. .:. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..: CCDS81 EFELETNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPP 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 KALEGQG-ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCP-- .. : :. .::.:: ...::.: ::.. : .:. : ::.:. :::..: ::: CCDS81 RTSERQAESCGVGQGHAENQCVSCRAGTYYDGARERCILCPNGTFQNEEGQMTCEPCPRP 620 630 640 650 660 670 670 680 690 700 710 720 pF1KE1 -SSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLT .: .: : : :.::::: :.:: .::::: ::: : .::.::: :::.:::::::: : CCDS81 GNSGALKTPEAWNMSECGGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLAT 680 690 700 710 720 730 730 740 750 760 770 780 pF1KE1 KHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDG ::.:.:::::::..:.::::: :::::::::::::::::::::.:.:..:::::.::::: CCDS81 KHQGATSFQDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDG 740 750 760 770 780 790 790 800 810 820 830 840 pF1KE1 STNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLP :::.:.:::..:::::::.:::::::::::.::::.::.: : ::::::::::::::::: CCDS81 STNITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLP 800 810 820 830 840 850 850 860 870 880 890 900 pF1KE1 IEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVP :::.::: :::::..: .:.:::::::::::::::::::.:::::::::::::..::::: CCDS81 IEDDCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVP 860 870 880 890 900 910 910 920 930 940 950 960 pF1KE1 YVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKE :::::::::.::::::::::::::::::::::::::::::::::::::::::::::::.: CCDS81 YVTYDEDYQELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESRE 920 930 940 950 960 970 970 980 pF1KE1 MFPRSFIKLLRSKVSRFLRPYK :::::::.:::::::::::::: CCDS81 MFPRSFIRLLRSKVSRFLRPYK 980 990 >>CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 (993 aa) initn: 4135 init1: 2251 opt: 3137 Z-score: 1987.5 bits: 379.2 E(32554): 2.2e-104 Smith-Waterman score: 4963; 66.0% identity (85.6% similar) in 1002 aa overlap (1-988:1-993) 10 20 30 40 50 60 pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCL ::.. : :: ::.: ...: : : .. ::::: ::::.:::::::::::.::::. CCDS48 MGSGRVP-GLC-LLVLLVHARAAQYS--KAAQDVDECVEGTDNCHIDAICQNTPRSYKCI 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 CKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDE :: :: :.::.:.:.:::: . :.::::.:.::::::::::.::: ::::::::::::: CCDS48 CKSGYTGDGKHCKDVDECERED-NAGCVHDCVNIPGNYRCTCYDGFHLAHDGHNCLDVDE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 CQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRET : ..:::::: ::: ::::::.:. ::::::::::::.: .::::::::.:::::::::: CCDS48 CAEGNGGCQQSCVNMMGSYECHCREGFFLSDNQHTCIQRPEEGMNCMNKNHGCAHICRET 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 PKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT ::::.::.:::::.:..::.:: ::::::::::::.:.::. :: :::: :..::.::.: CCDS48 PKGGIACECRPGFELTKNQRDCKLTCNYGNGGCQHTCDDTEQGPRCGCHIKFVLHTDGKT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 CIETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT ::::::::::::: :.:.::::.:.::::: :::: ::::::.:: .:::::::.:::: CCDS48 CIETCAVNNGGCDSKCHDAATGVHCTCPVGFMLQPDRKTCKDIDECRLNNGGCDHICRNT 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 VGSFECGCRKGYKLLTDERTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHC ::::::.:.:::::: .::.:::::::::.:::::::.:.::::::::::::.::: ::: CCDS48 VGSFECSCKKGYKLLINERNCQDIDECSFDRTCDHICVNTPGSFQCLCHRGYLLYGITHC 300 310 320 330 340 350 370 380 390 400 410 pF1KE1 GDVDECSMSNGSCDQGCVNTKGSYECVCPPGR-RLHWNGKDCVETGKCLSRAKTSPRAQL :::::::.. :.: ::.:: :::.:.:: :. :::::::::.: :: . .: .:.: CCDS48 GDVDECSINRGGCRFGCINTPGSYQCTCPAGQGRLHWNGKDCTEPLKCQGSPGAS-KAML 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 SCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGK-ALQKRNGTSSGLGPSCSD ::...: ..: :.::... :.:.:::....:::.:.:.. : .::.:.. . : . CCDS48 SCNRSGKKDTCALTCPSRARFLPESENGFTVSCGTPSPRAAPARAGHNGNSTN-SNHCHE 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE1 APTTPIKQKARFKIRDAKCHLRPHSQARAKETAR------QPLLDHCHVTFVTLKCDSSK : . :::.: :::.::::.:. .......:..: : ..:.:::. ::::::. CCDS48 AAVLSIKQRASFKIKDAKCRLHLRNKGKTEEAGRITGPGGAPC-SECQVTFIHLKCDSSR 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE1 KR--RRGRKSPSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIG : ::.: :.:::...: :.: :.. ::.. .: :::.: :. :....: :::::. CCDS48 KGKGRRARTPPGKEVTRLTLELEAEVRAEETTASCGLPCLRQRMERRLKGSLKMLRKSIN 540 550 560 570 580 590 600 610 620 630 640 pF1KE1 RQQFYVQVSGTEYEVAQRPA----KALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQC ...: ....: .::.:..:. . : . .: :: .:::.: ::.. :. :: CCDS48 QDRFLLRLAGLDYELAHKPGLVAGERAEPMESCRPGQHRAGTKCVSCPQGTYYHGQTEQC 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE1 VSCMPGTYQDMEGQLSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVG : : ::.:. :::::: ::.::. : :: ::. :.::: :: :.::::::: :: : CCDS48 VPCPAGTFQEREGQLSCDLCPGSDAHGPLGATNVTTCAGQCPPGQHSVDGFKPCQPCPRG 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE1 TYQPEPGRTGCFPCGGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQP ::::: ::: :::::::: :::::. :::::..::.:::::.:::. :::::: .:.::: CCDS48 TYQPEAGRTLCFPCGGGLTTKHEGAISFQDCDTKVQCSPGHYYNTSIHRCIRCAMGSYQP 720 730 740 750 760 770 770 780 790 800 810 820 pF1KE1 EFGQNHCITCPGNTSTDFDGSTNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVW .: :: : :::::::::::::.:..:::..::::::..:::::::::::.:::..::.: CCDS48 DFRQNFCSRCPGNTSTDFDGSTSVAQCKNRQCGGELGEFTGYIESPNYPGNYPAGVECIW 780 790 800 810 820 830 830 840 850 860 870 880 pF1KE1 HIAPPPKRRILIVVPEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSR .: :::::.::::::::::: ::::::::::::..::.::::::::::::::::::.::: CCDS48 NINPPPKRKILIVVPEIFLPSEDECGDVLVMRKNSSPSSITTYETCQTYERPIAFTARSR 840 850 860 870 880 890 890 900 910 920 930 940 pF1KE1 KLWIQFKSNEGNSGKGFQVPYVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKAL ::::.::..:.::..:::.:::::::::.::.:::::::::::::::::::::::::::. CCDS48 KLWINFKTSEANSARGFQIPYVTYDEDYEQLVEDIVRDGRLYASENHQEILKDKKLIKAF 900 910 920 930 940 950 950 960 970 980 pF1KE1 FDVLAHPQNYFKYTAQESKEMFPRSFIKLLRSKVSRFLRPYK :.:::::::::::: .. :::.:.::::::::::: :::::: CCDS48 FEVLAHPQNYFKYT-EKHKEMLPKSFIKLLRSKVSSFLRPYK 960 970 980 990 >>CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 (971 aa) initn: 3212 init1: 1909 opt: 1931 Z-score: 1230.8 bits: 239.2 E(32554): 3.1e-62 Smith-Waterman score: 4520; 62.3% identity (78.2% similar) in 1009 aa overlap (19-988:36-971) 10 20 30 40 pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA ::: :: : :::::..: :::: :: CCDS77 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML .::::: :::: :::::.:::.:::::::: :. ::::::.:.:::::::::::::::: CCDS77 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN ::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..::: CCDS77 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC :::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.: CCDS77 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC 180 190 200 210 220 230 230 240 250 pF1KE1 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD : .: .:.:::.:.: ::::::::::::::: CCDS77 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE1 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE :.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.:::::: CCDS77 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE1 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV ..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: :: CCDS77 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE1 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT :: ::::: : :: .:::: :::::. : : ...:::..: :.:.:: ..::: : . CCDS77 NTVGSYECQCHPGYKLHWNKKDCVEV-KGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGI 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE1 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH . ...: ..:: .: . :: : .. : .: :. .. ::. ..:: CCDS77 HLSSGLQGAYSVTCGSSSPLRNKQQKSNDSAFG--------DVTTIRTSVTFKLNEGKCS 480 490 500 510 520 530 500 510 520 530 540 550 pF1KE1 LRPHSQARAKETARQPLLDHCHVT------FVTLKCDSSKKR--RRGRKSPSKEVSHITA :. .:. . .: : . : . .:.: :.:.:. :: : ::. ::. CCDS77 LK---NAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEM-FITV 540 550 560 570 580 560 570 580 590 600 610 pF1KE1 EFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPA :::.::...:.. .:. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..: CCDS77 EFELETNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPP 590 600 610 620 630 640 620 630 640 650 660 pF1KE1 KALEGQG-ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCPSS .. : :. .::.:: : .:: CCDS77 RTSERQAESCGVGQ----------------GHAENQC----------------------- 650 660 670 680 690 700 710 720 pF1KE1 DGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHE : :.:: .::::: ::: : .::.::: :::.:::::::: :::. CCDS77 ---------------GLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQ 670 680 690 700 710 730 740 750 760 770 780 pF1KE1 GTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTN :.:::::::..:.::::: :::::::::::::::::::::.:.:..:::::.:::::::: CCDS77 GATSFQDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTN 720 730 740 750 760 770 790 800 810 820 830 840 pF1KE1 VTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIED .:.:::..:::::::.:::::::::::.::::.::.: : :::::::::::::::::::: CCDS77 ITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIED 780 790 800 810 820 830 850 860 870 880 890 900 pF1KE1 ECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVPYVT .::: :::::..: .:.:::::::::::::::::::.:::::::::::::..:::::::: CCDS77 DCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVT 840 850 860 870 880 890 910 920 930 940 950 960 pF1KE1 YDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKEMFP ::::::.::::::::::::::::::::::::::::::::::::::::::::::::.:::: CCDS77 YDEDYQELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFP 900 910 920 930 940 950 970 980 pF1KE1 RSFIKLLRSKVSRFLRPYK ::::.:::::::::::::: CCDS77 RSFIRLLRSKVSRFLRPYK 960 970 >>CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 (807 aa) initn: 2830 init1: 1059 opt: 1402 Z-score: 899.6 bits: 177.7 E(32554): 8.6e-44 Smith-Waterman score: 3713; 54.4% identity (66.1% similar) in 1004 aa overlap (19-988:36-807) 10 20 30 40 pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA ::: :: : :::::..: :::: :: CCDS53 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML .::::: :::: :::::.:::.:::::::: :. ::::::.:.:::::::::::::::: CCDS53 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN ::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..::: CCDS53 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC :::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.: CCDS53 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC 180 190 200 210 220 230 230 240 250 pF1KE1 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD : .: .:.:::.:.: ::::::::::::::: CCDS53 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE1 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE :.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.:::::: CCDS53 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE1 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV ..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: :: CCDS53 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE1 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT :: ::::: : :: .:::: :::: . CCDS53 NTVGSYECQCHPGYKLHWNKKDCVAS---------------------------------- 420 430 440 440 450 460 470 480 490 pF1KE1 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH CCDS53 ------------------------------------------------------------ 500 510 520 530 540 550 pF1KE1 LRPHSQARAKETARQPLLDHCHVTFVTLKCDSSKKRRRGRKSPSKEVSHITAEFEIETKM CCDS53 ------------------------------------------------------------ 560 570 580 590 600 610 pF1KE1 EEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPAKALEGQG- :. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..: .. : :. CCDS53 ------CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAE 450 460 470 480 490 620 630 640 650 660 670 pF1KE1 ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCP---SSDGLGL .::.:: ...::.: ::.. : .:. : ::.:. :::..: ::: .: .: CCDS53 SCGVGQGHAENQCVSCRAGTYYDGARERCILCPNGTFQNEEGQMTCEPCPRPGNSGALKT 500 510 520 530 540 550 680 690 700 710 720 730 pF1KE1 PGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHEGTTSF : : :.::::: :.:: .::::: ::: : .::.::: :::.:::::::: :::.:.::: CCDS53 PEAWNMSECGGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSF 560 570 580 590 600 610 740 750 760 770 780 790 pF1KE1 QDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTNVTHCK ::::..:.::::: :::::::::::::::::::::.:.:..:::::.::::::::.:.:: CCDS53 QDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCK 620 630 640 650 660 670 800 810 820 830 840 850 pF1KE1 NQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIEDECGDV . CCDS53 T----------------------------------------------------------- 680 860 870 880 890 900 910 pF1KE1 LVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVPYVTYDEDY : .:.:::::::::::::::::::.:::::::::::::..::::::::::::: CCDS53 -------SSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDY 690 700 710 720 730 920 930 940 950 960 970 pF1KE1 QQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKEMFPRSFIK :.::::::::::::::::::::::::::::::::::::::::::::::::.::::::::. CCDS53 QELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIR 740 750 760 770 780 790 980 pF1KE1 LLRSKVSRFLRPYK :::::::::::::: CCDS53 LLRSKVSRFLRPYK 800 >>CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 (937 aa) initn: 872 init1: 363 opt: 1046 Z-score: 675.6 bits: 136.4 E(32554): 2.6e-31 Smith-Waterman score: 1046; 36.2% identity (58.5% similar) in 417 aa overlap (37-443:242-642) 10 20 30 40 50 60 pF1KE1 RWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDC-HIDAICQNTPKSYKCLCKPGY :: .: : .: : : :: : :: :: CCDS55 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCAH---FCINIPGSYVCRCKQGY 220 230 240 250 260 70 80 90 100 110 120 pF1KE1 KGEGKQ--CEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQD .. : :. : : . .: : . :.:.::.. : :..:. ::.::. :. :: : . CCDS55 ILNSDQTTCRIQDLCAMEDHN--CEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCAS 270 280 290 300 310 320 130 140 150 160 170 180 pF1KE1 NNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPKG .: ::.. :::: ::: :::: :: :. ...:: . . : ...::: : : .: . CCDS55 ENHGCEHECVNADGSYLCQCHEGFALNPDKKTCTKIDY----CASSNHGCQHECVNTDDS 330 340 350 360 370 380 190 200 210 220 230 240 pF1KE1 GVACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRTC .: : :: : ..: : : .. ::.: : . . . : ::. :.: .:.:: CCDS55 -YSCHCLKGFTLNPDKKTCRRINYCALNKPGCEHECVNMEESYYCRCHRGYTLDPNGKTC 390 400 410 420 430 440 250 260 270 280 290 pF1KE1 --IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRN .. :: .. ::.. : .: . :.: :: .. : :::. .. ::... ::.. : : CCDS55 SRVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCSRVDYCLLSDHGCEYSCVN 450 460 470 480 490 500 300 310 320 330 340 350 pF1KE1 TVGSFECGCRKGYKLLTDERTCQDIDECSF-ERTCDHICINSPGSFQCLCHRGYILY--G :: : : .:. : .: .:: .: :.. .. :.: :..: :: : : .:::: : CCDS55 MDRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSSEDSFVCQCFEGYILREDG 510 520 530 540 550 560 360 370 380 390 400 410 pF1KE1 TTHCGDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPR : : : :. . .:.. :::. :: : : : :: .:: : . : : : CCDS55 KT-CRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGKRCRRKDVCKS---THHG 570 580 590 600 610 420 430 440 450 460 470 pF1KE1 AQLSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSC . : . :. : .: ... : CCDS55 CEHICVNNGNSYIC--KCSEGFVLAEDGRRCKKCTEGPIDLVFVIDGSKSLGEENFEVVK 620 630 640 650 660 670 >>CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 (956 aa) initn: 872 init1: 363 opt: 1046 Z-score: 675.5 bits: 136.4 E(32554): 2.6e-31 Smith-Waterman score: 1048; 30.0% identity (53.8% similar) in 666 aa overlap (37-664:242-876) 10 20 30 40 50 60 pF1KE1 RWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDC-HIDAICQNTPKSYKCLCKPGY :: .: :. : : : :: : :: :: CCDS55 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCAHF---CINIPGSYVCRCKQGY 220 230 240 250 260 70 80 90 100 110 120 pF1KE1 KGEGKQ--CEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQD .. : :. : : . .: : . :.:.::.. : :..:. ::.::. :. :: : . CCDS55 ILNSDQTTCRIQDLCAMEDHN--CEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCAS 270 280 290 300 310 320 130 140 150 160 170 180 pF1KE1 NNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPKG .: ::.. :::: ::: :::: :: :. ...:: . . : ...::: : : .: . CCDS55 ENHGCEHECVNADGSYLCQCHEGFALNPDKKTCTKIDY----CASSNHGCQHECVNTDDS 330 340 350 360 370 380 190 200 210 220 230 240 pF1KE1 GVACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRTC .: : :: : ..: : : .. ::.: : . . . : ::. :.: .:.:: CCDS55 -YSCHCLKGFTLNPDKKTCRRINYCALNKPGCEHECVNMEESYYCRCHRGYTLDPNGKTC 390 400 410 420 430 440 250 260 270 280 290 pF1KE1 --IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRN .. :: .. ::.. : .: . :.: :: .. : :::. .. ::... ::.. : : CCDS55 SRVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCSRVDYCLLSDHGCEYSCVN 450 460 470 480 490 500 300 310 320 330 340 350 pF1KE1 TVGSFECGCRKGYKLLTDERTCQDIDECSF-ERTCDHICINSPGSFQCLCHRGYILY--G :: : : .:. : .: .:: .: :.. .. :.: :..: :: : : .:::: : CCDS55 MDRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSSEDSFVCQCFEGYILREDG 510 520 530 540 550 560 360 370 380 390 400 410 pF1KE1 TTHCGDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPR : : : :. . .:.. :::. :: : : : :: .:: : . : : : CCDS55 KT-CRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGKRCRRKDVCKS---THHG 570 580 590 600 610 420 430 440 450 460 pF1KE1 AQLSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGP-------QG-KALQKRN-- . : . :. : .: ... :.. .: . :: .: :.: ..: CCDS55 CEHICVNNGNSYIC--KCSEGFVLAEDGRRCK--KC-TEGPIDLVFVIDGSKSLGEENFE 620 630 640 650 660 670 470 480 490 500 510 520 pF1KE1 ---GTSSGLGPSCSDAPTTPIKQKARFKIR-DAKCHLRPHSQAR--AKETARQPLLDHCH .:. : . .: . ... . .. :: ..:. : .:.. . . CCDS55 VVKQFVTGIIDSLTISPKAARVGLLQYSTQVHTEFTLRNFNSAKDMKKAVAHMKYMGKGS 680 690 700 710 720 730 530 540 550 560 pF1KE1 VTFVTLK--CDSSKKRRRGRKSPSKEVSHITAEF----------EIETKMEEASDTCEAD .: ..:: . : . .: . : .: . . : : .: . . : : CCDS55 MTGLALKHMFERSFTQGEGARPLSTRVPRAAIVFTDGRAQDDVSEWASKAKANGITMYAV 740 750 760 770 780 790 570 580 590 600 610 620 pF1KE1 CLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPAKALEGQGACGAGQVLQDS . : :. :: . . ... ::.. .: :.... : : : : :.:: CCDS55 GVGKAIEEELQ---EIASEPTNKHLFYAEDFSTMDEISEKLKK-----GICEA---LEDS 800 810 820 830 840 630 640 650 660 670 680 pF1KE1 KCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCPSSDGLGLPGARNVSECGGQCS .:. .. . : . : : ... :::. CCDS55 DGRQDSPAGELPKTVQQPTESEPVTI-NIQDLLSCSNFAVQHRYLFEEDNLLRSTQKLSH 850 860 870 880 890 900 690 700 710 720 730 740 pF1KE1 PGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHEGTTSFQDCEAKVHCSPGHH CCDS55 STKPSGSPLEEKHDQCKCENLIMFQNLANEEVRKLTQRLEEMTQRMEALENRLRYR 910 920 930 940 950 >>CCDS83309.1 MATN2 gene_id:4147|Hs108|chr8 (915 aa) initn: 1119 init1: 376 opt: 974 Z-score: 630.5 bits: 128.0 E(32554): 8.4e-29 Smith-Waterman score: 974; 35.9% identity (59.4% similar) in 379 aa overlap (37-407:242-608) 10 20 30 40 50 60 pF1KE1 RWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCLCKPGYK :: .: .: : : :: : :: :: CCDS83 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCA--HFCINIPGSYVCRCKQGYI 220 230 240 250 260 70 80 90 100 110 120 pF1KE1 GEGKQ--CEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQDN .. : :. : : . .: : . :.:.::.. : :..:. ::.::. :. :: : .. CCDS83 LNSDQTTCRIQDLCAMEDHN--CEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCASE 270 280 290 300 310 320 130 140 150 160 170 180 pF1KE1 NGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPKGG : ::.. :::: ::: :::: :: :. ...:: : : : . :: : : . .. CCDS83 NHGCEHECVNADGSYLCQCHEGFALNPDKKTCT-RINY---CALNKPGCEHECVNMEES- 330 340 350 360 370 380 190 200 210 220 230 240 pF1KE1 VACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRTC- : :. :. : : : :. . : . ::.. : .:. . .: : . . .. : .:: CCDS83 YYCRCHRGYTLDPNGKTCSRVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCS 390 400 410 420 430 440 250 260 270 280 290 300 pF1KE1 -IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT .. : ... ::. .: . . :.:: : .:. ::::: .. : ... ::.: : .. CCDS83 RVDYCLLSDHGCEYSCVNMDRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSS 450 460 470 480 490 500 310 320 330 340 350 pF1KE1 VGSFECGCRKGYKLLTDERTCQDIDEC-SFERTCDHICINSPGSFQCLCHRGYILY-GTT :: : : .:: : : .::. : : .... :.:::.:: :. : : .:. : CCDS83 EDSFVCQCFEGYILREDGKTCRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGK 510 520 530 540 550 560 360 370 380 390 400 410 pF1KE1 HCGDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQ .: : :. .. .:.. :::. .:: : : : : .:. : :: CCDS83 RCRRKDVCKSTHHGCEHICVNNGNSYICKCSEGFVLAEDGRRC---KKCTEGPIDLVFVI 570 580 590 600 610 420 430 440 450 460 470 pF1KE1 LSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSD CCDS83 DGSKSLGEENFEVVKQFVTGIIDSLTISPKAARVGLLQYSTQVHTEFTLRNFNSAKDMKK 620 630 640 650 660 670 >>CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541 aa) initn: 978 init1: 275 opt: 817 Z-score: 529.9 bits: 110.2 E(32554): 3.4e-23 Smith-Waterman score: 1061; 27.7% identity (48.6% similar) in 869 aa overlap (36-812:127-935) 10 20 30 40 50 60 pF1KE1 VRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYK-CLCKPG ::: . : . : .: : . : : :: CCDS41 RQVYTTEARTVLRCCRGWMQQPDEEGCLSAECSASL--CFHGGRC--VPGSAQPCHCPPG 100 110 120 130 140 150 70 80 90 100 110 120 pF1KE1 YKGEGKQCE-DIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQD ..: .:. :.:::.. .:::: :.:.: ::.: : : :: : :...:: .. : CCDS41 FQGP--RCQYDVDECRT--HNGGCQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCAL 160 170 180 190 200 130 140 150 160 170 180 pF1KE1 NNGGCQQICVN-AMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPK .:::::. ::. .. ..:::. :: :... . :..:: : :.. .: : : .. . CCDS41 GNGGCQHHCVQLTITRHRCQCRPGFQLQEDGRHCVRRSP----CANRNGSCMHRC-QVVR 210 220 230 240 250 260 190 200 210 220 230 240 pF1KE1 GGVACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT : . :.:. :..:: . : : . : : . : :.: .:. . : :: : : .::: CCDS41 GLARCECHVGYQLAADGKACEDVDECAAGLAQCAHGCLNTQGSFKCVCHAGYELGADGRQ 270 280 290 300 310 320 250 260 270 280 290 pF1KE1 C-------IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGC : ...: .:::::.. :. :..: :.:: :. :. : .:: :...: ... : CCDS41 CYRIEMEIVNSCEANNGGCSHGCSHTSAGPLCTCPRGYELDTDQRTCIDVDDC-ADSPCC 330 340 350 360 370 380 300 310 320 330 340 350 pF1KE1 DHFCRNTVGSFECGCRKGYKLLTDERTCQDIDECSFERT-CDHICINSPGSFQCLCHRGY .. : :. :..:::: ::.: .: :.:.:::. : :.: : : ::::: :. :: CCDS41 QQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEHHCTNLAGSFQCSCEAGY 390 400 410 420 430 440 360 pF1KE1 ILYGTTH-CG-------DVD---------------------------------------- :. . :. :.: CCDS41 RLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQDDDVGADEEEAELRGE 450 460 470 480 490 500 370 380 390 400 pF1KE1 ----------------ECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCL .::.. .: .: . : : :: : :.: : :: CCDS41 HTLTEKFVCLDDSFGHDCSLTCDDCRNGGTCLLGLDGCDCPEG----WTGLICNETCPPD 510 520 530 540 550 410 420 430 440 450 460 pF1KE1 SRAKTSPRAQLSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVP-GPQGKALQKR-N . .:. . ::...: .: .: : . .. : : : :: .:. : CCDS41 TFGKNCSFS-CSCQNGGTCDSVTGACRC-----PPGVSGTNCEDGCPKGYYGKHCRKKCN 560 570 580 590 600 610 470 480 490 500 510 520 pF1KE1 GTSSGLGPSCSDAPTTPIKQKARFKIRDAKCHLRPHSQARAKETAR-----QPLLDHCHV .. : : .:: ::: : . .. :: . : CCDS41 CANRGRCHRLYGACLCDPGLYGRF------CHLTCPPWAFGPGCSEECQCVQPHTQSCDK 620 630 640 650 660 530 540 550 560 570 pF1KE1 TFVTLKCDSSKKRRRGRKSPSK-EVSHI-TAEFEIET-KMEEASDTCEADCLRKRAEQSL . .: : ::.. .. :.... . .. : . : :. ..: :: .. CCDS41 RDGSCSC---KAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVSGEC-GKRCPAGF 670 680 690 700 710 720 580 590 600 610 620 630 pF1KE1 QAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTH :. . .: : :. :.. . : ... :: : :.. .: : : : . CCDS41 QGEDCGQECPVG--TFGVNCSSSC-SCGGAPCHGVTGQCRCPPGRTGED--CEADCPEGR 730 740 750 760 770 640 650 660 670 680 690 pF1KE1 FG-GELGQCVSCMPGTYQDME-GQLSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADG .: : : .:. .. : : : : : :. :.: : : :... . CCDS41 WGLGCQEICPACQHAARCDPETGACLCLP-------GFVGSR----CQDVCPAGWYGPSC 780 790 800 810 820 700 710 720 730 740 750 pF1KE1 FKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHEGTTSFQ--DCEAKVHCSPGHHY-NTTT :. : .: :. .: : :. .. :. :: .:: :: .. . CCDS41 QTRCSCANDGHCHPATGHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAIS 830 840 850 860 870 880 760 770 780 790 800 810 pF1KE1 HRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTNVTHCKNQHCGGELGDYTGYIESPN :. : .: :. :. :: . : : .:. :: :. .: : CCDS41 GLCL-CEAGYVGPRCEQQ----CP---QGHF-GPGCEQRCQCQH-GAACDHVSGACTCPA 890 900 910 920 930 820 830 840 850 860 870 pF1KE1 YPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIEDECGDVLVMRKSASPTSITTYETCQ CCDS41 GWRGTFCEHACPAGFFGLDCRSACNCTAGAACDAVNGSCLCPAGRRGPRCAETCPAHTYG 940 950 960 970 980 990 >>CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342 aa) initn: 438 init1: 258 opt: 759 Z-score: 494.0 bits: 103.3 E(32554): 3.4e-21 Smith-Waterman score: 911; 28.7% identity (50.4% similar) in 867 aa overlap (10-814:560-1325) 10 20 30 pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSE ::. : : .:. : . .::::: . CCDS54 QQRKCVDIDECTQVQHLCSQGRCENTEGSFLCICPA----GFMASEEGT-NCIDVDECLR 530 540 550 560 570 580 40 50 60 70 80 90 pF1KE1 GTDDCHIDAICQNTPKSYKC-LCKPGYKGEGK-QCEDIDECENDYYNGGCVHE-CINIPG : : .. : :: ...: : ::. . .::::::: : . : : :.: :: CCDS54 -PDVCG-EGHCVNTVGAFRCEYCDSGYRMTQRGRCEDIDECLNP---STCPDEQCVNSPG 590 600 610 620 630 100 110 120 130 140 150 pF1KE1 NYRCT-CFDGFMLAHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHT .:.:. : .:: . .:. ::::::: . : . : : ::: :.::.:. . ... CCDS54 SYQCVPCTEGFR-GWNGQ-CLDVDECLEPNVCANGDCSNLEGSYMCSCHKGYTRTPDHKH 640 650 660 670 680 690 160 170 180 190 200 210 pF1KE1 C--IHRSNEGMNCMNKDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLT--CNYGNG : : . ..: :.: . :..: .:. : : :..:. . .: :.. . CCDS54 CRDIDECQQGNLCVNGQ------CKNT-EGSFRCTCGQGYQLSAAKDQCEDIDECQHRHL 700 710 720 730 740 750 220 230 240 250 260 pF1KE1 GCQHS-CEDTDTGPTCGCHQKYALHSDGRTC--IETCAVNNGGCDR-TCKDTATGVRCSC : :. :..:. . : : : : . : : :. : ... :.: : .:: . :.: CCDS54 -CAHGQCRNTEGSFQCVCDQGYRASGLGDHCEDINECLEDKSVCQRGDCINTAGSYDCTC 760 770 780 790 800 270 280 290 300 310 320 pF1KE1 PVGFTLQPDGKTCKDINECLVNNGGC--DHFCRNTVGSFECGCRKGYKLLTDERTCQDID : :: :. :.:::.::::: . : : . : :: :::.: :..:... .: :::.::: CCDS54 PDGFQLD-DNKTCQDINECE-HPGLCGPQGECLNTEGSFHCVCQQGFSISADGRTCEDID 810 820 830 840 850 860 330 340 350 360 370 380 pF1KE1 ECSFERTCD-H-ICINSPGSFQCLCHRGYILYGTTH-CGDVDECSMSNGSCDQG-CVNTK :: . .:: : .: :. :::.:::..:. . : ::.:: . .: : .. : :.. CCDS54 ECVNNTVCDSHGFCDNTAGSFRCLCYQGFQAPQDGQGCVDVNECELLSGVCGEAFCENVE 870 880 890 900 910 920 390 400 410 420 430 pF1KE1 GSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHTL-- ::. ::: : . ::.: ::..:. .... : : :. . .: CCDS54 GSFLCVCADE-----NQEYSPMTGQCRSRTSTDLDVDVDQPKEEKKE-CYYNLNDASLCD 930 940 950 960 970 980 440 450 460 470 pF1KE1 --FVPD--------------SENSYVLSCGVPG--------PQGKALQKRNGTSS-GLGP ..:. ..: .. : : : :.::.. . .:: . : CCDS54 NVLAPNVTKQECCCTSGVGWGDNCEIFPCPVLGTAEFTEMCPKGKGFVPAGESSSEAGGE 990 1000 1010 1020 1030 1040 480 490 500 510 520 530 pF1KE1 SCSDAPTTPIKQKARFKIRDAKC-HLRPHSQARAKE-TARQPLLDHCHVTFVTLKCDSSK . .:: . . : .. : . :: . :. : .:. .: : .:.. . CCDS54 NYKDADECLLFGQEICK--NGFCLNTRPGYECYCKQGTYYDPVKLQC---FDMDECQDPS 1050 1060 1070 1080 1090 540 550 560 570 580 590 pF1KE1 KRRRGRKSPSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQ . : . . . .. . :. : :.: ::.. : . ... . CCDS54 SCIDG------QCVNTEGSYNCFCTHPMVLDASEKRCIRP-AESNEQIEETDVYQDLCWE 1100 1110 1120 1130 1140 600 610 620 630 640 650 pF1KE1 QFYVQVSGTEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPG .. . :: : .:: : :. :. : : : .: ::. : : CCDS54 HL-----SDEY-VCSRP---LVGK------QTTYTECC--CLYGEAWG---MQCALC-PL 1150 1160 1170 1180 660 670 680 690 700 pF1KE1 TYQDMEGQLSCTPCPSSDGLGLPGARN-VSECGGQCSP---GFFSAD----GFKPCQACP .: .:: : : : .:. . . . : .: .: : .:. :: CCDS54 KDSDDYAQLCNIPVT---GRRQPYGRDALVDFSEQYTPEADPYFIQDRFLNSFEELQAEE 1190 1200 1210 1220 1230 1240 710 720 730 740 750 760 pF1KE1 VGTYQPEPGRTGCFPCGGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTY : . :: .: . .:: : :. : :.: .:. :. CCDS54 CGILN------GCE--NGRCVRVQEGYT----CD----CFDGYHLDTAKMTCVDV----- 1250 1260 1270 1280 770 780 790 800 810 pF1KE1 QPEFGQNHCITCPGNTSTDFDGSTNVTHCKNQHCGGELGDYT-----GYIES--PNYPGD :.: : . .. .. ::: .: . :.: ::. : ::: CCDS54 ------NEC---------D-ELNNRMSLCKNAKCINTDGSYKCLCLPGYVPSDKPNYCTP 1290 1300 1310 1320 820 830 840 850 860 870 pF1KE1 YPANAECVWHIAPPPKRRILIVVPEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYER CCDS54 LNTALNLEKDSDLE 1330 1340 988 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 02:41:35 2016 done: Sat Nov 5 02:41:36 2016 Total Scan time: 3.950 Total Display time: 0.320 Function used was FASTA [36.3.4 Apr, 2011]