FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1065, 988 aa
1>>>pF1KE1065 988 - 988 aa - 988 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.6196+/-0.00128; mu= 17.6602+/- 0.076
mean_var=253.9400+/-50.395, 0's: 0 Z-trim(109.0): 212 B-trim: 221 in 1/53
Lambda= 0.080484
statistics sampled from 10373 (10617) to 10373 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.674), E-opt: 0.2 (0.326), width: 16
Scan time: 3.950
The best scores are: opt bits E(32554)
CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 ( 988) 7230 854.5 0
CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 999) 3736 448.8 2.5e-125
CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 ( 993) 3137 379.2 2.2e-104
CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 ( 971) 1931 239.2 3.1e-62
CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 807) 1402 177.7 8.6e-44
CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 ( 937) 1046 136.4 2.6e-31
CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 ( 956) 1046 136.4 2.6e-31
CCDS83309.1 MATN2 gene_id:4147|Hs108|chr8 ( 915) 974 128.0 8.4e-29
CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 817 110.2 3.4e-23
CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342) 759 103.3 3.4e-21
CCDS54344.1 LTBP1 gene_id:4052|Hs108|chr2 (1353) 759 103.3 3.4e-21
CCDS33178.2 LTBP1 gene_id:4052|Hs108|chr2 (1395) 759 103.4 3.5e-21
CCDS33177.2 LTBP1 gene_id:4052|Hs108|chr2 (1721) 759 103.5 3.9e-21
CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 748 102.6 1.2e-20
CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 743 102.0 1.9e-20
CCDS8103.1 LTBP3 gene_id:4054|Hs108|chr11 (1256) 728 99.7 4e-20
CCDS44647.1 LTBP3 gene_id:4054|Hs108|chr11 (1303) 728 99.7 4e-20
CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 728 100.2 6.1e-20
CCDS46762.1 FBLN2 gene_id:2199|Hs108|chr3 (1184) 613 86.3 4e-16
CCDS46761.1 FBLN2 gene_id:2199|Hs108|chr3 (1231) 613 86.3 4.1e-16
CCDS9898.1 FBLN5 gene_id:10516|Hs108|chr14 ( 448) 568 80.4 8.9e-15
CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 564 80.8 2.4e-14
CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 564 80.8 2.4e-14
CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 564 80.8 2.5e-14
CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 531 77.5 5.3e-13
CCDS8002.1 VWCE gene_id:220001|Hs108|chr11 ( 955) 509 74.1 1.5e-12
CCDS1857.1 EFEMP1 gene_id:2202|Hs108|chr2 ( 493) 502 72.8 1.9e-12
CCDS8116.1 EFEMP2 gene_id:30008|Hs108|chr11 ( 443) 490 71.4 4.7e-12
CCDS43028.1 FBLN1 gene_id:2192|Hs108|chr22 ( 566) 491 71.6 5e-12
CCDS14068.1 FBLN1 gene_id:2192|Hs108|chr22 ( 601) 491 71.7 5.1e-12
CCDS14069.1 FBLN1 gene_id:2192|Hs108|chr22 ( 683) 491 71.8 5.5e-12
CCDS14067.1 FBLN1 gene_id:2192|Hs108|chr22 ( 703) 491 71.8 5.6e-12
CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 494 72.5 5.8e-12
CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 494 72.5 5.9e-12
CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 494 72.8 7.3e-12
CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 480 71.5 3e-11
CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 480 71.5 3e-11
CCDS13149.1 CD93 gene_id:22918|Hs108|chr20 ( 652) 457 67.8 8.3e-11
CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 460 68.5 9.1e-11
>>CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 (988 aa)
initn: 7230 init1: 7230 opt: 7230 Z-score: 4556.1 bits: 854.5 E(32554): 0
Smith-Waterman score: 7230; 100.0% identity (100.0% similar) in 988 aa overlap (1-988:1-988)
10 20 30 40 50 60
pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 CKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 CQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRET
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 PKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 CIETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CIETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 VGSFECGCRKGYKLLTDERTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VGSFECGCRKGYKLLTDERTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHC
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 GDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 CSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE1 TTPIKQKARFKIRDAKCHLRPHSQARAKETARQPLLDHCHVTFVTLKCDSSKKRRRGRKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 TTPIKQKARFKIRDAKCHLRPHSQARAKETARQPLLDHCHVTFVTLKCDSSKKRRRGRKS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE1 PSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE1 TEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 TEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQ
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE1 LSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE1 GGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE1 STDFDGSTNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 STDFDGSTNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE1 PEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSG
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE1 KGFQVPYVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 KGFQVPYVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYT
910 920 930 940 950 960
970 980
pF1KE1 AQESKEMFPRSFIKLLRSKVSRFLRPYK
::::::::::::::::::::::::::::
CCDS14 AQESKEMFPRSFIKLLRSKVSRFLRPYK
970 980
>>CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 (999 aa)
initn: 2673 init1: 2673 opt: 3736 Z-score: 2363.4 bits: 448.8 E(32554): 2.5e-125
Smith-Waterman score: 4733; 64.3% identity (80.5% similar) in 1012 aa overlap (19-988:36-999)
10 20 30 40
pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA
::: :: : :::::..: :::: ::
CCDS81 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML
.::::: :::: :::::.:::.:::::::: :. ::::::.:.::::::::::::::::
CCDS81 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML
70 80 90 100 110
110 120 130 140 150 160
pF1KE1 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN
::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..:::
CCDS81 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC
:::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.:
CCDS81 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC
180 190 200 210 220 230
230 240 250
pF1KE1 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD
: .: .:.:::.:.: :::::::::::::::
CCDS81 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE1 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE
:.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.::::::
CCDS81 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE1 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV
..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: ::
CCDS81 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE1 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT
:: ::::: : :: .:::: :::::. : : ...:::..: :.:.:: ..::: : :
CCDS81 NTVGSYECQCHPGYKLHWNKKDCVEV-KGLLPTSVSPRVSLHCGKSGGGDGCFLRC--H-
420 430 440 450 460 470
440 450 460 470 480 490
pF1KE1 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH
::. : :: .: :. .. ::. ..::
CCDS81 -------------------------------SGIHLS-SD--VTTIRTSVTFKLNEGKCS
480 490 500
500 510 520 530 540 550
pF1KE1 LRPHSQARAKETARQPLLDHCHVT------FVTLKCDSSKKR--RRGRKSPSKEVSHITA
:. .:. . .: : . : . .:.: :.:.:. :: : ::. ::.
CCDS81 LK---NAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEM-FITV
510 520 530 540 550
560 570 580 590 600 610
pF1KE1 EFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPA
:::.::...:.. .:. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..:
CCDS81 EFELETNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPP
560 570 580 590 600 610
620 630 640 650 660
pF1KE1 KALEGQG-ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCP--
.. : :. .::.:: ...::.: ::.. : .:. : ::.:. :::..: :::
CCDS81 RTSERQAESCGVGQGHAENQCVSCRAGTYYDGARERCILCPNGTFQNEEGQMTCEPCPRP
620 630 640 650 660 670
670 680 690 700 710 720
pF1KE1 -SSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLT
.: .: : : :.::::: :.:: .::::: ::: : .::.::: :::.:::::::: :
CCDS81 GNSGALKTPEAWNMSECGGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLAT
680 690 700 710 720 730
730 740 750 760 770 780
pF1KE1 KHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDG
::.:.:::::::..:.::::: :::::::::::::::::::::.:.:..:::::.:::::
CCDS81 KHQGATSFQDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDG
740 750 760 770 780 790
790 800 810 820 830 840
pF1KE1 STNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLP
:::.:.:::..:::::::.:::::::::::.::::.::.: : :::::::::::::::::
CCDS81 STNITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLP
800 810 820 830 840 850
850 860 870 880 890 900
pF1KE1 IEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVP
:::.::: :::::..: .:.:::::::::::::::::::.:::::::::::::..:::::
CCDS81 IEDDCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVP
860 870 880 890 900 910
910 920 930 940 950 960
pF1KE1 YVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKE
:::::::::.::::::::::::::::::::::::::::::::::::::::::::::::.:
CCDS81 YVTYDEDYQELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESRE
920 930 940 950 960 970
970 980
pF1KE1 MFPRSFIKLLRSKVSRFLRPYK
:::::::.::::::::::::::
CCDS81 MFPRSFIRLLRSKVSRFLRPYK
980 990
>>CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 (993 aa)
initn: 4135 init1: 2251 opt: 3137 Z-score: 1987.5 bits: 379.2 E(32554): 2.2e-104
Smith-Waterman score: 4963; 66.0% identity (85.6% similar) in 1002 aa overlap (1-988:1-993)
10 20 30 40 50 60
pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCL
::.. : :: ::.: ...: : : .. ::::: ::::.:::::::::::.::::.
CCDS48 MGSGRVP-GLC-LLVLLVHARAAQYS--KAAQDVDECVEGTDNCHIDAICQNTPRSYKCI
10 20 30 40 50
70 80 90 100 110 120
pF1KE1 CKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDE
:: :: :.::.:.:.:::: . :.::::.:.::::::::::.::: :::::::::::::
CCDS48 CKSGYTGDGKHCKDVDECERED-NAGCVHDCVNIPGNYRCTCYDGFHLAHDGHNCLDVDE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE1 CQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRET
: ..:::::: ::: ::::::.:. ::::::::::::.: .::::::::.::::::::::
CCDS48 CAEGNGGCQQSCVNMMGSYECHCREGFFLSDNQHTCIQRPEEGMNCMNKNHGCAHICRET
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE1 PKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT
::::.::.:::::.:..::.:: ::::::::::::.:.::. :: :::: :..::.::.:
CCDS48 PKGGIACECRPGFELTKNQRDCKLTCNYGNGGCQHTCDDTEQGPRCGCHIKFVLHTDGKT
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE1 CIETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT
::::::::::::: :.:.::::.:.::::: :::: ::::::.:: .:::::::.::::
CCDS48 CIETCAVNNGGCDSKCHDAATGVHCTCPVGFMLQPDRKTCKDIDECRLNNGGCDHICRNT
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE1 VGSFECGCRKGYKLLTDERTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHC
::::::.:.:::::: .::.:::::::::.:::::::.:.::::::::::::.::: :::
CCDS48 VGSFECSCKKGYKLLINERNCQDIDECSFDRTCDHICVNTPGSFQCLCHRGYLLYGITHC
300 310 320 330 340 350
370 380 390 400 410
pF1KE1 GDVDECSMSNGSCDQGCVNTKGSYECVCPPGR-RLHWNGKDCVETGKCLSRAKTSPRAQL
:::::::.. :.: ::.:: :::.:.:: :. :::::::::.: :: . .: .:.:
CCDS48 GDVDECSINRGGCRFGCINTPGSYQCTCPAGQGRLHWNGKDCTEPLKCQGSPGAS-KAML
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE1 SCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGK-ALQKRNGTSSGLGPSCSD
::...: ..: :.::... :.:.:::....:::.:.:.. : .::.:.. . : .
CCDS48 SCNRSGKKDTCALTCPSRARFLPESENGFTVSCGTPSPRAAPARAGHNGNSTN-SNHCHE
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE1 APTTPIKQKARFKIRDAKCHLRPHSQARAKETAR------QPLLDHCHVTFVTLKCDSSK
: . :::.: :::.::::.:. .......:..: : ..:.:::. ::::::.
CCDS48 AAVLSIKQRASFKIKDAKCRLHLRNKGKTEEAGRITGPGGAPC-SECQVTFIHLKCDSSR
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE1 KR--RRGRKSPSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIG
: ::.: :.:::...: :.: :.. ::.. .: :::.: :. :....: :::::.
CCDS48 KGKGRRARTPPGKEVTRLTLELEAEVRAEETTASCGLPCLRQRMERRLKGSLKMLRKSIN
540 550 560 570 580 590
600 610 620 630 640
pF1KE1 RQQFYVQVSGTEYEVAQRPA----KALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQC
...: ....: .::.:..:. . : . .: :: .:::.: ::.. :. ::
CCDS48 QDRFLLRLAGLDYELAHKPGLVAGERAEPMESCRPGQHRAGTKCVSCPQGTYYHGQTEQC
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE1 VSCMPGTYQDMEGQLSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVG
: : ::.:. :::::: ::.::. : :: ::. :.::: :: :.::::::: :: :
CCDS48 VPCPAGTFQEREGQLSCDLCPGSDAHGPLGATNVTTCAGQCPPGQHSVDGFKPCQPCPRG
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE1 TYQPEPGRTGCFPCGGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQP
::::: ::: :::::::: :::::. :::::..::.:::::.:::. :::::: .:.:::
CCDS48 TYQPEAGRTLCFPCGGGLTTKHEGAISFQDCDTKVQCSPGHYYNTSIHRCIRCAMGSYQP
720 730 740 750 760 770
770 780 790 800 810 820
pF1KE1 EFGQNHCITCPGNTSTDFDGSTNVTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVW
.: :: : :::::::::::::.:..:::..::::::..:::::::::::.:::..::.:
CCDS48 DFRQNFCSRCPGNTSTDFDGSTSVAQCKNRQCGGELGEFTGYIESPNYPGNYPAGVECIW
780 790 800 810 820 830
830 840 850 860 870 880
pF1KE1 HIAPPPKRRILIVVPEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSR
.: :::::.::::::::::: ::::::::::::..::.::::::::::::::::::.:::
CCDS48 NINPPPKRKILIVVPEIFLPSEDECGDVLVMRKNSSPSSITTYETCQTYERPIAFTARSR
840 850 860 870 880 890
890 900 910 920 930 940
pF1KE1 KLWIQFKSNEGNSGKGFQVPYVTYDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKAL
::::.::..:.::..:::.:::::::::.::.:::::::::::::::::::::::::::.
CCDS48 KLWINFKTSEANSARGFQIPYVTYDEDYEQLVEDIVRDGRLYASENHQEILKDKKLIKAF
900 910 920 930 940 950
950 960 970 980
pF1KE1 FDVLAHPQNYFKYTAQESKEMFPRSFIKLLRSKVSRFLRPYK
:.:::::::::::: .. :::.:.::::::::::: ::::::
CCDS48 FEVLAHPQNYFKYT-EKHKEMLPKSFIKLLRSKVSSFLRPYK
960 970 980 990
>>CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 (971 aa)
initn: 3212 init1: 1909 opt: 1931 Z-score: 1230.8 bits: 239.2 E(32554): 3.1e-62
Smith-Waterman score: 4520; 62.3% identity (78.2% similar) in 1009 aa overlap (19-988:36-971)
10 20 30 40
pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA
::: :: : :::::..: :::: ::
CCDS77 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML
.::::: :::: :::::.:::.:::::::: :. ::::::.:.::::::::::::::::
CCDS77 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML
70 80 90 100 110
110 120 130 140 150 160
pF1KE1 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN
::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..:::
CCDS77 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC
:::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.:
CCDS77 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC
180 190 200 210 220 230
230 240 250
pF1KE1 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD
: .: .:.:::.:.: :::::::::::::::
CCDS77 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE1 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE
:.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.::::::
CCDS77 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE1 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV
..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: ::
CCDS77 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE1 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT
:: ::::: : :: .:::: :::::. : : ...:::..: :.:.:: ..::: : .
CCDS77 NTVGSYECQCHPGYKLHWNKKDCVEV-KGLLPTSVSPRVSLHCGKSGGGDGCFLRCHSGI
420 430 440 450 460 470
440 450 460 470 480 490
pF1KE1 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH
. ...: ..:: .: . :: : .. : .: :. .. ::. ..::
CCDS77 HLSSGLQGAYSVTCGSSSPLRNKQQKSNDSAFG--------DVTTIRTSVTFKLNEGKCS
480 490 500 510 520 530
500 510 520 530 540 550
pF1KE1 LRPHSQARAKETARQPLLDHCHVT------FVTLKCDSSKKR--RRGRKSPSKEVSHITA
:. .:. . .: : . : . .:.: :.:.:. :: : ::. ::.
CCDS77 LK---NAELFPEGLRPALPEKHSSVKESFRYVNLTCSSGKQVPGAPGRPSTPKEM-FITV
540 550 560 570 580
560 570 580 590 600 610
pF1KE1 EFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPA
:::.::...:.. .:. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..:
CCDS77 EFELETNQKEVTASCDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPP
590 600 610 620 630 640
620 630 640 650 660
pF1KE1 KALEGQG-ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCPSS
.. : :. .::.:: : .::
CCDS77 RTSERQAESCGVGQ----------------GHAENQC-----------------------
650 660
670 680 690 700 710 720
pF1KE1 DGLGLPGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHE
: :.:: .::::: ::: : .::.::: :::.:::::::: :::.
CCDS77 ---------------GLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQ
670 680 690 700 710
730 740 750 760 770 780
pF1KE1 GTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTN
:.:::::::..:.::::: :::::::::::::::::::::.:.:..:::::.::::::::
CCDS77 GATSFQDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTN
720 730 740 750 760 770
790 800 810 820 830 840
pF1KE1 VTHCKNQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIED
.:.:::..:::::::.:::::::::::.::::.::.: : ::::::::::::::::::::
CCDS77 ITQCKNRRCGGELGDFTGYIESPNYPGNYPANTECTWTINPPPKRRILIVVPEIFLPIED
780 790 800 810 820 830
850 860 870 880 890 900
pF1KE1 ECGDVLVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVPYVT
.::: :::::..: .:.:::::::::::::::::::.:::::::::::::..::::::::
CCDS77 DCGDYLVMRKTSSSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVT
840 850 860 870 880 890
910 920 930 940 950 960
pF1KE1 YDEDYQQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKEMFP
::::::.::::::::::::::::::::::::::::::::::::::::::::::::.::::
CCDS77 YDEDYQELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFP
900 910 920 930 940 950
970 980
pF1KE1 RSFIKLLRSKVSRFLRPYK
::::.::::::::::::::
CCDS77 RSFIRLLRSKVSRFLRPYK
960 970
>>CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 (807 aa)
initn: 2830 init1: 1059 opt: 1402 Z-score: 899.6 bits: 177.7 E(32554): 8.6e-44
Smith-Waterman score: 3713; 54.4% identity (66.1% similar) in 1004 aa overlap (19-988:36-807)
10 20 30 40
pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDA
::: :: : :::::..: :::: ::
CCDS53 RNRPGAAWAVLLLLLLLPPLLLLAGAVPPGRGRAAG----PQE-DVDECAQGLDDCHADA
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 ICQNTPKSYKCLCKPGYKGEGKQCEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFML
.::::: :::: :::::.:::.:::::::: :. ::::::.:.::::::::::::::::
CCDS53 LCQNTPTSYKCSCKPGYQGEGRQCEDIDECGNEL-NGGCVHDCLNIPGNYRCTCFDGFML
70 80 90 100 110
110 120 130 140 150 160
pF1KE1 AHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMN
::::::::::::: .::::::. :::.:::::: :. :::::::::::::::.::..:::
CCDS53 AHDGHNCLDVDECLENNGGCQHTCVNVMGSYECCCKEGFFLSDNQHTCIHRSEEGLSCMN
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 KDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLTCNYGNGGCQHSCEDTDTGPTCGC
:::::.:::.:.:.:.:::.:::::.::.::.:: ::::.:::::::::.:: :: :.:
CCDS53 KDHGCSHICKEAPRGSVACECRPGFELAKNQRDCILTCNHGNGGCQHSCDDTADGPECSC
180 190 200 210 220 230
230 240 250
pF1KE1 HQKYALHSDGRTCIE------------------------------TCAVNNGGCDRTCKD
: .: .:.:::.:.: :::::::::::::::
CCDS53 HPQYKMHTDGRSCLEREDTVLEVTESNTTSVVDGDKRVKRRLLMETCAVNNGGCDRTCKD
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE1 TATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNTVGSFECGCRKGYKLLTDE
:.:::.:::::::::: ::::::::.:: . ::::::::.: ::::.:::.::.::::::
CCDS53 TSTGVHCSCPVGFTLQLDGKTCKDIDECQTRNGGCDHFCKNIVGSFDCGCKKGFKLLTDE
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE1 RTCQDIDECSFERTCDHICINSPGSFQCLCHRGYILYGTTHCGDVDECSMSNGSCDQGCV
..:::.::::..::::: ::: ::.: : :.::: ::: :::::..:::..::.:.: ::
CCDS53 KSCQDVDECSLDRTCDHSCINHPGTFACACNRGYTLYGFTHCGDTNECSINNGGCQQVCV
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE1 NTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHT
:: ::::: : :: .:::: :::: .
CCDS53 NTVGSYECQCHPGYKLHWNKKDCVAS----------------------------------
420 430 440
440 450 460 470 480 490
pF1KE1 LFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSDAPTTPIKQKARFKIRDAKCH
CCDS53 ------------------------------------------------------------
500 510 520 530 540 550
pF1KE1 LRPHSQARAKETARQPLLDHCHVTFVTLKCDSSKKRRRGRKSPSKEVSHITAEFEIETKM
CCDS53 ------------------------------------------------------------
560 570 580 590 600 610
pF1KE1 EEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPAKALEGQG-
:. .:. ::.:. :. ::.::::.. :.::..:.:: . .::..: .. : :.
CCDS53 ------CDLSCIVKRTEKRLRKAIRTLRKAVHREQFHLQLSGMNLDVAKKPPRTSERQAE
450 460 470 480 490
620 630 640 650 660 670
pF1KE1 ACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCP---SSDGLGL
.::.:: ...::.: ::.. : .:. : ::.:. :::..: ::: .: .:
CCDS53 SCGVGQGHAENQCVSCRAGTYYDGARERCILCPNGTFQNEEGQMTCEPCPRPGNSGALKT
500 510 520 530 540 550
680 690 700 710 720 730
pF1KE1 PGARNVSECGGQCSPGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHEGTTSF
: : :.::::: :.:: .::::: ::: : .::.::: :::.:::::::: :::.:.:::
CCDS53 PEAWNMSECGGLCQPGEYSADGFAPCQLCALGTFQPEAGRTSCFPCGGGLATKHQGATSF
560 570 580 590 600 610
740 750 760 770 780 790
pF1KE1 QDCEAKVHCSPGHHYNTTTHRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTNVTHCK
::::..:.::::: :::::::::::::::::::::.:.:..:::::.::::::::.:.::
CCDS53 QDCETRVQCSPGHFYNTTTHRCIRCPVGTYQPEFGKNNCVSCPGNTTTDFDGSTNITQCK
620 630 640 650 660 670
800 810 820 830 840 850
pF1KE1 NQHCGGELGDYTGYIESPNYPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIEDECGDV
.
CCDS53 T-----------------------------------------------------------
680
860 870 880 890 900 910
pF1KE1 LVMRKSASPTSITTYETCQTYERPIAFTSRSRKLWIQFKSNEGNSGKGFQVPYVTYDEDY
: .:.:::::::::::::::::::.:::::::::::::..:::::::::::::
CCDS53 -------SSNSVTTYETCQTYERPIAFTSRSKKLWIQFKSNEGNSARGFQVPYVTYDEDY
690 700 710 720 730
920 930 940 950 960 970
pF1KE1 QQLIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESKEMFPRSFIK
:.::::::::::::::::::::::::::::::::::::::::::::::::.::::::::.
CCDS53 QELIEDIVRDGRLYASENHQEILKDKKLIKALFDVLAHPQNYFKYTAQESREMFPRSFIR
740 750 760 770 780 790
980
pF1KE1 LLRSKVSRFLRPYK
::::::::::::::
CCDS53 LLRSKVSRFLRPYK
800
>>CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 (937 aa)
initn: 872 init1: 363 opt: 1046 Z-score: 675.6 bits: 136.4 E(32554): 2.6e-31
Smith-Waterman score: 1046; 36.2% identity (58.5% similar) in 417 aa overlap (37-443:242-642)
10 20 30 40 50 60
pF1KE1 RWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDC-HIDAICQNTPKSYKCLCKPGY
:: .: : .: : : :: : :: ::
CCDS55 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCAH---FCINIPGSYVCRCKQGY
220 230 240 250 260
70 80 90 100 110 120
pF1KE1 KGEGKQ--CEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQD
.. : :. : : . .: : . :.:.::.. : :..:. ::.::. :. :: : .
CCDS55 ILNSDQTTCRIQDLCAMEDHN--CEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCAS
270 280 290 300 310 320
130 140 150 160 170 180
pF1KE1 NNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPKG
.: ::.. :::: ::: :::: :: :. ...:: . . : ...::: : : .: .
CCDS55 ENHGCEHECVNADGSYLCQCHEGFALNPDKKTCTKIDY----CASSNHGCQHECVNTDDS
330 340 350 360 370 380
190 200 210 220 230 240
pF1KE1 GVACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRTC
.: : :: : ..: : : .. ::.: : . . . : ::. :.: .:.::
CCDS55 -YSCHCLKGFTLNPDKKTCRRINYCALNKPGCEHECVNMEESYYCRCHRGYTLDPNGKTC
390 400 410 420 430 440
250 260 270 280 290
pF1KE1 --IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRN
.. :: .. ::.. : .: . :.: :: .. : :::. .. ::... ::.. : :
CCDS55 SRVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCSRVDYCLLSDHGCEYSCVN
450 460 470 480 490 500
300 310 320 330 340 350
pF1KE1 TVGSFECGCRKGYKLLTDERTCQDIDECSF-ERTCDHICINSPGSFQCLCHRGYILY--G
:: : : .:. : .: .:: .: :.. .. :.: :..: :: : : .:::: :
CCDS55 MDRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSSEDSFVCQCFEGYILREDG
510 520 530 540 550 560
360 370 380 390 400 410
pF1KE1 TTHCGDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPR
: : : :. . .:.. :::. :: : : : :: .:: : . : : :
CCDS55 KT-CRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGKRCRRKDVCKS---THHG
570 580 590 600 610
420 430 440 450 460 470
pF1KE1 AQLSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSC
. : . :. : .: ... :
CCDS55 CEHICVNNGNSYIC--KCSEGFVLAEDGRRCKKCTEGPIDLVFVIDGSKSLGEENFEVVK
620 630 640 650 660 670
>>CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 (956 aa)
initn: 872 init1: 363 opt: 1046 Z-score: 675.5 bits: 136.4 E(32554): 2.6e-31
Smith-Waterman score: 1048; 30.0% identity (53.8% similar) in 666 aa overlap (37-664:242-876)
10 20 30 40 50 60
pF1KE1 RWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDC-HIDAICQNTPKSYKCLCKPGY
:: .: :. : : : :: : :: ::
CCDS55 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCAHF---CINIPGSYVCRCKQGY
220 230 240 250 260
70 80 90 100 110 120
pF1KE1 KGEGKQ--CEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQD
.. : :. : : . .: : . :.:.::.. : :..:. ::.::. :. :: : .
CCDS55 ILNSDQTTCRIQDLCAMEDHN--CEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCAS
270 280 290 300 310 320
130 140 150 160 170 180
pF1KE1 NNGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPKG
.: ::.. :::: ::: :::: :: :. ...:: . . : ...::: : : .: .
CCDS55 ENHGCEHECVNADGSYLCQCHEGFALNPDKKTCTKIDY----CASSNHGCQHECVNTDDS
330 340 350 360 370 380
190 200 210 220 230 240
pF1KE1 GVACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRTC
.: : :: : ..: : : .. ::.: : . . . : ::. :.: .:.::
CCDS55 -YSCHCLKGFTLNPDKKTCRRINYCALNKPGCEHECVNMEESYYCRCHRGYTLDPNGKTC
390 400 410 420 430 440
250 260 270 280 290
pF1KE1 --IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRN
.. :: .. ::.. : .: . :.: :: .. : :::. .. ::... ::.. : :
CCDS55 SRVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCSRVDYCLLSDHGCEYSCVN
450 460 470 480 490 500
300 310 320 330 340 350
pF1KE1 TVGSFECGCRKGYKLLTDERTCQDIDECSF-ERTCDHICINSPGSFQCLCHRGYILY--G
:: : : .:. : .: .:: .: :.. .. :.: :..: :: : : .:::: :
CCDS55 MDRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSSEDSFVCQCFEGYILREDG
510 520 530 540 550 560
360 370 380 390 400 410
pF1KE1 TTHCGDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPR
: : : :. . .:.. :::. :: : : : :: .:: : . : : :
CCDS55 KT-CRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGKRCRRKDVCKS---THHG
570 580 590 600 610
420 430 440 450 460
pF1KE1 AQLSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGP-------QG-KALQKRN--
. : . :. : .: ... :.. .: . :: .: :.: ..:
CCDS55 CEHICVNNGNSYIC--KCSEGFVLAEDGRRCK--KC-TEGPIDLVFVIDGSKSLGEENFE
620 630 640 650 660 670
470 480 490 500 510 520
pF1KE1 ---GTSSGLGPSCSDAPTTPIKQKARFKIR-DAKCHLRPHSQAR--AKETARQPLLDHCH
.:. : . .: . ... . .. :: ..:. : .:.. . .
CCDS55 VVKQFVTGIIDSLTISPKAARVGLLQYSTQVHTEFTLRNFNSAKDMKKAVAHMKYMGKGS
680 690 700 710 720 730
530 540 550 560
pF1KE1 VTFVTLK--CDSSKKRRRGRKSPSKEVSHITAEF----------EIETKMEEASDTCEAD
.: ..:: . : . .: . : .: . . : : .: . . : :
CCDS55 MTGLALKHMFERSFTQGEGARPLSTRVPRAAIVFTDGRAQDDVSEWASKAKANGITMYAV
740 750 760 770 780 790
570 580 590 600 610 620
pF1KE1 CLRKRAEQSLQAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPAKALEGQGACGAGQVLQDS
. : :. :: . . ... ::.. .: :.... : : : : :.::
CCDS55 GVGKAIEEELQ---EIASEPTNKHLFYAEDFSTMDEISEKLKK-----GICEA---LEDS
800 810 820 830 840
630 640 650 660 670 680
pF1KE1 KCVACGPGTHFGGELGQCVSCMPGTYQDMEGQLSCTPCPSSDGLGLPGARNVSECGGQCS
.:. .. . : . : : ... :::.
CCDS55 DGRQDSPAGELPKTVQQPTESEPVTI-NIQDLLSCSNFAVQHRYLFEEDNLLRSTQKLSH
850 860 870 880 890 900
690 700 710 720 730 740
pF1KE1 PGFFSADGFKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHEGTTSFQDCEAKVHCSPGHH
CCDS55 STKPSGSPLEEKHDQCKCENLIMFQNLANEEVRKLTQRLEEMTQRMEALENRLRYR
910 920 930 940 950
>>CCDS83309.1 MATN2 gene_id:4147|Hs108|chr8 (915 aa)
initn: 1119 init1: 376 opt: 974 Z-score: 630.5 bits: 128.0 E(32554): 8.4e-29
Smith-Waterman score: 974; 35.9% identity (59.4% similar) in 379 aa overlap (37-407:242-608)
10 20 30 40 50 60
pF1KE1 RWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYKCLCKPGYK
:: .: .: : : :: : :: ::
CCDS83 HEDHVFLVANFSQIETLTSVFQKKLCTAHMCSTLEHNCA--HFCINIPGSYVCRCKQGYI
220 230 240 250 260
70 80 90 100 110 120
pF1KE1 GEGKQ--CEDIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQDN
.. : :. : : . .: : . :.:.::.. : :..:. ::.::. :. :: : ..
CCDS83 LNSDQTTCRIQDLCAMEDHN--CEQLCVNVPGSFVCQCYSGYALAEDGKRCVAVDYCASE
270 280 290 300 310 320
130 140 150 160 170 180
pF1KE1 NGGCQQICVNAMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPKGG
: ::.. :::: ::: :::: :: :. ...:: : : : . :: : : . ..
CCDS83 NHGCEHECVNADGSYLCQCHEGFALNPDKKTCT-RINY---CALNKPGCEHECVNMEES-
330 340 350 360 370 380
190 200 210 220 230 240
pF1KE1 VACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRTC-
: :. :. : : : :. . : . ::.. : .:. . .: : . . .. : .::
CCDS83 YYCRCHRGYTLDPNGKTCSRVDHCAQQDHGCEQLCLNTEDSFVCQCSEGFLINEDLKTCS
390 400 410 420 430 440
250 260 270 280 290 300
pF1KE1 -IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGCDHFCRNT
.. : ... ::. .: . . :.:: : .:. ::::: .. : ... ::.: : ..
CCDS83 RVDYCLLSDHGCEYSCVNMDRSFACQCPEGHVLRSDGKTCAKLDSCALGDHGCEHSCVSS
450 460 470 480 490 500
310 320 330 340 350
pF1KE1 VGSFECGCRKGYKLLTDERTCQDIDEC-SFERTCDHICINSPGSFQCLCHRGYILY-GTT
:: : : .:: : : .::. : : .... :.:::.:: :. : : .:. :
CCDS83 EDSFVCQCFEGYILREDGKTCRRKDVCQAIDHGCEHICVNSDDSYTCECLEGFRLAEDGK
510 520 530 540 550 560
360 370 380 390 400 410
pF1KE1 HCGDVDECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQ
.: : :. .. .:.. :::. .:: : : : : .:. : ::
CCDS83 RCRRKDVCKSTHHGCEHICVNNGNSYICKCSEGFVLAEDGRRC---KKCTEGPIDLVFVI
570 580 590 600 610
420 430 440 450 460 470
pF1KE1 LSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVPGPQGKALQKRNGTSSGLGPSCSD
CCDS83 DGSKSLGEENFEVVKQFVTGIIDSLTISPKAARVGLLQYSTQVHTEFTLRNFNSAKDMKK
620 630 640 650 660 670
>>CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541 aa)
initn: 978 init1: 275 opt: 817 Z-score: 529.9 bits: 110.2 E(32554): 3.4e-23
Smith-Waterman score: 1061; 27.7% identity (48.6% similar) in 869 aa overlap (36-812:127-935)
10 20 30 40 50 60
pF1KE1 VRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSEGTDDCHIDAICQNTPKSYK-CLCKPG
::: . : . : .: : . : : ::
CCDS41 RQVYTTEARTVLRCCRGWMQQPDEEGCLSAECSASL--CFHGGRC--VPGSAQPCHCPPG
100 110 120 130 140 150
70 80 90 100 110 120
pF1KE1 YKGEGKQCE-DIDECENDYYNGGCVHECINIPGNYRCTCFDGFMLAHDGHNCLDVDECQD
..: .:. :.:::.. .:::: :.:.: ::.: : : :: : :...:: .. :
CCDS41 FQGP--RCQYDVDECRT--HNGGCQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCAL
160 170 180 190 200
130 140 150 160 170 180
pF1KE1 NNGGCQQICVN-AMGSYECQCHSGFFLSDNQHTCIHRSNEGMNCMNKDHGCAHICRETPK
.:::::. ::. .. ..:::. :: :... . :..:: : :.. .: : : .. .
CCDS41 GNGGCQHHCVQLTITRHRCQCRPGFQLQEDGRHCVRRSP----CANRNGSCMHRC-QVVR
210 220 230 240 250 260
190 200 210 220 230 240
pF1KE1 GGVACDCRPGFDLAQNQKDCTLT--CNYGNGGCQHSCEDTDTGPTCGCHQKYALHSDGRT
: . :.:. :..:: . : : . : : . : :.: .:. . : :: : : .:::
CCDS41 GLARCECHVGYQLAADGKACEDVDECAAGLAQCAHGCLNTQGSFKCVCHAGYELGADGRQ
270 280 290 300 310 320
250 260 270 280 290
pF1KE1 C-------IETCAVNNGGCDRTCKDTATGVRCSCPVGFTLQPDGKTCKDINECLVNNGGC
: ...: .:::::.. :. :..: :.:: :. :. : .:: :...: ... :
CCDS41 CYRIEMEIVNSCEANNGGCSHGCSHTSAGPLCTCPRGYELDTDQRTCIDVDDC-ADSPCC
330 340 350 360 370 380
300 310 320 330 340 350
pF1KE1 DHFCRNTVGSFECGCRKGYKLLTDERTCQDIDECSFERT-CDHICINSPGSFQCLCHRGY
.. : :. :..:::: ::.: .: :.:.:::. : :.: : : ::::: :. ::
CCDS41 QQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEHHCTNLAGSFQCSCEAGY
390 400 410 420 430 440
360
pF1KE1 ILYGTTH-CG-------DVD----------------------------------------
:. . :. :.:
CCDS41 RLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQDDDVGADEEEAELRGE
450 460 470 480 490 500
370 380 390 400
pF1KE1 ----------------ECSMSNGSCDQGCVNTKGSYECVCPPGRRLHWNGKDCVETGKCL
.::.. .: .: . : : :: : :.: : ::
CCDS41 HTLTEKFVCLDDSFGHDCSLTCDDCRNGGTCLLGLDGCDCPEG----WTGLICNETCPPD
510 520 530 540 550
410 420 430 440 450 460
pF1KE1 SRAKTSPRAQLSCSKAGGVESCFLSCPAHTLFVPDSENSYVLSCGVP-GPQGKALQKR-N
. .:. . ::...: .: .: : . .. : : : :: .:. :
CCDS41 TFGKNCSFS-CSCQNGGTCDSVTGACRC-----PPGVSGTNCEDGCPKGYYGKHCRKKCN
560 570 580 590 600 610
470 480 490 500 510 520
pF1KE1 GTSSGLGPSCSDAPTTPIKQKARFKIRDAKCHLRPHSQARAKETAR-----QPLLDHCHV
.. : : .:: ::: : . .. :: . :
CCDS41 CANRGRCHRLYGACLCDPGLYGRF------CHLTCPPWAFGPGCSEECQCVQPHTQSCDK
620 630 640 650 660
530 540 550 560 570
pF1KE1 TFVTLKCDSSKKRRRGRKSPSK-EVSHI-TAEFEIET-KMEEASDTCEADCLRKRAEQSL
. .: : ::.. .. :.... . .. : . : :. ..: :: ..
CCDS41 RDGSCSC---KAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVSGEC-GKRCPAGF
670 680 690 700 710 720
580 590 600 610 620 630
pF1KE1 QAAIKTLRKSIGRQQFYVQVSGTEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTH
:. . .: : :. :.. . : ... :: : :.. .: : : : .
CCDS41 QGEDCGQECPVG--TFGVNCSSSC-SCGGAPCHGVTGQCRCPPGRTGED--CEADCPEGR
730 740 750 760 770
640 650 660 670 680 690
pF1KE1 FG-GELGQCVSCMPGTYQDME-GQLSCTPCPSSDGLGLPGARNVSECGGQCSPGFFSADG
.: : : .:. .. : : : : : :. :.: : : :... .
CCDS41 WGLGCQEICPACQHAARCDPETGACLCLP-------GFVGSR----CQDVCPAGWYGPSC
780 790 800 810 820
700 710 720 730 740 750
pF1KE1 FKPCQACPVGTYQPEPGRTGCFPCGGGLLTKHEGTTSFQ--DCEAKVHCSPGHHY-NTTT
:. : .: :. .: : :. .. :. :: .:: :: .. .
CCDS41 QTRCSCANDGHCHPATGHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAIS
830 840 850 860 870 880
760 770 780 790 800 810
pF1KE1 HRCIRCPVGTYQPEFGQNHCITCPGNTSTDFDGSTNVTHCKNQHCGGELGDYTGYIESPN
:. : .: :. :. :: . : : .:. :: :. .: :
CCDS41 GLCL-CEAGYVGPRCEQQ----CP---QGHF-GPGCEQRCQCQH-GAACDHVSGACTCPA
890 900 910 920 930
820 830 840 850 860 870
pF1KE1 YPGDYPANAECVWHIAPPPKRRILIVVPEIFLPIEDECGDVLVMRKSASPTSITTYETCQ
CCDS41 GWRGTFCEHACPAGFFGLDCRSACNCTAGAACDAVNGSCLCPAGRRGPRCAETCPAHTYG
940 950 960 970 980 990
>>CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342 aa)
initn: 438 init1: 258 opt: 759 Z-score: 494.0 bits: 103.3 E(32554): 3.4e-21
Smith-Waterman score: 911; 28.7% identity (50.4% similar) in 867 aa overlap (10-814:560-1325)
10 20 30
pF1KE1 MGAAAVRWHLCVLLALGTRGRLAGGSGLPGSVDVDECSE
::. : : .:. : . .::::: .
CCDS54 QQRKCVDIDECTQVQHLCSQGRCENTEGSFLCICPA----GFMASEEGT-NCIDVDECLR
530 540 550 560 570 580
40 50 60 70 80 90
pF1KE1 GTDDCHIDAICQNTPKSYKC-LCKPGYKGEGK-QCEDIDECENDYYNGGCVHE-CINIPG
: : .. : :: ...: : ::. . .::::::: : . : : :.: ::
CCDS54 -PDVCG-EGHCVNTVGAFRCEYCDSGYRMTQRGRCEDIDECLNP---STCPDEQCVNSPG
590 600 610 620 630
100 110 120 130 140 150
pF1KE1 NYRCT-CFDGFMLAHDGHNCLDVDECQDNNGGCQQICVNAMGSYECQCHSGFFLSDNQHT
.:.:. : .:: . .:. ::::::: . : . : : ::: :.::.:. . ...
CCDS54 SYQCVPCTEGFR-GWNGQ-CLDVDECLEPNVCANGDCSNLEGSYMCSCHKGYTRTPDHKH
640 650 660 670 680 690
160 170 180 190 200 210
pF1KE1 C--IHRSNEGMNCMNKDHGCAHICRETPKGGVACDCRPGFDLAQNQKDCTLT--CNYGNG
: : . ..: :.: . :..: .:. : : :..:. . .: :.. .
CCDS54 CRDIDECQQGNLCVNGQ------CKNT-EGSFRCTCGQGYQLSAAKDQCEDIDECQHRHL
700 710 720 730 740 750
220 230 240 250 260
pF1KE1 GCQHS-CEDTDTGPTCGCHQKYALHSDGRTC--IETCAVNNGGCDR-TCKDTATGVRCSC
: :. :..:. . : : : : . : : :. : ... :.: : .:: . :.:
CCDS54 -CAHGQCRNTEGSFQCVCDQGYRASGLGDHCEDINECLEDKSVCQRGDCINTAGSYDCTC
760 770 780 790 800
270 280 290 300 310 320
pF1KE1 PVGFTLQPDGKTCKDINECLVNNGGC--DHFCRNTVGSFECGCRKGYKLLTDERTCQDID
: :: :. :.:::.::::: . : : . : :: :::.: :..:... .: :::.:::
CCDS54 PDGFQLD-DNKTCQDINECE-HPGLCGPQGECLNTEGSFHCVCQQGFSISADGRTCEDID
810 820 830 840 850 860
330 340 350 360 370 380
pF1KE1 ECSFERTCD-H-ICINSPGSFQCLCHRGYILYGTTH-CGDVDECSMSNGSCDQG-CVNTK
:: . .:: : .: :. :::.:::..:. . : ::.:: . .: : .. : :..
CCDS54 ECVNNTVCDSHGFCDNTAGSFRCLCYQGFQAPQDGQGCVDVNECELLSGVCGEAFCENVE
870 880 890 900 910 920
390 400 410 420 430
pF1KE1 GSYECVCPPGRRLHWNGKDCVETGKCLSRAKTSPRAQLSCSKAGGVESCFLSCPAHTL--
::. ::: : . ::.: ::..:. .... : : :. . .:
CCDS54 GSFLCVCADE-----NQEYSPMTGQCRSRTSTDLDVDVDQPKEEKKE-CYYNLNDASLCD
930 940 950 960 970 980
440 450 460 470
pF1KE1 --FVPD--------------SENSYVLSCGVPG--------PQGKALQKRNGTSS-GLGP
..:. ..: .. : : : :.::.. . .:: . :
CCDS54 NVLAPNVTKQECCCTSGVGWGDNCEIFPCPVLGTAEFTEMCPKGKGFVPAGESSSEAGGE
990 1000 1010 1020 1030 1040
480 490 500 510 520 530
pF1KE1 SCSDAPTTPIKQKARFKIRDAKC-HLRPHSQARAKE-TARQPLLDHCHVTFVTLKCDSSK
. .:: . . : .. : . :: . :. : .:. .: : .:.. .
CCDS54 NYKDADECLLFGQEICK--NGFCLNTRPGYECYCKQGTYYDPVKLQC---FDMDECQDPS
1050 1060 1070 1080 1090
540 550 560 570 580 590
pF1KE1 KRRRGRKSPSKEVSHITAEFEIETKMEEASDTCEADCLRKRAEQSLQAAIKTLRKSIGRQ
. : . . . .. . :. : :.: ::.. : . ... .
CCDS54 SCIDG------QCVNTEGSYNCFCTHPMVLDASEKRCIRP-AESNEQIEETDVYQDLCWE
1100 1110 1120 1130 1140
600 610 620 630 640 650
pF1KE1 QFYVQVSGTEYEVAQRPAKALEGQGACGAGQVLQDSKCVACGPGTHFGGELGQCVSCMPG
.. . :: : .:: : :. :. : : : .: ::. : :
CCDS54 HL-----SDEY-VCSRP---LVGK------QTTYTECC--CLYGEAWG---MQCALC-PL
1150 1160 1170 1180
660 670 680 690 700
pF1KE1 TYQDMEGQLSCTPCPSSDGLGLPGARN-VSECGGQCSP---GFFSAD----GFKPCQACP
.: .:: : : : .:. . . . : .: .: : .:. ::
CCDS54 KDSDDYAQLCNIPVT---GRRQPYGRDALVDFSEQYTPEADPYFIQDRFLNSFEELQAEE
1190 1200 1210 1220 1230 1240
710 720 730 740 750 760
pF1KE1 VGTYQPEPGRTGCFPCGGGLLTKHEGTTSFQDCEAKVHCSPGHHYNTTTHRCIRCPVGTY
: . :: .: . .:: : :. : :.: .:. :.
CCDS54 CGILN------GCE--NGRCVRVQEGYT----CD----CFDGYHLDTAKMTCVDV-----
1250 1260 1270 1280
770 780 790 800 810
pF1KE1 QPEFGQNHCITCPGNTSTDFDGSTNVTHCKNQHCGGELGDYT-----GYIES--PNYPGD
:.: : . .. .. ::: .: . :.: ::. : :::
CCDS54 ------NEC---------D-ELNNRMSLCKNAKCINTDGSYKCLCLPGYVPSDKPNYCTP
1290 1300 1310 1320
820 830 840 850 860 870
pF1KE1 YPANAECVWHIAPPPKRRILIVVPEIFLPIEDECGDVLVMRKSASPTSITTYETCQTYER
CCDS54 LNTALNLEKDSDLE
1330 1340
988 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 02:41:35 2016 done: Sat Nov 5 02:41:36 2016
Total Scan time: 3.950 Total Display time: 0.320
Function used was FASTA [36.3.4 Apr, 2011]