FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5504, 420 aa 1>>>pF1KE5504 420 - 420 aa - 420 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7695+/-0.000702; mu= 14.7726+/- 0.042 mean_var=72.5661+/-14.735, 0's: 0 Z-trim(110.5): 18 B-trim: 0 in 0/50 Lambda= 0.150559 statistics sampled from 11611 (11628) to 11611 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.723), E-opt: 0.2 (0.357), width: 16 Scan time: 2.590 The best scores are: opt bits E(32554) CCDS12794.1 NAPSA gene_id:9476|Hs108|chr19 ( 420) 2892 637.1 9.1e-183 CCDS73013.1 CTSE gene_id:1510|Hs108|chr1 ( 396) 1168 262.7 4.6e-70 CCDS30981.1 REN gene_id:5972|Hs108|chr1 ( 406) 1048 236.6 3.3e-62 CCDS8001.1 PGA5 gene_id:5222|Hs108|chr11 ( 388) 997 225.5 6.9e-59 CCDS31574.1 PGA3 gene_id:643834|Hs108|chr11 ( 388) 993 224.6 1.3e-58 CCDS31575.1 PGA4 gene_id:643847|Hs108|chr11 ( 388) 992 224.4 1.5e-58 CCDS4859.1 PGC gene_id:5225|Hs108|chr6 ( 388) 902 204.9 1.1e-52 CCDS7725.1 CTSD gene_id:1509|Hs108|chr11 ( 412) 901 204.7 1.4e-52 CCDS73012.1 CTSE gene_id:1510|Hs108|chr1 ( 363) 728 167.1 2.5e-41 CCDS55000.1 PGC gene_id:5225|Hs108|chr6 ( 315) 537 125.6 6.9e-29 CCDS13669.1 BACE2 gene_id:25825|Hs108|chr21 ( 468) 301 74.4 2.6e-13 CCDS13670.1 BACE2 gene_id:25825|Hs108|chr21 ( 396) 298 73.7 3.6e-13 CCDS13668.1 BACE2 gene_id:25825|Hs108|chr21 ( 518) 298 73.7 4.5e-13 >>CCDS12794.1 NAPSA gene_id:9476|Hs108|chr19 (420 aa) initn: 2892 init1: 2892 opt: 2892 Z-score: 3394.7 bits: 637.1 E(32554): 9.1e-183 Smith-Waterman score: 2892; 99.8% identity (99.8% similar) in 420 aa overlap (1-420:1-420) 10 20 30 40 50 60 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLNLLRGWREPAELPKLGAPS ::::::::::::::::::::::::::::::::::::::: :::::::::::::::::::: CCDS12 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWREPAELPKLGAPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 PGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSVPCWLHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSVPCWLHH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 RFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALWEPSLVFAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALWEPSLVFAF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 AHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDGGELVLGGSDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDGGELVLGGSDP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 AHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLITGPTEEIRALH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLITGPTEEIRALH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 AAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNGVRLCLSGFQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNGVRLCLSGFQA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 LDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGWGETAQAQFPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGWGETAQAQFPG 370 380 390 400 410 420 >>CCDS73013.1 CTSE gene_id:1510|Hs108|chr1 (396 aa) initn: 1165 init1: 640 opt: 1168 Z-score: 1371.3 bits: 262.7 E(32554): 4.6e-70 Smith-Waterman score: 1168; 45.1% identity (71.3% similar) in 397 aa overlap (10-401:5-394) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTL----NLLRGWREPA-ELPK ::::: ::.. . ..: :.::.: .. : .: . :. .. . CCDS73 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKLRARSQLSEFWKSHNLDMIQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSVP . :. :: :: :..::: :..:.::::::: :::::::::::: : : CCDS73 FTESCSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCT--SPA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 CWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALWEPS : : ::.:. ::... : .:.:::::: ..::.. :.... :. .. :::.. ::. CCDS73 CKTHSRFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSVEGLTVVGQQFGESVTEPG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 LVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDGGELVL .:. :.::::::::.: :.: :: : .: .. :.:.: :.:: :.. .:: :.::.. CCDS73 QTFVDAEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGGAGSELIF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 GGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLITGPTEE :: : .:. :..:::: ::::: .. ..:: . .:..:: ::.::::::::::... CCDS73 GGYDHSHFSGSLNWVPVTKQAYWQIALDNIQVGGTVMFCSEGCQAIVDTGTSLITGPSDK 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 IRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNGVRLCL :. :. :::. :. ::: . :... .: :.: ..:: ..:. :.. .:...: CCDS73 IKQLQNAIGAAPV-DGEYAVECANLNVMPDVTFTINGVPYTLSPTAYTLLDFVDGMQFCS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 SGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGWGETAQ ::::.::. :::::.:::::::. . .:::::. ::::: : CCDS73 SGFQGLDIHPPAGPLWILGDVFIRQFYSVFDRGN----NRVGLAPAVP 360 370 380 390 420 pF1KE5 AQFPG >>CCDS30981.1 REN gene_id:5972|Hs108|chr1 (406 aa) initn: 470 init1: 470 opt: 1048 Z-score: 1230.3 bits: 236.6 E(32554): 3.3e-62 Smith-Waterman score: 1048; 42.9% identity (68.6% similar) in 382 aa overlap (26-402:36-406) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLNLLR-G--WREPAE : :.: : . .: ... : : : .: . CCDS30 RMPRWGLLLLLWGSCTFGLPTDTTTFKRIFLKRMPSIRESLKERGVDMARLGPEWSQPMK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFF :: . . : :.:: :.::.::::.:::::.: :.:::::::.:::: .: . CCDS30 RLTLGNTTSS-----VILTNYMDTQYYGEIGIGTPPQTFKVVFDTGSSNVWVPSSKCSRL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 SVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALW . : :. :: . :::.. :::.....:.:: :.:.::.: .:.::: .. .:::. CCDS30 YTACVYHKLFDASDSSSYKHNGTELTLRYSTGTVSGFLSQDIITVGGIT-VTQMFGEVTE 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 EPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPD--G :.: : .:.:::..:.:: .. : : .: .. ::.: . ::::: ::: :. . : CCDS30 MPALPFMLAEFDGVVGMGFIEQAIGRVTPIFDNIISQGVLKEDVFSFYYNRDSENSQSLG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 GELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLIT :..::::::: :: . .. . . :::.:. :.:: . :: :: :..:::.: :. CCDS30 GQIVLGGSDPQHYEGNFHYINLIKTGVWQIQMKGVSVGSSTLLCEDGCLALVDTGASYIS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNG : : :. : :.:. : .:.. :.: : :: .:: ::: ..::. :::.: . .. CCDS30 GSTSSIEKLMEALGAKKRLF-DYVVKCNEGPTLPDISFHLGGKEYTLTSADYVFQESYSS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 VRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGW .:: ...:.:.:::.:: : :: .:. . . ::: . :.:.: :: CCDS30 KKLCTLAIHAMDIPPPTGPTWALGATFIRKFYTEFDR----RNNRIGFALAR 360 370 380 390 400 420 pF1KE5 GETAQAQFPG >>CCDS8001.1 PGA5 gene_id:5222|Hs108|chr11 (388 aa) initn: 933 init1: 291 opt: 997 Z-score: 1170.7 bits: 225.5 E(32554): 6.9e-59 Smith-Waterman score: 1002; 41.9% identity (67.2% similar) in 399 aa overlap (11-399:4-385) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLN---LLRGWRE-----PAE :::: :. . : . ..:: : . ::::. ::. . . ::. CCDS80 MKWLLLLGLVAL--SECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 --LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCH .:. ::. :. :: :: :..::: ::.::: :.:::.:::::::::::: : CCDS80 KYFPQWEAPTLVDEQ---PLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS 60 70 80 90 100 120 130 140 150 160 170 pF1KE5 FFSVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEA :. : :.::.:. ::..:... .: :::: . :::. : . .:::. .. ::: . CCDS80 --SLACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE5 LWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDG ::. . .: :::::::..: .: :. : .: . .:::... .:: ::. : . .: CCDS80 ETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSAD--DKSG 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE5 GELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLIT . ...:: : ..: :..::::: .:::: .. . .. ::.:: ::.::::::.: CCDS80 SVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGETIACAEGCQAIVDTGTSLLT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 GPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNG ::: : ... ::. :.... :: : .:: . : ..:: . . :..:. . CCDS80 GPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGS- 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 VRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGW :.::::...:: .: .:::::::. : .::::.. .:::: CCDS80 ---CISGFQGMNVPTESGELWILGDVFIRQYFTVFDRAN----NQVGLAPVA 350 360 370 380 420 pF1KE5 GETAQAQFPG >>CCDS31574.1 PGA3 gene_id:643834|Hs108|chr11 (388 aa) initn: 929 init1: 292 opt: 993 Z-score: 1166.0 bits: 224.6 E(32554): 1.3e-58 Smith-Waterman score: 998; 41.6% identity (67.2% similar) in 399 aa overlap (11-399:4-385) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLN---LLRGWRE-----PAE :::: :. . : . ..:: : . ::::. ::. . . ::. CCDS31 MKWLLLLGLVAL--SECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 --LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCH .:. ::. :. :: :: :..::: ::.::: :.:::.:::::::::::: : CCDS31 KYFPQWKAPTLVDEQ---PLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS 60 70 80 90 100 120 130 140 150 160 170 pF1KE5 FFSVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEA :. : :.::.:. ::..:... .: :::: . :::. : . .:::. .. ::: . CCDS31 --SLACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE5 LWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDG ::. . .: :::::::..: .: :. : .: . .:::... .:: ::. : . .: CCDS31 ETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQ--SG 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE5 GELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLIT . ...:: : ..: :..::::: .:::: .. . .. ::.:: ::.::::::.: CCDS31 SVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 GPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNG ::: : ... ::. :.... :: : .:: . : ..:: . . :..:. . CCDS31 GPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGS- 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 VRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGW :.::::....: .: .:::::::. : .::::.. .:::: CCDS31 ---CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRAN----NQVGLAPVA 350 360 370 380 420 pF1KE5 GETAQAQFPG >>CCDS31575.1 PGA4 gene_id:643847|Hs108|chr11 (388 aa) initn: 929 init1: 292 opt: 992 Z-score: 1164.8 bits: 224.4 E(32554): 1.5e-58 Smith-Waterman score: 997; 41.6% identity (67.2% similar) in 399 aa overlap (11-399:4-385) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLN---LLRGWRE-----PAE :::: :. . : . ..:: : . ::::. ::. . . ::. CCDS31 MKWLLLLGLVAL--SECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 --LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCH .:. ::. :. :: :: :..::: ::.::: :.:::.:::::::::::: : CCDS31 KYFPQWEAPTLVDEQ---PLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS 60 70 80 90 100 120 130 140 150 160 170 pF1KE5 FFSVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEA :. : :.::.:. ::..:... .: :::: . :::. : . .:::. .. ::: . CCDS31 --SLACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE5 LWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDG ::. . .: :::::::..: .: :. : .: . .:::... .:: ::. : . .: CCDS31 ETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQ--SG 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE5 GELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLIT . ...:: : ..: :..::::: .:::: .. . .. ::.:: ::.::::::.: CCDS31 SVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 GPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNG ::: : ... ::. :.... :: : .:: . : ..:: . . :..:. . CCDS31 GPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGS- 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 VRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGW :.::::....: .: .:::::::. : .::::.. .:::: CCDS31 ---CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRAN----NQVGLAPVA 350 360 370 380 420 pF1KE5 GETAQAQFPG >>CCDS4859.1 PGC gene_id:5225|Hs108|chr6 (388 aa) initn: 802 init1: 436 opt: 902 Z-score: 1059.2 bits: 204.9 E(32554): 1.1e-52 Smith-Waterman score: 902; 39.4% identity (64.9% similar) in 388 aa overlap (24-401:16-387) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLN-------LLRGWR-EPAE :.....::.. . :.:.. .:: . .:: CCDS48 MKWMVVVLVCLQLLEAAVVKVPLKKFKSIRETMKEKGLLGEFLRTHKYDPAW 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFF ..: : .:. : :. :::::..::::::: : :::::::::::: :. CCDS48 KYRFGDLSVTYEPM-----AYMDAAYFGEISIGTPPQNFLVLFDTGSSNLWVPSVYCQ-- 60 70 80 90 100 120 130 140 150 160 170 pF1KE5 SVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALW : : : ::.:. ::....:: :..:::.: . :... : ::. .:. . :: . CCDS48 SQACTSHSRFNPSESSTYSTNGQTFSLQYGSGSLTGFFGYDTLTVQSIQVPNQEFGLSEN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE5 EPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDGGE ::. :..:.::::.::..: :::. . :. .:..: : .:::: ::. . . .:: CCDS48 EPGTNFVYAQFDGIMGLAYPALSVDEATTAMQGMVQEGALTSPVFSVYLS-NQQGSSGGA 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE5 LVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLT-LCAKGCAAILDTGTSLITG .:.:: : . : . ..::: :::: .:. .: . :..:: ::.::::::.: CCDS48 VVFGGVDSSLYTGQIYWAPVTQELYWQIGIEEFLIGGQASGWCSEGCQAIVDTGTSLLTV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 PTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNGV : . . :: : :. :.... :. : .::...:...:: : : .:.. . :: CCDS48 PQQYMSALLQATGAQEDEYGQFLVNCNSIQNLPSLTFIINGVEFPLPPSSYIL--SNNGY 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 RLCLSGFQALDVPPPAG-PFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGW : : . . : :.:::::::: .: .:.: :. :::.: : CCDS48 --CTVGVEPTYLSSQNGQPLWILGDVFLRSYYSVYDLGN----NRVGFATAA 350 360 370 380 420 pF1KE5 GETAQAQFPG >>CCDS7725.1 CTSD gene_id:1509|Hs108|chr11 (412 aa) initn: 1327 init1: 888 opt: 901 Z-score: 1057.6 bits: 204.7 E(32554): 1.4e-52 Smith-Waterman score: 1330; 47.1% identity (73.9% similar) in 418 aa overlap (1-401:1-409) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLNLLRGWRE------PAELP :.: :: :: : : . :..: :.:::::. :::.. . : : :. CCDS77 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV . ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:..... CCDS77 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI 60 70 80 90 100 110 120 130 140 150 160 pF1KE5 PCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA ::.::... ::.. :::.: :.::.: ..: ::.: ... ::.: CCDS77 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE5 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR .:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.: CCDS77 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE5 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD ::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.: CCDS77 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE5 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV :::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::. CCDS77 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE5 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART ..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.: CCDS77 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR 360 370 380 390 400 410 410 420 pF1KE5 RGADLGWGETAQAQFPG CCDS77 L >>CCDS73012.1 CTSE gene_id:1510|Hs108|chr1 (363 aa) initn: 727 init1: 470 opt: 728 Z-score: 855.4 bits: 167.1 E(32554): 2.5e-41 Smith-Waterman score: 728; 43.5% identity (68.6% similar) in 271 aa overlap (10-274:5-273) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTL----NLLRGWREPA-ELPK ::::: ::.. . ..: :.::.: .. : .: . :. .. . CCDS73 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKLRARSQLSEFWKSHNLDMIQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSVP . :. :: :: :..::: :..:.::::::: :::::::::::: : : CCDS73 FTESCSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCT--SPA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 CWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALWEPS : : ::.:. ::... : .:.:::::: ..::.. :.... :. .. :::.. ::. CCDS73 CKTHSRFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSVEGLTVVGQQFGESVTEPG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 LVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDGGELVL .:. :.::::::::.: :.: :: : .: .. :.:.: :.:: :.. .:: :.::.. CCDS73 QTFVDAEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGGAGSELIF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 GGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVG-PGLTLCAKGCAAILDTGTSLITGPTE :: : .:. :..:::: ::::: .. . . : :: : CCDS73 GGYDHSHFSGSLNWVPVTKQAYWQIALDNMLWSVPTLTSCRMSPSPLTESPIPSAQLPTP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 EIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNGVRLC CCDS73 YWTSWMECSSAAVAFKDLTSTLQLGPSGSWGMSSFDSFTQSLTVGITVWDWPQQSPKEGP 300 310 320 330 340 350 >>CCDS55000.1 PGC gene_id:5225|Hs108|chr6 (315 aa) initn: 507 init1: 292 opt: 537 Z-score: 632.1 bits: 125.6 E(32554): 6.9e-29 Smith-Waterman score: 537; 37.4% identity (62.6% similar) in 265 aa overlap (24-276:16-269) 10 20 30 40 50 pF1KE5 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRTLN-------LLRGWR-EPAE :.....::.. . :.:.. .:: . .:: CCDS55 MKWMVVVLVCLQLLEAAVVKVPLKKFKSIRETMKEKGLLGEFLRTHKYDPAW 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFF ..: : .:. : :. :::::..::::::: : :::::::::::: :. CCDS55 KYRFGDLSVTYEPM-----AYMDAAYFGEISIGTPPQNFLVLFDTGSSNLWVPSVYCQ-- 60 70 80 90 100 120 130 140 150 160 170 pF1KE5 SVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEALW : : : ::.:. ::....:: :..:::.: . :... : ::. .:. . :: . CCDS55 SQACTSHSRFNPSESSTYSTNGQTFSLQYGSGSLTGFFGYDTLTVQSIQVPNQEFGLSEN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE5 EPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDG-G ::. :..:.::::.::..: :::. . :. .:..: : .:::: ::. : .: : CCDS55 EPGTNFVYAQFDGIMGLAYPALSVDEATTAMQGMVQEGALTSPVFSVYLSNLVLESSGLG 170 180 190 200 210 220 240 250 260 270 280 pF1KE5 ELVLGGSDPAHYIPPLTFVPVT---VPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSL :. :.. :: . . . . :.: .:. : .: : CCDS55 PLLT----PSRAAPPSSTLQLPEKPLEQTWNILTPFTKTLPVSNLSRKVTSWAGVGIPVT 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE5 ITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTR CCDS55 CLPEAGSGGERRAECGLGVPTTRGPPRSQHHSGA 290 300 310 420 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 07:41:06 2016 done: Tue Nov 8 07:41:07 2016 Total Scan time: 2.590 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]