FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3522, 712 aa 1>>>pF1KE3522 712 - 712 aa - 712 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5649+/-0.00101; mu= 13.4012+/- 0.060 mean_var=86.2483+/-17.207, 0's: 0 Z-trim(106.3): 54 B-trim: 509 in 1/48 Lambda= 0.138102 statistics sampled from 8840 (8894) to 8840 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.273), width: 16 Scan time: 3.880 The best scores are: opt bits E(32554) CCDS9053.1 USP44 gene_id:84101|Hs108|chr12 ( 712) 4847 976.1 0 CCDS69111.1 USP49 gene_id:25862|Hs108|chr6 ( 688) 2010 410.9 3.3e-114 CCDS4861.1 USP49 gene_id:25862|Hs108|chr6 ( 640) 1796 368.2 2.1e-101 CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 ( 476) 602 130.3 6.7e-30 CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 ( 520) 602 130.3 7.2e-30 CCDS14370.1 USP51 gene_id:158880|Hs108|chrX ( 711) 478 105.6 2.6e-22 CCDS42285.1 USP22 gene_id:23326|Hs108|chr17 ( 525) 315 73.1 1.2e-12 CCDS65260.1 USP27X gene_id:389856|Hs108|chrX ( 438) 310 72.1 2e-12 >>CCDS9053.1 USP44 gene_id:84101|Hs108|chr12 (712 aa) initn: 4847 init1: 4847 opt: 4847 Z-score: 5218.4 bits: 976.1 E(32554): 0 Smith-Waterman score: 4847; 99.9% identity (100.0% similar) in 712 aa overlap (1-712:1-712) 10 20 30 40 50 60 pF1KE3 MLAMDTCKHVGQLQLAQDHSSLNPQKWHCVDCNTTESIWACLSCSHVACGRYIEEHALKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MLAMDTCKHVGQLQLAQDHSSLNPQKWHCVDCNTTESIWACLSCSHVACGRYIEEHALKH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 FQESSHPVALEVNEMYVFCYLCDDYVLNDNATGDLKLLRRTLSAIKSQNYHCTTRSGRFL ::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::: CCDS90 FQESSHPVALEVNEMYVFCYLCDDYVLNDNTTGDLKLLRRTLSAIKSQNYHCTTRSGRFL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 RSMGTGDDSYFLHDGAQSLLQSEDQLYTALWHRRRILMGKIFRTWFEQSPIGRKKQEEPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RSMGTGDDSYFLHDGAQSLLQSEDQLYTALWHRRRILMGKIFRTWFEQSPIGRKKQEEPF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 QEKIVVKREVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEIVSVQVPAQTPASP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QEKIVVKREVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEIVSVQVPAQTPASP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 AKDKVLSTSENEISQKVSDSSVKRRPIVTPGVTGLRNLGNTCYMNSVLQVLSHLLIFRQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 AKDKVLSTSENEISQKVSDSSVKRRPIVTPGVTGLRNLGNTCYMNSVLQVLSHLLIFRQC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 FLKLDLNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQSSLSSGLSGGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 FLKLDLNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQSSLSSGLSGGA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 SKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSVWRLIPAFRGYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSVWRLIPAFRGYA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 QQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNVVNNIFHGQLLSQVTCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNVVNNIFHGQLLSQVTCL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 ACDNKSNTIEPFWDLSLEFPERYQCSGKDIASQPCLVTEMLAKFTETEALEGKIYVCDQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 ACDNKSNTIEPFWDLSLEFPERYQCSGKDIASQPCLVTEMLAKFTETEALEGKIYVCDQC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 NSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLKRFRWSGRNNREKIGVHVGFEEILNM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 NSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLKRFRWSGRNNREKIGVHVGFEEILNM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 EPYCCRETLKSLRPECFIYDLSAVVMHHGKGFGSGHYTAYCYNSEGGFWVHCNDSKLSMC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 EPYCCRETLKSLRPECFIYDLSAVVMHHGKGFGSGHYTAYCYNSEGGFWVHCNDSKLSMC 610 620 630 640 650 660 670 680 690 700 710 pF1KE3 TMDEVCKAQAYILFYTQRVTENGHSKLLPPELLLGSQHPNEDADTSSNEILS :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 TMDEVCKAQAYILFYTQRVTENGHSKLLPPELLLGSQHPNEDADTSSNEILS 670 680 690 700 710 >>CCDS69111.1 USP49 gene_id:25862|Hs108|chr6 (688 aa) initn: 2753 init1: 958 opt: 2010 Z-score: 2163.8 bits: 410.9 E(32554): 3.3e-114 Smith-Waterman score: 2796; 59.5% identity (79.1% similar) in 709 aa overlap (4-702:1-680) 10 20 30 40 50 60 pF1KE3 MLAMDTCKHVGQLQLAQDHSSLNPQKWHCVDCNTTESIWACLSCSHVACGRYIEEHALKH :: :::::.:.:::::: :::::: :..: ::::.::::.:::::::::::.::::: CCDS69 MDRCKHVGRLRLAQDHSILNPQKWCCLECATTESVWACLKCSHVACGRYIEDHALKH 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 FQESSHPVALEVNEMYVFCYLCDDYVLNDNATGDLKLLRRTLSAIKSQNYHCTTRSGRFL :.:..::.:.:: ..::::::: ::::::: ::::::: .: :...:. .: :: : CCDS69 FEETGHPLAMEVRDLYVFCYLCKDYVLNDNPEGDLKLLRSSLLAVRGQKQDTPVRRGRTL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 RSMGTGDDSYFLHDGAQSLLQSEDQLYTALWHRRRILMGKIFRTWFEQSPIGRKKQEEPF :::..:.: . : :.. :. ::::.::. :... .: :::.: :. : :. CCDS69 RSMASGEDVVL----PQRAPQGQPQMLTALWYRRQRLLARTLRLWFEKSSRGQAKLEQRR 120 130 140 150 160 170 190 200 210 220 230 pF1KE3 QEKIVVKR--EVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEIVSVQVPAQTPA ::. . .. :...::.:.. .. :: : ::::: :: ...: .. CCDS69 QEEALERKKEEARRRRREVKRRLLEELASTPPRKSARLL------------LHTPRDAGP 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 SPAKDKVLSTSENEISQKVSDSSVK--RRPIVTPGVTGLRNLGNTCYMNSVLQVLSHLLI . .. .: : :..: ...: :.: ..:::::::::::::::::.::::::: CCDS69 AASRPAALPT-----SRRVPAATLKLRRQPAMAPGVTGLRNLGNTCYMNSILQVLSHLQK 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 FRQCFLKLD---LNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQSSLS ::.:::.:: .. . ... ::. .: :.. . ... ..: . .: :.. CCDS69 FRECFLNLDPSKTEHLFPKATNGKTQLSGKP--TNSSATELS--LRNDRAEACEREGFC- 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE3 SGLSGGASKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSVWRLI .: :: .:..:::: :::.:..::::.::::::.:::::::::::::::::::: :: CCDS69 --WNGRASISRSLELIQNKEPSSKHISLCRELHTLFRVMWSGKWALVSPFAMLHSVWSLI 340 350 360 370 380 420 430 440 450 460 470 pF1KE3 PAFRGYAQQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNVVNNIFHGQL :::::: :::::::::::: :.:.:::. ::. ::: ::::: ::::.:::.:::::: CCDS69 PAFRGYDQQDAQEFLCELLHKVQQELESEGTTRRILIPFSQRKLTKQVLKVVNTIFHGQL 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE3 LSQVTCLACDNKSNTIEPFWDLSLEFPERYQCSGKD---IASQPCLVTEMLAKFTETEAL ::::::..:. :::::::::::::::::::.: : . . ::.::::::::::::: CCDS69 LSQVTCISCNYKSNTIEPFWDLSLEFPERYHCIEKGFVPLNQTECLLTEMLAKFTETEAL 450 460 470 480 490 500 540 550 560 570 580 590 pF1KE3 EGKIYVCDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLKRFRWSGRNNREKIGV ::.::.:::::::::. . ::.::.::.::::: .::::::::::::::::::.:::::: CCDS69 EGRIYACDQCNSKRRKSNPKPLVLSEARKQLMIYRLPQVLRLHLKRFRWSGRNHREKIGV 510 520 530 540 550 560 600 610 620 630 640 650 pF1KE3 HVGFEEILNMEPYCCRETLKSLRPECFIYDLSAVVMHHGKGFGSGHYTAYCYNSEGGFWV :: :...:.:::::::. :.:: : : :::::::::::::::::::::::::.:::::: CCDS69 HVVFDQVLTMEPYCCRDMLSSLDKETFAYDLSAVVMHHGKGFGSGHYTAYCYNTEGGFWV 570 580 590 600 610 620 660 670 680 690 700 710 pF1KE3 HCNDSKLSMCTMDEVCKAQAYILFYTQRVTENGHSKLLPPELLLGSQHPNEDADTSSNEI :::::::..:...::::.:::::::::: : .:.... .: : :.: CCDS69 HCNDSKLNVCSVEEVCKTQAYILFYTQR-TVQGNARISETHLQAQVQSSNNDEGRPQTFS 630 640 650 660 670 680 pF1KE3 LS >>CCDS4861.1 USP49 gene_id:25862|Hs108|chr6 (640 aa) initn: 2554 init1: 803 opt: 1796 Z-score: 1933.9 bits: 368.2 E(32554): 2.1e-101 Smith-Waterman score: 2582; 59.8% identity (79.1% similar) in 654 aa overlap (4-647:1-626) 10 20 30 40 50 60 pF1KE3 MLAMDTCKHVGQLQLAQDHSSLNPQKWHCVDCNTTESIWACLSCSHVACGRYIEEHALKH :: :::::.:.:::::: :::::: :..: ::::.::::.:::::::::::.::::: CCDS48 MDRCKHVGRLRLAQDHSILNPQKWCCLECATTESVWACLKCSHVACGRYIEDHALKH 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 FQESSHPVALEVNEMYVFCYLCDDYVLNDNATGDLKLLRRTLSAIKSQNYHCTTRSGRFL :.:..::.:.:: ..::::::: ::::::: ::::::: .: :...:. .: :: : CCDS48 FEETGHPLAMEVRDLYVFCYLCKDYVLNDNPEGDLKLLRSSLLAVRGQKQDTPVRRGRTL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 RSMGTGDDSYFLHDGAQSLLQSEDQLYTALWHRRRILMGKIFRTWFEQSPIGRKKQEEPF :::..:.: . : :.. :. ::::.::. :... .: :::.: :. : :. CCDS48 RSMASGEDVVL----PQRAPQGQPQMLTALWYRRQRLLARTLRLWFEKSSRGQAKLEQRR 120 130 140 150 160 170 190 200 210 220 230 pF1KE3 QEKIVVKR--EVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEIVSVQVPAQTPA ::. . .. :...::.:.. .. :: : ::::: :: ...: .. CCDS48 QEEALERKKEEARRRRREVKRRLLEELASTPPRKSARLL------------LHTPRDAGP 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 SPAKDKVLSTSENEISQKVSDSSVK--RRPIVTPGVTGLRNLGNTCYMNSVLQVLSHLLI . .. .: : :..: ...: :.: ..:::::::::::::::::.::::::: CCDS48 AASRPAALPT-----SRRVPAATLKLRRQPAMAPGVTGLRNLGNTCYMNSILQVLSHLQK 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 FRQCFLKLD---LNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQSSLS ::.:::.:: .. . ... ::. .: :.. . ... ..: . .: :.. CCDS48 FRECFLNLDPSKTEHLFPKATNGKTQLSGKP--TNSSATELS--LRNDRAEACEREGFC- 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE3 SGLSGGASKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSVWRLI .: :: .:..:::: :::.:..::::.::::::.:::::::::::::::::::: :: CCDS48 --WNGRASISRSLELIQNKEPSSKHISLCRELHTLFRVMWSGKWALVSPFAMLHSVWSLI 340 350 360 370 380 420 430 440 450 460 470 pF1KE3 PAFRGYAQQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNVVNNIFHGQL :::::: :::::::::::: :.:.:::. ::. ::: ::::: ::::.:::.:::::: CCDS48 PAFRGYDQQDAQEFLCELLHKVQQELESEGTTRRILIPFSQRKLTKQVLKVVNTIFHGQL 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE3 LSQVTCLACDNKSNTIEPFWDLSLEFPERYQCSGKD---IASQPCLVTEMLAKFTETEAL ::::::..:. :::::::::::::::::::.: : . . ::.::::::::::::: CCDS48 LSQVTCISCNYKSNTIEPFWDLSLEFPERYHCIEKGFVPLNQTECLLTEMLAKFTETEAL 450 460 470 480 490 500 540 550 560 570 580 590 pF1KE3 EGKIYVCDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLKRFRWSGRNNREKIGV ::.::.:::::::::. . ::.::.::.::::: .::::::::::::::::::.:::::: CCDS48 EGRIYACDQCNSKRRKSNPKPLVLSEARKQLMIYRLPQVLRLHLKRFRWSGRNHREKIGV 510 520 530 540 550 560 600 610 620 630 640 650 pF1KE3 HVGFEEILNMEPYCCRETLKSLRPECFIYDLSAVVMHHGKGFGSGHYTAYCYNSEGGFWV :: :...:.:::::::. :.:: : : :::::::::::::::::::::::::.::: CCDS48 HVVFDQVLTMEPYCCRDMLSSLDKETFAYDLSAVVMHHGKGFGSGHYTAYCYNTEGGACA 570 580 590 600 610 620 660 670 680 690 700 710 pF1KE3 HCNDSKLSMCTMDEVCKAQAYILFYTQRVTENGHSKLLPPELLLGSQHPNEDADTSSNEI CCDS48 LLCGVGDTERG 630 640 >>CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 (476 aa) initn: 650 init1: 191 opt: 602 Z-score: 650.3 bits: 130.3 E(32554): 6.7e-30 Smith-Waterman score: 710; 32.2% identity (58.5% similar) in 482 aa overlap (218-687:65-476) 190 200 210 220 230 240 pF1KE3 REVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEIVSVQVPAQTPASPAKDKVLS ::.:.. .. ... : : : :.: CCDS58 NKSPWVCLTCSSVHCGSYRCDDFVVNDTKLGLVQKVREHLQNLENSAFTADRHKKRKLLE 40 50 60 70 80 90 250 260 270 280 290 300 pF1KE3 TSE-NEISQKVSDSSVKRRPIVTPGVTGLRNLGNTCYMNSVLQVLSHLLIFRQCFLKLDL .: : ::. :. .. .::::::::::.::..:: ::.. : :..: CCDS58 NSTLNSKLLKVNGST------TAICATGLRNLGNTCFMNAILQSLSNIEQF-CCYFK--- 100 110 120 130 140 310 320 330 340 350 360 pF1KE3 NQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQSSLSSGLSGGASKGRKM . : : : .: . ::. CCDS58 ---------------ELPAVE----------------------------LRNGKTAGRR- 150 160 370 380 390 400 410 420 pF1KE3 ELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSVWRLIPAFRGYAQQDAQE . . .. .:: .:.. . ..:.:. . :: .... ::...: :::: ::::.: CCDS58 -TYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPESLFYVVWKIMPNFRGYQQQDAHE 170 180 190 200 210 430 440 450 460 470 pF1KE3 FLCELLDKIQRELET--TGTSLPALIP------TSQRKLIKQVLNVVNNIFHGQLLSQVT :. :::... ::. .:.: :.. .:.. :. . .::. :: : : ..:. CCDS58 FMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNKCCINGASTVVTAIFGGILQNEVN 220 230 240 250 260 270 480 490 500 510 520 530 pF1KE3 CLACDNKSNTIEPFWDLSLEFPERYQCS-GKDIASQP-CLVTEMLAKFTETEAL-EGKIY :: : ..: ..:: ::::..: ... . .:. . : : . . : .::. : : : ..: CCDS58 CLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGPVCSLRDCLRSFTDLEELDETELY 280 290 300 310 320 330 540 550 560 570 580 590 pF1KE3 VCDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLKRFRWSGRNNREKIGVHVGFE .: .:..:.. . :.. : .::.:: ::::::.:.. :.:. ..: : CCDS58 MCHKCKKKQK-----------STKKFWIQKLPKVLCLHLKRFHWTAYL-RNKVDTYVEFP 340 350 360 370 380 600 610 620 630 640 650 pF1KE3 EILNMEPYCCRETLKSLRPECFIYDLSAVVMHHGKGFGSGHYTAYCYNSEGGFWVHCNDS . ... : .. :: .:::.:::.:::.: :::::::: .. : : : ::: CCDS58 -LRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAY--ATHEGRWFHFNDS 390 400 410 420 430 440 660 670 680 690 700 710 pF1KE3 KLSMCTMDEVCKAQAYILFYTQRVTENGHSKLLPPELLLGSQHPNEDADTSSNEILS ... . : ::.::::::... .. : .:: CCDS58 TVTLTDEETVVKAKAYILFYVEHQAKAGSDKL 450 460 470 >>CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 (520 aa) initn: 721 init1: 191 opt: 602 Z-score: 649.7 bits: 130.3 E(32554): 7.2e-30 Smith-Waterman score: 724; 27.0% identity (50.0% similar) in 712 aa overlap (7-687:3-520) 10 20 30 40 50 pF1KE3 MLAMDTCKHVGQ-LQLAQDHSSL---NPQKWHCVDCNTTESIWACLSCSHVACGRYIEEH : :... . .: : ... .:..: : : ...: :.::.:: : ::::.. : CCDS32 MECPHLSSSVCIAPDSAKFPNGSPSSWCCSVCRSNKSPWVCLTCSSVHCGRYVNGH 10 20 30 40 50 60 70 80 90 100 pF1KE3 ALKHFQESS----------------HPVALEVNEMYVFCYLCDDYVLNDNATGDLKLLRR : ::..... : : .. . . ..:: :::.:.::. : .. .:. CCDS32 AKKHYEDAQVPLTNHKKSEKQDKVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVRE 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE3 TLSAIKSQNYHCTTRSGRFLRSMGTGDDSYFLHDGAQSLLQSEDQLYTALWHRRRILMGK : :: :.. .:: :..: :. CCDS32 HL-----QNL--------------------------------ENSAFTADRHKKRKLL-- 120 130 170 180 190 200 210 220 pF1KE3 IFRTWFEQSPIGRKKQEEPFQEKIVVKREVKKRRQELEYQVKAELESMPPRKSLRLQGLA :.: .. : :...: CCDS32 ------ENSTLNSKL--------------------------------------LKVNG-- 140 150 230 240 250 260 270 280 pF1KE3 QSTIIEIVSVQVPAQTPASPAKDKVLSTSENEISQKVSDSSVKRRPIVTPGVTGLRNLGN : ... .:::::::: CCDS32 -------------------------------------STTAI--------CATGLRNLGN 160 290 300 310 320 330 340 pF1KE3 TCYMNSVLQVLSHLLIFRQCFLKLDLNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEK ::.::..:: ::.. : :..: . : : CCDS32 TCFMNAILQSLSNIEQF-CCYFK------------------ELPAVE------------- 170 180 190 350 360 370 380 390 400 pF1KE3 DTGFVCSRQSSLSSGLSGGASKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALV : .: . ::. . . .. .:: .:.. . ..:.:. . CCDS32 ---------------LRNGKTAGRRT--YHTRSQGDNNVSLVEEFRKTLCALWQGSQTAF 200 210 220 230 410 420 430 440 450 pF1KE3 SPFAMLHSVWRLIPAFRGYAQQDAQEFLCELLDKIQRELET--TGTSLPALIP------T :: .... ::...: :::: ::::.::. :::... ::. .:.: :.. . CCDS32 SPESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSA 240 250 260 270 280 290 460 470 480 490 500 510 pF1KE3 SQRKLIKQVLNVVNNIFHGQLLSQVTCLACDNKSNTIEPFWDLSLEFPERYQCS-GKDIA :.. :. . .::. :: : : ..:.:: : ..: ..:: ::::..: ... . .:. CCDS32 SNKCCINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQE 300 310 320 330 340 350 520 530 540 550 560 pF1KE3 SQP-CLVTEMLAKFTETEAL-EGKIYVCDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQV . : : . . : .::. : : : ..:.: .:..:.. . :.. : .::.: CCDS32 NGPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQK-----------STKKFWIQKLPKV 360 370 380 390 400 570 580 590 600 610 620 pF1KE3 LRLHLKRFRWSGRNNREKIGVHVGFEEILNMEPYCCRETLKSLRPECFIYDLSAVVMHHG : ::::::.:.. :.:. ..: : . ... : .. :: .:::.:::.::: CCDS32 LCLHLKRFHWTAYL-RNKVDTYVEFP-LRGLDMKCYLLEPENSGPESCLYDLAAVVVHHG 410 420 430 440 450 460 630 640 650 660 670 680 pF1KE3 KGFGSGHYTAYCYNSEGGFWVHCNDSKLSMCTMDEVCKAQAYILFYTQRVTENGHSKLLP .: :::::::: .. : : : ::: ... . : ::.::::::... .. : .:: CCDS32 SGVGSGHYTAYA--THEGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL 470 480 490 500 510 520 690 700 710 pF1KE3 PELLLGSQHPNEDADTSSNEILS >>CCDS14370.1 USP51 gene_id:158880|Hs108|chrX (711 aa) initn: 490 init1: 156 opt: 478 Z-score: 514.0 bits: 105.6 E(32554): 2.6e-22 Smith-Waterman score: 497; 28.4% identity (51.6% similar) in 510 aa overlap (198-681:290-709) 170 180 190 200 210 220 pF1KE3 QSPIGRKKQEEPFQEKIVVKREVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEI .: ..:.. . . .. : :: . CCDS14 EKHIHKHAETKQHHLAVDLYHGVIYCFMCKDYVYDKDIEQIAKETKEKILRLLTSTSTD- 260 270 280 290 300 310 230 240 250 260 270 280 pF1KE3 VSVQVPAQTPASPAKDKVLSTSENEISQKVSDSSVKRRP--IVTPGVTGLRNLGNTCYMN :: : : .: .:: . .: :. . ::: . : :. :: ::::::.:: CCDS14 VSHQ---QFMTSGFEDKQSTCETKEQEPKLVKPKKKRRKKSVYTVGLRGLINLGNTCFMN 320 330 340 350 360 370 290 300 310 320 330 340 pF1KE3 SVLQVLSHLLIFRQCFLKLDLNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFV ..:.:.:. .... :: :.: . : .. . . : .: CCDS14 CIVQALTHIPLLKDFFL------------SDKHK-C--------IMTSPSLC------LV 380 390 400 350 360 370 380 390 400 pF1KE3 CSRQSSLSSGLSGGASKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAM : :. .::..:.::. . :. . CCDS14 C-------------------------------------EMSSLFHAMYSGSRTPHIPYKL 410 420 430 410 420 430 440 450 460 pF1KE3 LHSVWRLIPAFRGYAQQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNVV :: .: . :: ::::.::: .:: ..:. . . . : :. .: : CCDS14 LHLIWIHAEHLAGYRQQDAHEFLIAILDVLHRHSKDDSGGQEANNPNCCNCIIDQ----- 440 450 460 470 480 470 480 490 500 510 pF1KE3 NNIFHGQLLSQVTCLACDNKSNTIEPFWDLSLEFP-----------ERYQCS-GKD--IA :: : : :.::: :: . :.::.: ::.::..: :: . . ..: : CCDS14 --IFTGGLQSDVTCQACHSVSTTIDPCWDISLDLPGSCATFDSQNPERADSTVSRDDHIP 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE3 SQPCLVTEMLAKFTETEALEGKIYV-CDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVL . : : :. : ::. : : .. . :..:.: . :. ::: . .:: : CCDS14 GIPSL-TDCLQWFTRPEHLGSSAKIKCNSCQSYQ-----------ESTKQLTMKKLPIVA 550 560 570 580 590 580 590 600 610 620 pF1KE3 RLHLKRFRWSGRNNREKIGVHVGFEEILNMEPY--CCRET-LKSLRP--ECFI----YDL .:::::. :.. :.::.. ..: :.: :. .:. .: .: .: :.: CCDS14 CFHLKRFEHVGKQ-RRKINTFISFPLELDMTPFLASTKESRMKEGQPPTDCVPNENKYSL 600 610 620 630 640 650 630 640 650 660 670 680 pF1KE3 SAVVMHHGKGFGSGHYTAYCYNSEGGFWVHCNDSKLSMCTMDEVCKAQAYILFYTQRVTE ::. ::: . :::::.. ... : :.:. .. :.... ...:.::: .. : CCDS14 FAVINHHGT-LESGHYTSFIRQQKDQ-WFSCDDAIITKATIEDLLYSEGYLLFYHKQGLE 660 670 680 690 700 690 700 710 pF1KE3 NGHSKLLPPELLLGSQHPNEDADTSSNEILS CCDS14 KD 710 >>CCDS42285.1 USP22 gene_id:23326|Hs108|chr17 (525 aa) initn: 451 init1: 138 opt: 315 Z-score: 340.6 bits: 73.1 E(32554): 1.2e-12 Smith-Waterman score: 469; 29.6% identity (50.2% similar) in 446 aa overlap (263-681:163-523) 240 250 260 270 280 pF1KE3 PAQTPASPAKDKVLSTSENEISQKVSDSSVKRRPIV---TPGVTGLRNLGNTCYMNSVLQ ::: :. : :. :: ::::::.:: ..: CCDS42 RKAWKMQGVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLINLGNTCFMNCIVQ 140 150 160 170 180 190 290 300 310 320 330 340 pF1KE3 VLSHLLIFRQCFLKLDLNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQ .:.: ..:. :: :.. : : : CCDS42 ALTHTPLLRDFFL------------SDRHR--------------------------CEMQ 200 210 350 360 370 380 390 400 pF1KE3 SSLSSGLSGGASKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSV : :.: . : :. .::: ..::. . :. .:: : CCDS42 S-----------------------PSSCLV--C-EMSSLFQEFYSGHRSPHIPYKLLHLV 220 230 240 410 420 430 440 450 460 pF1KE3 WRLIPAFRGYAQQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNVVNNIF : . :: ::::.::: :: ..:. . .. : :. .: : :: CCDS42 WTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNGKKANNPNHCNCIIDQ-------IF 250 260 270 280 290 300 470 480 490 500 510 pF1KE3 HGQLLSQVTCLACDNKSNTIEPFWDLSLEFP-------------ERYQCSGKDIASQPCL : : :.::: .: . :.::.::::.::..: : .:.. .: CCDS42 TGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNGESHVSGTTT 310 320 330 340 350 360 520 530 540 550 560 570 pF1KE3 VTEMLAKFTETEALEGKIYV-CDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLK .:. : .::. : : .. . :. :.: . :. ::: . .:: : .::: CCDS42 LTDCLRRFTRPEHLGSSAKIKCSGCHSYQ-----------ESTKQLTMKKLPIVACFHLK 370 380 390 400 410 580 590 600 610 620 pF1KE3 RFRWSGRNNREKIGVHVGFEEILNMEPYCC-----RETLKSLRPECFI-----YDLSAVV ::. :.. :.:: ..:.: :.: :. : . . .: . :.: ::: CCDS42 RFEHSAKL-RRKITTYVSFPLELDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVV 420 430 440 450 460 630 640 650 660 670 680 pF1KE3 MHHGKGFGSGHYTAYCYNSEGGFWVHCNDSKLSMCTMDEVCKAQAYILFYTQRVTENGHS :.: . :::::.. . . : .:.:. .. .. .: ...:.::: .. : CCDS42 NHQGT-LESGHYTSFIRQHKDQ-WFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE 470 480 490 500 510 520 690 700 710 pF1KE3 KLLPPELLLGSQHPNEDADTSSNEILS >>CCDS65260.1 USP27X gene_id:389856|Hs108|chrX (438 aa) initn: 446 init1: 133 opt: 310 Z-score: 336.5 bits: 72.1 E(32554): 2e-12 Smith-Waterman score: 458; 26.6% identity (50.0% similar) in 516 aa overlap (198-687:4-430) 170 180 190 200 210 220 pF1KE3 QSPIGRKKQEEPFQEKIVVKREVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEI .: ..:.. ... . : :: :. CCDS65 MCKDYVYDKDIEQIAKEEQGEALKLQASTSTEV 10 20 30 230 240 250 260 270 280 pF1KE3 VSVQVPAQTPASPAKDKVLSTSENEISQKVSDSSVKRRPIV---TPGVTGLRNLGNTCYM : ..:. : . :.. :. .. . .:: :. : :. :: ::::::.: CCDS65 SHQQC--SVPGLGEKFPTWETTKPEL--ELLGHNPRRRRITSSFTIGLRGLINLGNTCFM 40 50 60 70 80 290 300 310 320 330 340 pF1KE3 NSVLQVLSHLLIFRQCFLKLDLNQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGF : ..:.:.: :.:. :: :.. : :. : . . : . CCDS65 NCIVQALTHTPILRDFFL------------SDRHR-CEMP--------SPELC------L 90 100 110 120 350 360 370 380 390 400 pF1KE3 VCSRQSSLSSGLSGGASKGRKMELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFA :: :. .::. ..::. . :. CCDS65 VC-------------------------------------EMSSLFRELYSGNPSPHVPYK 130 140 410 420 430 440 450 460 pF1KE3 MLHSVWRLIPAFRGYAQQDAQEFLCELLDKIQRELETTGTSLPALIPTSQRKLIKQVLNV .:: :: . :: ::::.::: :: ..:. . .. : :. .: : CCDS65 LLHLVWIHARHLAGYRQQDAHEFLIAALDVLHRHCKGDDVGKAANNPNHCNCIIDQ---- 150 160 170 180 190 200 470 480 490 500 510 pF1KE3 VNNIFHGQLLSQVTCLACDNKSNTIEPFWDLSLEFP------------ERYQCSGKDIAS :: : : :.::: :: . :.::.: ::.::..: .. . .:.. CCDS65 ---IFTGGLQSDVTCQACHGVSTTIDPCWDISLDLPGSCTSFWPMSPGRESSVNGESHIP 210 220 230 240 250 520 530 540 550 560 570 pF1KE3 QPCLVTEMLAKFTETEALEGKIYV-CDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVLR .:. : .::. : : .. . : .:.: . :. ::: . .:: : CCDS65 GITTLTDCLRRFTRPEHLGSSAKIKCGSCQSYQ-----------ESTKQLTMNKLPVVAC 260 270 280 290 300 580 590 600 610 620 pF1KE3 LHLKRFRWSGRNNREKIGVHVGFEEILNMEPYCCRETLKSLRPECFI----------YDL .:.:::. :... :.:: ....: :.: :. . . . . :.: CCDS65 FHFKRFEHSAKQ-RRKITTYISFPLELDMTPFMASSKESRMNGQLQLPTNSGNNENKYSL 310 320 330 340 350 360 630 640 650 660 670 680 pF1KE3 SAVVMHHGKGFGSGHYTAYCYNSEGGFWVHCNDSKLSMCTMDEVCKAQAYILFYTQRVTE ::: :.: . :::::.. . . : .:.:. .. .. .: ...:.::: ..: : CCDS65 FAVVNHQGT-LESGHYTSFIRHHKDQ-WFKCDDAVITKASIKDVLDSEGYLLFYHKQVLE 370 380 390 400 410 420 690 700 710 pF1KE3 NGHSKLLPPELLLGSQHPNEDADTSSNEILS . :. CCDS65 HESEKVKEMNTQAY 430 712 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 03:11:35 2016 done: Mon Nov 7 03:11:35 2016 Total Scan time: 3.880 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]