FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1063, 525 aa 1>>>pF1KA1063 525 - 525 aa - 525 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4708+/-0.000896; mu= 17.6408+/- 0.054 mean_var=72.5788+/-14.428, 0's: 0 Z-trim(106.7): 101 B-trim: 40 in 1/49 Lambda= 0.150546 statistics sampled from 8999 (9110) to 8999 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.653), E-opt: 0.2 (0.28), width: 16 Scan time: 3.180 The best scores are: opt bits E(32554) CCDS42285.1 USP22 gene_id:23326|Hs108|chr17 ( 525) 3694 811.8 0 CCDS65260.1 USP27X gene_id:389856|Hs108|chrX ( 438) 2348 519.4 3.3e-147 CCDS14370.1 USP51 gene_id:158880|Hs108|chrX ( 711) 1944 431.8 1.3e-120 CCDS69111.1 USP49 gene_id:25862|Hs108|chr6 ( 688) 400 96.4 1.1e-19 CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 ( 605) 393 94.9 2.9e-19 CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 ( 362) 378 91.5 1.8e-18 CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 ( 396) 372 90.2 4.8e-18 CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 ( 476) 361 87.9 2.9e-17 CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 ( 520) 361 87.9 3.1e-17 CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012) 358 87.4 8.5e-17 CCDS10137.1 USP8 gene_id:9101|Hs108|chr15 (1118) 358 87.4 9.3e-17 CCDS78300.1 USP17L8 gene_id:392188|Hs108|chr8 ( 530) 353 86.1 1.1e-16 CCDS32755.1 USP36 gene_id:57602|Hs108|chr17 (1123) 355 86.8 1.5e-16 CCDS47535.1 USP42 gene_id:84132|Hs108|chr7 (1316) 348 85.3 4.8e-16 CCDS4861.1 USP49 gene_id:25862|Hs108|chr6 ( 640) 335 82.3 1.9e-15 CCDS78298.1 USP17L1 gene_id:401447|Hs108|chr8 ( 530) 329 80.9 3.9e-15 CCDS78299.1 USP17L4 gene_id:645402|Hs108|chr8 ( 530) 326 80.3 6.2e-15 CCDS78301.1 USP17L3 gene_id:645836|Hs108|chr8 ( 530) 324 79.8 8.4e-15 CCDS9053.1 USP44 gene_id:84101|Hs108|chr12 ( 712) 315 78.0 4.1e-14 CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 ( 914) 313 77.6 6.9e-14 CCDS10607.1 USP31 gene_id:57478|Hs108|chr16 (1352) 285 71.6 6.4e-12 >>CCDS42285.1 USP22 gene_id:23326|Hs108|chr17 (525 aa) initn: 3694 init1: 3694 opt: 3694 Z-score: 4335.0 bits: 811.8 E(32554): 0 Smith-Waterman score: 3694; 100.0% identity (100.0% similar) in 525 aa overlap (1-525:1-525) 10 20 30 40 50 60 pF1KA1 MVSRPEPEGEAMDAELAVAPPGCSHLGSFKVDNWKQNLRAIYQCFVWSGTAEARKRKAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MVSRPEPEGEAMDAELAVAPPGCSHLGSFKVDNWKQNLRAIYQCFVWSGTAEARKRKAKS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 CICHVCGVHLNRLHSCLYCVFFGCFTKKHIHEHAKAKRHNLAIDLMYGGIYCFLCQDYIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 CICHVCGVHLNRLHSCLYCVFFGCFTKKHIHEHAKAKRHNLAIDLMYGGIYCFLCQDYIY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 DKDMEIIAKEEQRKAWKMQGVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 DKDMEIIAKEEQRKAWKMQGVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLIN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 LGNTCFMNCIVQALTHTPLLRDFFLSDRHRCEMQSPSSCLVCEMSSLFQEFYSGHRSPHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LGNTCFMNCIVQALTHTPLLRDFFLSDRHRCEMQSPSSCLVCEMSSLFQEFYSGHRSPHI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 PYKLLHLVWTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNGKKANNPNHCNCIIDQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PYKLLHLVWTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNGKKANNPNHCNCIIDQI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 FTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNGESHVSGTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 FTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNGESHVSGTT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 TLTDCLRRFTRPEHLGSSAKIKCSGCHSYQESTKQLTMKKLPIVACFHLKRFEHSAKLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TLTDCLRRFTRPEHLGSSAKIKCSGCHSYQESTKQLTMKKLPIVACFHLKRFEHSAKLRR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 KITTYVSFPLELDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVVNHQGTLESGHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KITTYVSFPLELDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVVNHQGTLESGHY 430 440 450 460 470 480 490 500 510 520 pF1KA1 TSFIRQHKDQWFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE ::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TSFIRQHKDQWFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE 490 500 510 520 >>CCDS65260.1 USP27X gene_id:389856|Hs108|chrX (438 aa) initn: 2444 init1: 1296 opt: 2348 Z-score: 2756.3 bits: 519.4 E(32554): 3.3e-147 Smith-Waterman score: 2433; 82.4% identity (90.2% similar) in 427 aa overlap (114-525:1-426) 90 100 110 120 130 pF1KA1 CFTKKHIHEHAKAKRHNLAIDLMYGGIYCFLCQDYIYDKDMEIIAKEEQRKAWKMQ---- .:.::.::::.: :::::: .: :.: CCDS65 MCKDYVYDKDIEQIAKEEQGEALKLQASTS 10 20 30 140 150 160 170 180 pF1KA1 -----------GVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLINLGNTCFMN :.:::: ::: :: ::::: :::.::.:::. ::::::::::::::::: CCDS65 TEVSHQQCSVPGLGEKFPTWETTKPELELLGHNPRRRRITSSFTIGLRGLINLGNTCFMN 40 50 60 70 80 90 190 200 210 220 230 240 pF1KA1 CIVQALTHTPLLRDFFLSDRHRCEMQSPSSCLVCEMSSLFQEFYSGHRSPHIPYKLLHLV ::::::::::.:::::::::::::: :: ::::::::::.:.:::. :::.:::::::: CCDS65 CIVQALTHTPILRDFFLSDRHRCEMPSPELCLVCEMSSLFRELYSGNPSPHVPYKLLHLV 100 110 120 130 140 150 250 260 270 280 290 300 pF1KA1 WTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNGKKANNPNHCNCIIDQIFTGGLQSD : ::::::::.::::::::::::::::::::::: :: :::::::::::::::::::::: CCDS65 WIHARHLAGYRQQDAHEFLIAALDVLHRHCKGDDVGKAANNPNHCNCIIDQIFTGGLQSD 160 170 180 190 200 210 310 320 330 340 350 360 pF1KA1 VTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNGESHVSGTTTLTDCLRR ::::.:::::::::: :::::::::: : :::.::: :..: :::::. : ::::::::: CCDS65 VTCQACHGVSTTIDPCWDISLDLPGSCTSFWPMSPGRESSV-NGESHIPGITTLTDCLRR 220 230 240 250 260 370 380 390 400 410 420 pF1KA1 FTRPEHLGSSAKIKCSGCHSYQESTKQLTMKKLPIVACFHLKRFEHSAKLRRKITTYVSF :::::::::::::::..:.:::::::::::.:::.:::::.:::::::: :::::::.:: CCDS65 FTRPEHLGSSAKIKCGSCQSYQESTKQLTMNKLPVVACFHFKRFEHSAKQRRKITTYISF 270 280 290 300 310 320 430 440 450 460 470 480 pF1KA1 PLELDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVVNHQGTLESGHYTSFIRQHK ::::::::::::::::::::: : ::.: ::.:::::::::::::::::::::::::.:: CCDS65 PLELDMTPFMASSKESRMNGQLQLPTNSGNNENKYSLFAVVNHQGTLESGHYTSFIRHHK 330 340 350 360 370 380 490 500 510 520 pF1KA1 DQWFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE :::::::::.:::::::::::::::::::::: ::.: CCDS65 DQWFKCDDAVITKASIKDVLDSEGYLLFYHKQVLEHESEKVKEMNTQAY 390 400 410 420 430 >>CCDS14370.1 USP51 gene_id:158880|Hs108|chrX (711 aa) initn: 2548 init1: 1527 opt: 1944 Z-score: 2278.9 bits: 431.8 E(32554): 1.3e-120 Smith-Waterman score: 2548; 69.7% identity (85.4% similar) in 528 aa overlap (12-523:184-709) 10 20 30 40 pF1KA1 MVSRPEPEGEAMDAELAVAPPGCSHLGSFKVD-NWKQNLRA ...:.. .: ::::. :::: ::..::: CCDS14 SRPGSRPQTRRSCSGDLDGSGDPGGLGDWLLEVEFGQGPTGCSHVESFKVGKNWQKNLRL 160 170 180 190 200 210 50 60 70 80 90 100 pF1KA1 IYQCFVWSGTAEARKRKAKSCICHVCGVHLNRLHSCLYCVFFGCFTKKHIHEHAKAKRHN ::: :::::: :.:::::::::::::..:.::::::: ::::::::.::::.::..:.:. CCDS14 IYQRFVWSGTPETRKRKAKSCICHVCSTHMNRLHSCLSCVFFGCFTEKHIHKHAETKQHH 220 230 240 250 260 270 110 120 130 140 pF1KA1 LAIDLMYGGIYCFLCQDYIYDKDMEIIAKEEQRKAWKM---------------QGVGEKF ::.::..: ::::.:.::.::::.: :::: ..: .. .: .: CCDS14 LAVDLYHGVIYCFMCKDYVYDKDIEQIAKETKEKILRLLTSTSTDVSHQQFMTSGFEDKQ 280 290 300 310 320 330 150 160 170 180 190 200 pF1KA1 STWEPTKRELELLKHNPKRRKITSNCTIGLRGLINLGNTCFMNCIVQALTHTPLLRDFFL :: : ..: .:.: . :::: : :.::::::::::::::::::::::: :::.:::: CCDS14 STCETKEQEPKLVKPKKKRRK-KSVYTVGLRGLINLGNTCFMNCIVQALTHIPLLKDFFL 340 350 360 370 380 390 210 220 230 240 250 260 pF1KA1 SDRHRCEMQSPSSCLVCEMSSLFQEFYSGHRSPHIPYKLLHLVWTHARHLAGYEQQDAHE ::.:.: : ::: ::::::::::. .::: :.::::::::::.: ::.:::::.:::::: CCDS14 SDKHKCIMTSPSLCLVCEMSSLFHAMYSGSRTPHIPYKLLHLIWIHAEHLAGYRQQDAHE 400 410 420 430 440 450 270 280 290 300 310 320 pF1KA1 FLIAALDVLHRHCKGDDNGKKANNPNHCNCIIDQIFTGGLQSDVTCQVCHGVSTTIDPFW :::: ::::::: : :..:..::::: ::::::::::::::::::::.::.::::::: : CCDS14 FLIAILDVLHRHSKDDSGGQEANNPNCCNCIIDQIFTGGLQSDVTCQACHSVSTTIDPCW 460 470 480 490 500 510 330 340 350 360 370 380 pF1KA1 DISLDLPGSSTPFWPLSPGSEGNVVNGESHVSGTTTLTDCLRRFTRPEHLGSSAKIKCSG ::::::::: . : .: ..:. ..:. : .:::::. :::::::::::::::.. CCDS14 DISLDLPGSCATFDSQNPERADSTVSRDDHIPGIPSLTDCLQWFTRPEHLGSSAKIKCNS 520 530 540 550 560 570 390 400 410 420 430 440 pF1KA1 CHSYQESTKQLTMKKLPIVACFHLKRFEHSAKLRRKITTYVSFPLELDMTPFMASSKESR :.::::::::::::::::::::::::::: .: ::::.:..:::::::::::.::.:::: CCDS14 CQSYQESTKQLTMKKLPIVACFHLKRFEHVGKQRRKINTFISFPLELDMTPFLASTKESR 580 590 600 610 620 630 450 460 470 480 490 500 pF1KA1 MNGQYQQPTDSLNNDNKYSLFAVVNHQGTLESGHYTSFIRQHKDQWFKCDDAIITKASIK :. . : ::: . :.::::::::.::.::::::::::::::.:::::.:::::::::.:. CCDS14 MK-EGQPPTDCVPNENKYSLFAVINHHGTLESGHYTSFIRQQKDQWFSCDDAIITKATIE 640 650 660 670 680 690 510 520 pF1KA1 DVLDSEGYLLFYHKQFLEYE :.: ::::::::::: :: CCDS14 DLLYSEGYLLFYHKQGLEKD 700 710 >>CCDS69111.1 USP49 gene_id:25862|Hs108|chr6 (688 aa) initn: 487 init1: 147 opt: 400 Z-score: 466.8 bits: 96.4 E(32554): 1.1e-19 Smith-Waterman score: 441; 27.9% identity (51.1% similar) in 456 aa overlap (150-523:230-660) 120 130 140 150 160 170 pF1KA1 YDKDMEIIAKEEQRKAWKMQGVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLI ::.:.. . .:. . :. :: CCDS69 LASTPPRKSARLLLHTPRDAGPAASRPAALPTSRRVPAATLKLRRQPAMAP---GVTGLR 200 210 220 230 240 250 180 190 200 pF1KA1 NLGNTCFMNCIVQALTHTPLLRDFFLS--------------------------------- ::::::.:: :.:.:.: .:. ::. CCDS69 NLGNTCYMNSILQVLSHLQKFRECFLNLDPSKTEHLFPKATNGKTQLSGKPTNSSATELS 260 270 280 290 300 310 210 220 230 pF1KA1 ---DRHR-CEMQS--------------------PSSCLV--C-EMSSLFQEFYSGHRSPH :: . :: .. ::: . : :. .::. ..::. . CCDS69 LRNDRAEACEREGFCWNGRASISRSLELIQNKEPSSKHISLCRELHTLFRVMWSGKWALV 320 330 340 350 360 370 240 250 260 270 280 290 pF1KA1 IPYKLLHLVWTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNGKKANNP-------NH :. .:: ::. . ::.::::.::: : .... ... . .. : .. CCDS69 SPFAMLHSVWSLIPAFRGYDQQDAQEFLCELLHKVQQELESEGTTRRILIPFSQRKLTKQ 380 390 400 410 420 430 300 310 320 330 340 350 pF1KA1 CNCIIDQIFTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNG ... :: : : :.::: :. :.::.::::.::..: . .: : . CCDS69 VLKVVNTIFHGQLLSQVTCISCNYKSNTIEPFWDLSLEFPERYHCI------EKGFVPLN 440 450 460 470 480 490 360 370 380 390 400 pF1KA1 ESHVSGTTTLTDCLRRFTRPEHLGSSAKIKCSGCHSYQ-----------ESTKQLTMKKL ... ::. : .::. : : . :. :.: . :. ::: . .: CCDS69 QTE----CLLTEMLAKFTETEALEGRI-YACDQCNSKRRKSNPKPLVLSEARKQLMIYRL 500 510 520 530 540 410 420 430 440 450 460 pF1KA1 PIVACFHLKRFEHSAK-LRRKITTYVSFPLELDMTPFMASSKESRMNGQYQQPTDSLNND : : .:::::. :.. :.:: ..: : : : :. . : ::... CCDS69 PQVLRLHLKRFRWSGRNHREKIGVHVVFDQVLTMEPYCCRDMLS-----------SLDKE 550 560 570 580 590 470 480 490 500 510 pF1KA1 N-KYSLFAVVNHQGT-LESGHYTSFIRQHKDQ-WFKCDDAIITKASIKDVLDSEGYLLFY . :.: ::: :.: . :::::.. . . : .:.:. .. :...: ...:.::: CCDS69 TFAYDLSAVVMHHGKGFGSGHYTAYCYNTEGGFWVHCNDSKLNVCSVEEVCKTQAYILFY 600 610 620 630 640 650 520 pF1KA1 HKQFLEYE .. .. CCDS69 TQRTVQGNARISETHLQAQVQSSNNDEGRPQTFS 660 670 680 >>CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 (605 aa) initn: 609 init1: 185 opt: 393 Z-score: 459.4 bits: 94.9 E(32554): 2.9e-19 Smith-Waterman score: 579; 30.7% identity (55.6% similar) in 401 aa overlap (144-517:233-596) 120 130 140 150 160 170 pF1KA1 LCQDYIYDKDMEIIAKEEQRKAWKMQGVGEKFSTWEPTKRELE--LLKHNPKRRKITSNC ... :: : . . .: : ..:. CCDS84 GRKGSASQVPSQAPPSRVPEIISPTYRPIGRYTLWETGKGQAPGPSRSSSPGRDGMNSKS 210 220 230 240 250 260 180 190 200 210 220 pF1KA1 TIGLRGLINLGNTCFMNCIVQALTHTPLLRDFFLSDRHRCEMQSPS---SCLVCEMSSLF . :: :: ::::::::: :.: :..: :::. :. . ... : . :: :...:. CCDS84 AQGLAGLRNLGNTCFMNSILQCLSNTRELRDYCLQRLYMRDLHHGSNAHTALVEEFAKLI 270 280 290 300 310 320 230 240 250 260 270 pF1KA1 QEFYSGHRSPHI-PYKLLHLVWTHARHLAGYEQQDAHEFLIAALDVLHR----------- : .... . . : .. . .: ...::.::::.::: :: :: CCDS84 QTIWTSSPNDVVSPSEFKTQIQRYAPRFVGYNQQDAQEFLRFLLDGLHNEVNRVTLRPKS 330 340 350 360 370 380 280 290 300 310 320 pF1KA1 ------HCKGDDNGKKANNP--NHCNCIIDQIFTGGLQSDVTCQVCHGVSTTIDPFWDIS : :..:.. .. . : ..:.: :.:..:: : ::..:::::.: CCDS84 NPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLS 390 400 410 420 430 440 330 340 350 360 370 380 pF1KA1 LDLPGSSTPFWPLSPGSEGNVVNGESHVSGTTTLTDCLRRFTRPEHLGSSAKIKCSGCHS : . . : .:: ::.: ::. . : .. : : :.. CCDS84 LPIAKRGYP---------------------EVTLMDCMRLFTKEDVLDGDEKPTCCRCRG 450 460 470 480 390 400 410 420 430 440 pF1KA1 YQESTKQLTMKKLPIVACFHLKRFEHSAKLRRKITTYVSFPL-ELDMTPFMASSKESRMN .. :.......: . .::::: .: :.::.:.::: .::. : . . CCDS84 RKRCIKKFSIQRFPKILVLHLKRFSESRIRTSKLTTFVNFPLRDLDLREFASEN------ 490 500 510 520 530 450 460 470 480 490 500 pF1KA1 GQYQQPTDSLNNDNKYSLFAVVNHQGTLESGHYTSFIRQH-KDQWFKCDDAIITKASIKD .: :.:.:: ::.:: .::::.. :. .: .:. .: : .. CCDS84 ----------TNHAVYNLYAVSNHSGTTMGGHYTAYCRSPGTGEWHTFNDSSVTPMSSSQ 540 550 560 570 580 510 520 pF1KA1 VLDSEGYLLFYHKQFLEYE : :..::::: CCDS84 VRTSDAYLLFYELASPPSRM 590 600 >>CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 (362 aa) initn: 609 init1: 185 opt: 378 Z-score: 445.1 bits: 91.5 E(32554): 1.8e-18 Smith-Waterman score: 564; 31.1% identity (56.5% similar) in 379 aa overlap (164-517:12-353) 140 150 160 170 180 190 pF1KA1 KAWKMQGVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLINLGNTCFMNCIVQA ... .:. . :: :: ::::::::: :.: CCDS58 MLVPGSTRPYSKKRQNSKSAQGLAGLRNLGNTCFMNSILQC 10 20 30 40 200 210 220 230 240 pF1KA1 LTHTPLLRDFFLSDRHRCEMQSPS---SCLVCEMSSLFQEFYSGHRSPHI-PYKLLHLVW :..: :::. :. . ... : . :: :...:.: .... . . : .. . CCDS58 LSNTRELRDYCLQRLYMRDLHHGSNAHTALVEEFAKLIQTIWTSSPNDVVSPSEFKTQIQ 50 60 70 80 90 100 250 260 270 280 290 pF1KA1 THARHLAGYEQQDAHEFLIAALDVLHR-----------------HCKGDDNGKKANNP-- .: ...::.::::.::: :: :: : :..:.. CCDS58 RYAPRFVGYNQQDAQEFLRFLLDGLHNEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYL 110 120 130 140 150 160 300 310 320 330 340 350 pF1KA1 NHCNCIIDQIFTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVV .. . : ..:.: :.:..:: : ::..:::::.:: . . : CCDS58 EREDSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPIAKRGYP------------- 170 180 190 200 360 370 380 390 400 410 pF1KA1 NGESHVSGTTTLTDCLRRFTRPEHLGSSAKIKCSGCHSYQESTKQLTMKKLPIVACFHLK .:: ::.: ::. . : .. : : :.. .. :.......: . .::: CCDS58 --------EVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVLHLK 210 220 230 240 250 260 420 430 440 450 460 pF1KA1 RFEHSAKLRRKITTYVSFPL-ELDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVV :: .: :.::.:.::: .::. : . . .: :.:.:: CCDS58 RFSESRIRTSKLTTFVNFPLRDLDLREFASEN----------------TNHAVYNLYAVS 270 280 290 300 470 480 490 500 510 520 pF1KA1 NHQGTLESGHYTSFIRQH-KDQWFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE ::.:: .::::.. :. .: .:. .: : ..: :..::::: CCDS58 NHSGTTMGGHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 310 320 330 340 350 360 >>CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 (396 aa) initn: 609 init1: 185 opt: 372 Z-score: 437.5 bits: 90.2 E(32554): 4.8e-18 Smith-Waterman score: 558; 31.6% identity (56.1% similar) in 374 aa overlap (169-517:51-387) 140 150 160 170 180 190 pF1KA1 QGVGEKFSTWEPTKRELELLKHNPKRRKITSNCTIGLRGLINLGNTCFMNCIVQALTHTP :. . :: :: ::::::::: :.: :..: CCDS84 LAKELRPRSPLSPSLLLSTFVGLLLNKAKNSKSAQGLAGLRNLGNTCFMNSILQCLSNTR 30 40 50 60 70 80 200 210 220 230 240 250 pF1KA1 LLRDFFLSDRHRCEMQSPS---SCLVCEMSSLFQEFYSGHRSPHI-PYKLLHLVWTHARH :::. :. . ... : . :: :...:.: .... . . : .. . .: . CCDS84 ELRDYCLQRLYMRDLHHGSNAHTALVEEFAKLIQTIWTSSPNDVVSPSEFKTQIQRYAPR 90 100 110 120 130 140 260 270 280 290 pF1KA1 LAGYEQQDAHEFLIAALDVLHR-----------------HCKGDDNGKKANNP--NHCNC ..::.::::.::: :: :: : :..:.. .. . CCDS84 FVGYNQQDAQEFLRFLLDGLHNEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDS 150 160 170 180 190 200 300 310 320 330 340 350 pF1KA1 IIDQIFTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNGESH : ..:.: :.:..:: : ::..:::::.:: . . : CCDS84 RIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPIAKRGYP------------------ 210 220 230 240 360 370 380 390 400 410 pF1KA1 VSGTTTLTDCLRRFTRPEHLGSSAKIKCSGCHSYQESTKQLTMKKLPIVACFHLKRFEHS .:: ::.: ::. . : .. : : :.. .. :.......: . .::::: .: CCDS84 ---EVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVLHLKRFSES 250 260 270 280 290 420 430 440 450 460 470 pF1KA1 AKLRRKITTYVSFPL-ELDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVVNHQGT :.::.:.::: .::. : . . .: :.:.:: ::.:: CCDS84 RIRTSKLTTFVNFPLRDLDLREFASEN----------------TNHAVYNLYAVSNHSGT 300 310 320 330 340 480 490 500 510 520 pF1KA1 LESGHYTSFIRQH-KDQWFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE .::::.. :. .: .:. .: : ..: :..::::: CCDS84 TMGGHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 350 360 370 380 390 >>CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 (476 aa) initn: 636 init1: 231 opt: 361 Z-score: 423.4 bits: 87.9 E(32554): 2.9e-17 Smith-Waterman score: 642; 33.2% identity (57.7% similar) in 452 aa overlap (105-517:42-464) 80 90 100 110 120 130 pF1KA1 SCLYCVFFGCFTKKHIHEHAKAKRHNLAIDLMYGGIYC--FLCQDYIY-DKDMEIIAKEE : ....: . :.:.. : . .. : . CCDS58 IAPDSAKFPNGSPSSWCCSVCRSNKSPWVCLTCSSVHCGSYRCDDFVVNDTKLGLVQKVR 20 30 40 50 60 70 140 150 160 170 180 pF1KA1 QRKAWKMQGV-GEKFSTWEPTKREL-ELLKHNPKRRKITSNCT-IGLRGLINLGNTCFMN .. .:.. . :.. . ::.: : : : :.... : : :: ::::::::: CCDS58 EH----LQNLENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMN 80 90 100 110 120 190 200 210 220 230 pF1KA1 CIVQALTHT----------PL--LRDFFLSDRHRCEMQSPSS---CLVCEMSSLFQEFYS :.:.:.. : ::. . :. . .: .. :: :. . . ... CCDS58 AILQSLSNIEQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQ 130 140 150 160 170 180 240 250 260 270 280 pF1KA1 GHRSPHIPYKLLHLVWTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNG--KKA---- : .. : .:...:: .. ::.:::::::. :: :: . .: :: ..: CCDS58 GSQTAFSPESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQE 190 200 210 220 230 240 290 300 310 320 330 pF1KA1 ----NNPNHCNCI------IDQIFTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTP . :.: :: . :: : ::..:.: .: : .::: :.:::.: . CCDS58 NSTLSASNKC-CINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIP---SQ 250 260 270 280 290 300 340 350 360 370 380 390 pF1KA1 FWPLSPGSEGNVVNGESHVSGTTTLTDCLRRFTRPEHLGSSAKIKCSGCHSYQESTKQLT : : :. : :: . .: :::: :: :.: . : :.. :.:::.. CCDS58 FR--SKRSK-NQENGP-----VCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFW 310 320 330 340 350 400 410 420 430 440 450 pF1KA1 MKKLPIVACFHLKRFEHSAKLRRKITTYVSFPLE-LDMTPFMASSKESRMNGQYQQPTDS ..::: : :.:::::. .: :: :. ::: :::. ::: .. .: .: CCDS58 IQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLL------------EPENS 360 370 380 390 400 460 470 480 490 500 510 pF1KA1 LNNDNKYSLFAVVNHQGT-LESGHYTSFIRQHKDQWFKCDDAIITKASIKDVLDSEGYLL .. :.: ::: :.:. . :::::.. :. .::. .:. .: .. . :. ...:.: CCDS58 GPESCLYDLAAVVVHHGSGVGSGHYTAYAT-HEGRWFHFNDSTVTLTDEETVVKAKAYIL 410 420 430 440 450 460 520 pF1KA1 FYHKQFLEYE :: CCDS58 FYVEHQAKAGSDKL 470 >>CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 (520 aa) initn: 636 init1: 231 opt: 361 Z-score: 422.8 bits: 87.9 E(32554): 3.1e-17 Smith-Waterman score: 683; 31.6% identity (55.1% similar) in 512 aa overlap (61-517:28-508) 40 50 60 70 80 pF1KA1 VDNWKQNLRAIYQCFVWSGTAEARKRKAKSCICHVCGVHLNRLHSCLYCVFFGC------ : : :: . . :: : : CCDS32 MECPHLSSSVCIAPDSAKFPNGSPSSWC-CSVCRSNKSPW-VCLTCSSVHCGRYVNG 10 20 30 40 50 90 100 110 120 130 pF1KA1 FTKKHIHE-------HAKAKR-----HNLAIDLMYGGIYCFLCQDYIY-DKDMEIIAKEE .::: .. : :... :.. .: . ::. :.:.. : . .. : . CCDS32 HAKKHYEDAQVPLTNHKKSEKQDKVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVR 60 70 80 90 100 110 140 150 160 170 180 pF1KA1 QRKAWKMQGV-GEKFSTWEPTKREL-ELLKHNPKRRKITSNCT-IGLRGLINLGNTCFMN .. .:.. . :.. . ::.: : : : :.... : : :: ::::::::: CCDS32 EH----LQNLENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMN 120 130 140 150 160 170 190 200 210 220 230 pF1KA1 CIVQALTHT----------PL--LRDFFLSDRHRCEMQSPSS---CLVCEMSSLFQEFYS :.:.:.. : ::. . :. . .: .. :: :. . . ... CCDS32 AILQSLSNIEQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQ 180 190 200 210 220 230 240 250 260 270 280 pF1KA1 GHRSPHIPYKLLHLVWTHARHLAGYEQQDAHEFLIAALDVLHRHCKGDDNG--KKA---- : .. : .:...:: .. ::.:::::::. :: :: . .: :: ..: CCDS32 GSQTAFSPESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQE 240 250 260 270 280 290 290 300 310 320 330 pF1KA1 ----NNPNHCNCI------IDQIFTGGLQSDVTCQVCHGVSTTIDPFWDISLDLPGSSTP . :.: :: . :: : ::..:.: .: : .::: :.:::.:.. CCDS32 NSTLSASNKC-CINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQ--- 300 310 320 330 340 340 350 360 370 380 390 pF1KA1 FWPLSPGSEGNVVNGESHVSGTTTLTDCLRRFTRPEHLGSSAKIKCSGCHSYQESTKQLT . : :: . .: :::: :: :.: . : :.. :.:::.. CCDS32 ---FRSKRSKNQENGP-----VCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFW 350 360 370 380 390 400 410 420 430 440 450 pF1KA1 MKKLPIVACFHLKRFEHSAKLRRKITTYVSFPLE-LDMTPFMASSKESRMNGQYQQPTDS ..::: : :.:::::. .: :: :. ::: :::. ::: .. .: .: CCDS32 IQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLL------------EPENS 400 410 420 430 440 460 470 480 490 500 510 pF1KA1 LNNDNKYSLFAVVNHQGT-LESGHYTSFIRQHKDQWFKCDDAIITKASIKDVLDSEGYLL .. :.: ::: :.:. . :::::.. :. .::. .:. .: .. . :. ...:.: CCDS32 GPESCLYDLAAVVVHHGSGVGSGHYTAYAT-HEGRWFHFNDSTVTLTDEETVVKAKAYIL 450 460 470 480 490 500 520 pF1KA1 FYHKQFLEYE :: CCDS32 FYVEHQAKAGSDKL 510 520 >>CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012 aa) initn: 564 init1: 209 opt: 358 Z-score: 415.0 bits: 87.4 E(32554): 8.5e-17 Smith-Waterman score: 571; 30.4% identity (55.1% similar) in 421 aa overlap (125-517:618-1000) 100 110 120 130 140 150 pF1KA1 KAKRHNLAIDLMYGGIYCFLCQDYIYDKDMEIIAKEEQRKAWKMQGVGEKFSTWEPTKRE . : .::.:: :... . : : CCDS61 PTHKAKPQIPAERDREPSKLKRSYSSPDITQAIQEEEKRKPTVTPTVNRENKPTCYPKAE 590 600 610 620 630 640 160 170 180 190 200 pF1KA1 LELLKHNPKRR--KITSNCTIGLRGLINLGNTCFMNCIVQALTHTPLLRDFF-----LSD . :. . : . .. .: :: ::::::.:: :.: : ..: : :.: .: CCDS61 ISRLSASQIRNLNPVFGGSGPALTGLRNLGNTCYMNSILQCLCNAPHLADYFNRNCYQDD 650 660 670 680 690 700 210 220 230 240 250 260 pF1KA1 RHRCEMQSPSSCLVCEMSSLFQEFYSGHRSPHIPYKLLHLVWTHARHLAGYEQQDAHEFL .: .. . .. .. :.. ... ...:. : . . ..::: :::..:.: CCDS61 INRSNLLGHKGEVAEEFGIIMKALWTGQYRYISPKDFKITIGKINDQFAGYSQQDSQELL 710 720 730 740 750 760 270 280 290 300 pF1KA1 IAALDVLHRHCKGDDNGK--KANNPNHCN-----------------CIIDQIFTGGLQSD . .: ::. . :: : : .: .: . :: .: : ..: CCDS61 LFLMDGLHEDLNKADNRKRYKEENNDHLDDFKAAEHAWQKHKQLNESIIVALFQGQFKST 770 780 790 800 810 820 310 320 330 340 350 360 pF1KA1 VTCQVCHGVSTTIDPFWDISLDLPGSSTPFWPLSPGSEGNVVNGESHVSGTTTLTDCLRR : : .:: : :.. : .:: ::. :. :: :::: CCDS61 VQCLTCHKKSRTFEAFMYLSL----------PLASTSK-------------CTLQDCLRL 830 840 850 860 370 380 390 400 410 420 pF1KA1 FTRPEHLGSSAKIKCSGCHSYQESTKQLTMKKLPIVACFHLKRFEHSAKLRRKITTYVSF :.. :.: .. .. :: :.. ..: :.. . ::: : ::::: .... ..:. : :.: CCDS61 FSKEEKLTDNNRFYCSHCRARRDSLKKIEIWKLPPVLLVHLKRFSYDGRWKQKLQTSVDF 870 880 890 900 910 920 430 440 450 460 470 480 pF1KA1 PLE-LDMTPFMASSKESRMNGQYQQPTDSLNNDNKYSLFAVVNHQGTLESGHYTSFIRQH ::: ::.. .. . : :: .::.::.: :: : :..::::.. .. CCDS61 PLENLDLSQYVIGPK---------------NNLKKYNLFSVSNHYGGLDGGHYTAYCKNA 930 940 950 960 490 500 510 520 pF1KA1 KDQ-WFKCDDAIITKASIKDVLDSEGYLLFYHKQFLEYE : ::: :: .. :...: .: .:.::: CCDS61 ARQRWFKFDDHEVSDISVSSVKSSAAYILFYTSLGPRVTDVAT 970 980 990 1000 1010 525 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 03:33:24 2016 done: Mon Nov 7 03:33:24 2016 Total Scan time: 3.180 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]