FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1097, 911 aa
1>>>pF1KA1097 911 - 911 aa - 911 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7386+/-0.000979; mu= 14.2780+/- 0.059
mean_var=103.0243+/-20.413, 0's: 0 Z-trim(107.7): 104 B-trim: 5 in 1/50
Lambda= 0.126359
statistics sampled from 9658 (9762) to 9658 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.671), E-opt: 0.2 (0.3), width: 16
Scan time: 3.580
The best scores are: opt bits E(32554)
CCDS679.1 USP33 gene_id:23032|Hs108|chr1 ( 911) 6229 1146.8 0
CCDS678.1 USP33 gene_id:23032|Hs108|chr1 ( 942) 6229 1146.8 0
CCDS680.1 USP33 gene_id:23032|Hs108|chr1 ( 828) 5394 994.5 0
CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 ( 914) 3090 574.6 3e-163
CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 ( 476) 429 89.3 1.8e-17
CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 ( 520) 429 89.3 2e-17
CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 ( 362) 416 86.9 7.5e-17
CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 ( 396) 416 86.9 8e-17
CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 ( 605) 416 87.0 1.2e-16
CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012) 402 84.6 1e-15
CCDS10137.1 USP8 gene_id:9101|Hs108|chr15 (1118) 402 84.6 1.1e-15
CCDS2794.1 USP4 gene_id:7375|Hs108|chr3 ( 916) 384 81.3 9.4e-15
CCDS2793.1 USP4 gene_id:7375|Hs108|chr3 ( 963) 384 81.3 9.8e-15
CCDS8963.1 USP15 gene_id:9958|Hs108|chr12 ( 952) 368 78.4 7.3e-14
CCDS58251.1 USP15 gene_id:9958|Hs108|chr12 ( 981) 368 78.4 7.5e-14
CCDS14277.1 USP11 gene_id:8237|Hs108|chrX ( 963) 353 75.6 4.9e-13
CCDS30920.1 USP21 gene_id:27005|Hs108|chr1 ( 565) 338 72.8 2.1e-12
>>CCDS679.1 USP33 gene_id:23032|Hs108|chr1 (911 aa)
initn: 6229 init1: 6229 opt: 6229 Z-score: 6137.0 bits: 1146.8 E(32554): 0
Smith-Waterman score: 6229; 99.9% identity (100.0% similar) in 911 aa overlap (1-911:1-911)
10 20 30 40 50 60
pF1KA1 MSAFRNHCPHLDSVGEITKEDLIQKSLGTCQDCKVQGPNLWACLENRCSYVGCGESQVDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MSAFRNHCPHLDSVGEITKEDLIQKSLGTCQDCKVQGPNLWACLENRCSYVGCGESQVDH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 STIHSQETKHYLTVNLTTLRVWCYACSKEVFLDRKLGTQPSLPHVRQPHQIQENSVQDFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 STIHSQETKHYLTVNLTTLRVWCYACSKEVFLDRKLGTQPSLPHVRQPHQIQENSVQDFK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 IPSNTTLKTPLVAVFDDLDIEADEEDELRARGLTGLKNIGNTCYMNAALQALSNCPPLTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 IPSNTTLKTPLVAVFDDLDIEADEEDELRARGLTGLKNIGNTCYMNAALQALSNCPPLTQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 FFLDCGGLARTDKKPAICKSYLKLMTELWYKSRPGSVVPTTLFQGIKTVNPTFRGYSQQD
:::::::::::::::::::::::::::::.::::::::::::::::::::::::::::::
CCDS67 FFLDCGGLARTDKKPAICKSYLKLMTELWHKSRPGSVVPTTLFQGIKTVNPTFRGYSQQD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 AQEFLRCLMDLLHEELKEQVMEVEEDPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 AQEFLRCLMDLLHEELKEQVMEVEEDPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 NENGSRCFSEDNNETTMLIQDDENNSEMSKDWQKEKMCNKINKVNSEGEFDKDRDSISET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 NENGSRCFSEDNNETTMLIQDDENNSEMSKDWQKEKMCNKINKVNSEGEFDKDRDSISET
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 VDLNNQETVKVQIHSRASEYITDVHSNDLSTPQILPSNEGVNPRLSASPPKSGNLWPGLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 VDLNNQETVKVQIHSRASEYITDVHSNDLSTPQILPSNEGVNPRLSASPPKSGNLWPGLA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 PPHKKAQSASPKRKKQHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 PPHKKAQSASPKRKKQHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 KEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 KEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 CLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKIST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 CLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKIST
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 HVSFPLEGLDLQPFLAKDSPAQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 HVSFPLEGLDLQPFLAKDSPAQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 QSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 QSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFK
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 TFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYGGGPAVNHLYICH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYGGGPAVNHLYICH
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 TCQIEAEKIEKRRKTELEIFIRLNRAFQKEDSPATFYCISMQWFREWESFVKGKDGDPPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TCQIEAEKIEKRRKTELEIFIRLNRAFQKEDSPATFYCISMQWFREWESFVKGKDGDPPG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 PIDNTKIAVTKCGNVMLRQGADSGQISEETWNFLQSIYGGGPEVILRPPVVHVDPDILQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 PIDNTKIAVTKCGNVMLRQGADSGQISEETWNFLQSIYGGGPEVILRPPVVHVDPDILQA
850 860 870 880 890 900
910
pF1KA1 EEKIEVETRSL
:::::::::::
CCDS67 EEKIEVETRSL
910
>>CCDS678.1 USP33 gene_id:23032|Hs108|chr1 (942 aa)
initn: 6229 init1: 6229 opt: 6229 Z-score: 6136.8 bits: 1146.8 E(32554): 0
Smith-Waterman score: 6229; 99.9% identity (100.0% similar) in 911 aa overlap (1-911:32-942)
10 20 30
pF1KA1 MSAFRNHCPHLDSVGEITKEDLIQKSLGTC
::::::::::::::::::::::::::::::
CCDS67 TGSNSHITILTLKVLPHFESLGKQEKIPNKMSAFRNHCPHLDSVGEITKEDLIQKSLGTC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA1 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV
70 80 90 100 110 120
100 110 120 130 140 150
pF1KA1 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA
130 140 150 160 170 180
160 170 180 190 200 210
pF1KA1 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWY
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS67 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWH
190 200 210 220 230 240
220 230 240 250 260 270
pF1KA1 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEVEEDPQTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEVEEDPQTI
250 260 270 280 290 300
280 290 300 310 320 330
pF1KA1 TTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENNSEMSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENNSEMSK
310 320 330 340 350 360
340 350 360 370 380 390
pF1KA1 DWQKEKMCNKINKVNSEGEFDKDRDSISETVDLNNQETVKVQIHSRASEYITDVHSNDLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 DWQKEKMCNKINKVNSEGEFDKDRDSISETVDLNNQETVKVQIHSRASEYITDVHSNDLS
370 380 390 400 410 420
400 410 420 430 440 450
pF1KA1 TPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKYRSVISDIFDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKYRSVISDIFDG
430 440 450 460 470 480
460 470 480 490 500 510
pF1KA1 TIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQG
490 500 510 520 530 540
520 530 540 550 560 570
pF1KA1 WIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 WIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVK
550 560 570 580 590 600
580 590 600 610 620 630
pF1KA1 FCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 FCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLS
610 620 630 640 650 660
640 650 660 670 680 690
pF1KA1 VICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 VICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQK
670 680 690 700 710 720
700 710 720 730 740 750
pF1KA1 ERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 ERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIED
730 740 750 760 770 780
760 770 780 790 800 810
pF1KA1 LVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRLNRAFQKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 LVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRLNRAFQKE
790 800 810 820 830 840
820 830 840 850 860 870
pF1KA1 DSPATFYCISMQWFREWESFVKGKDGDPPGPIDNTKIAVTKCGNVMLRQGADSGQISEET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 DSPATFYCISMQWFREWESFVKGKDGDPPGPIDNTKIAVTKCGNVMLRQGADSGQISEET
850 860 870 880 890 900
880 890 900 910
pF1KA1 WNFLQSIYGGGPEVILRPPVVHVDPDILQAEEKIEVETRSL
:::::::::::::::::::::::::::::::::::::::::
CCDS67 WNFLQSIYGGGPEVILRPPVVHVDPDILQAEEKIEVETRSL
910 920 930 940
>>CCDS680.1 USP33 gene_id:23032|Hs108|chr1 (828 aa)
initn: 5406 init1: 3526 opt: 5394 Z-score: 5315.0 bits: 994.5 E(32554): 0
Smith-Waterman score: 5394; 98.5% identity (99.0% similar) in 805 aa overlap (1-805:32-828)
10 20 30
pF1KA1 MSAFRNHCPHLDSVGEITKEDLIQKSLGTC
::::::::::::::::::::::::::::::
CCDS68 TGSNSHITILTLKVLPHFESLGKQEKIPNKMSAFRNHCPHLDSVGEITKEDLIQKSLGTC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA1 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV
70 80 90 100 110 120
100 110 120 130 140 150
pF1KA1 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA
130 140 150 160 170 180
160 170 180 190 200 210
pF1KA1 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWY
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS68 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWH
190 200 210 220 230 240
220 230 240 250 260 270
pF1KA1 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEVEEDPQTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEVEEDPQTI
250 260 270 280 290 300
280 290 300 310 320 330
pF1KA1 TTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENNSEMSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 TTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENNSEMSK
310 320 330 340 350 360
340 350 360 370 380 390
pF1KA1 DWQKEKMCNKINKVNSEGEFDKDRDSISETVDLNNQETVKVQIHSRASEYITDVHSNDLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 DWQKEKMCNKINKVNSEGEFDKDRDSISETVDLNNQETVKVQIHSRASEYITDVHSNDLS
370 380 390 400 410 420
400 410 420 430 440 450
pF1KA1 TPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKYRSVISDIFDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 TPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKYRSVISDIFDG
430 440 450 460 470 480
460 470 480 490 500 510
pF1KA1 TIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 TIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQG
490 500 510 520 530 540
520 530 540 550 560 570
pF1KA1 WIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVK
:::::::::: ::::::::::::::::::::::::::::::::::::::::::
CCDS68 WIAFFMEYVK--------SWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVK
550 560 570 580 590
580 590 600 610 620 630
pF1KA1 FCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 FCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLS
600 610 620 630 640 650
640 650 660 670 680 690
pF1KA1 VICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 VICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQK
660 670 680 690 700 710
700 710 720 730 740 750
pF1KA1 ERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 ERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIED
720 730 740 750 760 770
760 770 780 790 800 810
pF1KA1 LVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRLNRAFQKE
::::::::::::::::::::::::::::::::::::::::::::::::::::...
CCDS68 LVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRVKK
780 790 800 810 820
820 830 840 850 860 870
pF1KA1 DSPATFYCISMQWFREWESFVKGKDGDPPGPIDNTKIAVTKCGNVMLRQGADSGQISEET
>>CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 (914 aa)
initn: 3572 init1: 2249 opt: 3090 Z-score: 3044.4 bits: 574.6 E(32554): 3e-163
Smith-Waterman score: 3772; 60.2% identity (82.0% similar) in 931 aa overlap (1-911:1-914)
10 20 30 40 50 60
pF1KA1 MSAFRNHCPHLDSVGEITKEDLIQKSLGTCQDCKVQGPNLWACLENRCSYVGCGESQVDH
:. :. ::::::.::.:::::. :: ::::.: : ::::::::. : ::::::: .::
CCDS43 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 STIHSQETKHYLTVNLTTLRVWCYACSKEVFLDRKLGTQPSLPHVRQPHQIQENSVQDFK
::::.: :: :::::::.:.::::: :::::...:.. : . . ...: ::
CCDS43 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAA----PLLGSSSKFSE---QDSP
70 80 90 100 110
130 140 150 160 170 180
pF1KA1 IPSNTTLKTPLVAVFDDLDIEADEEDELRARGLTGLKNIGNTCYMNAALQALSNCPPLTQ
::. .: .:: :. . :. :.:.:. :::::.::.::.::::::::::::::::::
CCDS43 PPSHPLKAVP-IAVADEGESES-EDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQ
120 130 140 150 160 170
190 200 210 220 230 240
pF1KA1 FFLDCGGLARTDKKPAICKSYLKLMTELWYKSRPGSVVPTTLFQGIKTVNPTFRGYSQQD
:::.::::.:::::::.:::: ::..:.:.:.::. ::::.: .::: ::: ::::.:::
CCDS43 FFLECGGLVRTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQD
180 190 200 210 220 230
250 260 270 280 290
pF1KA1 AQEFLRCLMDLLHEELKEQVMEV-----EEDPQTITTEETMEEDKSQSDVDFQSCESCSN
.::::::::: ::::::: :. . .: .. :.: : :.: :. .: ::.: .
CCDS43 TQEFLRCLMDQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDS--S
240 250 260 270 280
300 310 320 330 340 350
pF1KA1 SDRAENENGSRCFSEDNNETTMLIQDDENNSEMSKDWQKE-KMCNKINKVNSEGEFDKDR
:::.:... .: . .. :: .:: :. . . :. .:. :. ...::: . :.:
CCDS43 SDRGEGDGQGRGGGSSQAETELLIPDEAGRAISEKERMKDRKFSWGQQRTNSE-QVDEDA
290 300 310 320 330 340
360 370 380 390 400
pF1KA1 DSISETVDLNNQETVKVQIHS-------RASEYITDVHSNDLSTP-QILPSNEGVNPRLS
: . . :..: . ..: : :. : .:.: . : : . . .:: . .::
CCDS43 DVDTAMAALDDQPA-EAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEG-HAKLS
350 360 370 380 390 400
410 420 430 440 450 460
pF1KA1 ASPPKSGNLWPGLAPPH--KKAQ--SASPKRKKQHKKYRSVISDIFDGTIISSVQCLTCD
.:::... . .:: . :::: ::. .:.:. ..:::::::::::.:.: :::::::
CCDS43 SSPPRASPV--RMAPSYVLKKAQVLSAGSRRRKE-QRYRSVISDIFDGSILSLVQCLTCD
410 420 430 440 450 460
470 480 490 500 510 520
pF1KA1 RVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRF
:::.:.:::::::::::::::::::::. . . .: :.::..:: :::.::..::..::
CCDS43 RVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRF
470 480 490 500 510 520
530 540 550 560 570 580
pF1KA1 VVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILC
::::.:::::::::::.:::::::: ::::::::::::.:::::::::.::: .:::::
CCDS43 VVSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILC
530 540 550 560 570 580
590 600 610 620 630 640
pF1KA1 IHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLSVICHHGTASSGH
:::::::::.:.: ::..:::::::::::.:::::. .::.::::::::::::::.:::
CCDS43 IHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGH
590 600 610 620 630 640
650 660 670 680 690 700
pF1KA1 YIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIM
:::::.: .:. ::::::: :::: :..:::::.::::::::::::..::... .: .
CCDS43 YIAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMR
650 660 670 680 690 700
710 720 730 740 750 760
pF1KA1 EPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDN
:::::.::.::.:::::.::::::::.:. ::: :::.::.: ::.:::..::::.:..
CCDS43 EPSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEH
710 720 730 740 750 760
770 780 790 800 810 820
pF1KA1 LYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRLNRAFQKEDSPATFYCISMQ
::.:.::::::::::.: ::.: : . :::. :.. ::.::.::: :.::...::::::
CCDS43 LYNRFGGGPAVNHLYVCSICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQ
770 780 790 800 810 820
830 840 850 860 870 880
pF1KA1 WFREWESFVKGKDGDPPGPIDNTKIAVTK-CGNVMLRQGADSGQISEETWNFLQSIYGGG
::::::.::::::..:::::::..:: .: :.:.:.:::: ::::::::..:.:.::::
CCDS43 WFREWEAFVKGKDNEPPGPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGG
830 840 850 860 870 880
890 900 910
pF1KA1 PEVILRPPVVH-VDPDILQAEEKIEVETRSL
::. .: :.. . :. :..:.:::.:::..
CCDS43 PEIAIRQSVAQPLGPENLHGEQKIEAETRAV
890 900 910
>>CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 (476 aa)
initn: 741 init1: 264 opt: 429 Z-score: 427.0 bits: 89.3 E(32554): 1.8e-17
Smith-Waterman score: 438; 33.1% identity (60.2% similar) in 254 aa overlap (442-692:264-475)
420 430 440 450 460 470
pF1KA1 SGNLWPGLAPPHKKAQSASPKRKKQHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETF
.:.. :: : . . :.:: : : .. :
CCDS58 GGFNGVSRSAILQENSTLSASNKCCINGASTVVTAIFGGILQNEVNCLICGTESRKFDPF
240 250 260 270 280 290
480 490 500 510 520 530
pF1KA1 QDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRFVVSCVPSWF
:::: :: ....: : .. :
CCDS58 LDLSLDIP-----SQFRS--------KRSKNQEN--------------------------
300 310
540 550 560 570 580 590
pF1KA1 WGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHE
::: .:.::: .: .:: ..: :.:::: ....: .:..:..::.:::::.
CCDS58 -GPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWT
320 330 340 350 360 370
600 610 620 630 640
pF1KA1 LMFSTKISTHVSFPLEGLDLQPFL--AKDSPAQIVTYDLLSVICHHGTA-SSGHYIAYCR
.. .:..:.: :::.:::.. .: ..: . ::: .:. :::.. .:::: ::
CCDS58 AYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYAT
380 390 400 410 420 430
650 660 670 680 690 700
pF1KA1 NNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQ
.. . :..:.:..:: ..: :: .:.::.::: . . .: ...
CCDS58 HE--GRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL
440 450 460 470
710 720 730 740 750 760
pF1KA1 FYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYG
>>CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 (520 aa)
initn: 750 init1: 264 opt: 429 Z-score: 426.5 bits: 89.3 E(32554): 2e-17
Smith-Waterman score: 496; 26.0% identity (44.2% similar) in 731 aa overlap (8-692:3-519)
10 20 30 40 50
pF1KA1 MSAFRNHCPHLDSVGEITKEDLI----QKSLGTCQDCKV-QGPNLWACLENRCSYVGCG-
::::.: :. .. . : :. :. ..: :.:: :: : ::
CCDS32 MECPHLSSSVCIAPDSAKFPNGSPSSWCCSVCRSNKSP--WVCL--TCSSVHCGR
10 20 30 40 50
60 70 80 90
pF1KA1 -----------ESQV---DHSTIHSQE-TKHYLTVNLTTLRVWCYACSKEVFLDRKLGTQ
..:: .:. ..:. ..: . .. .. ..:: :. : : :::
CCDS32 YVNGHAKKHYEDAQVPLTNHKKSEKQDKVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGL-
60 70 80 90 100 110
100 110 120 130 140 150
pF1KA1 PSLPHVRQPHQIQENSV------QDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRARGL
. .::. : :::. . :. :.::.. :. : . :
CCDS32 --VQKVREHLQNLENSAFTADRHKKRKLLENSTLNSKLLKV----------NGSTTAICA
120 130 140 150
160 170 180 190
pF1KA1 TGLKNIGNTCYMNAALQALSNCPPLTQFF-------LDCGGLA--RT-------DKKPAI
:::.:.::::.::: ::.::: . .: : : : :: :.. ..
CCDS32 TGLRNLGNTCFMNAILQSLSNIEQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSL
160 170 180 190 200 210
200 210 220 230 240 250
pF1KA1 CKSYLKLMTELWYKSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELK
. . : . :: :. . : .:: . . :.::::.::::.::.: :.: :: ::.
CCDS32 VEEFRKTLCALWQGSQT-AFSPESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQ
220 230 240 250 260 270
260 270 280 290 300 310
pF1KA1 EQVMEVEEDPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTM
CCDS32 ------------------------------------------------------------
320 330 340 350 360 370
pF1KA1 LIQDDENNSEMSKDWQKEKMCNKINKVNSEGEFDKDRDSISETVDLNNQETVKVQIHSRA
: :
CCDS32 ------------------------------GGF---------------------------
280
380 390 400 410 420 430
pF1KA1 SEYITDVHSNDLSTPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQH
: .: :: : :::: : .::
CCDS32 ---------NGVSRSAILQE----NSTLSASNKCCIN-------------GAS-------
290 300
440 450 460 470 480 490
pF1KA1 KKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIV
.:.. :: : . . :.:: : : .. : :::: :: ....:
CCDS32 ----TVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIP-----SQFRS--------
310 320 330 340 350
500 510 520 530 540 550
pF1KA1 KAGSCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMY
: .. : ::: .:.::: .: .:: ..:
CCDS32 KRSKNQEN---------------------------GPVCSLRDCLRSFTDLEELDETELY
360 370 380
560 570 580 590 600 610
pF1KA1 SCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFL--
:.:::: ....: .:..:..::.:::::. .. .:..:.: :::.:::.. .:
CCDS32 MCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLE
390 400 410 420 430 440
620 630 640 650 660 670
pF1KA1 AKDSPAQIVTYDLLSVICHHGTA-SSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNA
..: . ::: .:. :::.. .:::: :: . .. :..:.:..:: ..: :: .:
CCDS32 PENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKA
450 460 470 480 490 500
680 690 700 710 720 730
pF1KA1 EAYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFL
.::.::: . . .: ...
CCDS32 KAYILFYVEHQAKAGSDKL
510 520
>>CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 (362 aa)
initn: 734 init1: 235 opt: 416 Z-score: 416.1 bits: 86.9 E(32554): 7.5e-17
Smith-Waterman score: 427; 31.6% identity (53.8% similar) in 275 aa overlap (415-685:135-357)
390 400 410 420 430 440
pF1KA1 HSNDLSTPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKY----
: : : . . : ... .::
CCDS58 PRFVGYNQQDAQEFLRFLLDGLHNEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLERE
110 120 130 140 150 160
450 460 470 480 490 500
pF1KA1 RSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAG
: :.:.: : . ::. : : :.... : ::::::
CCDS58 DSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPI----------------------
170 180 190 200
510 520 530 540 550 560
pF1KA1 SCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCE
: .:. : :::.::. : .: : ::. .:
CCDS58 ------AKRGY----------------------PEVTLMDCMRLFTKEDVLDGDEKPTCC
210 220 230
570 580 590 600 610 620
pF1KA1 KCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSP
.:. . .: ..: ::.:: .::::: . . ..:..: :.:::. :::. : ....
CCDS58 RCRGRKRCIKKFSIQRFPKILVLHLKRFSESRIRTSKLTTFVNFPLRDLDLREFASENTN
240 250 260 270 280 290
630 640 650 660 670 680
pF1KA1 AQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLF
. :.: .: : ::. .::: ::::. .. :. :.:.::: .: : :....::.::
CCDS58 HAV--YNLYAVSNHSGTTMGGHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLF
300 310 320 330 340 350
690 700 710 720 730 740
pF1KA1 YRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGV
:. .:
CCDS58 YELASPPSRM
360
>>CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 (396 aa)
initn: 734 init1: 235 opt: 416 Z-score: 415.5 bits: 86.9 E(32554): 8e-17
Smith-Waterman score: 427; 31.6% identity (53.8% similar) in 275 aa overlap (415-685:169-391)
390 400 410 420 430 440
pF1KA1 HSNDLSTPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKY----
: : : . . : ... .::
CCDS84 PRFVGYNQQDAQEFLRFLLDGLHNEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLERE
140 150 160 170 180 190
450 460 470 480 490 500
pF1KA1 RSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAG
: :.:.: : . ::. : : :.... : ::::::
CCDS84 DSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPI----------------------
200 210 220 230
510 520 530 540 550 560
pF1KA1 SCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCE
: .:. : :::.::. : .: : ::. .:
CCDS84 ------AKRGY----------------------PEVTLMDCMRLFTKEDVLDGDEKPTCC
240 250 260
570 580 590 600 610 620
pF1KA1 KCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSP
.:. . .: ..: ::.:: .::::: . . ..:..: :.:::. :::. : ....
CCDS84 RCRGRKRCIKKFSIQRFPKILVLHLKRFSESRIRTSKLTTFVNFPLRDLDLREFASENTN
270 280 290 300 310 320
630 640 650 660 670 680
pF1KA1 AQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLF
. :.: .: : ::. .::: ::::. .. :. :.:.::: .: : :....::.::
CCDS84 HAV--YNLYAVSNHSGTTMGGHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLF
330 340 350 360 370 380
690 700 710 720 730 740
pF1KA1 YRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGV
:. .:
CCDS84 YELASPPSRM
390
>>CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 (605 aa)
initn: 734 init1: 235 opt: 416 Z-score: 412.6 bits: 87.0 E(32554): 1.2e-16
Smith-Waterman score: 427; 31.6% identity (53.8% similar) in 275 aa overlap (415-685:378-600)
390 400 410 420 430 440
pF1KA1 HSNDLSTPQILPSNEGVNPRLSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKY----
: : : . . : ... .::
CCDS84 PRFVGYNQQDAQEFLRFLLDGLHNEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLERE
350 360 370 380 390 400
450 460 470 480 490 500
pF1KA1 RSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAG
: :.:.: : . ::. : : :.... : ::::::
CCDS84 DSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPI----------------------
410 420 430 440
510 520 530 540 550 560
pF1KA1 SCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCE
: .:. : :::.::. : .: : ::. .:
CCDS84 ------AKRGY----------------------PEVTLMDCMRLFTKEDVLDGDEKPTCC
450 460 470
570 580 590 600 610 620
pF1KA1 KCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSP
.:. . .: ..: ::.:: .::::: . . ..:..: :.:::. :::. : ....
CCDS84 RCRGRKRCIKKFSIQRFPKILVLHLKRFSESRIRTSKLTTFVNFPLRDLDLREFASENTN
480 490 500 510 520 530
630 640 650 660 670 680
pF1KA1 AQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLF
. :.: .: : ::. .::: ::::. .. :. :.:.::: .: : :....::.::
CCDS84 HAV--YNLYAVSNHSGTTMGGHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLF
540 550 560 570 580 590
690 700 710 720 730 740
pF1KA1 YRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGV
:. .:
CCDS84 YELASPPSRM
600
>>CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012 aa)
initn: 746 init1: 218 opt: 402 Z-score: 395.4 bits: 84.6 E(32554): 1e-15
Smith-Waterman score: 427; 32.7% identity (58.1% similar) in 248 aa overlap (435-681:806-1000)
410 420 430 440 450 460
pF1KA1 LSASPPKSGNLWPGLAPPHKKAQSASPKRKKQHKKY-RSVISDIFDGTIISSVQCLTCDR
..::. .:.: .:.: . :.:::::: .
CCDS61 EDLNKADNRKRYKEENNDHLDDFKAAEHAWQKHKQLNESIIVALFQGQFKSTVQCLTCHK
780 790 800 810 820 830
470 480 490 500 510 520
pF1KA1 VSVTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRFV
: :.:.:. :::: : :.:.
CCDS61 KSRTFEAFMYLSLP---------LASTSK-------------------------------
840 850
530 540 550 560 570 580
pF1KA1 VSCVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILCI
: :::::: : ...: .: . : .:. :...: .. ..: .: .
CCDS61 --C----------TLQDCLRLFSKEEKLTDNNRFYCSHCRARRDSLKKIEIWKLPPVLLV
860 870 880 890 900
590 600 610 620 630 640
pF1KA1 HLKRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLSVICHHGTASSGHY
::::: .. .. :..: :.::::.:::. .. . .. :.:.:: :.: ..:::
CCDS61 HLKRFSYDGRWKQKLQTSVDFPLENLDLSQYVIGPK-NNLKKYNLFSVSNHYGGLDGGHY
910 920 930 940 950 960
650 660 670 680 690 700
pF1KA1 IAYCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIME
:::.: . :..:::. :...: :.:... ::.:::
CCDS61 TAYCKNAARQRWFKFDDHEVSDISVSSVKSSAAYILFYTSLGPRVTDVAT
970 980 990 1000 1010
710 720 730 740 750 760
pF1KA1 PSLLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDNL
911 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 10:42:46 2016 done: Thu Nov 3 10:42:46 2016
Total Scan time: 3.580 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]