FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3824, 2554 aa
1>>>pF1KE3824 2554 - 2554 aa - 2554 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.3096+/-0.00105; mu= 16.7442+/- 0.064
mean_var=110.7565+/-22.489, 0's: 0 Z-trim(107.4): 79 B-trim: 344 in 1/50
Lambda= 0.121868
statistics sampled from 9471 (9551) to 9471 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.629), E-opt: 0.2 (0.293), width: 16
Scan time: 6.100
The best scores are: opt bits E(32554)
CCDS55403.1 USP9X gene_id:8239|Hs108|chrX (2554) 17316 3056.7 0
CCDS43930.1 USP9X gene_id:8239|Hs108|chrX (2570) 16777 2961.9 0
CCDS14781.1 USP9Y gene_id:8287|Hs108|chrY (2555) 16001 2825.5 0
CCDS44154.2 USP24 gene_id:23358|Hs108|chr1 (2620) 1164 216.9 1.1e-54
CCDS42686.1 USP34 gene_id:9736|Hs108|chr2 (3546) 595 116.9 1.9e-24
CCDS44084.1 USP48 gene_id:84196|Hs108|chr1 ( 485) 342 72.1 8.1e-12
CCDS81277.1 USP48 gene_id:84196|Hs108|chr1 ( 983) 342 72.2 1.5e-11
CCDS30623.1 USP48 gene_id:84196|Hs108|chr1 (1035) 342 72.2 1.6e-11
>>CCDS55403.1 USP9X gene_id:8239|Hs108|chrX (2554 aa)
initn: 17316 init1: 17316 opt: 17316 Z-score: 16442.8 bits: 3056.7 E(32554): 0
Smith-Waterman score: 17316; 100.0% identity (100.0% similar) in 2554 aa overlap (1-2554:1-2554)
10 20 30 40 50 60
pF1KE3 MTATTRGSPVGGNDNQGQAPDGQSQPPLQQNQTSSPDSSNENSPATPPDEQGQGDAPPQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MTATTRGSPVGGNDNQGQAPDGQSQPPLQQNQTSSPDSSNENSPATPPDEQGQGDAPPQL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 EDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGELEVLLEAAIDLSKKGLDVKSEACQRFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 EDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGELEVLLEAAIDLSKKGLDVKSEACQRFF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 RDGLTISFTKILTDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFPLLELLAMALNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RDGLTISFTKILTDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFPLLELLAMALNP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 HCKFHIYNGTRPCESVSSSVQLPEDELFARSPDPRSPKGWLVDLLNKFGTLNGFQILHDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HCKFHIYNGTRPCESVSSSVQLPEDELFARSPDPRSPKGWLVDLLNKFGTLNGFQILHDR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 FINGSALNVQIIAALIKPFGQCYEFLTLHTVKKYFLPIIEMVPQFLENLTDEELKKEAKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FINGSALNVQIIAALIKPFGQCYEFLTLHTVKKYFLPIIEMVPQFLENLTDEELKKEAKN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 EAKNDALSMIIKSLKNLASRVPGQEETVKNLEIFRLKMILRLLQISSFNGKMNALNEVNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 EAKNDALSMIIKSLKNLASRVPGQEETVKNLEIFRLKMILRLLQISSFNGKMNALNEVNK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 VISSVSYYTHRHGNPEEEEWLTAERMAEWIQQNNILSIVLRDSLHQPQYVEKLEKILRFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VISSVSYYTHRHGNPEEEEWLTAERMAEWIQQNNILSIVLRDSLHQPQYVEKLEKILRFV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 IKEKALTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPEQLDHLFDCFKASWTNAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 IKEKALTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPEQLDHLFDCFKASWTNAS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 KKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAHSDDVPVDIMDLALSAHIKILDYSC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAHSDDVPVDIMDLALSAHIKILDYSC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 SQDRDTQKIQWIDRFIEELRTNDKWVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SQDRDTQKIQWIDRFIEELRTNDKWVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRH
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 DLINQLQHNHALVTLVAENLATYMESMRLYARDHEDYDPQTVRLGSRYSHVQEVQERLNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DLINQLQHNHALVTLVAENLATYMESMRLYARDHEDYDPQTVRLGSRYSHVQEVQERLNF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 LRFLLKDGQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLMGDEPDLDPDINKDFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LRFLLKDGQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLMGDEPDLDPDINKDFF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 ESNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ESNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 SNDDIASRAIDLLKEIYTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTLCVLDGDKDSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SNDDIASRAIDLLKEIYTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTLCVLDGDKDSV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 NCARQEAVRMVRVLTVLREYINECDSDYHEERTILPMSRAFRGKHLSFVVRFPNQGRQVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NCARQEAVRMVRVLTVLREYINECDSDYHEERTILPMSRAFRGKHLSFVVRFPNQGRQVD
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 DLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELIDPADDRKLIGQLNLKDKSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELIDPADDRKLIGQLNLKDKSL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 ITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNPEVESCLPGVIMSLHPRYISF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNPEVESCLPGVIMSLHPRYISF
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 LWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKLRAICLDHAKLGESSLSPSLDSLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKLRAICLDHAKLGESSLSPSLDSLF
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 FGPSASQVLYLTEVVYALLMPAGAPLADDSSDFQFHFLKSGGLPLVLSMLTRNNFLPNAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FGPSASQVLYLTEVVYALLMPAGAPLADDSSDFQFHFLKSGGLPLVLSMLTRNNFLPNAD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 METRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPGVEGVNPMTQINQVTHDQAVVLQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 METRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPGVEGVNPMTQINQVTHDQAVVLQS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 ALQSIPNPSSECMLRNVSVRLAQQISDEASRYMPDICVIRAIQKIIWASGCGSLQLVFSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ALQSIPNPSSECMLRNVSVRLAQQISDEASRYMPDICVIRAIQKIIWASGCGSLQLVFSP
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 NEEITKIYEKTNAGNEPDLEDEQVCCEALEVMTLCFALIPTALDALSKEKAWQTFIIDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NEEITKIYEKTNAGNEPDLEDEQVCCEALEVMTLCFALIPTALDALSKEKAWQTFIIDLL
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 LHCHSKTVRQVAQEQFFLMCTRCCMGHRPLLFFITLLFTVLGSTARERAKHSGDYFTLLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LHCHSKTVRQVAQEQFFLMCTRCCMGHRPLLFFITLLFTVLGSTARERAKHSGDYFTLLR
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 HLLNYAYNSNINVPNAEVLLNNEIDWLKRIRDDVKRTGETGIEETILEGHLGVTKELLAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HLLNYAYNSNINVPNAEVLLNNEIDWLKRIRDDVKRTGETGIEETILEGHLGVTKELLAF
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 QTSEKKFHIGCEKGGANLIKELIDDFIFPASNVYLQYMRNGELPAEQAIPVCGSPPTINA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QTSEKKFHIGCEKGGANLIKELIDDFIFPASNVYLQYMRNGELPAEQAIPVCGSPPTINA
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 GFELLVALAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GFELLVALAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLK
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 NAGATCYMNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NAGATCYMNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGY
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE3 PQQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PQQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNL
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE3 REQHDALEFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 REQHDALEFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTL
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE3 NVDIRNHQNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NVDIRNHQNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRF
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE3 DYDWERECAIKFNDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DYDWERECAIKFNDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGS
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE3 TKYRLVGVLVHSGQASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TKYRLVGVLVHSGQASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQC
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE3 FGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAITTRPHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAITTRPHQ
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE3 IIMPSAIERSVRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 IIMPSAIERSVRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEI
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE3 TMISIQLAARFLFTTGFHTKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TMISIQLAARFLFTTGFHTKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRF
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE3 SEYLLECPSAEVRGAFAKLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SEYLLECPSAEVRGAFAKLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAV
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE3 LNLLRREVSEHGRHLQQYFNLFVMYANLGVAEKTQLLKLSVPATFMLVSLDEGPGPPIKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LNLLRREVSEHGRHLQQYFNLFVMYANLGVAEKTQLLKLSVPATFMLVSLDEGPGPPIKY
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE3 QYAELGKLYSVVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQNVADILF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QYAELGKLYSVVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQNVADILF
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE3 VRTSYVKKIIEDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VRTSYVKKIIEDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLL
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE3 LQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPV
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE3 AYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQSNETSNGYFLERS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 AYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQSNETSNGYFLERS
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE3 HSARMTLAKACELCPEEEPDDQDAPDEHESPPPEDAPLYPHSPGSQYQQNNHVHGQPYTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HSARMTLAKACELCPEEEPDDQDAPDEHESPPPEDAPLYPHSPGSQYQQNNHVHGQPYTG
2470 2480 2490 2500 2510 2520
2530 2540 2550
pF1KE3 PAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
::::::::::::::::::::::::::::::::::
CCDS55 PAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
2530 2540 2550
>>CCDS43930.1 USP9X gene_id:8239|Hs108|chrX (2570 aa)
initn: 16746 init1: 16746 opt: 16777 Z-score: 15930.6 bits: 2961.9 E(32554): 0
Smith-Waterman score: 17274; 99.4% identity (99.4% similar) in 2570 aa overlap (1-2554:1-2570)
10 20 30 40 50 60
pF1KE3 MTATTRGSPVGGNDNQGQAPDGQSQPPLQQNQTSSPDSSNENSPATPPDEQGQGDAPPQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MTATTRGSPVGGNDNQGQAPDGQSQPPLQQNQTSSPDSSNENSPATPPDEQGQGDAPPQL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 EDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGELEVLLEAAIDLSKKGLDVKSEACQRFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGELEVLLEAAIDLSKKGLDVKSEACQRFF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 RDGLTISFTKILTDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFPLLELLAMALNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RDGLTISFTKILTDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFPLLELLAMALNP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 HCKFHIYNGTRPCESVSSSVQLPEDELFARSPDPRSPKGWLVDLLNKFGTLNGFQILHDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HCKFHIYNGTRPCESVSSSVQLPEDELFARSPDPRSPKGWLVDLLNKFGTLNGFQILHDR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 FINGSALNVQIIAALIKPFGQCYEFLTLHTVKKYFLPIIEMVPQFLENLTDEELKKEAKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FINGSALNVQIIAALIKPFGQCYEFLTLHTVKKYFLPIIEMVPQFLENLTDEELKKEAKN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 EAKNDALSMIIKSLKNLASRVPGQEETVKNLEIFRLKMILRLLQISSFNGKMNALNEVNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EAKNDALSMIIKSLKNLASRVPGQEETVKNLEIFRLKMILRLLQISSFNGKMNALNEVNK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 VISSVSYYTHRHGNPEEEEWLTAERMAEWIQQNNILSIVLRDSLHQPQYVEKLEKILRFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VISSVSYYTHRHGNPEEEEWLTAERMAEWIQQNNILSIVLRDSLHQPQYVEKLEKILRFV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 IKEKALTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPEQLDHLFDCFKASWTNAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IKEKALTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPEQLDHLFDCFKASWTNAS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 KKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAHSDDVPVDIMDLALSAHIKILDYSC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAHSDDVPVDIMDLALSAHIKILDYSC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 SQDRDTQKIQWIDRFIEELRTNDKWVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SQDRDTQKIQWIDRFIEELRTNDKWVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRH
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 DLINQLQHNHALVTLVAENLATYMESMRLYARDHEDYDPQTVRLGSRYSHVQEVQERLNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DLINQLQHNHALVTLVAENLATYMESMRLYARDHEDYDPQTVRLGSRYSHVQEVQERLNF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 LRFLLKDGQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLMGDEPDLDPDINKDFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LRFLLKDGQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLMGDEPDLDPDINKDFF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 ESNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ESNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 SNDDIASRAIDLLKEIYTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTLCVLDGDKDSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SNDDIASRAIDLLKEIYTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTLCVLDGDKDSV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 NCARQEAVRMVRVLTVLREYINECDSDYHEERTILPMSRAFRGKHLSFVVRFPNQGRQVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NCARQEAVRMVRVLTVLREYINECDSDYHEERTILPMSRAFRGKHLSFVVRFPNQGRQVD
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 DLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELIDPADDRKLIGQLNLKDKSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELIDPADDRKLIGQLNLKDKSL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 ITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNPEVESCLPGVIMSLHPRYISF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNPEVESCLPGVIMSLHPRYISF
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 LWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKLRAICLDHAKLGESSLSPSLDSLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKLRAICLDHAKLGESSLSPSLDSLF
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 FGPSASQVLYLTEVVYALLMPAGAPLADDSSDFQFHFLKSGGLPLVLSMLTRNNFLPNAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FGPSASQVLYLTEVVYALLMPAGAPLADDSSDFQFHFLKSGGLPLVLSMLTRNNFLPNAD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 METRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPGVEGVNPMTQINQVTHDQAVVLQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 METRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPGVEGVNPMTQINQVTHDQAVVLQS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 ALQSIPNPSSECMLRNVSVRLAQQISDEASRYMPDICVIRAIQKIIWASGCGSLQLVFSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ALQSIPNPSSECMLRNVSVRLAQQISDEASRYMPDICVIRAIQKIIWASGCGSLQLVFSP
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 NEEITKIYEKTNAGNEPDLEDEQVCCEALEVMTLCFALIPTALDALSKEKAWQTFIIDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NEEITKIYEKTNAGNEPDLEDEQVCCEALEVMTLCFALIPTALDALSKEKAWQTFIIDLL
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 LHCHSKTVRQVAQEQFFLMCTRCCMGHRPLLFFITLLFTVLGSTARERAKHSGDYFTLLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LHCHSKTVRQVAQEQFFLMCTRCCMGHRPLLFFITLLFTVLGSTARERAKHSGDYFTLLR
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 HLLNYAYNSNINVPNAEVLLNNEIDWLKRIRDDVKRTGETGIEETILEGHLGVTKELLAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HLLNYAYNSNINVPNAEVLLNNEIDWLKRIRDDVKRTGETGIEETILEGHLGVTKELLAF
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 QTSEKKFHIGCEKGGANLIKELIDDFIFPASNVYLQYMRNGELPAEQAIPVCGSPPTINA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QTSEKKFHIGCEKGGANLIKELIDDFIFPASNVYLQYMRNGELPAEQAIPVCGSPPTINA
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 GFELLVALAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GFELLVALAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLK
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 NAGATCYMNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NAGATCYMNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGY
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE3 PQQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PQQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNL
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE3 REQHDALEFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 REQHDALEFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTL
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE3 NVDIRNHQNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NVDIRNHQNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRF
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE3 DYDWERECAIKFNDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DYDWERECAIKFNDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGS
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE3 TKYRLVGVLVHSGQASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TKYRLVGVLVHSGQASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQC
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE3 FGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAITTRPHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAITTRPHQ
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE3 IIMPSAIERSVRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IIMPSAIERSVRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEI
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE3 TMISIQLAARFLFTTGFHTKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TMISIQLAARFLFTTGFHTKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRF
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE3 SEYLLECPSAEVRGAFAKLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SEYLLECPSAEVRGAFAKLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAV
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE3 LNLLRREVSEHGRHLQQYFNLFVMYANLGVAEKTQLLKLSVPATFMLVSLDEGPGPPIKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LNLLRREVSEHGRHLQQYFNLFVMYANLGVAEKTQLLKLSVPATFMLVSLDEGPGPPIKY
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE3 QYAELGKLYSVVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQNVADILF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QYAELGKLYSVVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQNVADILF
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE3 VRTSYVKKIIEDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VRTSYVKKIIEDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLL
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE3 LQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPV
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE3 AYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQSNETSNGYFLERS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQSNETSNGYFLERS
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500
pF1KE3 HSARMTLAKACELCPEE----------------EPDDQDAPDEHESPPPEDAPLYPHSPG
::::::::::::::::: :::::::::::::::::::::::::::
CCDS43 HSARMTLAKACELCPEEVKKATSVQQIEMEESKEPDDQDAPDEHESPPPEDAPLYPHSPG
2470 2480 2490 2500 2510 2520
2510 2520 2530 2540 2550
pF1KE3 SQYQQNNHVHGQPYTGPAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SQYQQNNHVHGQPYTGPAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
2530 2540 2550 2560 2570
>>CCDS14781.1 USP9Y gene_id:8287|Hs108|chrY (2555 aa)
initn: 10829 init1: 10829 opt: 16001 Z-score: 15193.3 bits: 2825.5 E(32554): 0
Smith-Waterman score: 16001; 91.6% identity (97.3% similar) in 2556 aa overlap (1-2554:1-2555)
10 20 30 40 50
pF1KE3 MTATTRGSPVGGNDNQGQAPDGQSQPPLQQNQTSSPDSSNENSPATPP-DEQGQGDAPPQ
::: :.::::::::.:::. ::::: .::::::::::::::: :::: .::::::::::
CCDS14 MTAITHGSPVGGNDSQGQVLDGQSQHLFQQNQTSSPDSSNENSVATPPPEEQGQGDAPPQ
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 LEDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGELEVLLEAAIDLSKKGLDVKSEACQRF
::::::::::.::.::::::::::::::::::::::::::::::: :::::::::::::
CCDS14 HEDEEPAFPHTELANLDDMINRPRWVVPVLPKGELEVLLEAAIDLSVKGLDVKSEACQRF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 FRDGLTISFTKILTDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFPLLELLAMALN
::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FRDGLTISFTKILMDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFPLLELLAMALN
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 PHCKFHIYNGTRPCESVSSSVQLPEDELFARSPDPRSPKGWLVDLLNKFGTLNGFQILHD
::::::::::::::: .::..::::::::::: ::::::::::::.::::::::::::::
CCDS14 PHCKFHIYNGTRPCELISSNAQLPEDELFARSSDPRSPKGWLVDLINKFGTLNGFQILHD
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE3 RFINGSALNVQIIAALIKPFGQCYEFLTLHTVKKYFLPIIEMVPQFLENLTDEELKKEAK
::.::::::.:::::::::::::::::. ::.::::.:.::.::..::::::::::::::
CCDS14 RFFNGSALNIQIIAALIKPFGQCYEFLSQHTLKKYFIPVIEIVPHLLENLTDEELKKEAK
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE3 NEAKNDALSMIIKSLKNLASRVPGQEETVKNLEIFRLKMILRLLQISSFNGKMNALNEVN
:::::::::::::::::::::. ::.::.:::::::::::::::::::::::::::::.:
CCDS14 NEAKNDALSMIIKSLKNLASRISGQDETIKNLEIFRLKMILRLLQISSFNGKMNALNEIN
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE3 KVISSVSYYTHRHGNPEEEEWLTAERMAEWIQQNNILSIVLRDSLHQPQYVEKLEKILRF
:::::::::::::.:::::::::::::::::::::::::::.::::::::::::::::::
CCDS14 KVISSVSYYTHRHSNPEEEEWLTAERMAEWIQQNNILSIVLQDSLHQPQYVEKLEKILRF
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE3 VIKEKALTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPEQLDHLFDCFKASWTNA
::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::::
CCDS14 VIKEKALTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPGQLDHLFDCFKASWTNA
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE3 SKKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAHSDDVPVDIMDLALSAHIKILDYS
::::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::
CCDS14 SKKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAQSDDVPVDIMDLALSAHIKILDYS
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE3 CSQDRDTQKIQWIDRFIEELRTNDKWVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYR
::::::.:::::::.::::::::::::::::::::::::::::: :::::::::::.:::
CCDS14 CSQDRDAQKIQWIDHFIEELRTNDKWVIPALKQIREICSLFGEASQNLSQTQRSPHIFYR
550 560 570 580 590 600
600 610 620 630 640 650
pF1KE3 HDLINQLQHNHALVTLVAENLATYMESMRLYARDHEDYDPQTVRLGSRYSHVQEVQERLN
::::::::.::::::::::::::::.:.:::: :::::::::::::::::::::::::::
CCDS14 HDLINQLQQNHALVTLVAENLATYMNSIRLYAGDHEDYDPQTVRLGSRYSHVQEVQERLN
610 620 630 640 650 660
660 670 680 690 700 710
pF1KE3 FLRFLLKDGQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLMGDEPDLDPDINKDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FLRFLLKDGQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLMGDEPDLDPDINKDF
670 680 690 700 710 720
720 730 740 750 760 770
pF1KE3 FESNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVI
:::::::::::::::::::::::::::::::: ::.::::.:::::::::::::::::::
CCDS14 FESNVLQLDPSLLTENGMKCFERFFKAVNCRERKLIAKRRSYMMDDLELIGLDYLWRVVI
730 740 750 760 770 780
780 790 800 810 820 830
pF1KE3 QSNDDIASRAIDLLKEIYTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTLCVLDGDKDS
::.:.::.:::::::::::::::::..::::::::::::::::::::::::::.::::.:
CCDS14 QSSDEIANRAIDLLKEIYTNLGPRLKANQVVIHEDFIQSCFDRLKASYDTLCVFDGDKNS
790 800 810 820 830 840
840 850 860 870 880 890
pF1KE3 VNCARQEAVRMVRVLTVLREYINECDSDYHEERTILPMSRAFRGKHLSFVVRFPNQGRQV
.:::::::.::::::::..:::::::::::.:: ::::::::::::::..::::::::::
CCDS14 INCARQEAIRMVRVLTVIKEYINECDSDYHKERMILPMSRAFRGKHLSLIVRFPNQGRQV
850 860 870 880 890 900
900 910 920 930 940 950
pF1KE3 DDLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELIDPADDRKLIGQLNLKDKS
:.:..:::::::::::::::.::::::::: :::::::::::: :::::::::::::::
CCDS14 DELDIWSHTNDTIGSVRRCIVNRIKANVAHKKIELFVGGELIDSEDDRKLIGQLNLKDKS
910 920 930 940 950 960
960 970 980 990 1000 1010
pF1KE3 LITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNPEVESCLPGVIMSLHPRYIS
:::::::::. ::::::::::::::.::::: :::.:::: ::::::::::::.::::::
CCDS14 LITAKLTQINFNMPSSPDSSSDSSTASPGNHRNHYNDGPNLEVESCLPGVIMSVHPRYIS
970 980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KE3 FLWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKLRAICLDHAKLGESSLSPSLDSL
::::::::::.:::::::::::::::::::: :..:::::.:::::::::..::: ::::
CCDS14 FLWQVADLGSNLNMPPLRDGARVLMKLMPPDRTAVEKLRAVCLDHAKLGEGKLSPPLDSL
1030 1040 1050 1060 1070 1080
1080 1090 1100 1110 1120 1130
pF1KE3 FFGPSASQVLYLTEVVYALLMPAGAPLADDSSDFQFHFLKSGGLPLVLSMLTRNNFLPNA
::::::::::::::::::::::::.::.: ::::: ::::::::::::::: :::::::.
CCDS14 FFGPSASQVLYLTEVVYALLMPAGVPLTDGSSDFQVHFLKSGGLPLVLSMLIRNNFLPNT
1090 1100 1110 1120 1130 1140
1140 1150 1160 1170 1180 1190
pF1KE3 DMETRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPGVEGVNPMTQINQVTHDQAVVLQ
::::::::::::::::::::::::::::::::::::: :.:..:.:::::::::::::::
CCDS14 DMETRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPVVDGTDPITQINQVTHDQAVVLQ
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230 1240 1250
pF1KE3 SALQSIPNPSSECMLRNVSVRLAQQISDEASRYMPDICVIRAIQKIIWASGCGSLQLVFS
:::::::::::::.::: :. :::.::.::::::::::::::::::::::.::.: ::::
CCDS14 SALQSIPNPSSECVLRNESILLAQEISNEASRYMPDICVIRAIQKIIWASACGALGLVFS
1210 1220 1230 1240 1250 1260
1260 1270 1280 1290 1300 1310
pF1KE3 PNEEITKIYE-KTNAGNEPDLEDEQVCCEALEVMTLCFALIPTALDALSKEKAWQTFIID
:::::::::. ::..:. ..:::::::::::::::::::.:::::::::::::::::::
CCDS14 PNEEITKIYQMTTNGSNKLEVEDEQVCCEALEVMTLCFALLPTALDALSKEKAWQTFIID
1270 1280 1290 1300 1310 1320
1320 1330 1340 1350 1360 1370
pF1KE3 LLLHCHSKTVRQVAQEQFFLMCTRCCMGHRPLLFFITLLFTVLGSTARERAKHSGDYFTL
::::: ::::::.::::::::::::::::::::::::::::.:::::::..:.:::::::
CCDS14 LLLHCPSKTVRQLAQEQFFLMCTRCCMGHRPLLFFITLLFTILGSTAREKGKYSGDYFTL
1330 1340 1350 1360 1370 1380
1380 1390 1400 1410 1420 1430
pF1KE3 LRHLLNYAYNSNINVPNAEVLLNNEIDWLKRIRDDVKRTGETGIEETILEGHLGVTKELL
::::::::::.:::.::::::: .::::::::::.:: :::::.:: :::::::::::::
CCDS14 LRHLLNYAYNGNINIPNAEVLLVSEIDWLKRIRDNVKNTGETGVEEPILEGHLGVTKELL
1390 1400 1410 1420 1430 1440
1440 1450 1460 1470 1480 1490
pF1KE3 AFQTSEKKFHIGCEKGGANLIKELIDDFIFPASNVYLQYMRNGELPAEQAIPVCGSPPTI
::::::::.:.::::::::::::::::::::::.:::::.:.::::::::::::.:: ::
CCDS14 AFQTSEKKYHFGCEKGGANLIKELIDDFIFPASKVYLQYLRSGELPAEQAIPVCSSPVTI
1450 1460 1470 1480 1490 1500
1500 1510 1520 1530 1540 1550
pF1KE3 NAGFELLVALAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVG
:::::::::::.::::::::::: ::::::.:::::::::::::::::::::::::::::
CCDS14 NAGFELLVALAIGCVRNLKQIVDCLTEMYYMGTAITTCEALTEWEYLPPVGPRPPKGFVG
1510 1520 1530 1540 1550 1560
1560 1570 1580 1590 1600 1610
pF1KE3 LKNAGATCYMNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVF
:::::::::::::::::::::::::.::::::::::. ::: ::::::.:::::::::::
CCDS14 LKNAGATCYMNSVIQQLYMIPSIRNSILAIEGTGSDLHDDMFGDEKQDSESNVDPRDDVF
1570 1580 1590 1600 1610 1620
1620 1630 1640 1650 1660 1670
pF1KE3 GYPQQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPV
:::.:::::::::::::::::::::::::::::::::::.::::::::::::::::::::
CCDS14 GYPHQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASQLQYYVPRGFWKQFRLWGEPV
1630 1640 1650 1660 1670 1680
1680 1690 1700 1710 1720 1730
pF1KE3 NLREQHDALEFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFT
::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::
CCDS14 NLREQHDALEFFNSLVDSLDEALKALGHPAILSKVLGGSFADQKICQGCPHRYECEESFT
1690 1700 1710 1720 1730 1740
1740 1750 1760 1770 1780 1790
pF1KE3 TLNVDIRNHQNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLK
:::::::::::::::::::.::::::::::::::::.::::::::::::::: :::::::
CCDS14 TLNVDIRNHQNLLDSLEQYIKGDLLEGANAYHCEKCDKKVDTVKRLLIKKLPRVLAIQLK
1750 1760 1770 1780 1790 1800
1800 1810 1820 1830 1840 1850
pF1KE3 RFDYDWERECAIKFNDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETA
:::::::::::::::::::::::::: ::::::::.:: :::: :..::.:.:::..:::
CCDS14 RFDYDWERECAIKFNDYFEFPRELDMGPYTVAGVANLERDNVNSENELIEQKEQSDNETA
1810 1820 1830 1840 1850 1860
1860 1870 1880 1890 1900 1910
pF1KE3 GSTKYRLVGVLVHSGQASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKN
:.::::::::::::::::::::::::::::: : . ..::::::::::::::::::::::
CCDS14 GGTKYRLVGVLVHSGQASGGHYYSYIIQRNGKDDQTDHWYKFDDGDVTECKMDDDEEMKN
1870 1880 1890 1900 1910 1920
1920 1930 1940 1950 1960 1970
pF1KE3 QCFGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAITTRP
::::::::::::::::::::::::::::::::::::.:: ::.:::.:::::::.:. ::
CCDS14 QCFGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYEQMDMIDEDDEMIRYISELTIA-RP
1930 1940 1950 1960 1970
1980 1990 2000 2010 2020 2030
pF1KE3 HQIIMPSAIERSVRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAE
::::: :::::::::::.:::::.:::.:::::.::::::::::::: ::::.::::::
CCDS14 HQIIMSPAIERSVRKQNVKFMHNRLQYSLEYFQFVKKLLTCNGVYLNPAPGQDYLLPEAE
1980 1990 2000 2010 2020 2030
2040 2050 2060 2070 2080 2090
pF1KE3 EITMISIQLAARFLFTTGFHTKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSN
:::::::::::::::::::::::.::: :::::::::.::::::::::::.:::::::::
CCDS14 EITMISIQLAARFLFTTGFHTKKIVRGPASDWYDALCVLLRHSKNVRFWFTHNVLFNVSN
2040 2050 2060 2070 2080 2090
2100 2110 2120 2130 2140 2150
pF1KE3 RFSEYLLECPSAEVRGAFAKLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLR
::::::::::::::::::::::::::::::::: :::::::::::::: :::::::::::
CCDS14 RFSEYLLECPSAEVRGAFAKLIVFIAHFSLQDGSCPSPFASPGPSSQACDNLSLSDHLLR
2100 2110 2120 2130 2140 2150
2160 2170 2180 2190 2200 2210
pF1KE3 AVLNLLRREVSEHGRHLQQYFNLFVMYANLGVAEKTQLLKLSVPATFMLVSLDEGPGPPI
:.::::::::::::.::::::::::::::::::::::::::.::::::::::::::::::
CCDS14 ATLNLLRREVSEHGHHLQQYFNLFVMYANLGVAEKTQLLKLNVPATFMLVSLDEGPGPPI
2160 2170 2180 2190 2200 2210
2220 2230 2240 2250 2260 2270
pF1KE3 KYQYAELGKLYSVVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQNVADI
::::::::::::::::::::::::: ::::::::::::::::: ::::::::::::: ::
CCDS14 KYQYAELGKLYSVVSQLIRCCNVSSTMQSSINGNPPLPNPFGDLNLSQPIMPIQQNVLDI
2220 2230 2240 2250 2260 2270
2280 2290 2300 2310 2320 2330
pF1KE3 LFVRTSYVKKIIEDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLD
:::::::::::::::::::.:.:::::: :::::::::::::::::::::::::::::::
CCDS14 LFVRTSYVKKIIEDCSNSEDTIKLLRFCSWENPQFSSTVLSELLWQVAYSYTYELRPYLD
2280 2290 2300 2310 2320 2330
2340 2350 2360 2370 2380 2390
pF1KE3 LLLQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNC
::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::.:
CCDS14 LLFQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSSC
2340 2350 2360 2370 2380 2390
2400 2410 2420 2430 2440 2450
pF1KE3 PVAYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQSNETSNGYFLE
:::::::::::::::::::::::::::::::::::::::.:::::::::::::.::::::
CCDS14 PVAYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYSYNNWSPPVQSNETANGYFLE
2400 2410 2420 2430 2440 2450
2460 2470 2480 2490 2500 2510
pF1KE3 RSHSARMTLAKACELCPEEEPDDQDAPDEHESPPPEDAPLYPHSPGSQYQQNNHVHGQPY
::::::::::::::::::::::::::::::: : ::::::::::.::::::::::::::
CCDS14 RSHSARMTLAKACELCPEEEPDDQDAPDEHEPSPSEDAPLYPHSPASQYQQNNHVHGQPY
2460 2470 2480 2490 2500 2510
2520 2530 2540 2550
pF1KE3 TGPAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
:::::::.::::.::::.::::::.:::: :: :::
CCDS14 TGPAAHHLNNPQKTGQRTQENYEGNEEVSSPQMKDQ
2520 2530 2540 2550
>>CCDS44154.2 USP24 gene_id:23358|Hs108|chr1 (2620 aa)
initn: 1697 init1: 755 opt: 1164 Z-score: 1095.0 bits: 216.9 E(32554): 1.1e-54
Smith-Waterman score: 3545; 30.5% identity (59.1% similar) in 2702 aa overlap (6-2495:71-2593)
10 20 30
pF1KE3 MTATTRGSPVGGNDNQGQAPD-GQSQPPLQQNQTS
::. ::.:. : .:. : : . .
CCDS44 LTNERPGLDYGGYEPMDSGGGPSPGPGGGPRGD--GGGDGGGGGPSRGGSTG--GGGGFD
50 60 70 80 90
40 50 60 70 80 90
pF1KE3 SPDSSNENSPATPPDEQGQGDAPPQLEDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGEL
: . .: : ::.:. .. : :: :.: .:.. . .: .: . :
CCDS44 PPPAYHEVVDAEKNDENGNCSG------EGIEFPTTNLYELESRVLTDHWSIPYKREESL
100 110 120 130 140 150
100 110 120 130 140 150
pF1KE3 EVLLEAAIDLSKKGLDVKSEACQRFFRDGLTISFTKILTDEAVSGWKFEIHRCIINNTHR
: :. :.. ::. ..: :.::. . .: :.::. :: : :::. : :
CCDS44 GKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKKLLTSSAVHKWGTEIHEGIYNMLML
160 170 180 190 200 210
160 170 180 190 200 210
pF1KE3 LVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYNGTRPCESVSSSVQLPEDELFARSP
:.:: . ...:: .: :: .:.::.:: ..:. : . . . : . : ..:: ::
CCDS44 LIELVAERIKQDPIPTGLLGVLTMAFNPDNEYHFKNRMKVSQRNWAEV-FGEGNMFAVSP
220 230 240 250 260
220 230 240 250 260
pF1KE3 DP---RSPKGWLVDLLNKFGTLNGFQILHDRFINGSALNVQIIAALIKPFGQCYEFLTLH
. :.::.:::.:::: :.:: .. . ... ... ..:::.:.: : :.:.
CCDS44 VSTFQKEPHGWVVDLVNKFGELGGFAAIQAK-LHSEDIELGAVSALIQPLGVCAEYLNSS
270 280 290 300 310 320
270 280 290 300 310 320
pF1KE3 TVKKYFLPIIEMVPQFLENLTDEELKKEAKNEAKNDALSMIIKSLKNLASRVPGQEETVK
.:. .. :.: . : .... ...:: . . .. .....: : : : . :
CCDS44 VVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLVSIPELLSAVKLLCMRF--QPDLVT
330 340 350 360 370 380
330 340 350 360 370 380
pF1KE3 NLEIFRLKMILRLLQISSFNGKMNALNEVNKVISSVSYYTHRHGNPEEEEWLTAERMAEW
.. .:: ..::.:. :..:::.:.::.:.: . . . .. . ..:. .:
CCDS44 IVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIEDSTL------SKSVKNAIDTDRLLDW
390 400 410 420 430
390 400 410 420 430 440
pF1KE3 IQQNNILSIVLRDSLHQPQYVEKLEKILRFVIKEKALTLQDLDNIWAAQAGKHEAIVKNV
. .:..:::.:. .. : :: .... :.... .. :.:..: .:: :.:. ....:.
CCDS44 LVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK--LSLDELTKIWKIQSGQSSTVIENI
440 450 460 470 480 490
450 460 470 480 490 500
pF1KE3 HDLLAKLAWDFSPEQLDHLFDCFKASWTNASKKQREKLLELIRRLAEDDKDGVMAHKVLN
: ..: : :. .::.::: .. :: . : . :.::: :: :.... . . . :::.
CCDS44 HTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGREARFETTSGKVLD
500 510 520 530 540 550
510 520 530 540 550 560
pF1KE3 LLWNLAHSDDVPVDIMDLALSAHIKILDYSCSQDRDTQKIQWIDRFIEELRT--------
.::.::: .: .... :: :. ::. . . ... : ..: . ::...
CCDS44 VLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KEAIKRSYIIKCIEDIKRPGEWSGLE
560 570 580 590 600 610
570 580 590 600
pF1KE3 -NDK--------------WVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRHDLINQL
: : ::.:::.:..:: : :. .. ..: .:..:
CCDS44 KNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF--IKQTYQKQDKS--------IIQDL
620 630 640 650 660
610 620 630 640 650 660
pF1KE3 QHNHALVTLVAENLATYMESMRLYAR-DHEDYDPQTVRLGSRYSHVQEVQERLNFLRFLL
..: .: ::. .: . :: : .. . .::.. . .. .:.:: :.:
CCDS44 KKNFEIVKLVTGSL---IACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFL
670 680 690 700 710
670 680 690 700 710 720
pF1KE3 KDGQLWLCAPQAKQIWKCLAENAVYLC--DREACFKWYSKLMGDEPDLDPDINKDFFESN
... :.: .::.::.::. . .: ::: ::.:..: . ::. :.....:. .
CCDS44 QEATLYLGWNRAKEIWECLVTGQ-DVCELDREMCFEWFTK---GQHDLESDVQQQLFKEK
720 730 740 750 760 770
730 740 750 760 770 780
pF1KE3 VLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQSND
.:.:. .: ::.. :. ::. :: . .: . ... :::::.:..:.....: :
CCDS44 ILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESPD
780 790 800 810 820 830
790 800 810 820 830
pF1KE3 D-IASRAIDLLKEI-YTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTL-------CVLD
. ::..::.:. . : ::.:::. ..: .:. :: .:. ::.:. ..: :
CCDS44 EEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVTR
840 850 860 870 880 890
840 850 860 870 880
pF1KE3 GDK-------DSVNCARQEAVRMVRVLTVLR------EYINECDSDYHEERTILPMSRAF
. : .: . : : .... . : .:. .. : ::::: . .:
CCDS44 ATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASF
900 910 920 930 940 950
890 900 910 920 930 940
pF1KE3 RGKHLSFVVRFPNQGRQVDDLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELI
.:. :.. : . . : . : .:.:.:::::: : ... . : . :..:.. :.
CCDS44 HGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKIAKQLCSPVDN--IQIFTNDSLL
960 970 980 990 1000 1010
950 960 970 980 990 1000
pF1KE3 DPADDRKLIGQLNLKDKSLITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNPE
:.::. ::...:....:.: . .. :: :::..::..: : .. :. :
CCDS44 TVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYA----ME
1020 1030 1040 1050 1060
1010 1020 1030 1040 1050
pF1KE3 VESCLPGVIMSLHPRYISFLWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKL----
:. ::::.:.: ...:.:.:. :. : . .: :. :.: : . : :
CCDS44 QEKSLPGVVMALVCNVFDMLYQLAN----LEEPRITLRVRKLLLLIPTDPAIQEALDQLD
1070 1080 1090 1100 1110 1120
1060 1070 1080 1090
pF1KE3 ---RAICLDHAKLGESSLSPSL--------------DSLF--FGPSAS--QVLYLTEVVY
: : . ..:: :::: .::: :.:. : .::: ::.
CCDS44 SLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVLS
1130 1140 1150 1160 1170 1180
1100 1110 1120 1130 1140 1150
pF1KE3 ALLMP-AGAPLADD-SSDFQFHFLKSGGLPLVLSMLTRNNFLPNADMETRRGAYLNALKI
. ::: : .: . ...: .:::.::: ::.... :... ..:.:::.:.: :..
CCDS44 SKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQL
1190 1200 1210 1220 1230 1240
1160 1170 1180 1190 1200
pF1KE3 AKLLLTAIGYGHVRAVAEA-CQPGVEGVN--PMTQINQVTHDQAVVLQSALQS------I
:..:: .: . : . :.:... :. .... : : . . .: .
CCDS44 ARFLL--VGQTMPTLLDEDLTKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLSV
1250 1260 1270 1280 1290 1300
1210 1220 1230 1240 1250 1260
pF1KE3 PNPSSECMLRNV-SVRLAQQISDEASRYMPDI-CVIRAIQKIIWASGCGSLQLVFS--PN
. :: . . . ..:.: : . :.: . . : .: . ::.. : :.:: : :
CCDS44 SDRSSIRVEEIIPAARVAIQ-TMEVSDFTSTVACFMR----LSWAAAAGRLDLVGSSQPI
1310 1320 1330 1340 1350
1270 1280 1290
pF1KE3 EEITKIYEK------TNAGN--------EP--------------DLEDEQVCCEALEVMT
.: ... ...:. :: . .: . ::: ...
CCDS44 KESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQQSVSTKDSLIAGEALSLLV
1360 1370 1380 1390 1400 1410
1300 1310 1320 1330 1340
pF1KE3 LCFALIPTALDALSKEKAWQTFIIDLLLHCHSKTVRQVAQEQFFLMCTRCCMGH----RP
:. : : .. . ::::.:: : .:.:: .:.. . .: .:
CCDS44 TCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQKP
1420 1430 1440 1450 1460 1470
1350 1360 1370 1380 1390
pF1KE3 LLFFITLLFT----------VLGSTARERAKHSGDYFTLLRHLLNYAYNSNINV--PNAE
:.. ...: .. .. .. .. .:: : .::. .:... .
CCDS44 NQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISPA
1480 1490 1500 1510 1520 1530
1400 1410 1420 1430 1440 1450
pF1KE3 VLLNNEIDWLKRIRDDVKRTGETGIEETIL-EGHLGVTKELLAFQTSEKKFHIGCEKGGA
..:..:: :: .. . ::. ..:: ::: . : ::.. .:: : :.
CCDS44 TMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKTLLSLCGAEK------EMLGS
1540 1550 1560 1570 1580
1460 1470 1480 1490 1500
pF1KE3 NLIKELIDDFIFPASNVYLQYMRNGELPAEQAI-------PVCGSPPTINAGFELLVALA
.::: :.:::.: :: . : :.. :: .: : :.. . :..:.:: ::
CCDS44 SLIKPLLDDFLFRASRIIL----NSHSPAGSAAISQQDFHPKCSTANSRLAAYEVLVMLA
1590 1600 1610 1620 1630 1640
1510 1520 1530 1540 1550 1560
pF1KE3 VGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYMN
. ::. :. : :.. : :..::::: : .:::::.:.:::::::
CCDS44 DSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSSSGFVGLRNGGATCYMN
1650 1660 1670 1680 1690 1700
1570 1580 1590 1600 1610 1620
pF1KE3 SVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKPA
.:.::::: :.. ...:. :::: :: : :.::
CCDS44 AVFQQLYMQPGLPESLLS-------VDDDT------DN-----PDDSVF-----------
1710 1720 1730
1630 1640 1650 1660 1670 1680
pF1KE3 LSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALEF
:.. : .:::: :.::::::..::: :..:.. . .:::.:: ::
CCDS44 ---------YQV------QSLFGHLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYEF
1740 1750 1760 1770
1690 1700 1710 1720 1730 1740
pF1KE3 FNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQN
:.::.:..:: :: .:. ...... : ..:::::. :::::: ::.: .::. . . :.
CCDS44 FTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQS
1780 1790 1800 1810 1820 1830
1750 1760 1770 1780 1790 1800
pF1KE3 LLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERECA
: ::.:.:.:..:::.:::.::::..: :::: ::.:: ::.:.: :: .::: .
CCDS44 LEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRS
1840 1850 1860 1870 1880 1890
1810 1820 1830 1840 1850 1860
pF1KE3 IKFNDYFEFPRELDMEPYTVAGVAKLEGDN-VNPESQLIQQSE--QSESETAGSTKYRLV
::... ..:: :.::::::.:.:. .... :. ... ..:. . ....: . .:.::
CCDS44 IKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYELV
1900 1910 1920 1930 1940 1950
1870 1880 1890 1900 1910 1920
pF1KE3 GVLVHSGQASGGHYYSYIIQRNG-GDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGEY
::.:::::: .:::::.: .: : : : .::::.: . : ..: : .. .::::::
CCDS44 GVIVHSGQAHAGHYYSFIKDRRGCGKG---KWYKFNDTVIEEFDLND-ETLEYECFGGEY
1960 1970 1980 1990 2000 2010
1930 1940 1950 1960 1970
pF1KE3 MGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAI-----------
.:.:. . :: :.::::.:::.:.. ::.. .. :....
CCDS44 RPKVYDQTNPYTDVRR--RYWNAYMLFYQRVS--DQNSPVLPKKSRVSVVRQEAEDLSLS
2020 2030 2040 2050 2060
1980 1990 2000
pF1KE3 -----------TTRPHQ-------II----------------MPSAIERSVRKQNVQFMH
. :::. :. ::. : . :: .:..::.
CCDS44 APSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARIYQMVRDENLKFMK
2070 2080 2090 2100 2110 2120
2010 2020 2030 2040 2050 2060
pF1KE3 NRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLAARFLFTTGFHTK
:: :: .::.:. .: . :.. :. : : .. .:.::: .::: : ..::
CCDS44 NRDVYSSDYFSFVLSLASLNATKLKHP-----YYPC---MAKVSLQLAIQFLFQTYLRTK
2130 2140 2150 2160 2170 2180
2070 2080 2090 2100 2110
pF1KE3 KVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRFSE-YLLECPSAEVRGAFAKL
: .: .. .: .. :: .: .. :... . . . .. . .:::: ::: : : .
CCDS44 KKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLECNVREVRVAVATI
2190 2200 2210 2220 2230 2240
2120 2130 2140 2150 2160 2170
pF1KE3 IVFIAHFSLQDGPCPSPFASPGPSSQAY-DNLSLSDHLLRAVLNLLRREVSEHGRHLQQY
. . .:. :. : :.:. .::...: :: ..: :. .. ::
CCDS44 L----EKTLD-------------SALFYQDKLKSLHQLLEVLLALLDKDVPENCKNCAQY
2250 2260 2270 2280
2180 2190 2200 2210 2220 2230
pF1KE3 FNLFVMYAN-LGVAEKTQLLKLSVPATFMLVSLDEGPG---PPIKY----QYAELGKLYS
: :: ... :. ::. : : ..:. : . :. : :.:.:..
CCDS44 FFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWSSAQAREFGNLHN
2290 2300 2310 2320 2330 2340
2240 2250 2260 2270 2280
pF1KE3 VVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQNVADILFVRTS--YVKK
.:. :. .::: : .. . : . :.:..:....: .::. . :. .
CCDS44 TVALLVLHSDVSS--QRNVAPGIFKQRPPISIAPSSPLLPLHEEVEALLFMSEGKPYLLE
2350 2360 2370 2380 2390 2400
2290 2300 2310 2320 2330 2340
pF1KE3 II----EDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLLLQIL
.. : .. .... .::. : .:: :.: . :. . .::. ..:: .::
CCDS44 VMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLHEIL
2410 2420 2430 2440 2450 2460
2350 2360 2370 2380 2390 2400
pF1KE3 LIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPVAYQI
.::: :..:. : . . ..::. ...:.. ..: :::.: .:.: ..::.: .
CCDS44 VIEDPIQVERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAAKEY
2470 2480 2490 2500 2510
2410 2420 2430 2440 2450 2460
pF1KE3 LQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQ-SNETSNGYFLERSHSA
.. :. ..:.:::.:: . ... . :.: . :::::.: ..:. ::
CCDS44 FKENS---HHWSWAVQWL-----------QKKMSEHYWTPQSNVSNETSTGKTFQRTISA
2520 2530 2540 2550 2560
2470 2480 2490 2500 2510 2520
pF1KE3 RMTLAKACELCPEEEPDDQDAPDEHESPPPEDAPLYPHSPGSQYQQNNHVHGQPYTGPAA
. ::: : : :.: . .. .: :: :.
CCDS44 QDTLAYATALLNEKEQSGSSNGSES-SPANENGDRHLQQGSESPMMIGELRSDLDDVDP
2570 2580 2590 2600 2610 2620
2530 2540 2550
pF1KE3 HHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
>>CCDS42686.1 USP34 gene_id:9736|Hs108|chr2 (3546 aa)
initn: 829 init1: 230 opt: 595 Z-score: 552.3 bits: 116.9 E(32554): 1.9e-24
Smith-Waterman score: 1055; 22.6% identity (51.0% similar) in 1948 aa overlap (510-2344:862-2611)
480 490 500 510 520 530
pF1KE3 SKKQREKLLELIRRLAEDDKDGVMAHKVLNLLWNLAHSDDVPVDIMDLALSAHIKILDYS
:::......:. :.. . .. :.:
CCDS42 SQGPVVHKHQFNSNAVTDINLDNVCKKGNTLLWDIVQDEDA-VNLSEGLINEAEKLLCSL
840 850 860 870 880 890
540 550 560 570 580 590
pF1KE3 CSQDRDTQ-KIQWIDRFIEELRTNDKWVIPALKQIREICSLFGEAPQNLSQTQRSPHVFY
: : ....:. .:.: .: . :: ..: . .::: : :. .
CCDS42 VCWFTDRQIRMRFIEGCLENLGNNRSVVI----SLRLLPKLFGTFQQFGSS-------YD
900 910 920 930
600 610 620 630 640 650
pF1KE3 RHDLINQLQHNHALVTLVAENLATYMESMRLYARDHEDYDPQTVRLGSRYSHVQEVQERL
: . ... .. : .::. :....: . : . ::: ::: ::
CCDS42 THWITMWAEKELNMMKLFFDNLVYYIQTVREGRQKH-----------ALYSHSAEVQVRL
940 950 960 970 980
660 670 680 690 700 710
pF1KE3 NFLRFLLKD----GQLWLCAPQAKQIWKCLAENAVYLCDREACFKWYSKLM--GDEPDLD
.:: ... .. : :. .:.::.:.. : .: ..:. . . :. .
CCDS42 QFLTCVFSTLGSPDHFRLSLEQVDILWHCLVEDS--ECYDDA-LHWFLNQVRSKDQHAMG
990 1000 1010 1020 1030 1040
720 730 740 750 760 770
pF1KE3 PDINKDFFESNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAY-MMDDLELIGL
. : .: .. :: : .. .:.. :... : ..:... :: .. :: :.
CCDS42 METYKHLFLEKMPQLKPETISMTGLNLFQHL-----CNLARLATS--AYDGCSNSELCGM
1050 1060 1070 1080 1090
780 790 800 810 820 830
pF1KE3 DYLWRVVIQSND-DIASRAIDLLKEIYTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTL
: .: ....... :.. ::. .. : : :. .: .::..:.. : . ..:
CCDS42 DQFWGIALRAQSGDVSRAAIQYINSYYINGKTGLEKEQ-----EFISKCMESLMIASSSL
1100 1110 1120 1130 1140 1150
840 850 860 870 880
pF1KE3 CVLDGDKDSVNCARQEAVRMVRV-LTVLREYINECDSDYHEERT-ILPMSRAFRGKHLSF
. .. : . .... :... : ..:. . ... : : : .:. :. :.
CCDS42 ---EQESHSSLMVIERGLLMLKTHLEAFRRRFAYHLRQWQIEGTGISSHLKALSDKQ-SL
1160 1170 1180 1190 1200
890 900 910 920 930 940
pF1KE3 VVRFPNQGRQVDD-LEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGELIDPADDR
.: : . : . . . .: ....: :.:.: .: : :. .
CCDS42 PLRVVCQPAGLPDKMTIEMYPSDQVADLR--------AEVTHWYENL--QKEQINQQAQL
1210 1220 1230 1240 1250
950 960 970 980 990 1000
pF1KE3 KLIGQLNLKDK--SLITAKLTQISSN--MPSSPDSSSDSSTGSPGNHGNHYSDG-PNPEV
. .:: : : . . . . . .:::. . .. : .. : . : : : :
CCDS42 QEFGQSNRKGEFPGGLMGPVRMISSGHELTTDYDEKALHELGFKDMQMVFVSLGAPRRER
1260 1270 1280 1290 1300 1310
1010 1020 1030 1040
pF1KE3 E--------SCLPG-------VIMSLHPRYISFLWQVADLGSSLNMPPLR---DGARVL-
. :::: ... :. ... :... .. .:.. : . : .. :
CCDS42 KGEGVQLPASCLPPPQKDNIPMLLLLQEPHLTTLFDLLEMLASFKPPSGKVAVDDSESLR
1320 1330 1340 1350 1360 1370
1050 1060 1070 1080 1090
pF1KE3 ---MKLMPPD-STTIEKLRAI---C----LDHAKLGESSLSPSLD--SLFFGPSASQVLY
..: . : . .: . : . .... . . ... :. :: ..::
CCDS42 CEELHLHAENLSRRVWELLMLLPTCPNMLMAFQNISDEQSNDGFNWKELLKIKSAHKLLY
1380 1390 1400 1410 1420 1430
1100 1110 1120
pF1KE3 LTEVVYALLMP--------AGA-----PLADDSSDFQFH---------FLKSGGLPLVLS
:.. :: : .:. : .::::. : . :. .::: .:
CCDS42 ALEIIEALGKPNRRIRRESTGSYSDLYPDSDDSSEDQVENSKNSWSCKFVAAGGLQQLLE
1440 1450 1460 1470 1480 1490
1130 1140 1150 1160 1170
pF1KE3 MLTRNNFLPNADMETRRGAYLNALK-IAKLLLT--------AIGYGHVRA---VAEACQ-
... . . :. ..:. :. : . ::. ..: : : .::. .
CCDS42 IFNSGILEPK-EQESWTVWQLDCLACLLKLICQFAVDPSDLDLAYHDVFAWSGIAESHRK
1500 1510 1520 1530 1540 1550
1180 1190 1200 1210 1220
pF1KE3 ---PG----VEGVNPM-TQINQVTHDQAVVLQ--SALQSIPNPSSECMLRNVSVRLAQQI
:: . : . .: ..:. :..: : .: . : :.. :. .
CCDS42 RTWPGKSRKAAGDHAKGLHIPRLTEVFLVLVQGTSLIQRLM--SVAYTYDNLAPRVLKAQ
1560 1570 1580 1590 1600 1610
1230 1240 1250 1260 1270 1280
pF1KE3 SDEASRYMPDICVIRAIQKIIWASGCGSLQLVFSPNEEITKIYEKTNAGNEPDLEDEQVC
::. ::. .. . :: :. .. .. .... .: . :. ..
CCDS42 SDHRSRH--EVSHYSMWLLVSWAHCCSLVKSSLADSDHLQDWLKKLTLLI-PETAVRHES
1620 1630 1640 1650 1660 1670
1290 1300 1310 1320 1330 1340
pF1KE3 CEALEVMTLCFALIPTALDALSKEKAWQTFIIDLLLHCHSKTVRQVAQEQFFLMCTRCCM
: .: ..: ..::. .. ..: :: : .. . . : .
CCDS42 CSGLYKLSL------SGLDG--GDSINRSF----LLLAASTLLKFLPDAQAL--------
1680 1690 1700 1710
1350 1360 1370 1380 1390 1400
pF1KE3 GHRPLLFFITLLFTVLGSTARERAKHSGDYFTLLRHLLNYAYNSNINVPNAEVLLNNEID
.:. . .: .: :: :: .:.. ::.. .: ..:
CCDS42 --KPIRIDDYEEEPILKPGCKE-------YFWLLCKLVD-----NIHIKDASQTTLLDLD
1720 1730 1740 1750
1410 1420 1430 1440 1450 1460
pF1KE3 WLKRIRDDVKRTGET-GIEETILEGHLGVTKEL-LAFQTSEKKFHIGCEKGGANLIKELI
: : : :. : .. .: :.: : :: .. ..: . . : .......
CCDS42 ALARHLADCIRSREILDHQDGNVEDD-GLTGLLRLATSVVKHKPPFKFSREGQEFLRDIF
1760 1770 1780 1790 1800 1810
1470 1480 1490 1500 1510 1520
pF1KE3 DD-FIFPASNVYLQYMRNGELPAEQAIPVCGSPPTINAGFELLVALAVGCVRNLKQIVDS
. :..:. : .: : : : . :...::: .. : :.: . : .
CCDS42 NLLFLLPS------------LKDRQQ-PKCKSHSSRAAAYDLLVEMVKGSVENYRLIHNW
1820 1830 1840 1850 1860
1530 1540 1550 1560 1570 1580
pF1KE3 LTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYMNSVIQQLYMIPSIR
. ... .: .:.: : : :::: : :::::. :.:::::::: :
CCDS42 VMAQHM------QSHAPYKWDYWPHEDVRAECRFVGLTNLGATCYLASTIQQLYMIPEAR
1870 1880 1890 1900 1910
1590 1600 1610 1620 1630 1640
pF1KE3 NGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKPALSKTEDRKEYNIG
..... . . .::. ::
CCDS42 QAVFTAKYS-----EDMK------------------------------HKT---------
1920 1930
1650 1660 1670 1680 1690 1700
pF1KE3 VLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALEFFNSLVDSLDEALK
.: .:: .: .: :. . : :: : : . . .:.: ::.: :::..:. ...:
CCDS42 TLLELQKMFTYLMESECKAYNPRPFCKTYTMDKQPLNTGEQKDMTEFFTDLITKIEEMSP
1940 1950 1960 1970 1980 1990
1710 1720 1730 1740 1750 1760
pF1KE3 ALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQNLLDSLEQYVKGDL
: . .....:: .... . : : . : : :. .. . .:. .::.. . :
CCDS42 ELKN--TVKSLFGGVITNNVVSLDCEHVSQTAEEFYTVRCQVADMKNIYESLDEVTIKDT
2000 2010 2020 2030 2040 2050
1770 1780 1790 1800 1810 1820
pF1KE3 LEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERECAIKFNDYFEFPREL
::: : : : .:.::: . :: .:::: .:... :. .. : : .: :: .:
CCDS42 LEGDNMYTCSHCGKKVRAEKRACFKKLPRILSFNTMRYTFNMVTMMKEKVNTHFSFPLRL
2060 2070 2080 2090 2100 2110
1830 1840 1850 1860 1870 1880
pF1KE3 DMEPYTVAGVAKLEGDNVNPES--QLIQQSEQSESETAGSTKYRLVGVLVHSGQASGGHY
:: ::: : : . :. .. ..:..::: .: :.:: ::.: :.::::
CCDS42 DMTPYTEDF---LMGKSERKEGFKEVSDHSKDSESY-----EYDLIGVTVHTGTADGGHY
2120 2130 2140 2150 2160
1890 1900 1910 1920 1930
pF1KE3 YSYIIQ-RNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGEYMGEVFDHMM-KRMS
::.: . : . :.:: :.:..: : :. .. ..:::::. ...: . : :.
CCDS42 YSFIRDIVNPHAYKNNKWYLFNDAEV---KPFDSAQLASECFGGEMTTKTYDSVTDKFMD
2170 2180 2190 2200 2210 2220
1940 1950 1960 1970 1980 1990
pF1KE3 YRRQKRWWNAYILFYERMDTIDQDDELIRYISELAITTRPHQIIMPSAIERSVRKQNVQF
. .: .::.:::.::. ... : ... . : . . . ..:.::
CCDS42 FSFEKTH-SAYMLFYKRMEPEEENG-------------REYKFDVSSELLEWIWHDNMQF
2230 2240 2250 2260
2000 2010 2020 2030 2040 2050
pF1KE3 MHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLAARFLFTTGFH
.... . :: :: .: .: :. ::. . ..... .:.. :.. : .:
CCDS42 LQDKNIFEHTYFGFMWQLCSCI-------PST---LPDPKAVSLMTAKLSTSFVLETFIH
2270 2280 2290 2300 2310
2060 2070 2080 2090 2100 2110
pF1KE3 TKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRFSEYLLECPSAEVRGAFAK
.:. . . .: . : . .:. . :: . . . . . :..::. :: : .
CCDS42 SKE--KPTMLQWIELLTKQFNNSQAACEWFL-DRMADDDWWPMQILIKCPNQIVRQMFQR
2320 2330 2340 2350 2360 2370
2120 2130 2140 2150 2160 2170
pF1KE3 LIVFI--------AHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAVLNLLRREVSE
: . . ::. :: : . . : . . : ...:..: .... :.
CCDS42 LCIHVIQRLRPVHAHLYLQPG-MEDGSDDMDTSVEDIGGRSCVTRFVRTLLLIMEHGVKP
2380 2390 2400 2410 2420 2430
2180 2190 2200 2210 2220
pF1KE3 HGRHLQQYFNLFVMYANLGVAEKTQLLKLSVPATFMLVSLD-EGP-GPPIKYQYAELGKL
:..:: .:: .. .:..: :. ::.:.. .:.. . .:: .: .. : :.
CCDS42 HSKHLTEYFAFLYEFAKMGEEESQFLLSLQAISTMVHFYMGTKGPENPQVEVLSEEEGEE
2440 2450 2460 2470 2480 2490
2230 2240 2250 2260 2270 2280
pF1KE3 YSVVSQLIRCCNVSSRMQSSINGNPPLPNPFGDPNLSQPIMPIQQ-NVADILFVRT-SYV
... . . : .... : . . . :. . ..: ..: . . ..
CCDS42 EEEEEDILSLAEEKYR-PAALEKMIALVALLVEQSRSERHLTLSQTDMAALTGGKGFPFL
2500 2510 2520 2530 2540 2550
2290 2300 2310 2320 2330 2340
pF1KE3 KKIIEDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLLLQILLI
. :.: : ..: .:. : : ... ..: :. ..: :.. :: ...
CCDS42 FQHIRDGINIRQTCNLIFSLCRYNNRLAEHIVSMLFTSIAKLTPEAANPFFKLLTMLMEF
2560 2570 2580 2590 2600 2610
2350 2360 2370 2380 2390 2400
pF1KE3 EDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPVAYQILQ
CCDS42 AGGPPGMPPFASYILQRIWEVIEYNPSQCLDWLAVQTPRNKLAHSWVLQNMENWVERFLL
2620 2630 2640 2650 2660 2670
>>CCDS44084.1 USP48 gene_id:84196|Hs108|chr1 (485 aa)
initn: 366 init1: 225 opt: 342 Z-score: 325.7 bits: 72.1 E(32554): 8.1e-12
Smith-Waterman score: 452; 26.4% identity (52.4% similar) in 473 aa overlap (1546-2011:78-477)
1520 1530 1540 1550 1560 1570
pF1KE3 LKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYMNSVIQQL
: : ..:::: : :::::.:. .:
CCDS44 CKGNPNCLVGIGEHIWLGEIDENSFHNIDDPNCERRKKNSFVGLTNLGATCYVNTFLQVW
50 60 70 80 90 100
1580 1590 1600 1610 1620 1630
pF1KE3 YMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKPALSKTED
.. .:... .: :: : :: :. :.. .:.
CCDS44 FLNLELRQALYLCPSTCSDY---MLGDGIQE-EKDYEPQT--------------------
110 120 130 140
1640 1650 1660 1670 1680 1690
pF1KE3 RKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALEFFNSLVD
. .::: .:. : : .: : :: : . : . .:.:: :: . ...
CCDS44 -------ICEHLQYLFALLQNSNRRYIDPSGFVKALGL-----DTGQQQDAQEFSKLFMS
150 160 170 180 190
1700 1710 1720 1730 1740 1750
pF1KE3 SLDEALKALGHP---AMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQNLLD
:...:. .: .... . : .: .:. : .. . .: :...:..:..: :
CCDS44 LLEDTLSKQKNPDVRNIVQQQFCGEYAYVTVCNQCGRESKLLSKFYELELNIQGHKQLTD
200 210 220 230 240 250
1760 1770 1780 1790 1800 1810
pF1KE3 SLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERECAIKF
. ...: . ::: : : ::.:..: ...... . .:: .: .:: :: .: . :.
CCDS44 CISEFLKEEKLEGDNRYFCENCQSKQNATRKIRLLSLPCTLNLQLMRFVFDRQTGHKKKL
260 270 280 290 300 310
1820 1830 1840 1850 1860 1870
pF1KE3 NDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGSTKYRLVGVLVHS
: :. : . ::::::. . .:: :.: .::.:
CCDS44 NTYIGFSEILDMEPYV--------------------------EHKGGSYVYELSAVLIHR
320 330 340
1880 1890 1900 1910 1920 1930
pF1KE3 G-QASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGEYMGEVFD
: .: .::: ... : . ..::::.: :. :: : : : : ..:
CCDS44 GVSAYSGHYIAHV-----KDPQSGEWYKFNDEDIE--KM---EGKKLQLGIEEDLAEPSK
350 360 370 380 390
1940 1950 1960 1970 1980
pF1KE3 HMMKRMSYRRQKR-WWNAYILFYERMDTIDQDDELIRYISELA-ITTRPHQIIMPSAIER
. .. . . . :::.: : :..: .. . .. . : .. : .. . ::
CCDS44 SQTRKPKCGKGTHCSRNAYMLVY-RLQTQEKPNTTVQVPAFLQELVDRDNSKFEEWCIEM
400 410 420 430 440 450
1990 2000 2010 2020 2030 2040
pF1KE3 S-VRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLA
. .:::.:. . . . : .:
CCDS44 AEMRKQSVDKGKAKHEEVKELYQRLPAGAGL
460 470 480
>>CCDS81277.1 USP48 gene_id:84196|Hs108|chr1 (983 aa)
initn: 366 init1: 225 opt: 342 Z-score: 320.8 bits: 72.2 E(32554): 1.5e-11
Smith-Waterman score: 452; 26.4% identity (52.4% similar) in 473 aa overlap (1546-2011:78-477)
1520 1530 1540 1550 1560 1570
pF1KE3 LKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYMNSVIQQL
: : ..:::: : :::::.:. .:
CCDS81 CKGNPNCLVGIGEHIWLGEIDENSFHNIDDPNCERRKKNSFVGLTNLGATCYVNTFLQVW
50 60 70 80 90 100
1580 1590 1600 1610 1620 1630
pF1KE3 YMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKPALSKTED
.. .:... .: :: : :: :. :.. .:.
CCDS81 FLNLELRQALYLCPSTCSDY---MLGDGIQE-EKDYEPQT--------------------
110 120 130 140
1640 1650 1660 1670 1680 1690
pF1KE3 RKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALEFFNSLVD
. .::: .:. : : .: : :: : . : . .:.:: :: . ...
CCDS81 -------ICEHLQYLFALLQNSNRRYIDPSGFVKALGL-----DTGQQQDAQEFSKLFMS
150 160 170 180 190
1700 1710 1720 1730 1740 1750
pF1KE3 SLDEALKALGHP---AMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQNLLD
:...:. .: .... . : .: .:. : .. . .: :...:..:..: :
CCDS81 LLEDTLSKQKNPDVRNIVQQQFCGEYAYVTVCNQCGRESKLLSKFYELELNIQGHKQLTD
200 210 220 230 240 250
1760 1770 1780 1790 1800 1810
pF1KE3 SLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERECAIKF
. ...: . ::: : : ::.:..: ...... . .:: .: .:: :: .: . :.
CCDS81 CISEFLKEEKLEGDNRYFCENCQSKQNATRKIRLLSLPCTLNLQLMRFVFDRQTGHKKKL
260 270 280 290 300 310
1820 1830 1840 1850 1860 1870
pF1KE3 NDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGSTKYRLVGVLVHS
: :. : . ::::::. . .:: :.: .::.:
CCDS81 NTYIGFSEILDMEPYV--------------------------EHKGGSYVYELSAVLIHR
320 330 340
1880 1890 1900 1910 1920 1930
pF1KE3 G-QASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGEYMGEVFD
: .: .::: ... : . ..::::.: :. :: : : : : ..:
CCDS81 GVSAYSGHYIAHV-----KDPQSGEWYKFNDEDIE--KM---EGKKLQLGIEEDLAEPSK
350 360 370 380 390
1940 1950 1960 1970 1980
pF1KE3 HMMKRMSYRRQKR-WWNAYILFYERMDTIDQDDELIRYISELA-ITTRPHQIIMPSAIER
. .. . . . :::.: : :..: .. . .. . : .. : .. . ::
CCDS81 SQTRKPKCGKGTHCSRNAYMLVY-RLQTQEKPNTTVQVPAFLQELVDRDNSKFEEWCIEM
400 410 420 430 440 450
1990 2000 2010 2020 2030 2040
pF1KE3 S-VRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLA
. .:::.:. . . . : .:
CCDS81 AEMRKQSVDKGKAKHEEVKELYQRLPAGAEPYEFVSLEWLQKWLDESTPTKPIDNHACLC
460 470 480 490 500 510
>>CCDS30623.1 USP48 gene_id:84196|Hs108|chr1 (1035 aa)
initn: 366 init1: 225 opt: 342 Z-score: 320.4 bits: 72.2 E(32554): 1.6e-11
Smith-Waterman score: 452; 26.4% identity (52.4% similar) in 473 aa overlap (1546-2011:78-477)
1520 1530 1540 1550 1560 1570
pF1KE3 LKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYMNSVIQQL
: : ..:::: : :::::.:. .:
CCDS30 CKGNPNCLVGIGEHIWLGEIDENSFHNIDDPNCERRKKNSFVGLTNLGATCYVNTFLQVW
50 60 70 80 90 100
1580 1590 1600 1610 1620 1630
pF1KE3 YMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKPALSKTED
.. .:... .: :: : :: :. :.. .:.
CCDS30 FLNLELRQALYLCPSTCSDY---MLGDGIQE-EKDYEPQT--------------------
110 120 130 140
1640 1650 1660 1670 1680 1690
pF1KE3 RKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALEFFNSLVD
. .::: .:. : : .: : :: : . : . .:.:: :: . ...
CCDS30 -------ICEHLQYLFALLQNSNRRYIDPSGFVKALGL-----DTGQQQDAQEFSKLFMS
150 160 170 180 190
1700 1710 1720 1730 1740 1750
pF1KE3 SLDEALKALGHP---AMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQNLLD
:...:. .: .... . : .: .:. : .. . .: :...:..:..: :
CCDS30 LLEDTLSKQKNPDVRNIVQQQFCGEYAYVTVCNQCGRESKLLSKFYELELNIQGHKQLTD
200 210 220 230 240 250
1760 1770 1780 1790 1800 1810
pF1KE3 SLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERECAIKF
. ...: . ::: : : ::.:..: ...... . .:: .: .:: :: .: . :.
CCDS30 CISEFLKEEKLEGDNRYFCENCQSKQNATRKIRLLSLPCTLNLQLMRFVFDRQTGHKKKL
260 270 280 290 300 310
1820 1830 1840 1850 1860 1870
pF1KE3 NDYFEFPRELDMEPYTVAGVAKLEGDNVNPESQLIQQSEQSESETAGSTKYRLVGVLVHS
: :. : . ::::::. . .:: :.: .::.:
CCDS30 NTYIGFSEILDMEPYV--------------------------EHKGGSYVYELSAVLIHR
320 330 340
1880 1890 1900 1910 1920 1930
pF1KE3 G-QASGGHYYSYIIQRNGGDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGEYMGEVFD
: .: .::: ... : . ..::::.: :. :: : : : : ..:
CCDS30 GVSAYSGHYIAHV-----KDPQSGEWYKFNDEDIE--KM---EGKKLQLGIEEDLAEPSK
350 360 370 380 390
1940 1950 1960 1970 1980
pF1KE3 HMMKRMSYRRQKR-WWNAYILFYERMDTIDQDDELIRYISELA-ITTRPHQIIMPSAIER
. .. . . . :::.: : :..: .. . .. . : .. : .. . ::
CCDS30 SQTRKPKCGKGTHCSRNAYMLVY-RLQTQEKPNTTVQVPAFLQELVDRDNSKFEEWCIEM
400 410 420 430 440 450
1990 2000 2010 2020 2030 2040
pF1KE3 S-VRKQNVQFMHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLA
. .:::.:. . . . : .:
CCDS30 AEMRKQSVDKGKAKHEEVKELYQRLPAGAEPYEFVSLEWLQKWLDESTPTKPIDNHACLC
460 470 480 490 500 510
2554 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 19:47:13 2016 done: Mon Nov 7 19:47:14 2016
Total Scan time: 6.100 Total Display time: 1.280
Function used was FASTA [36.3.4 Apr, 2011]