FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3506, 2620 aa
1>>>pF1KE3506 2620 - 2620 aa - 2620 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6057+/-0.00139; mu= 12.5870+/- 0.085
mean_var=250.5650+/-50.978, 0's: 0 Z-trim(107.8): 81 B-trim: 10 in 1/51
Lambda= 0.081024
statistics sampled from 9764 (9829) to 9764 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.609), E-opt: 0.2 (0.302), width: 16
Scan time: 5.320
The best scores are: opt bits E(32554)
CCDS44154.2 USP24 gene_id:23358|Hs108|chr1 (2620) 17232 2030.2 0
CCDS55403.1 USP9X gene_id:8239|Hs108|chrX (2554) 1164 151.9 4e-35
CCDS43930.1 USP9X gene_id:8239|Hs108|chrX (2570) 1164 151.9 4e-35
CCDS14781.1 USP9Y gene_id:8287|Hs108|chrY (2555) 1096 144.0 9.9e-33
CCDS42686.1 USP34 gene_id:9736|Hs108|chr2 (3546) 652 92.2 5.2e-17
>>CCDS44154.2 USP24 gene_id:23358|Hs108|chr1 (2620 aa)
initn: 17232 init1: 17232 opt: 17232 Z-score: 10894.8 bits: 2030.2 E(32554): 0
Smith-Waterman score: 17232; 99.9% identity (100.0% similar) in 2620 aa overlap (1-2620:1-2620)
10 20 30 40 50 60
pF1KE3 MESEEEQHMTTLLCMGFSDPATIRKALRLAKNDINEAVALLTNERPGLDYGGYEPMDSGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MESEEEQHMTTLLCMGFSDPATIRKALRLAKNDINEAVALLTNERPGLDYGGYEPMDSGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 GPSPGPGGGPRGDGGGDGGGGGPSRGGSTGGGGGFDPPPAYHEVVDAEKNDENGNCSGEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GPSPGPGGGPRGDGGGDGGGGGPSRGGSTGGGGGFDPPPAYHEVVDAEKNDENGNCSGEG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 IEFPTTNLYELESRVLTDHWSIPYKREESLGKCLLASTYLARLGLSESDENCRRFMDRCM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 IEFPTTNLYELESRVLTDHWSIPYKREESLGKCLLASTYLARLGLSESDENCRRFMDRCM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 PEAFKKLLTSSAVHKWGTEIHEGIYNMLMLLIELVAERIKQDPIPIGLLGVLTMAFNPDN
::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
CCDS44 PEAFKKLLTSSAVHKWGTEIHEGIYNMLMLLIELVAERIKQDPIPTGLLGVLTMAFNPDN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 EYHFKNRMKVSQRNWAEVFGEGNMFAVSPVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EYHFKNRMKVSQRNWAEVFGEGNMFAVSPVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 LHSEDIELGAVSALIQPLGVCAEYLNSSVVQPMLDPVILTTIQDVRSVEEKDLKDKRLVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LHSEDIELGAVSALIQPLGVCAEYLNSSVVQPMLDPVILTTIQDVRSVEEKDLKDKRLVS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 IPELLSAVKLLCMRFQPDLVTIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIEDSTLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 IPELLSAVKLLCMRFQPDLVTIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIEDSTLS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 KSVKNAIDTDRLLDWLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSKLSLDELTKIWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KSVKNAIDTDRLLDWLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSKLSLDELTKIWK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 IQSGQSSTVIENIHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 IQSGQSSTVIENIHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGR
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 EARFETTSGKVLDVLWELAHLPTLPSSLIQQALEEHLTILSDAYAVKEAIKRSYIIKCIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EARFETTSGKVLDVLWELAHLPTLPSSLIQQALEEHLTILSDAYAVKEAIKRSYIIKCIE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 DIKRPGEWSGLEKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSFIKQTYQKQDKSIIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DIKRPGEWSGLEKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSFIKQTYQKQDKSIIQ
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 DLKKNFEIVKLVTGSLIACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DLKKNFEIVKLVTGSLIACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 EATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWFTKGQHDLESDVQQQLFKEKILKLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWFTKGQHDLESDVQQQLFKEKILKLE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 SYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESPDEEIAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESPDEEIAN
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 EAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVTRATKML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVTRATKML
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 TATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASFHGHLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASFHGHLL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 TLNVTYESTKDTFTVEAHSNETIGSVRWKIAKQLCSPVDNIQIFTNDSLLTVNKDQKLLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TLNVTYESTKDTFTVEAHSNETIGSVRWKIAKQLCSPVDNIQIFTNDSLLTVNKDQKLLH
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 QLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYAMEQEKSLPGVVMALVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYAMEQEKSLPGVVMALVC
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 NVFDMLYQLANLEEPRITLRVRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NVFDMLYQLANLEEPRITLRVRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSK
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 SPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVLSSKLMPTADDDMARSCAKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVLSSKLMPTADDDMARSCAKS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 FCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQLARFLLVGQTMPTLLDEDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQLARFLLVGQTMPTLLDEDL
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 TKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQ
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 TMEVSDFTSTVACFMRLSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TMEVSDFTSTVACFMRLSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSG
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 SEGEPVALHAGICVRQQSVSTKDSLIAGEALSLLVTCLQLRSQQLASFYNLPCVADFIID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SEGEPVALHAGICVRQQSVSTKDSLIAGEALSLLVTCLQLRSQQLASFYNLPCVADFIID
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 ILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLPLWSPTSIMRGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLPLWSPTSIMRGV
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 NQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISPATMLEDEITWLDNFEPNRTAECETSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISPATMLEDEITWLDNFEPNRTAECETSE
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 ADNILLAGHLRLIKTLLSLCGAEKEMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ADNILLAGHLRLIKTLLSLCGAEKEMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAIS
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE3 QQDFHPKCSTANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALTKEFDYLPPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QQDFHPKCSTANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALTKEFDYLPPV
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE3 DSRSSSGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSVDDDTDNPDDSVFYQVQSLFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DSRSSSGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSVDDDTDNPDDSVFYQVQSLFG
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE3 HLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKN
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE3 TFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCE
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE3 KCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGM
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE3 ARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKDRRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKDRRG
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE3 CGKGKWYKFNDTVIEEFDLNDETLEYECFGGEYRPKVYDQTNPYTDVRRRYWNAYMLFYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 CGKGKWYKFNDTVIEEFDLNDETLEYECFGGEYRPKVYDQTNPYTDVRRRYWNAYMLFYQ
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE3 RVSDQNSPVLPKKSRVSVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTKLVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RVSDQNSPVLPKKSRVSVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTKLVK
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE3 KGEKKGLFVEKMPARIYQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKHPYYPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KGEKKGLFVEKMPARIYQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKHPYYPC
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE3 MAKVSLQLAIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MAKVSLQLAIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRE
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE3 LIKIFLLECNVREVRVAVATILEKTLDSALFYQDKLKSLHQLLEVLLALLDKDVPENCKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LIKIFLLECNVREVRVAVATILEKTLDSALFYQDKLKSLHQLLEVLLALLDKDVPENCKN
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE3 CAQYFFLFNTFVQKQGIRAGDLLLRHSALRHMISFLLGASRQNNQIRRWSSAQAREFGNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 CAQYFFLFNTFVQKQGIRAGDLLLRHSALRHMISFLLGASRQNNQIRRWSSAQAREFGNL
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE3 HNTVALLVLHSDVSSQRNVAPGIFKQRPPISIAPSSPLLPLHEEVEALLFMSEGKPYLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HNTVALLVLHSDVSSQRNVAPGIFKQRPPISIAPSSPLLPLHEEVEALLFMSEGKPYLLE
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE3 VMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLHEIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLHEIL
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE3 VIEDPIQAERVKFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAAKEYFKEN
:::::::.::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VIEDPIQVERVKFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAAKEYFKEN
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE3 SHHWSWAVQWLQKKMSEHYWTPQSNVSNETSTGKTFQRTISAQDTLAYATALLNEKEQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SHHWSWAVQWLQKKMSEHYWTPQSNVSNETSTGKTFQRTISAQDTLAYATALLNEKEQSG
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620
pF1KE3 SSNGSESSPANENGDRHLQQGSESPMMIGELRSDLDDVDP
::::::::::::::::::::::::::::::::::::::::
CCDS44 SSNGSESSPANENGDRHLQQGSESPMMIGELRSDLDDVDP
2590 2600 2610 2620
>>CCDS55403.1 USP9X gene_id:8239|Hs108|chrX (2554 aa)
initn: 1699 init1: 755 opt: 1164 Z-score: 744.1 bits: 151.9 E(32554): 4e-35
Smith-Waterman score: 3545; 30.6% identity (59.1% similar) in 2705 aa overlap (68-2593:7-2495)
40 50 60 70 80 90
pF1KE3 VALLTNERPGLDYGGYEPMDSGGGPSPGPGGGPRGDGGGDGGGGGPSRGGSTGG--GGGF
:.: ::.:. : .:. : : .
CCDS55 MTATTRGSPV--GGNDNQGQAPD-GQSQPPLQQNQT
10 20 30
100 110 120 130 140
pF1KE3 DPPPAYHEVVDAEKNDENGNCSG------EGIEFPTTNLYELESRVLTDHWSIPYKREES
. : . .: : ::.:. .. : :: :.: .:.. . .: .: .
CCDS55 SSPDSSNENSPATPPDEQGQGDAPPQLEDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGE
40 50 60 70 80 90
150 160 170 180 190 200
pF1KE3 LGKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKKLLTSSAVHKWGTEIHEGIYNMLM
: : :. :.. ::. ..: :.::. . .: :.::. :: : :::. : :
CCDS55 LEVLLEAAIDLSKKGLDVKSEACQRFFRDGLTISFTKILTDEAVSGWKFEIHRCIINNTH
100 110 120 130 140 150
210 220 230 240 250 260
pF1KE3 LLIELVAERIKQDPIPIGLLGVLTMAFNPDNEYHFKNRMKVSQRNWAEV-FGEGNMFAVS
:.:: . ...:: .: :: .:.::.:: ..:. : . . . : . : ..:: :
CCDS55 RLVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYNGTRPCESVSSSVQLPEDELFARS
160 170 180 190 200 210
270 280 290 300 310 320
pF1KE3 PVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK-LHSEDIELGAVSALIQPLGVCAEYLNS
: . :.::.:::.:::: :.:: .. . ... ... ..:::.:.: : :.:.
CCDS55 PD---PRSPKGWLVDLLNKFGTLNGFQILHDRFINGSALNVQIIAALIKPFGQCYEFLTL
220 230 240 250 260
330 340 350 360 370 380
pF1KE3 SVVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLVSIPELLSAVKLLCMRF--QPDLV
.:. .. :.: . : .... ...:: . . .. .....: : : : . :
CCDS55 HTVKKYFLPIIEMVPQFLENLTDEELKKEAKNEAKNDALSMIIKSLKNLASRVPGQEETV
270 280 290 300 310 320
390 400 410 420 430
pF1KE3 TIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIED-STLSKSVKNA-----IDTDRLLD
.. .:: ..::.:. :..:::.:.::.:.: . : .. : . ..:. .
CCDS55 KNLEIFRLKMILRLLQISSFNGKMNALNEVNKVISSVSYYTHRHGNPEEEEWLTAERMAE
330 340 350 360 370 380
440 450 460 470 480 490
pF1KE3 WLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK--LSLDELTKIWKIQSGQSSTVIEN
:. .:..:::.:. .. : :: .... :.... .. :.:..: .:: :.:. ....:
CCDS55 WIQQNNILSIVLRDSLHQPQYVEKLEKILRFVIKEKALTLQDLDNIWAAQAGKHEAIVKN
390 400 410 420 430 440
500 510 520 530 540 550
pF1KE3 IHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGREARFETTSGKVL
.: ..: : :. .::.::: .. :: . : . :.::: :: :.... . . . :::
CCDS55 VHDLLAKLAWDFSPEQLDHLFDCFKASWTNASKKQREKLLELIRRLAEDDKDGVMAHKVL
450 460 470 480 490 500
560 570 580 590 600 610
pF1KE3 DVLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KEAIKRSYIIKCIEDIKRPGEWSGL
..::.::: .: .... :: :. ::. . . ... : ..: . ::...
CCDS55 NLLWNLAHSDDVPVDIMDLALSAHIKILDYSCSQDRDTQKIQWIDRFIEELRT-------
510 520 530 540 550 560
620 630 640 650 660
pF1KE3 EKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF--IKQTYQKQDKS--------IIQD
: : ::.:::.:..:: : :. .. ..: .:..
CCDS55 --NDK--------------WVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRHDLINQ
570 580 590 600
670 680 690 700 710
pF1KE3 LKKNFEIVKLVTGSL---IACHRLAAAVAGPGGLSGSTLVDG-RYTYREYLEAHLKFLAF
:..: .: ::. .: . :: : . .:. : ::.. . .. .:.:: :
CCDS55 LQHNHALVTLVAENLATYMESMRLYAR--DHEDYDPQTVRLGSRYSHVQEVQERLNFLRF
610 620 630 640 650 660
720 730 740 750 760 770
pF1KE3 FLQEATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWFTK---GQHDLESDVQQQLFKE
.:... :.: .::.::.::. . : ::: ::.:..: . ::. :.....:.
CCDS55 LLKDGQLWLCAPQAKQIWKCLAENA-VYLCDREACFKWYSKLMGDEPDLDPDINKDFFES
670 680 690 700 710 720
780 790 800 810 820 830
pF1KE3 KILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESP
..:.:. .: ::.. :. ::. :: . .: . ... :::::.:..:.....:
CCDS55 NVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQSN
730 740 750 760 770 780
840 850 860 870 880 890
pF1KE3 DEEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVT
:. ::..::.:. . : ::.:::. ..: .:. :: .:. ::.:. ..: :
CCDS55 DD-IASRAIDLLKEI-YTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTL-------CVL
790 800 810 820 830
900 910 920 930 940 950
pF1KE3 RATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGAS
. : .: . : : . :.: . ..:. .. : ::::: . .
CCDS55 DGDK-------DSVNCARQEAVR------MVRVLTVLREYINECDSDYHEERTILPMSRA
840 850 860 870 880
960 970 980 990 1000
pF1KE3 FHGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKIAKQLCSPVDN--IQIFTNDSL
:.:. :.. : . . : . : .:.:.:::::: : ... . : . :..:.. :
CCDS55 FRGKHLSFVVRFPNQGRQVDDLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGEL
890 900 910 920 930 940
1010 1020 1030 1040 1050 1060
pF1KE3 LTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYA----M
. :.::. ::...:....:.: . .. :: :::..::..: : .. :.
CCDS55 IDPADDRKLIGQLNLKDKSLITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNP
950 960 970 980 990 1000
1070 1080 1090 1100 1110 1120
pF1KE3 EQEKSLPGVVMALVCNVFDMLYQLANL----EEPRITLRVRKLLLLIPTDPAIQEALDQL
: :. ::::.:.: ...:.:.:.: . : . .: :. :.: : . : :
CCDS55 EVESCLPGVIMSLHPRYISFLWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKL---
1010 1020 1030 1040 1050
1130 1140 1150 1160 1170 1180
pF1KE3 DSLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVL
: : . ..:: :::: .::: :.:. : .::: ::.
CCDS55 ----RAICLDHAKLGESSLSPSL--------------DSLF--FGPSAS--QVLYLTEVV
1060 1070 1080 1090
1190 1200 1210 1220 1230 1240
pF1KE3 SSKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQ
. ::: : .: . ...: .:::.::: ::.... :... ..:.:::.:.: :.
CCDS55 YALLMP-AGAPLADD-SSDFQFHFLKSGGLPLVLSMLTRNNFLPNADMETRRGAYLNALK
1100 1110 1120 1130 1140 1150
1250 1260 1270 1280 1290
pF1KE3 LARFLL--VGQTMPTLLDEDLTKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLS
.:..:: .: . : . :.:... :. .... : : . . .:
CCDS55 IAKLLLTAIGYGHVRAVAEA-CQPGVEGVN--PMTQINQVTHDQAVVLQSALQS------
1160 1170 1180 1190 1200
1300 1310 1320 1330 1340 1350
pF1KE3 VSDRSSIRVEEIIPAARVAIQ-TMEVSDFTSTVACFMR----LSWAAAAGRLDLVGSSQP
. . :: . . . ..:.: : . :.: . . : .: . ::.. : :.:: : :
CCDS55 IPNPSSECMLRNV-SVRLAQQISDEASRYMPDI-CVIRAIQKIIWASGCGSLQLVFS--P
1210 1220 1230 1240 1250 1260
1360 1370 1380 1390 1400 1410
pF1KE3 IKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQQSVSTKDSLIAGEALSLL
.: .. : .. ...:. :: . .: . ::: ..
CCDS55 NEEITK-----IYEK-TNAGN--------EP--------------DLEDEQVCCEALEVM
1270 1280 1290
1420 1430 1440 1450 1460 1470
pF1KE3 VTCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQK
. :. : : .. . ::::.:: : .:.:: .:.. . .: .
CCDS55 TLCFALIPTALDALSKEKAWQTFIIDLLLHCHSKTVRQVAQEQFFLMCTRCCMGH----R
1300 1310 1320 1330 1340
1480 1490 1500 1510 1520 1530
pF1KE3 PNQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISP
: :.. ...: .. .. .. .. .:: : .::. .:... .
CCDS55 PLLFFITLLFT----------VLGSTARERAKHSGDYFTLLRHLLNYAYNSNINV--PNA
1350 1360 1370 1380 1390
1540 1550 1560 1570 1580
pF1KE3 ATMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKTLLSLCGAEK------EMLG
..:..:: :: .. . ::. .. .: ::: . : ::.. .:: : :
CCDS55 EVLLNNEIDWLKRIRDDVKRTGETG-IEETILEGHLGVTKELLAFQTSEKKFHIGCEKGG
1400 1410 1420 1430 1440 1450
1590 1600 1610 1620 1630 1640
pF1KE3 SSLIKPLLDDFLFRASRIIL----NSHSPAGSAAISQQDFHPKCSTANSRLAAYEVLVML
..::: :.:::.: :: . : :.. :: .: : :.. . :..:.:: :
CCDS55 ANLIKELIDDFIFPASNVYLQYMRNGELPAEQAI-------PVCGSPPTINAGFELLVAL
1460 1470 1480 1490 1500
1650 1660 1670 1680 1690 1700
pF1KE3 ADSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSSSGFVGLRNGGATCYM
: . ::. :. : :.. : :..::::: : .:::::.:.::::::
CCDS55 AVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYM
1510 1520 1530 1540 1550 1560
1710 1720 1730
pF1KE3 NAVFQQLYMQPGLPESLLS-------VDDDT------DN-----PDDSVF----------
:.:.::::: :.. ...:. :::: :: : :.::
CCDS55 NSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKP
1570 1580 1590 1600 1610 1620
1740 1750 1760 1770
pF1KE3 ----------YQV------QSLFGHLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYE
:.. : .:::: :.::::::..::: :..:.. . .:::.:: :
CCDS55 ALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALE
1630 1640 1650 1660 1670 1680
1780 1790 1800 1810 1820 1830
pF1KE3 FFTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQ
::.::.:..:: :: .:. ...... : ..:::::. :::::: ::.: .::. . . :
CCDS55 FFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQ
1690 1700 1710 1720 1730 1740
1840 1850 1860 1870 1880 1890
pF1KE3 SLEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGR
.: ::.:.:.:..:::.:::.::::..: :::: ::.:: ::.:.: :: .:::
CCDS55 NLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWEREC
1750 1760 1770 1780 1790 1800
1900 1910 1920 1930 1940 1950
pF1KE3 SIKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYEL
.::... ..:: :.::::::.:.:. .... :. ... ..:. . ....: . .:.:
CCDS55 AIKFNDYFEFPRELDMEPYTVAGVAKLEGDN-VNPESQLIQQS--EQSESETAGSTKYRL
1810 1820 1830 1840 1850 1860
1960 1970 1980 1990 2000 2010
pF1KE3 VGVIVHSGQAHAGHYYSFIKDRRGCGKG---KWYKFNDTVIEEFDLND-ETLEYECFGGE
:::.:::::: .:::::.: .: : : : .::::.: . : ..: : .. .:::::
CCDS55 VGVLVHSGQASGGHYYSYIIQRNG-GDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGE
1870 1880 1890 1900 1910 1920
2020 2030 2040 2050 2060
pF1KE3 YRPKVYDQTNPYTDVRR--RYWNAYMLFYQRVS--DQNSPVLPKKSRVSVVRQEAEDLSL
: .:.:. . :: :.::::.:::.:.. ::.. .. :....
CCDS55 YMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAI----------
1930 1940 1950 1960 1970
2070 2080 2090 2100 2110 2120
pF1KE3 SAPSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARIYQMVRDENLKFM
. ::: ... ::. : . :: .:..::
CCDS55 ------------TTRPH-----------QII------------MPSAIERSVRKQNVQFM
1980 1990
2130 2140 2150 2160 2170 2180
pF1KE3 KNRDVYSSDYFSFVLSLASLNATKLKHP-----YYPC---MAKVSLQLAIQFLFQTYLRT
.:: :: .::.:. .: . :.. :. : : .. .:.::: .::: : ..:
CCDS55 HNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLAARFLFTTGFHT
2000 2010 2020 2030 2040 2050
2190 2200 2210 2220 2230 2240
pF1KE3 KKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLECNVREVRVAVAT
:: .: .. .: .. :: .: .. :... . . . .. . .:::: ::: : :
CCDS55 KKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRFSE-YLLECPSAEVRGAFAK
2060 2070 2080 2090 2100 2110
2250 2260 2270 2280
pF1KE3 ILEKTLDSAL--------FYQ--------DKLKSLHQLLEVLLALLDKDVPENCKNCAQY
.. .: : . :.:. .::...: :: ..: :. .. ::
CCDS55 LIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAVLNLLRREVSEHGRHLQQY
2120 2130 2140 2150 2160 2170
2290 2300 2310 2320 2330 2340
pF1KE3 FFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWSSAQAREFGNLHN
: :: ... :. ::. : : ..:. : . :. : :.:.:..
CCDS55 FNLFVMYAN-LGVAEKTQLLKLSVPATFMLVSLDEG---PGPPIKY----QYAELGKLYS
2180 2190 2200 2210 2220 2230
2350 2360 2370 2380 2390
pF1KE3 TVALLVLHSDVSSQRNVAPGIFKQRPPISIA---P--SSPLLPLHEEVEALLFMSEGKPY
.:. :. .:::. . . .. ::. : :.:..:....: .::. . :
CCDS55 VVSQLIRCCNVSSRMQSS---INGNPPLPNPFGDPNLSQPIMPIQQNVADILFVRTS--Y
2240 2250 2260 2270 2280
2400 2410 2420 2430 2440 2450
pF1KE3 LLEVMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLH
. ... : .. .... .::. : .:: :.: . :. . .::. ..::
CCDS55 VKKII----EDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLLL
2290 2300 2310 2320 2330 2340
2460 2470 2480 2490 2500 2510
pF1KE3 EILVIEDPIQAERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAA
.::.::: :..:. : . . ..::. ...:.. ..: :::.: .:.: ..::.:
CCDS55 QILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPVA
2350 2360 2370 2380 2390 2400
2520 2530 2540 2550
pF1KE3 KEYFKENS---HHWSWAVQWLQKKM-------SEHY----WTPQSNVSNETSTGKTFQRT
. .. :. ..:.:::.:: .. . .: :.: . :::::.: ..:.
CCDS55 YQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQ-SNETSNGYFLERS
2410 2420 2430 2440 2450 2460
2560 2570 2580 2590 2600 2610
pF1KE3 ISAQDTLAYATALLNEKEQSGSSNGSES-SPANENGDRHLQQGSESPMMIGELRSDLDDV
::. ::: : : :.: . .. .: :: :.
CCDS55 HSARMTLAKACELCPEEEPDDQDAPDEHESPPPEDAPLYPHSPGSQYQQNNHVHGQPYTG
2470 2480 2490 2500 2510 2520
2620
pF1KE3 DP
CCDS55 PAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
2530 2540 2550
>>CCDS43930.1 USP9X gene_id:8239|Hs108|chrX (2570 aa)
initn: 1699 init1: 755 opt: 1164 Z-score: 744.0 bits: 151.9 E(32554): 4e-35
Smith-Waterman score: 3548; 30.7% identity (59.1% similar) in 2718 aa overlap (68-2605:7-2507)
40 50 60 70 80 90
pF1KE3 VALLTNERPGLDYGGYEPMDSGGGPSPGPGGGPRGDGGGDGGGGGPSRGGSTGG--GGGF
:.: ::.:. : .:. : : .
CCDS43 MTATTRGSPV--GGNDNQGQAPD-GQSQPPLQQNQT
10 20 30
100 110 120 130 140
pF1KE3 DPPPAYHEVVDAEKNDENGNCSG------EGIEFPTTNLYELESRVLTDHWSIPYKREES
. : . .: : ::.:. .. : :: :.: .:.. . .: .: .
CCDS43 SSPDSSNENSPATPPDEQGQGDAPPQLEDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGE
40 50 60 70 80 90
150 160 170 180 190 200
pF1KE3 LGKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKKLLTSSAVHKWGTEIHEGIYNMLM
: : :. :.. ::. ..: :.::. . .: :.::. :: : :::. : :
CCDS43 LEVLLEAAIDLSKKGLDVKSEACQRFFRDGLTISFTKILTDEAVSGWKFEIHRCIINNTH
100 110 120 130 140 150
210 220 230 240 250 260
pF1KE3 LLIELVAERIKQDPIPIGLLGVLTMAFNPDNEYHFKNRMKVSQRNWAEV-FGEGNMFAVS
:.:: . ...:: .: :: .:.::.:: ..:. : . . . : . : ..:: :
CCDS43 RLVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYNGTRPCESVSSSVQLPEDELFARS
160 170 180 190 200 210
270 280 290 300 310 320
pF1KE3 PVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK-LHSEDIELGAVSALIQPLGVCAEYLNS
: . :.::.:::.:::: :.:: .. . ... ... ..:::.:.: : :.:.
CCDS43 PDP---RSPKGWLVDLLNKFGTLNGFQILHDRFINGSALNVQIIAALIKPFGQCYEFLTL
220 230 240 250 260
330 340 350 360 370 380
pF1KE3 SVVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLVSIPELLSAVKLLCMRF--QPDLV
.:. .. :.: . : .... ...:: . . .. .....: : : : . :
CCDS43 HTVKKYFLPIIEMVPQFLENLTDEELKKEAKNEAKNDALSMIIKSLKNLASRVPGQEETV
270 280 290 300 310 320
390 400 410 420 430
pF1KE3 TIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIED-STLSKSVKNA-----IDTDRLLD
.. .:: ..::.:. :..:::.:.::.:.: . : .. : . ..:. .
CCDS43 KNLEIFRLKMILRLLQISSFNGKMNALNEVNKVISSVSYYTHRHGNPEEEEWLTAERMAE
330 340 350 360 370 380
440 450 460 470 480 490
pF1KE3 WLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK--LSLDELTKIWKIQSGQSSTVIEN
:. .:..:::.:. .. : :: .... :.... .. :.:..: .:: :.:. ....:
CCDS43 WIQQNNILSIVLRDSLHQPQYVEKLEKILRFVIKEKALTLQDLDNIWAAQAGKHEAIVKN
390 400 410 420 430 440
500 510 520 530 540 550
pF1KE3 IHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGREARFETTSGKVL
.: ..: : :. .::.::: .. :: . : . :.::: :: :.... . . . :::
CCDS43 VHDLLAKLAWDFSPEQLDHLFDCFKASWTNASKKQREKLLELIRRLAEDDKDGVMAHKVL
450 460 470 480 490 500
560 570 580 590 600 610
pF1KE3 DVLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KEAIKRSYIIKCIEDIKRPGEWSGL
..::.::: .: .... :: :. ::. . . ... : ..: . ::. :
CCDS43 NLLWNLAHSDDVPVDIMDLALSAHIKILDYSCSQDRDTQKIQWIDRFIEE---------L
510 520 530 540 550
620 630 640 650 660
pF1KE3 EKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF--IKQTYQKQDKS--------IIQD
. : : ::.:::.:..:: : :. .. ..: .:..
CCDS43 RTNDK--------------WVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRHDLINQ
560 570 580 590 600
670 680 690 700 710
pF1KE3 LKKNFEIVKLVTGSL---IACHRLAAAVAGPGGLSGSTLVDG-RYTYREYLEAHLKFLAF
:..: .: ::. .: . :: : . .:. : ::.. . .. .:.:: :
CCDS43 LQHNHALVTLVAENLATYMESMRLYA--RDHEDYDPQTVRLGSRYSHVQEVQERLNFLRF
610 620 630 640 650 660
720 730 740 750 760 770
pF1KE3 FLQEATLYLGWNRAKEIWECLVTGQ-DVCELDREMCFEWFTK---GQHDLESDVQQQLFK
.:... :.: .::.::.::. . .: ::: ::.:..: . ::. :.....:.
CCDS43 LLKDGQLWLCAPQAKQIWKCLAENAVYLC--DREACFKWYSKLMGDEPDLDPDINKDFFE
670 680 690 700 710 720
780 790 800 810 820 830
pF1KE3 EKILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMES
..:.:. .: ::.. :. ::. :: . .: . ... :::::.:..:.....:
CCDS43 SNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQS
730 740 750 760 770 780
840 850 860 870 880 890
pF1KE3 PDEEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAV
:. ::..::.:. . : ::.:::. ..: .:. :: .:. ::.:. ..: :
CCDS43 NDD-IASRAIDLLKEI-YTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTL-------CV
790 800 810 820 830
900 910 920 930 940 950
pF1KE3 TRATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGA
. : .: . : : .... . : .:. .. : ::::: .
CCDS43 LDGDK-------DSVNCARQEAVRMVRVLTVLR------EYINECDSDYHEERTILPMSR
840 850 860 870
960 970 980 990 1000
pF1KE3 SFHGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKIAKQLCSPVDN--IQIFTNDS
.:.:. :.. : . . : . : .:.:.:::::: : ... . : . :..:..
CCDS43 AFRGKHLSFVVRFPNQGRQVDDLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGE
880 890 900 910 920 930
1010 1020 1030 1040 1050 1060
pF1KE3 LLTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYA----
:. :.::. ::...:....:.: . .. :: :::..::..: : .. :.
CCDS43 LIDPADDRKLIGQLNLKDKSLITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPN
940 950 960 970 980 990
1070 1080 1090 1100 1110 1120
pF1KE3 MEQEKSLPGVVMALVCNVFDMLYQLANL----EEPRITLRVRKLLLLIPTDPAIQEALDQ
: :. ::::.:.: ...:.:.:.: . : . .: :. :.: : . : :
CCDS43 PEVESCLPGVIMSLHPRYISFLWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKL--
1000 1010 1020 1030 1040 1050
1130 1140 1150 1160 1170 1180
pF1KE3 LDSLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEV
: : . ..:: ::: :.::: :.:. : .::: ::
CCDS43 -----RAICLDHAKLGESSLSPS--------------LDSLF--FGPSAS--QVLYLTEV
1060 1070 1080 1090
1190 1200 1210 1220 1230 1240
pF1KE3 LSSKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICL
. . ::: : .: . ...: .:::.::: ::.... :... ..:.:::.:.: :
CCDS43 VYALLMP-AGAPLADD-SSDFQFHFLKSGGLPLVLSMLTRNNFLPNADMETRRGAYLNAL
1100 1110 1120 1130 1140 1150
1250 1260 1270 1280 1290
pF1KE3 QLARFLL--VGQTMPTLLDEDLTKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQL
..:..:: .: . : . :.:... :. .... : : . .:. .
CCDS43 KIAKLLLTAIGYGHVRAVAEA-CQPGVEGVN--PMTQINQVTHDQAVVL----QSALQ--
1160 1170 1180 1190 1200
1300 1310 1320 1330 1340 1350
pF1KE3 SVSDRSSIRVEEIIPAARVAIQ-TMEVSDFTSTVACFMR----LSWAAAAGRLDLVGSSQ
:. . :: . . . ..:.: : . :.: . . : .: . ::.. : :.:: :
CCDS43 SIPNPSSECMLRNV-SVRLAQQISDEASRYMPDI-CVIRAIQKIIWASGCGSLQLVFS--
1210 1220 1230 1240 1250
1360 1370 1380 1390 1400 1410
pF1KE3 PIKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQQSVSTKDSLIAGEALSL
: .: .. : .. ...:. :: . .: . ::: .
CCDS43 PNEEITK-----IYEK-TNAGN--------EP--------------DLEDEQVCCEALEV
1260 1270 1280 1290
1420 1430 1440 1450 1460 1470
pF1KE3 LVTCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQ
.. :. : : .. . ::::.:: : .:.:: .:.. . .:
CCDS43 MTLCFALIPTALDALSKEKAWQTFIIDLLLHCHSKTVRQVAQEQFFLMCTRCCMGH----
1300 1310 1320 1330 1340
1480 1490 1500 1510 1520 1530
pF1KE3 KPNQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRIS
.: :.. ...: .. .. .. .. .:: : .::. .:... .
CCDS43 RPLLFFITLLFT----------VLGSTARERAKHSGDYFTLLRHLLNYAYNSNINV--PN
1350 1360 1370 1380 1390
1540 1550 1560 1570 1580
pF1KE3 PATMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKTLLSLCGAEK------EML
..:..:: :: .. . ::. ..:: ::: . : ::.. .:: :
CCDS43 AEVLLNNEIDWLKRIRDDVKRTGETGIEETIL-EGHLGVTKELLAFQTSEKKFHIGCEKG
1400 1410 1420 1430 1440 1450
1590 1600 1610 1620 1630 1640
pF1KE3 GSSLIKPLLDDFLFRASRIIL----NSHSPAGSAAISQQDFHPKCSTANSRLAAYEVLVM
:..::: :.:::.: :: . : :.. :: .: : :.. . :..:.::
CCDS43 GANLIKELIDDFIFPASNVYLQYMRNGELPAEQAI-------PVCGSPPTINAGFELLVA
1460 1470 1480 1490 1500
1650 1660 1670 1680 1690
pF1KE3 LADSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSSSGFVGLRNGGATCY
:: . ::. :. : :.. : :..::::: : .:::::.:.:::::
CCDS43 LAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCY
1510 1520 1530 1540 1550 1560
1700 1710 1720 1730
pF1KE3 MNAVFQQLYMQPGLPESLLS-------VDDDT------DN-----PDDSVF---------
::.:.::::: :.. ...:. :::: :: : :.::
CCDS43 MNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDK
1570 1580 1590 1600 1610 1620
1740 1750 1760 1770
pF1KE3 -----------YQV------QSLFGHLMESKLQYYVPENFWKIFKMWNKELYVREQQDAY
:.. : .:::: :.::::::..::: :..:.. . .:::.::
CCDS43 PALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDAL
1630 1640 1650 1660 1670 1680
1780 1790 1800 1810 1820 1830
pF1KE3 EFFTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSC
:::.::.:..:: :: .:. ...... : ..:::::. :::::: ::.: .::. . .
CCDS43 EFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNH
1690 1700 1710 1720 1730 1740
1840 1850 1860 1870 1880 1890
pF1KE3 QSLEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESG
:.: ::.:.:.:..:::.:::.::::..: :::: ::.:: ::.:.: :: .:::
CCDS43 QNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERE
1750 1760 1770 1780 1790 1800
1900 1910 1920 1930 1940 1950
pF1KE3 RSIKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYE
.::... ..:: :.::::::.:.:. .... :. ... ..:. . ....: . .:.
CCDS43 CAIKFNDYFEFPRELDMEPYTVAGVAKLEGDN-VNPESQLIQQSE--QSESETAGSTKYR
1810 1820 1830 1840 1850 1860
1960 1970 1980 1990 2000 2010
pF1KE3 LVGVIVHSGQAHAGHYYSFIKDRRGCGKG---KWYKFNDTVIEEFDLND-ETLEYECFGG
::::.:::::: .:::::.: .: : : : .::::.: . : ..: : .. .::::
CCDS43 LVGVLVHSGQASGGHYYSYIIQRNG-GDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGG
1870 1880 1890 1900 1910 1920
2020 2030 2040 2050 2060
pF1KE3 EYRPKVYDQTNPYTDVRR--RYWNAYMLFYQRVS--DQNSPVLPKKSRVSVVRQEAEDLS
:: .:.:. . :: :.::::.:::.:.. ::.. .. :....
CCDS43 EYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAI---------
1930 1940 1950 1960 1970
2070 2080 2090 2100 2110 2120
pF1KE3 LSAPSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARIYQMVRDENLKF
. :::. :. ::. : . :: .:..:
CCDS43 -------------TTRPHQ-------II----------------MPSAIERSVRKQNVQF
1980 1990
2130 2140 2150 2160 2170
pF1KE3 MKNRDVYSSDYFSFVLSLASLNATKLKHP-----YYPC---MAKVSLQLAIQFLFQTYLR
:.:: :: .::.:. .: . :.. :. : : .. .:.::: .::: : ..
CCDS43 MHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLAARFLFTTGFH
2000 2010 2020 2030 2040 2050
2180 2190 2200 2210 2220 2230
pF1KE3 TKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLECNVREVRVAVA
::: .: .. .: .. :: .: .. :... . . . .. . .:::: ::: : :
CCDS43 TKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRFSE-YLLECPSAEVRGAFA
2060 2070 2080 2090 2100 2110
2240 2250 2260 2270 2280
pF1KE3 TILEKTLDSAL--------FYQ--------DKLKSLHQLLEVLLALLDKDVPENCKNCAQ
.. .: : . :.:. .::...: :: ..: :. .. :
CCDS43 KLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAVLNLLRREVSEHGRHLQQ
2120 2130 2140 2150 2160 2170
2290 2300 2310 2320 2330 2340
pF1KE3 YFFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWSSAQAREFGNLH
:: :: ... :. ::. : : ..:. : . :. : :.:.:.
CCDS43 YFNLFVMYAN-LGVAEKTQLLKLSVPATFMLVSLDEG---PGPPIKY----QYAELGKLY
2180 2190 2200 2210 2220
2350 2360 2370 2380 2390
pF1KE3 NTVALLVLHSDVSSQRNVAPGIFKQRPPISIA---P--SSPLLPLHEEVEALLFMSEGKP
..:. :. .:::. . . .. ::. : :.:..:....: .::. .
CCDS43 SVVSQLIRCCNVSSRMQSS---INGNPPLPNPFGDPNLSQPIMPIQQNVADILFVRTS--
2230 2240 2250 2260 2270 2280
2400 2410 2420 2430 2440 2450
pF1KE3 YLLEVMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLL
:. ... : .. .... .::. : .:: :.: . :. . .::. ..::
CCDS43 YVKKII----EDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLL
2290 2300 2310 2320 2330 2340
2460 2470 2480 2490 2500 2510
pF1KE3 HEILVIEDPIQAERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPA
.::.::: :..:. : . . ..::. ...:.. ..: :::.: .:.: ..::.
CCDS43 LQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPV
2350 2360 2370 2380 2390 2400
2520 2530 2540 2550
pF1KE3 AKEYFKENS---HHWSWAVQWLQKKM-------SEHY----WTPQSNVSNETSTGKTFQR
: . .. :. ..:.:::.:: .. . .: :.: . :::::.: ..:
CCDS43 AYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQ-SNETSNGYFLER
2410 2420 2430 2440 2450
2560 2570 2580 2590 2600 2610
pF1KE3 TISAQDTLAYATALLNEKEQSGSSNGS-ESSPANENGDRHLQQGSESPMMIGELRSDLDD
. ::. ::: : : :. ....: . : ..: :. . :::
CCDS43 SHSARMTLAKACELCPEEVKKATSVQQIEMEESKEPDDQDAPDEHESPPPEDAPLYPHSP
2460 2470 2480 2490 2500 2510
2620
pF1KE3 VDP
CCDS43 GSQYQQNNHVHGQPYTGPAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ
2520 2530 2540 2550 2560 2570
>>CCDS14781.1 USP9Y gene_id:8287|Hs108|chrY (2555 aa)
initn: 1866 init1: 744 opt: 1096 Z-score: 701.1 bits: 144.0 E(32554): 9.9e-33
Smith-Waterman score: 3474; 30.2% identity (59.0% similar) in 2650 aa overlap (97-2590:47-2492)
70 80 90 100 110 120
pF1KE3 GGGPRGDGGGDGGGGGPSRGGSTGGGGGFDPPPAYHEVVDAEKNDENGNCSGEGIEFPTT
::: . :: . :. : :: :
CCDS14 GQVLDGQSQHLFQQNQTSSPDSSNENSVATPPPEEQGQGDAPPQHED-----EEPAFPHT
20 30 40 50 60 70
130 140 150 160 170 180
pF1KE3 NLYELESRVLTDHWSIPYKREESLGKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKK
.: .:.. . .: .: . : : :. :. ::. ..: :.::. . .: :
CCDS14 ELANLDDMINRPRWVVPVLPKGELEVLLEAAIDLSVKGLDVKSEACQRFFRDGLTISFTK
80 90 100 110 120 130
190 200 210 220 230 240
pF1KE3 LLTSSAVHKWGTEIHEGIYNMLMLLIELVAERIKQDPIPIGLLGVLTMAFNPDNEYHFKN
.: . :: : :::. : : :.:: . ...:: .: :: .:.::.:: ..:. :
CCDS14 ILMDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYN
140 150 160 170 180
250 260 270 280 290 300
pF1KE3 RMKVSQRNWAEV-FGEGNMFAVSPVSTFQKEPHGWVVDLVNKFGELGGFAAIQAKL-HSE
. . ... . : ..:: :. . :.::.:::.:::: :.:: .. .. ..
CCDS14 GTRPCELISSNAQLPEDELFAR---SSDPRSPKGWLVDLINKFGTLNGFQILHDRFFNGS
190 200 210 220 230 240
310 320 330 340 350
pF1KE3 DIELGAVSALIQPLGVCAEYLNSSVVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLV
... ..:::.:.: : :.:.. ... .. ::: . . .... ...:: . .
CCDS14 ALNIQIIAALIKPFGQCYEFLSQHTLKKYFIPVIEIVPHLLENLTDEELKKEAKNEAKND
250 260 270 280 290 300
360 370 380 390 400 410
pF1KE3 SIPELLSAVKLLCMRF--QPDLVTIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIED-
.. .....: : :. : . . .. .:: ..::.:. :..:::.:.:..:.: .
CCDS14 ALSMIIKSLKNLASRISGQDETIKNLEIFRLKMILRLLQISSFNGKMNALNEINKVISSV
310 320 330 340 350 360
420 430 440 450 460
pF1KE3 STLSKSVKNA-----IDTDRLLDWLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK--
: .. .: . ..:. .:. .:..:::.:. .. : :: .... :.... ..
CCDS14 SYYTHRHSNPEEEEWLTAERMAEWIQQNNILSIVLQDSLHQPQYVEKLEKILRFVIKEKA
370 380 390 400 410 420
470 480 490 500 510 520
pF1KE3 LSLDELTKIWKIQSGQSSTVIENIHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQ
:.:..: .:: :.:. ....:.: ..: : :. ::.::: .. :: . : . :.
CCDS14 LTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPGQLDHLFDCFKASWTNASKKQRE
430 440 450 460 470 480
530 540 550 560 570 580
pF1KE3 KLLSLIGRIGREARFETTSGKVLDVLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KE
::: :: :.... . . . :::..::.::. .: .... :: :. ::. . . ..
CCDS14 KLLELIRRLAEDDKDGVMAHKVLNLLWNLAQSDDVPVDIMDLALSAHIKILDYSCSQDRD
490 500 510 520 530 540
590 600 610 620 630 640
pF1KE3 AIKRSYIIKCIEDIKRPGEWSGLEKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF--
: : ..: . ::... : : ::.:::.:..:: :
CCDS14 AQKIQWIDHFIEELRT---------NDK--------------WVIPALKQIREICSLFGE
550 560 570 580
650 660 670 680 690
pF1KE3 IKQTYQKQDKS--------IIQDLKKNFEIVKLVTGSLIACHRLAAAVAGPG-GLSGSTL
.:. .. ..: .:..:..: .: ::. .: . :: . .:.
CCDS14 ASQNLSQTQRSPHIFYRHDLINQLQQNHALVTLVAENLATYMNSIRLYAGDHEDYDPQTV
590 600 610 620 630 640
700 710 720 730 740 750
pF1KE3 VDG-RYTYREYLEAHLKFLAFFLQEATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWF
: ::.. . .. .:.:: :.:... :.: .::.::.::. . : ::: ::.:.
CCDS14 RLGSRYSHVQEVQERLNFLRFLLKDGQLWLCAPQAKQIWKCLAENA-VYLCDREACFKWY
650 660 670 680 690 700
760 770 780 790 800 810
pF1KE3 TK---GQHDLESDVQQQLFKEKILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQL
.: . ::. :.....:. ..:.:. .: ::.. :. ::. :: ...: . .
CCDS14 SKLMGDEPDLDPDINKDFFESNVLQLDPSLLTENGMKCFERFFKAVNCRERKLIAKRRSY
710 720 730 740 750 760
820 830 840 850 860 870
pF1KE3 YVEKLELIGMDFIWKIAMESPDEEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADC
... :::::.:..:.....: :: :::.::.:. . : ::.:::: ..: .:. :: .:
CCDS14 MMDDLELIGLDYLWRVVIQSSDE-IANRAIDLLKEI-YTNLGPRLKANQVVIHEDFIQSC
770 780 790 800 810 820
880 890 900 910 920 930
pF1KE3 YTRLEAASSALGGPTLTHAVTRATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAER
. ::.:. ..: : . : .. . : : . :.: . ..
CCDS14 FDRLKASYDTL-------CVFDGDKN-------SINCARQEAIR------MVRVLTVIKE
830 840 850 860
940 950 960 970 980 990
pF1KE3 YVITIEDFYSVPRTILPHGASFHGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKI
:. .. : : ::: . .:.:. :.: : . . : . . .:.:.:::::: :
CCDS14 YINECDSDYHKERMILPMSRAFRGKHLSLIVRFPNQGRQVDELDIWSHTNDTIGSVRRCI
870 880 890 900 910 920
1000 1010 1020 1030 1040
pF1KE3 AKQLCSPVDN--IQIFTNDSLLTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSS
.... . : . :..:.. :. . :.::. ::...:....:.: . . :: :::
CCDS14 VNRIKANVAHKKIELFVGGELIDSEDDRKLIGQLNLKDKSLITAKLTQINFNMPSSPDSS
930 940 950 960 970 980
1050 1060 1070 1080 1090 1100
pF1KE3 TSSSSSSSGVFSSSYA----MEQEKSLPGVVMALVCNVFDMLYQLA----NLEEPRITLR
..::..: : . : .: :. ::::.:.. ...:.:.: ::. : .
CCDS14 SDSSTASPGNHRNHYNDGPNLEVESCLPGVIMSVHPRYISFLWQVADLGSNLNMPPLRDG
990 1000 1010 1020 1030 1040
1110 1120 1130 1140 1150 1160
pF1KE3 VRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILES
.: :. :.: : . :...: .. .. :.: .. :: : :.:
CCDS14 ARVLMKLMPPD---RTAVEKLRAVCLDHAKLGE----GKLSP---------P-----LDS
1050 1060 1070
1170 1180 1190 1200 1210 1220
pF1KE3 LFRSFAPGMSTFRVLYNLEVLSSKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQR
:: :.:. : .::: ::. . ::: : .. . ...: .:::.::: ::.... :
CCDS14 LF--FGPSAS--QVLYLTEVVYALLMP-AGVPLTDG-SSDFQVHFLKSGGLPLVLSMLIR
1080 1090 1100 1110 1120 1130
1230 1240 1250 1260 1270
pF1KE3 DSIPSEVDYETRQGVYSICLQLARFLL--VGQTMPTLLDEDLTK--DGIEALSSRPFRNV
... ..:.:::.:.: :..:..:: .: . : :: . :. ..
CCDS14 NNFLPNTDMETRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPVVDGTD-----PITQI
1140 1150 1160 1170 1180
1280 1290 1300 1310 1320 1330
pF1KE3 SRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQTMEVSDFTSTVACFMR
.. : : . . .: . :.. .: : :. : ... .. . .. ...
CCDS14 NQVTHDQAVVLQSALQSIP---NPSSECVLRNESILLAQEISNEASRYMPDICVIRAIQK
1190 1200 1210 1220 1230 1240
1340 1350 1360 1370 1380 1390
pF1KE3 LSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQ
. ::.: : : :: : : .: ... .....:::
CCDS14 IIWASACGALGLVFS--PNEEITKI------YQMTTNGSN--------------------
1250 1260 1270
1400 1410 1420 1430 1440 1450
pF1KE3 QSVSTKDSLIAGEALSLLVTCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACD
.. ..: . ::: ... :. : : .. . ::::.:: :: .:..: .
CCDS14 -KLEVEDEQVCCEALEVMTLCFALLPTALDALSKEKAWQTFIIDLLLHCPSKTVRQLAQE
1280 1290 1300 1310 1320 1330
1460 1470 1480 1490 1500 1510
pF1KE3 QLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRC
:.. . .: .: :.. ...: . . :. .: . .:: :
CCDS14 QFFLMCTRCCMGH----RPLLFFITLLFT----ILGSTAREKG------KYSGDYFTLLR
1340 1350 1360 1370 1380
1520 1530 1540 1550 1560 1570
pF1KE3 QLLDDLTTSEMEQLRISPA-TMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKT
.::. ..... : : ..: .:: :: .. : ::. ... .: ::: . :
CCDS14 HLLNYAYNGNIN---IPNAEVLLVSEIDWLKRIRDNVKNTGETG-VEEPILEGHLGVTKE
1390 1400 1410 1420 1430
1580 1590 1600 1610 1620
pF1KE3 LLSLCGAEK------EMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAISQQDFHPKCS
::.. .:: : :..::: :.:::.: ::.. :. :. . .. : ::
CCDS14 LLAFQTSEKKYHFGCEKGGANLIKELIDDFIFPASKVYLQYLR---SGELPAEQAIPVCS
1440 1450 1460 1470 1480 1490
1630 1640 1650 1660 1670 1680
pF1KE3 TANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSS
. . :..:.:: :: . ::. :. : :... : :..::::: :
CCDS14 SPVTINAGFELLVALAIGCVRNLKQIVDCLTEMYYMGTAITTCEALTEWEYLPPVGPRPP
1500 1510 1520 1530 1540 1550
1690 1700 1710 1720
pF1KE3 SGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSV--------DD-------DTD---NP
.:::::.:.:::::::.:.::::: :.. .:.:.. :: :.. .:
CCDS14 KGFVGLKNAGATCYMNSVIQQLYMIPSIRNSILAIEGTGSDLHDDMFGDEKQDSESNVDP
1560 1570 1580 1590 1600 1610
1730 1740 1750 1760
pF1KE3 DDSVF--------------------YQV------QSLFGHLMESKLQYYVPENFWKIFKM
:.:: :.. : .:::: :.::::::..::: :..
CCDS14 RDDVFGYPHQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASQLQYYVPRGFWKQFRL
1620 1630 1640 1650 1660 1670
1770 1780 1790 1800 1810 1820
pF1KE3 WNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYER
:.. . .:::.:: :::.::.:..:: :: .:. :..... : ..:::::. ::::::
CCDS14 WGEPVNLREQHDALEFFNSLVDSLDEALKALGHPAILSKVLGGSFADQKICQGCPHRYEC
1680 1690 1700 1710 1720 1730
1830 1840 1850 1860 1870 1880
pF1KE3 EEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVL
::.: .::. . . :.: ::.:...:..:::.:::.:::: .: :::: ::.:: ::
CCDS14 EESFTTLNVDIRNHQNLLDSLEQYIKGDLLEGANAYHCEKCDKKVDTVKRLLIKKLPRVL
1740 1750 1760 1770 1780 1790
1890 1900 1910 1920 1930 1940
pF1KE3 VIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGG
.:.: :: .::: .::... ..:: :.: ::::.:.: . .. .:: . ..:
CCDS14 AIQLKRFDYDWERECAIKFNDYFEFPRELDMGPYTVAGVANLERDNVNSEN-ELIEQKEQ
1800 1810 1820 1830 1840 1850
1950 1960 1970 1980 1990
pF1KE3 GSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKDRRGCGK--GKWYKFNDTVIEEFDL
.. ...: .:.::::.:::::: .:::::.: .: : .::::.: . : .
CCDS14 SD--NETAGGTKYRLVGVLVHSGQASGGHYYSYIIQRNGKDDQTDHWYKFDDGDVTECKM
1860 1870 1880 1890 1900 1910
2000 2010 2020 2030 2040 2050
pF1KE3 ND-ETLEYECFGGEYRPKVYDQTNPYTDVRR--RYWNAYMLFYQRVSDQNSPVLPKKSRV
.: : .. .:::::: .:.:. . :: :.::::.:::....
CCDS14 DDDEEMKNQCFGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYEQMD-------------
1920 1930 1940 1950
2060 2070 2080 2090 2100 2110
pF1KE3 SVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARI
.. .. : . :: . :::. :.. :: :
CCDS14 -MIDEDDEMIRY-------ISELTIARPHQ------IIMS----------------PA-I
1960 1970 1980
2120 2130 2140 2150 2160
pF1KE3 YQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKH--------PYYPCMAKVSLQL
. :: .:.:::.:: :: .::.:: .: . :.. :. : .. .:.::
CCDS14 ERSVRKQNVKFMHNRLQYSLEYFQFVKKLLTCNGVYLNPAPGQDYLLPEAEEITMISIQL
1990 2000 2010 2020 2030 2040
2170 2180 2190 2200 2210 2220
pF1KE3 AIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLE
: .::: : ..::: .: . .: .. .:: .: .. :... . . . .. . .:::
CCDS14 AARFLFTTGFHTKKIVRGPASDWYDALCVLLRHSKNVRFWFTHNVLFNVSNRFSE-YLLE
2050 2060 2070 2080 2090 2100
2230 2240 2250 2260 2270
pF1KE3 CNVREVRVAVATILEKTLDSAL--------FYQ--------DKLKSLHQLLEVLLALLDK
: ::: : : .. .: : . :.:. .::.. : :: .
CCDS14 CPSAEVRGAFAKLIVFIAHFSLQDGSCPSPFASPGPSSQACDNLSLSDHLLRATLNLLRR
2110 2120 2130 2140 2150 2160
2280 2290 2300 2310 2320 2330
pF1KE3 DVPENCKNCAQYFFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWS
.: :. .. ::: :: ... :. ::. . : ..:. : . :.
CCDS14 EVSEHGHHLQQYFNLFVMYAN-LGVAEKTQLLKLNVPATFMLVSLDEG---PGPPIKY--
2170 2180 2190 2200 2210 2220
2340 2350 2360 2370 2380
pF1KE3 SAQAREFGNLHNTVALLVLHSDVSS--QRNVAPGIFKQRPPISIAPSSPLLPLHEEVEAL
: :.:.:...:. :. .::: : .. . : .. :.:..:....: .
CCDS14 --QYAELGKLYSVVSQLIRCCNVSSTMQSSINGNPPLPNPFGDLNLSQPIMPIQQNVLDI
2230 2240 2250 2260 2270
2390 2400 2410 2420 2430 2440
pF1KE3 LFMSEGKPYLLEVMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHE
::. . :. ... : .. :... .: . : .:: :.: . :. . .:
CCDS14 LFVRTS--YVKKII----EDCSNSEDTIKLLRFCSWENPQFSSTVLSELLWQVAYSYTYE
2280 2290 2300 2310 2320 2330
2450 2460 2470 2480 2490 2500
pF1KE3 LKNTFQLLHEILVIEDPIQAERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLV
:. ..:: .::.::: :..:. : . . ..::. ...:.. ..: :::.: .:
CCDS14 LRPYLDLLFQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMV
2340 2350 2360 2370 2380 2390
2510 2520 2530 2540 2550
pF1KE3 TLAQKCPAAKEYFKENS---HHWSWAVQWLQKKM-----------SEHYWTPQSNVSNET
.: ..::.: . .. :. ..:.:::.:: .. : . :.: . ::::
CCDS14 ALFSSCPVAYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYSYNNWSPPVQ-SNET
2400 2410 2420 2430 2440 2450
2560 2570 2580 2590 2600 2610
pF1KE3 STGKTFQRTISAQDTLAYATALLNEKEQSGSSNGSESSPANENGDRHLQQGSESPMMIGE
..: ..:. ::. ::: : : :.: . .. .: :.
CCDS14 ANGYFLERSHSARMTLAKACELCPEEEPDDQDAPDEHEPSPSEDAPLYPHSPASQYQQNN
2460 2470 2480 2490 2500 2510
2620
pF1KE3 LRSDLDDVDP
CCDS14 HVHGQPYTGPAAHHLNNPQKTGQRTQENYEGNEEVSSPQMKDQ
2520 2530 2540 2550
>>CCDS42686.1 USP34 gene_id:9736|Hs108|chr2 (3546 aa)
initn: 872 init1: 276 opt: 652 Z-score: 418.8 bits: 92.2 E(32554): 5.2e-17
Smith-Waterman score: 1183; 23.8% identity (53.0% similar) in 1733 aa overlap (702-2336:978-2494)
680 690 700 710 720
pF1KE3 VTGSLIACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFLQEAT----LYLG
:.. ....:.::. .. . :.
CCDS42 EKELNMMKLFFDNLVYYIQTVREGRQKHALYSHSAEVQVRLQFLTCVFSTLGSPDHFRLS
950 960 970 980 990 1000
730 740 750 760 770 780
pF1KE3 WNRAKEIWECLVTGQDVCELDREMCFEWF-----TKGQHDLESDVQQQLFKEKILKLESY
... .:.::: .. : : ..:: .: :: . .. ..:: ::. .:.
CCDS42 LEQVDILWHCLVEDSE-CYDD---ALHWFLNQVRSKDQHAMGMETYKHLFLEKMPQLKPE
1010 1020 1030 1040 1050 1060
790 800 810 820 830 840
pF1KE3 EITMNGFNLFKTFFENVNLCDHRLKRQGAQLY--VEKLELIGMDFIWKIAMESPDEEIAN
:.:.:.:::. .::. : : ... : . :: ::: .: ::... . ...
CCDS42 TISMTGLNLFQ------HLCN--LARLATSAYDGCSNSELCGMDQFWGIALRAQSGDVSR
1070 1080 1090 1100 1110
850 860 870 880 890
pF1KE3 EAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTH--AVTRATK
::: : .: ::: . :.:. ..::. :. : :::.: . . .. :.
CCDS42 AAIQYINSY-YINGKTGLEKE-----QEFISKCMESLMIASSSLEQESHSSLMVIERGLL
1120 1130 1140 1150 1160
900 910 920 930 940 950
pF1KE3 MLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASFHGH
:: : . . :. . :: . . .. .. : :.: .. . :.. .
CCDS42 MLK-THLEAFRRRFAYHLRQWQ---IEGTGISS--HLKALSDKQSLPLRVVCQPAGLPDK
1170 1180 1190 1200 1210 1220
960 970 980 990 1000
pF1KE3 L------------LTLNVT--YEST-KDTFTVEAHSNETIGSVRW-KIAKQLCSPVDNIQ
. : .:: ::. :. .. .:. .: : : .. : .:: .
CCDS42 MTIEMYPSDQVADLRAEVTHWYENLQKEQINQQAQLQEFGQSNRKGEFPGGLMGPV---R
1230 1240 1250 1260 1270 1280
1010 1020 1030 1040 1050 1060
pF1KE3 IFTNDSLLTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSS
.... ::.. :.: ::.:::.: :.. :. :.: ... . .:
CCDS42 MISSGHELTTDYDEKALHELGFKDMQMVFVSL---GAPRRERKGEGVQ-------LPASC
1290 1300 1310 1320 1330
1070 1080 1090
pF1KE3 YAMEQEKSLPGVVMAL---VCNVFDMLYQLANLEEPR----------------------I
:. ..: ... . ..::.: .::... : .
CCDS42 LPPPQKDNIPMLLLLQEPHLTTLFDLLEMLASFKPPSGKVAVDDSESLRCEELHLHAENL
1340 1350 1360 1370 1380 1390
1100 1110 1120 1130 1140 1150
pF1KE3 TLRVRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSKSPSLSSKQQHQP-SASS
. :: .::.:.:: : . :...... .:.. . . :. :. :. :
CCDS42 SRRVWELLMLLPTCPNMLMAFQNISD--------EQSNDGFNWKELLKIKSAHKLLYALE
1400 1410 1420 1430 1440
1160 1170 1180 1190 1200 1210
pF1KE3 ILESLFRSFAPGMSTFRVLYNLEVLSSKLMPTADD---DMARSCAKSFCENFLKAGGLSL
:.:.: : . :. . : :.: .:: :.... .:. .:. ::::.
CCDS42 IIEAL------GKPNRRIRRESTGSYSDLYPDSDDSSEDQVENSKNSWSCKFVAAGGLQQ
1450 1460 1470 1480 1490
1220 1230 1240 1250 1260 1270
pF1KE3 VVNVMQRDSI-PSEVDYETRQGVYSI-CLQLARFL-LVGQTMPTLLDEDLTKDGIEALSS
...... . :.: . : :... :: : .: :. : : ::. . : :
CCDS42 LLEIFNSGILEPKEQESWT---VWQLDCL--ACLLKLICQFAVDPSDLDLAYHDVFAWS-
1500 1510 1520 1530 1540 1550
1280 1290 1300 1310 1320 1330
pF1KE3 RPFRNVSRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQTMEVSDFTST
... .. :. . : :: :. . . ..... .. . : .: ::
CCDS42 ----GIA-ESHRKRTW---PGKS--RKAAGDHAKGLHIPRLTEVFLVLVQG------TSL
1560 1570 1580 1590
1340 1350 1360 1370 1380 1390
pF1KE3 VACFMRLSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHA
. .: .... ..: : :. .. :. : :
CCDS42 IQRLMSVAYTY-----------------DNLAP-----RVLKAQSDHRSRHE--------
1600 1610 1620
1400 1410 1420 1430 1440
pF1KE3 GICVRQQSVSTKDSLIAGEALSLLVT---CLQLRSQQLASFYNLPCVADFIIDILLGSPS
.. .. :::. : .: ...::. .: :.. . : :
CCDS42 ---------------VSHYSMWLLVSWAHCCSLVKSSLADSDHLQ---DWLKKLTLLIPE
1630 1640 1650 1660
1450 1460 1470 1480 1490 1500
pF1KE3 AEIRRVACDQLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLP---LWSPTSIMRGVNQRL
. .:. .:. :: :: . .. .... .: . : :: .: : .. .
CCDS42 TAVRHESCSGLYKLSLSGLDGGDSINRSFLLLAASTLLKFLPDAQALKPIRIDDYEEEPI
1670 1680 1690 1700 1710 1720
1510 1520 1530 1540 1550 1560
pF1KE3 LSQ-CMEYFDLRCQLLDDLTTSEMEQLRISPATMLEDEITWLDNFEPNRTAECETSEADN
:. : ::: : :.:.:.. .. : . : ... : .. . . . .....
CCDS42 LKPGCKEYFWLLCKLVDNIHIKDASQTTLLDLDALARHLA--DCIRSREILDHQDGNVED
1730 1740 1750 1760 1770 1780
1570 1580 1590 1600 1610 1620
pF1KE3 ILLAGHLRLIKTLLSLCGAEK-EMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAISQQ
:.: ::: .... : :. ... ... .:: .: : . ::
CCDS42 DGLTGLLRLATSVVKHKPPFKFSREGQEFLRDIFN-LLF-----LLPSLKD------RQQ
1790 1800 1810 1820 1830
1630 1640 1650 1660 1670 1680
pF1KE3 DFHPKCSTANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALTKEFDYLPPVDS
:::.. .:: :::..:: .. .: : ..: . ....: : ..:: : :
CCDS42 ---PKCKSHSSRAAAYDLLVEMVKGSVENYRLIHNWVMAQHMQSHAPY--KWDYWPHEDV
1840 1850 1860 1870 1880
1690 1700 1710 1720 1730 1740
pF1KE3 RSSSGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSVDDDTDNPDDSVFYQVQSLFGHL
:. :::: : :::::. ...::::: : ...... . : ... ..:..: .:
CCDS42 RAECRFVGLTNLGATCYLASTIQQLYMIPEARQAVFTAKYSEDMKHKTTLLELQKMFTYL
1890 1900 1910 1920 1930 1940
1750 1760 1770 1780 1790 1800
pF1KE3 MESKLQYYVPENFWKIFKMWNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKNTF
:::. . : :. : : . : .. : . ::.: ::::.:: ...:. .. .. . :. :
CCDS42 MESECKAYNPRPFCKTYTMDKQPLNTGEQKDMTEFFTDLITKIEEMSPEL-KNTV-KSLF
1950 1960 1970 1980 1990 2000
1810 1820 1830 1840 1850 1860
pF1KE3 QGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCEKC
:. ... . :: : . : :... :.. ... :::. . ..:::.: : : .:
CCDS42 GGVITNNVVSLDCEHVSQTAEEFYTVRCQVADMKNIYESLDEVTIKDTLEGDNMYTCSHC
2010 2020 2030 2040 2050 2060
1870 1880 1890 1900 1910 1920
pF1KE3 KEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGMAR
.: . ::.:.:.:: .: .. ::. :. . . : . .. :: :.: ::: . .
CCDS42 GKKVRAEKRACFKKLPRILSFNTMRYTFNMVTMMKEKVNTHFSFPLRLDMTPYTEDFLM-
2070 2080 2090 2100 2110 2120
1930 1940 1950 1960 1970
pF1KE3 QDSSSEVGENGRSVDQGGGGSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKD---RR
..:: :. . : : ..: . . .:.:.:: ::.: : .:::::::.: .
CCDS42 --GKSERKEGFKEV------SDHSKDSESYEYDLIGVTVHTGTADGGHYYSFIRDIVNPH
2130 2140 2150 2160 2170
1980 1990 2000 2010 2020 2030
pF1KE3 GCGKGKWYKFNDTVIEEFDLNDETLEYECFGGEYRPKVYDQ-TNPYTDVR-RRYWNAYML
. ..::: :::. .. :: . : ::::::. :.::. :. . : .. .::::
CCDS42 AYKNNKWYLFNDAEVKPFD--SAQLASECFGGEMTTKTYDSVTDKFMDFSFEKTHSAYML
2180 2190 2200 2210 2220 2230
2040 2050 2060 2070 2080 2090
pF1KE3 FYQRVSDQNSPVLPKKSRVSVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTK
::.:. :: . . : .. ... ..
CCDS42 FYKRME------------------------------PE---EENGREYK-----FDVSSE
2240 2250
2100 2110 2120 2130 2140 2150
pF1KE3 LVKKGEKKGLFVEKMPARIYQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKHPY
:. . . .:..:....... ::.:. .: : . : :
CCDS42 LL------------------EWIWHDNMQFLQDKNIFEHTYFGFMWQLCSCIPSTLPDP-
2260 2270 2280 2290
2160 2170 2180 2190 2200 2210
pF1KE3 YPCMAKVSLQLAIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSE
.. .. .:. .:...:....:.: . .:: . ...: ::.:... . ...
CCDS42 -KAVSLMTAKLSTSFVLETFIHSKEKPTM--LQWIELLTKQFNNSQAACEWFLDRMADDD
2300 2310 2320 2330 2340 2350
2220 2230 2240 2250
pF1KE3 GRELIKIFLLECN---VREV--RVAVATILE-KTLDSALFYQDKLKS-------------
. .:..: ::.. :. . .: . . . . :. : ...
CCDS42 WWPM--QILIKCPNQIVRQMFQRLCIHVIQRLRPVHAHLYLQPGMEDGSDDMDTSVEDIG
2360 2370 2380 2390 2400 2410
2260 2270 2280 2290 2300 2310
pF1KE3 ----LHQLLEVLLALLDKDVPENCKNCAQYFFLFNTFVQKQGIRAGDLLLRHSALRHMIS
. .....:: .... : . :. ..:: .. :. :.: . ...:: .:. :.
CCDS42 GRSCVTRFVRTLLLIMEHGVKPHSKHLTEYFAFLYEFA-KMGEEESQFLLSLQAISTMVH
2420 2430 2440 2450 2460 2470
2320 2330 2340 2350 2360 2370
pF1KE3 FLLGASR-QNNQIRRWSSAQAREFGNLHNTVALLVLHSDVSSQRNVAPGIFKQRPPISIA
: .:.. .: :.. : ...:
CCDS42 FYMGTKGPENPQVEVLSEEEGEEEEEEEDILSLAEEKYRPAALEKMIALVALLVEQSRSE
2480 2490 2500 2510 2520 2530
2620 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 19:11:20 2016 done: Mon Nov 7 19:11:21 2016
Total Scan time: 5.320 Total Display time: 0.930
Function used was FASTA [36.3.4 Apr, 2011]