FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3506, 2620 aa 1>>>pF1KE3506 2620 - 2620 aa - 2620 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6057+/-0.00139; mu= 12.5870+/- 0.085 mean_var=250.5650+/-50.978, 0's: 0 Z-trim(107.8): 81 B-trim: 10 in 1/51 Lambda= 0.081024 statistics sampled from 9764 (9829) to 9764 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.609), E-opt: 0.2 (0.302), width: 16 Scan time: 5.320 The best scores are: opt bits E(32554) CCDS44154.2 USP24 gene_id:23358|Hs108|chr1 (2620) 17232 2030.2 0 CCDS55403.1 USP9X gene_id:8239|Hs108|chrX (2554) 1164 151.9 4e-35 CCDS43930.1 USP9X gene_id:8239|Hs108|chrX (2570) 1164 151.9 4e-35 CCDS14781.1 USP9Y gene_id:8287|Hs108|chrY (2555) 1096 144.0 9.9e-33 CCDS42686.1 USP34 gene_id:9736|Hs108|chr2 (3546) 652 92.2 5.2e-17 >>CCDS44154.2 USP24 gene_id:23358|Hs108|chr1 (2620 aa) initn: 17232 init1: 17232 opt: 17232 Z-score: 10894.8 bits: 2030.2 E(32554): 0 Smith-Waterman score: 17232; 99.9% identity (100.0% similar) in 2620 aa overlap (1-2620:1-2620) 10 20 30 40 50 60 pF1KE3 MESEEEQHMTTLLCMGFSDPATIRKALRLAKNDINEAVALLTNERPGLDYGGYEPMDSGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MESEEEQHMTTLLCMGFSDPATIRKALRLAKNDINEAVALLTNERPGLDYGGYEPMDSGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GPSPGPGGGPRGDGGGDGGGGGPSRGGSTGGGGGFDPPPAYHEVVDAEKNDENGNCSGEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GPSPGPGGGPRGDGGGDGGGGGPSRGGSTGGGGGFDPPPAYHEVVDAEKNDENGNCSGEG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 IEFPTTNLYELESRVLTDHWSIPYKREESLGKCLLASTYLARLGLSESDENCRRFMDRCM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 IEFPTTNLYELESRVLTDHWSIPYKREESLGKCLLASTYLARLGLSESDENCRRFMDRCM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 PEAFKKLLTSSAVHKWGTEIHEGIYNMLMLLIELVAERIKQDPIPIGLLGVLTMAFNPDN ::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::: CCDS44 PEAFKKLLTSSAVHKWGTEIHEGIYNMLMLLIELVAERIKQDPIPTGLLGVLTMAFNPDN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 EYHFKNRMKVSQRNWAEVFGEGNMFAVSPVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EYHFKNRMKVSQRNWAEVFGEGNMFAVSPVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 LHSEDIELGAVSALIQPLGVCAEYLNSSVVQPMLDPVILTTIQDVRSVEEKDLKDKRLVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LHSEDIELGAVSALIQPLGVCAEYLNSSVVQPMLDPVILTTIQDVRSVEEKDLKDKRLVS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 IPELLSAVKLLCMRFQPDLVTIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIEDSTLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 IPELLSAVKLLCMRFQPDLVTIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIEDSTLS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 KSVKNAIDTDRLLDWLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSKLSLDELTKIWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KSVKNAIDTDRLLDWLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSKLSLDELTKIWK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 IQSGQSSTVIENIHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 IQSGQSSTVIENIHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 EARFETTSGKVLDVLWELAHLPTLPSSLIQQALEEHLTILSDAYAVKEAIKRSYIIKCIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EARFETTSGKVLDVLWELAHLPTLPSSLIQQALEEHLTILSDAYAVKEAIKRSYIIKCIE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 DIKRPGEWSGLEKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSFIKQTYQKQDKSIIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DIKRPGEWSGLEKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSFIKQTYQKQDKSIIQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 DLKKNFEIVKLVTGSLIACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DLKKNFEIVKLVTGSLIACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFLQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 EATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWFTKGQHDLESDVQQQLFKEKILKLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWFTKGQHDLESDVQQQLFKEKILKLE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 SYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESPDEEIAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESPDEEIAN 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 EAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVTRATKML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVTRATKML 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 TATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASFHGHLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASFHGHLL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 TLNVTYESTKDTFTVEAHSNETIGSVRWKIAKQLCSPVDNIQIFTNDSLLTVNKDQKLLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TLNVTYESTKDTFTVEAHSNETIGSVRWKIAKQLCSPVDNIQIFTNDSLLTVNKDQKLLH 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 QLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYAMEQEKSLPGVVMALVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYAMEQEKSLPGVVMALVC 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 NVFDMLYQLANLEEPRITLRVRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NVFDMLYQLANLEEPRITLRVRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSK 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE3 SPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVLSSKLMPTADDDMARSCAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVLSSKLMPTADDDMARSCAKS 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE3 FCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQLARFLLVGQTMPTLLDEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQLARFLLVGQTMPTLLDEDL 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE3 TKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQ 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE3 TMEVSDFTSTVACFMRLSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TMEVSDFTSTVACFMRLSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSG 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE3 SEGEPVALHAGICVRQQSVSTKDSLIAGEALSLLVTCLQLRSQQLASFYNLPCVADFIID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SEGEPVALHAGICVRQQSVSTKDSLIAGEALSLLVTCLQLRSQQLASFYNLPCVADFIID 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE3 ILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLPLWSPTSIMRGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLPLWSPTSIMRGV 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE3 NQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISPATMLEDEITWLDNFEPNRTAECETSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISPATMLEDEITWLDNFEPNRTAECETSE 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE3 ADNILLAGHLRLIKTLLSLCGAEKEMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ADNILLAGHLRLIKTLLSLCGAEKEMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAIS 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE3 QQDFHPKCSTANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALTKEFDYLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QQDFHPKCSTANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALTKEFDYLPPV 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE3 DSRSSSGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSVDDDTDNPDDSVFYQVQSLFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DSRSSSGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSVDDDTDNPDDSVFYQVQSLFG 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE3 HLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKN 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE3 TFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCE 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE3 KCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGM 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE3 ARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKDRRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKDRRG 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE3 CGKGKWYKFNDTVIEEFDLNDETLEYECFGGEYRPKVYDQTNPYTDVRRRYWNAYMLFYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 CGKGKWYKFNDTVIEEFDLNDETLEYECFGGEYRPKVYDQTNPYTDVRRRYWNAYMLFYQ 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE3 RVSDQNSPVLPKKSRVSVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTKLVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RVSDQNSPVLPKKSRVSVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTKLVK 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE3 KGEKKGLFVEKMPARIYQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKHPYYPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KGEKKGLFVEKMPARIYQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKHPYYPC 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE3 MAKVSLQLAIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MAKVSLQLAIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRE 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE3 LIKIFLLECNVREVRVAVATILEKTLDSALFYQDKLKSLHQLLEVLLALLDKDVPENCKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LIKIFLLECNVREVRVAVATILEKTLDSALFYQDKLKSLHQLLEVLLALLDKDVPENCKN 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE3 CAQYFFLFNTFVQKQGIRAGDLLLRHSALRHMISFLLGASRQNNQIRRWSSAQAREFGNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 CAQYFFLFNTFVQKQGIRAGDLLLRHSALRHMISFLLGASRQNNQIRRWSSAQAREFGNL 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE3 HNTVALLVLHSDVSSQRNVAPGIFKQRPPISIAPSSPLLPLHEEVEALLFMSEGKPYLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HNTVALLVLHSDVSSQRNVAPGIFKQRPPISIAPSSPLLPLHEEVEALLFMSEGKPYLLE 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE3 VMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLHEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLHEIL 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE3 VIEDPIQAERVKFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAAKEYFKEN :::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VIEDPIQVERVKFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAAKEYFKEN 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE3 SHHWSWAVQWLQKKMSEHYWTPQSNVSNETSTGKTFQRTISAQDTLAYATALLNEKEQSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SHHWSWAVQWLQKKMSEHYWTPQSNVSNETSTGKTFQRTISAQDTLAYATALLNEKEQSG 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 pF1KE3 SSNGSESSPANENGDRHLQQGSESPMMIGELRSDLDDVDP :::::::::::::::::::::::::::::::::::::::: CCDS44 SSNGSESSPANENGDRHLQQGSESPMMIGELRSDLDDVDP 2590 2600 2610 2620 >>CCDS55403.1 USP9X gene_id:8239|Hs108|chrX (2554 aa) initn: 1699 init1: 755 opt: 1164 Z-score: 744.1 bits: 151.9 E(32554): 4e-35 Smith-Waterman score: 3545; 30.6% identity (59.1% similar) in 2705 aa overlap (68-2593:7-2495) 40 50 60 70 80 90 pF1KE3 VALLTNERPGLDYGGYEPMDSGGGPSPGPGGGPRGDGGGDGGGGGPSRGGSTGG--GGGF :.: ::.:. : .:. : : . CCDS55 MTATTRGSPV--GGNDNQGQAPD-GQSQPPLQQNQT 10 20 30 100 110 120 130 140 pF1KE3 DPPPAYHEVVDAEKNDENGNCSG------EGIEFPTTNLYELESRVLTDHWSIPYKREES . : . .: : ::.:. .. : :: :.: .:.. . .: .: . CCDS55 SSPDSSNENSPATPPDEQGQGDAPPQLEDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGE 40 50 60 70 80 90 150 160 170 180 190 200 pF1KE3 LGKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKKLLTSSAVHKWGTEIHEGIYNMLM : : :. :.. ::. ..: :.::. . .: :.::. :: : :::. : : CCDS55 LEVLLEAAIDLSKKGLDVKSEACQRFFRDGLTISFTKILTDEAVSGWKFEIHRCIINNTH 100 110 120 130 140 150 210 220 230 240 250 260 pF1KE3 LLIELVAERIKQDPIPIGLLGVLTMAFNPDNEYHFKNRMKVSQRNWAEV-FGEGNMFAVS :.:: . ...:: .: :: .:.::.:: ..:. : . . . : . : ..:: : CCDS55 RLVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYNGTRPCESVSSSVQLPEDELFARS 160 170 180 190 200 210 270 280 290 300 310 320 pF1KE3 PVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK-LHSEDIELGAVSALIQPLGVCAEYLNS : . :.::.:::.:::: :.:: .. . ... ... ..:::.:.: : :.:. CCDS55 PD---PRSPKGWLVDLLNKFGTLNGFQILHDRFINGSALNVQIIAALIKPFGQCYEFLTL 220 230 240 250 260 330 340 350 360 370 380 pF1KE3 SVVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLVSIPELLSAVKLLCMRF--QPDLV .:. .. :.: . : .... ...:: . . .. .....: : : : . : CCDS55 HTVKKYFLPIIEMVPQFLENLTDEELKKEAKNEAKNDALSMIIKSLKNLASRVPGQEETV 270 280 290 300 310 320 390 400 410 420 430 pF1KE3 TIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIED-STLSKSVKNA-----IDTDRLLD .. .:: ..::.:. :..:::.:.::.:.: . : .. : . ..:. . CCDS55 KNLEIFRLKMILRLLQISSFNGKMNALNEVNKVISSVSYYTHRHGNPEEEEWLTAERMAE 330 340 350 360 370 380 440 450 460 470 480 490 pF1KE3 WLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK--LSLDELTKIWKIQSGQSSTVIEN :. .:..:::.:. .. : :: .... :.... .. :.:..: .:: :.:. ....: CCDS55 WIQQNNILSIVLRDSLHQPQYVEKLEKILRFVIKEKALTLQDLDNIWAAQAGKHEAIVKN 390 400 410 420 430 440 500 510 520 530 540 550 pF1KE3 IHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGREARFETTSGKVL .: ..: : :. .::.::: .. :: . : . :.::: :: :.... . . . ::: CCDS55 VHDLLAKLAWDFSPEQLDHLFDCFKASWTNASKKQREKLLELIRRLAEDDKDGVMAHKVL 450 460 470 480 490 500 560 570 580 590 600 610 pF1KE3 DVLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KEAIKRSYIIKCIEDIKRPGEWSGL ..::.::: .: .... :: :. ::. . . ... : ..: . ::... CCDS55 NLLWNLAHSDDVPVDIMDLALSAHIKILDYSCSQDRDTQKIQWIDRFIEELRT------- 510 520 530 540 550 560 620 630 640 650 660 pF1KE3 EKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF--IKQTYQKQDKS--------IIQD : : ::.:::.:..:: : :. .. ..: .:.. CCDS55 --NDK--------------WVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRHDLINQ 570 580 590 600 670 680 690 700 710 pF1KE3 LKKNFEIVKLVTGSL---IACHRLAAAVAGPGGLSGSTLVDG-RYTYREYLEAHLKFLAF :..: .: ::. .: . :: : . .:. : ::.. . .. .:.:: : CCDS55 LQHNHALVTLVAENLATYMESMRLYAR--DHEDYDPQTVRLGSRYSHVQEVQERLNFLRF 610 620 630 640 650 660 720 730 740 750 760 770 pF1KE3 FLQEATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWFTK---GQHDLESDVQQQLFKE .:... :.: .::.::.::. . : ::: ::.:..: . ::. :.....:. CCDS55 LLKDGQLWLCAPQAKQIWKCLAENA-VYLCDREACFKWYSKLMGDEPDLDPDINKDFFES 670 680 690 700 710 720 780 790 800 810 820 830 pF1KE3 KILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMESP ..:.:. .: ::.. :. ::. :: . .: . ... :::::.:..:.....: CCDS55 NVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQSN 730 740 750 760 770 780 840 850 860 870 880 890 pF1KE3 DEEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAVT :. ::..::.:. . : ::.:::. ..: .:. :: .:. ::.:. ..: : CCDS55 DD-IASRAIDLLKEI-YTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTL-------CVL 790 800 810 820 830 900 910 920 930 940 950 pF1KE3 RATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGAS . : .: . : : . :.: . ..:. .. : ::::: . . CCDS55 DGDK-------DSVNCARQEAVR------MVRVLTVLREYINECDSDYHEERTILPMSRA 840 850 860 870 880 960 970 980 990 1000 pF1KE3 FHGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKIAKQLCSPVDN--IQIFTNDSL :.:. :.. : . . : . : .:.:.:::::: : ... . : . :..:.. : CCDS55 FRGKHLSFVVRFPNQGRQVDDLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGEL 890 900 910 920 930 940 1010 1020 1030 1040 1050 1060 pF1KE3 LTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYA----M . :.::. ::...:....:.: . .. :: :::..::..: : .. :. CCDS55 IDPADDRKLIGQLNLKDKSLITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPNP 950 960 970 980 990 1000 1070 1080 1090 1100 1110 1120 pF1KE3 EQEKSLPGVVMALVCNVFDMLYQLANL----EEPRITLRVRKLLLLIPTDPAIQEALDQL : :. ::::.:.: ...:.:.:.: . : . .: :. :.: : . : : CCDS55 EVESCLPGVIMSLHPRYISFLWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKL--- 1010 1020 1030 1040 1050 1130 1140 1150 1160 1170 1180 pF1KE3 DSLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEVL : : . ..:: :::: .::: :.:. : .::: ::. CCDS55 ----RAICLDHAKLGESSLSPSL--------------DSLF--FGPSAS--QVLYLTEVV 1060 1070 1080 1090 1190 1200 1210 1220 1230 1240 pF1KE3 SSKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICLQ . ::: : .: . ...: .:::.::: ::.... :... ..:.:::.:.: :. CCDS55 YALLMP-AGAPLADD-SSDFQFHFLKSGGLPLVLSMLTRNNFLPNADMETRRGAYLNALK 1100 1110 1120 1130 1140 1150 1250 1260 1270 1280 1290 pF1KE3 LARFLL--VGQTMPTLLDEDLTKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQLS .:..:: .: . : . :.:... :. .... : : . . .: CCDS55 IAKLLLTAIGYGHVRAVAEA-CQPGVEGVN--PMTQINQVTHDQAVVLQSALQS------ 1160 1170 1180 1190 1200 1300 1310 1320 1330 1340 1350 pF1KE3 VSDRSSIRVEEIIPAARVAIQ-TMEVSDFTSTVACFMR----LSWAAAAGRLDLVGSSQP . . :: . . . ..:.: : . :.: . . : .: . ::.. : :.:: : : CCDS55 IPNPSSECMLRNV-SVRLAQQISDEASRYMPDI-CVIRAIQKIIWASGCGSLQLVFS--P 1210 1220 1230 1240 1250 1260 1360 1370 1380 1390 1400 1410 pF1KE3 IKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQQSVSTKDSLIAGEALSLL .: .. : .. ...:. :: . .: . ::: .. CCDS55 NEEITK-----IYEK-TNAGN--------EP--------------DLEDEQVCCEALEVM 1270 1280 1290 1420 1430 1440 1450 1460 1470 pF1KE3 VTCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQK . :. : : .. . ::::.:: : .:.:: .:.. . .: . CCDS55 TLCFALIPTALDALSKEKAWQTFIIDLLLHCHSKTVRQVAQEQFFLMCTRCCMGH----R 1300 1310 1320 1330 1340 1480 1490 1500 1510 1520 1530 pF1KE3 PNQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRISP : :.. ...: .. .. .. .. .:: : .::. .:... . CCDS55 PLLFFITLLFT----------VLGSTARERAKHSGDYFTLLRHLLNYAYNSNINV--PNA 1350 1360 1370 1380 1390 1540 1550 1560 1570 1580 pF1KE3 ATMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKTLLSLCGAEK------EMLG ..:..:: :: .. . ::. .. .: ::: . : ::.. .:: : : CCDS55 EVLLNNEIDWLKRIRDDVKRTGETG-IEETILEGHLGVTKELLAFQTSEKKFHIGCEKGG 1400 1410 1420 1430 1440 1450 1590 1600 1610 1620 1630 1640 pF1KE3 SSLIKPLLDDFLFRASRIIL----NSHSPAGSAAISQQDFHPKCSTANSRLAAYEVLVML ..::: :.:::.: :: . : :.. :: .: : :.. . :..:.:: : CCDS55 ANLIKELIDDFIFPASNVYLQYMRNGELPAEQAI-------PVCGSPPTINAGFELLVAL 1460 1470 1480 1490 1500 1650 1660 1670 1680 1690 1700 pF1KE3 ADSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSSSGFVGLRNGGATCYM : . ::. :. : :.. : :..::::: : .:::::.:.:::::: CCDS55 AVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCYM 1510 1520 1530 1540 1550 1560 1710 1720 1730 pF1KE3 NAVFQQLYMQPGLPESLLS-------VDDDT------DN-----PDDSVF---------- :.:.::::: :.. ...:. :::: :: : :.:: CCDS55 NSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDKP 1570 1580 1590 1600 1610 1620 1740 1750 1760 1770 pF1KE3 ----------YQV------QSLFGHLMESKLQYYVPENFWKIFKMWNKELYVREQQDAYE :.. : .:::: :.::::::..::: :..:.. . .:::.:: : CCDS55 ALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDALE 1630 1640 1650 1660 1670 1680 1780 1790 1800 1810 1820 1830 pF1KE3 FFTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQ ::.::.:..:: :: .:. ...... : ..:::::. :::::: ::.: .::. . . : CCDS55 FFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNHQ 1690 1700 1710 1720 1730 1740 1840 1850 1860 1870 1880 1890 pF1KE3 SLEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGR .: ::.:.:.:..:::.:::.::::..: :::: ::.:: ::.:.: :: .::: CCDS55 NLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWEREC 1750 1760 1770 1780 1790 1800 1900 1910 1920 1930 1940 1950 pF1KE3 SIKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYEL .::... ..:: :.::::::.:.:. .... :. ... ..:. . ....: . .:.: CCDS55 AIKFNDYFEFPRELDMEPYTVAGVAKLEGDN-VNPESQLIQQS--EQSESETAGSTKYRL 1810 1820 1830 1840 1850 1860 1960 1970 1980 1990 2000 2010 pF1KE3 VGVIVHSGQAHAGHYYSFIKDRRGCGKG---KWYKFNDTVIEEFDLND-ETLEYECFGGE :::.:::::: .:::::.: .: : : : .::::.: . : ..: : .. .::::: CCDS55 VGVLVHSGQASGGHYYSYIIQRNG-GDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGGE 1870 1880 1890 1900 1910 1920 2020 2030 2040 2050 2060 pF1KE3 YRPKVYDQTNPYTDVRR--RYWNAYMLFYQRVS--DQNSPVLPKKSRVSVVRQEAEDLSL : .:.:. . :: :.::::.:::.:.. ::.. .. :.... CCDS55 YMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAI---------- 1930 1940 1950 1960 1970 2070 2080 2090 2100 2110 2120 pF1KE3 SAPSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARIYQMVRDENLKFM . ::: ... ::. : . :: .:..:: CCDS55 ------------TTRPH-----------QII------------MPSAIERSVRKQNVQFM 1980 1990 2130 2140 2150 2160 2170 2180 pF1KE3 KNRDVYSSDYFSFVLSLASLNATKLKHP-----YYPC---MAKVSLQLAIQFLFQTYLRT .:: :: .::.:. .: . :.. :. : : .. .:.::: .::: : ..: CCDS55 HNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLAARFLFTTGFHT 2000 2010 2020 2030 2040 2050 2190 2200 2210 2220 2230 2240 pF1KE3 KKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLECNVREVRVAVAT :: .: .. .: .. :: .: .. :... . . . .. . .:::: ::: : : CCDS55 KKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRFSE-YLLECPSAEVRGAFAK 2060 2070 2080 2090 2100 2110 2250 2260 2270 2280 pF1KE3 ILEKTLDSAL--------FYQ--------DKLKSLHQLLEVLLALLDKDVPENCKNCAQY .. .: : . :.:. .::...: :: ..: :. .. :: CCDS55 LIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAVLNLLRREVSEHGRHLQQY 2120 2130 2140 2150 2160 2170 2290 2300 2310 2320 2330 2340 pF1KE3 FFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWSSAQAREFGNLHN : :: ... :. ::. : : ..:. : . :. : :.:.:.. CCDS55 FNLFVMYAN-LGVAEKTQLLKLSVPATFMLVSLDEG---PGPPIKY----QYAELGKLYS 2180 2190 2200 2210 2220 2230 2350 2360 2370 2380 2390 pF1KE3 TVALLVLHSDVSSQRNVAPGIFKQRPPISIA---P--SSPLLPLHEEVEALLFMSEGKPY .:. :. .:::. . . .. ::. : :.:..:....: .::. . : CCDS55 VVSQLIRCCNVSSRMQSS---INGNPPLPNPFGDPNLSQPIMPIQQNVADILFVRTS--Y 2240 2250 2260 2270 2280 2400 2410 2420 2430 2440 2450 pF1KE3 LLEVMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLLH . ... : .. .... .::. : .:: :.: . :. . .::. ..:: CCDS55 VKKII----EDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLLL 2290 2300 2310 2320 2330 2340 2460 2470 2480 2490 2500 2510 pF1KE3 EILVIEDPIQAERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPAA .::.::: :..:. : . . ..::. ...:.. ..: :::.: .:.: ..::.: CCDS55 QILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPVA 2350 2360 2370 2380 2390 2400 2520 2530 2540 2550 pF1KE3 KEYFKENS---HHWSWAVQWLQKKM-------SEHY----WTPQSNVSNETSTGKTFQRT . .. :. ..:.:::.:: .. . .: :.: . :::::.: ..:. CCDS55 YQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQ-SNETSNGYFLERS 2410 2420 2430 2440 2450 2460 2560 2570 2580 2590 2600 2610 pF1KE3 ISAQDTLAYATALLNEKEQSGSSNGSES-SPANENGDRHLQQGSESPMMIGELRSDLDDV ::. ::: : : :.: . .. .: :: :. CCDS55 HSARMTLAKACELCPEEEPDDQDAPDEHESPPPEDAPLYPHSPGSQYQQNNHVHGQPYTG 2470 2480 2490 2500 2510 2520 2620 pF1KE3 DP CCDS55 PAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ 2530 2540 2550 >>CCDS43930.1 USP9X gene_id:8239|Hs108|chrX (2570 aa) initn: 1699 init1: 755 opt: 1164 Z-score: 744.0 bits: 151.9 E(32554): 4e-35 Smith-Waterman score: 3548; 30.7% identity (59.1% similar) in 2718 aa overlap (68-2605:7-2507) 40 50 60 70 80 90 pF1KE3 VALLTNERPGLDYGGYEPMDSGGGPSPGPGGGPRGDGGGDGGGGGPSRGGSTGG--GGGF :.: ::.:. : .:. : : . CCDS43 MTATTRGSPV--GGNDNQGQAPD-GQSQPPLQQNQT 10 20 30 100 110 120 130 140 pF1KE3 DPPPAYHEVVDAEKNDENGNCSG------EGIEFPTTNLYELESRVLTDHWSIPYKREES . : . .: : ::.:. .. : :: :.: .:.. . .: .: . CCDS43 SSPDSSNENSPATPPDEQGQGDAPPQLEDEEPAFPHTDLAKLDDMINRPRWVVPVLPKGE 40 50 60 70 80 90 150 160 170 180 190 200 pF1KE3 LGKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKKLLTSSAVHKWGTEIHEGIYNMLM : : :. :.. ::. ..: :.::. . .: :.::. :: : :::. : : CCDS43 LEVLLEAAIDLSKKGLDVKSEACQRFFRDGLTISFTKILTDEAVSGWKFEIHRCIINNTH 100 110 120 130 140 150 210 220 230 240 250 260 pF1KE3 LLIELVAERIKQDPIPIGLLGVLTMAFNPDNEYHFKNRMKVSQRNWAEV-FGEGNMFAVS :.:: . ...:: .: :: .:.::.:: ..:. : . . . : . : ..:: : CCDS43 RLVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYNGTRPCESVSSSVQLPEDELFARS 160 170 180 190 200 210 270 280 290 300 310 320 pF1KE3 PVSTFQKEPHGWVVDLVNKFGELGGFAAIQAK-LHSEDIELGAVSALIQPLGVCAEYLNS : . :.::.:::.:::: :.:: .. . ... ... ..:::.:.: : :.:. CCDS43 PDP---RSPKGWLVDLLNKFGTLNGFQILHDRFINGSALNVQIIAALIKPFGQCYEFLTL 220 230 240 250 260 330 340 350 360 370 380 pF1KE3 SVVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLVSIPELLSAVKLLCMRF--QPDLV .:. .. :.: . : .... ...:: . . .. .....: : : : . : CCDS43 HTVKKYFLPIIEMVPQFLENLTDEELKKEAKNEAKNDALSMIIKSLKNLASRVPGQEETV 270 280 290 300 310 320 390 400 410 420 430 pF1KE3 TIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIED-STLSKSVKNA-----IDTDRLLD .. .:: ..::.:. :..:::.:.::.:.: . : .. : . ..:. . CCDS43 KNLEIFRLKMILRLLQISSFNGKMNALNEVNKVISSVSYYTHRHGNPEEEEWLTAERMAE 330 340 350 360 370 380 440 450 460 470 480 490 pF1KE3 WLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK--LSLDELTKIWKIQSGQSSTVIEN :. .:..:::.:. .. : :: .... :.... .. :.:..: .:: :.:. ....: CCDS43 WIQQNNILSIVLRDSLHQPQYVEKLEKILRFVIKEKALTLQDLDNIWAAQAGKHEAIVKN 390 400 410 420 430 440 500 510 520 530 540 550 pF1KE3 IHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQKLLSLIGRIGREARFETTSGKVL .: ..: : :. .::.::: .. :: . : . :.::: :: :.... . . . ::: CCDS43 VHDLLAKLAWDFSPEQLDHLFDCFKASWTNASKKQREKLLELIRRLAEDDKDGVMAHKVL 450 460 470 480 490 500 560 570 580 590 600 610 pF1KE3 DVLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KEAIKRSYIIKCIEDIKRPGEWSGL ..::.::: .: .... :: :. ::. . . ... : ..: . ::. : CCDS43 NLLWNLAHSDDVPVDIMDLALSAHIKILDYSCSQDRDTQKIQWIDRFIEE---------L 510 520 530 540 550 620 630 640 650 660 pF1KE3 EKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF--IKQTYQKQDKS--------IIQD . : : ::.:::.:..:: : :. .. ..: .:.. CCDS43 RTNDK--------------WVIPALKQIREICSLFGEAPQNLSQTQRSPHVFYRHDLINQ 560 570 580 590 600 670 680 690 700 710 pF1KE3 LKKNFEIVKLVTGSL---IACHRLAAAVAGPGGLSGSTLVDG-RYTYREYLEAHLKFLAF :..: .: ::. .: . :: : . .:. : ::.. . .. .:.:: : CCDS43 LQHNHALVTLVAENLATYMESMRLYA--RDHEDYDPQTVRLGSRYSHVQEVQERLNFLRF 610 620 630 640 650 660 720 730 740 750 760 770 pF1KE3 FLQEATLYLGWNRAKEIWECLVTGQ-DVCELDREMCFEWFTK---GQHDLESDVQQQLFK .:... :.: .::.::.::. . .: ::: ::.:..: . ::. :.....:. CCDS43 LLKDGQLWLCAPQAKQIWKCLAENAVYLC--DREACFKWYSKLMGDEPDLDPDINKDFFE 670 680 690 700 710 720 780 790 800 810 820 830 pF1KE3 EKILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQLYVEKLELIGMDFIWKIAMES ..:.:. .: ::.. :. ::. :: . .: . ... :::::.:..:.....: CCDS43 SNVLQLDPSLLTENGMKCFERFFKAVNCREGKLVAKRRAYMMDDLELIGLDYLWRVVIQS 730 740 750 760 770 780 840 850 860 870 880 890 pF1KE3 PDEEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTHAV :. ::..::.:. . : ::.:::. ..: .:. :: .:. ::.:. ..: : CCDS43 NDD-IASRAIDLLKEI-YTNLGPRLQVNQVVIHEDFIQSCFDRLKASYDTL-------CV 790 800 810 820 830 900 910 920 930 940 950 pF1KE3 TRATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGA . : .: . : : .... . : .:. .. : ::::: . CCDS43 LDGDK-------DSVNCARQEAVRMVRVLTVLR------EYINECDSDYHEERTILPMSR 840 850 860 870 960 970 980 990 1000 pF1KE3 SFHGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKIAKQLCSPVDN--IQIFTNDS .:.:. :.. : . . : . : .:.:.:::::: : ... . : . :..:.. CCDS43 AFRGKHLSFVVRFPNQGRQVDDLEVWSHTNDTIGSVRRCILNRIKANVAHTKIELFVGGE 880 890 900 910 920 930 1010 1020 1030 1040 1050 1060 pF1KE3 LLTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSSYA---- :. :.::. ::...:....:.: . .. :: :::..::..: : .. :. CCDS43 LIDPADDRKLIGQLNLKDKSLITAKLTQISSNMPSSPDSSSDSSTGSPGNHGNHYSDGPN 940 950 960 970 980 990 1070 1080 1090 1100 1110 1120 pF1KE3 MEQEKSLPGVVMALVCNVFDMLYQLANL----EEPRITLRVRKLLLLIPTDPAIQEALDQ : :. ::::.:.: ...:.:.:.: . : . .: :. :.: : . : : CCDS43 PEVESCLPGVIMSLHPRYISFLWQVADLGSSLNMPPLRDGARVLMKLMPPDSTTIEKL-- 1000 1010 1020 1030 1040 1050 1130 1140 1150 1160 1170 1180 pF1KE3 LDSLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILESLFRSFAPGMSTFRVLYNLEV : : . ..:: ::: :.::: :.:. : .::: :: CCDS43 -----RAICLDHAKLGESSLSPS--------------LDSLF--FGPSAS--QVLYLTEV 1060 1070 1080 1090 1190 1200 1210 1220 1230 1240 pF1KE3 LSSKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQRDSIPSEVDYETRQGVYSICL . . ::: : .: . ...: .:::.::: ::.... :... ..:.:::.:.: : CCDS43 VYALLMP-AGAPLADD-SSDFQFHFLKSGGLPLVLSMLTRNNFLPNADMETRRGAYLNAL 1100 1110 1120 1130 1140 1150 1250 1260 1270 1280 1290 pF1KE3 QLARFLL--VGQTMPTLLDEDLTKDGIEALSSRPFRNVSRQTSRQMSLCGTPEKSSYRQL ..:..:: .: . : . :.:... :. .... : : . .:. . CCDS43 KIAKLLLTAIGYGHVRAVAEA-CQPGVEGVN--PMTQINQVTHDQAVVL----QSALQ-- 1160 1170 1180 1190 1200 1300 1310 1320 1330 1340 1350 pF1KE3 SVSDRSSIRVEEIIPAARVAIQ-TMEVSDFTSTVACFMR----LSWAAAAGRLDLVGSSQ :. . :: . . . ..:.: : . :.: . . : .: . ::.. : :.:: : CCDS43 SIPNPSSECMLRNV-SVRLAQQISDEASRYMPDI-CVIRAIQKIIWASGCGSLQLVFS-- 1210 1220 1230 1240 1250 1360 1370 1380 1390 1400 1410 pF1KE3 PIKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQQSVSTKDSLIAGEALSL : .: .. : .. ...:. :: . .: . ::: . CCDS43 PNEEITK-----IYEK-TNAGN--------EP--------------DLEDEQVCCEALEV 1260 1270 1280 1290 1420 1430 1440 1450 1460 1470 pF1KE3 LVTCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACDQLYTLSQTDTSAHPDVQ .. :. : : .. . ::::.:: : .:.:: .:.. . .: CCDS43 MTLCFALIPTALDALSKEKAWQTFIIDLLLHCHSKTVRQVAQEQFFLMCTRCCMGH---- 1300 1310 1320 1330 1340 1480 1490 1500 1510 1520 1530 pF1KE3 KPNQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRCQLLDDLTTSEMEQLRIS .: :.. ...: .. .. .. .. .:: : .::. .:... . CCDS43 RPLLFFITLLFT----------VLGSTARERAKHSGDYFTLLRHLLNYAYNSNINV--PN 1350 1360 1370 1380 1390 1540 1550 1560 1570 1580 pF1KE3 PATMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKTLLSLCGAEK------EML ..:..:: :: .. . ::. ..:: ::: . : ::.. .:: : CCDS43 AEVLLNNEIDWLKRIRDDVKRTGETGIEETIL-EGHLGVTKELLAFQTSEKKFHIGCEKG 1400 1410 1420 1430 1440 1450 1590 1600 1610 1620 1630 1640 pF1KE3 GSSLIKPLLDDFLFRASRIIL----NSHSPAGSAAISQQDFHPKCSTANSRLAAYEVLVM :..::: :.:::.: :: . : :.. :: .: : :.. . :..:.:: CCDS43 GANLIKELIDDFIFPASNVYLQYMRNGELPAEQAI-------PVCGSPPTINAGFELLVA 1460 1470 1480 1490 1500 1650 1660 1670 1680 1690 pF1KE3 LADSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSSSGFVGLRNGGATCY :: . ::. :. : :.. : :..::::: : .:::::.:.::::: CCDS43 LAVGCVRNLKQIVDSLTEMYYIGTAITTCEALTEWEYLPPVGPRPPKGFVGLKNAGATCY 1510 1520 1530 1540 1550 1560 1700 1710 1720 1730 pF1KE3 MNAVFQQLYMQPGLPESLLS-------VDDDT------DN-----PDDSVF--------- ::.:.::::: :.. ...:. :::: :: : :.:: CCDS43 MNSVIQQLYMIPSIRNGILAIEGTGSDVDDDMSGDEKQDNESNVDPRDDVFGYPQQFEDK 1570 1580 1590 1600 1610 1620 1740 1750 1760 1770 pF1KE3 -----------YQV------QSLFGHLMESKLQYYVPENFWKIFKMWNKELYVREQQDAY :.. : .:::: :.::::::..::: :..:.. . .:::.:: CCDS43 PALSKTEDRKEYNIGVLRHLQVIFGHLAASRLQYYVPRGFWKQFRLWGEPVNLREQHDAL 1630 1640 1650 1660 1670 1680 1780 1790 1800 1810 1820 1830 pF1KE3 EFFTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYEREEAFMALNLGVTSC :::.::.:..:: :: .:. ...... : ..:::::. :::::: ::.: .::. . . CCDS43 EFFNSLVDSLDEALKALGHPAMLSKVLGGSFADQKICQGCPHRYECEESFTTLNVDIRNH 1690 1700 1710 1720 1730 1740 1840 1850 1860 1870 1880 1890 pF1KE3 QSLEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVLVIHLMRFGFDWESG :.: ::.:.:.:..:::.:::.::::..: :::: ::.:: ::.:.: :: .::: CCDS43 QNLLDSLEQYVKGDLLEGANAYHCEKCNKKVDTVKRLLIKKLPPVLAIQLKRFDYDWERE 1750 1760 1770 1780 1790 1800 1900 1910 1920 1930 1940 1950 pF1KE3 RSIKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGGGSPRKKVALTENYE .::... ..:: :.::::::.:.:. .... :. ... ..:. . ....: . .:. CCDS43 CAIKFNDYFEFPRELDMEPYTVAGVAKLEGDN-VNPESQLIQQSE--QSESETAGSTKYR 1810 1820 1830 1840 1850 1860 1960 1970 1980 1990 2000 2010 pF1KE3 LVGVIVHSGQAHAGHYYSFIKDRRGCGKG---KWYKFNDTVIEEFDLND-ETLEYECFGG ::::.:::::: .:::::.: .: : : : .::::.: . : ..: : .. .:::: CCDS43 LVGVLVHSGQASGGHYYSYIIQRNG-GDGERNRWYKFDDGDVTECKMDDDEEMKNQCFGG 1870 1880 1890 1900 1910 1920 2020 2030 2040 2050 2060 pF1KE3 EYRPKVYDQTNPYTDVRR--RYWNAYMLFYQRVS--DQNSPVLPKKSRVSVVRQEAEDLS :: .:.:. . :: :.::::.:::.:.. ::.. .. :.... CCDS43 EYMGEVFDHMMKRMSYRRQKRWWNAYILFYERMDTIDQDDELIRYISELAI--------- 1930 1940 1950 1960 1970 2070 2080 2090 2100 2110 2120 pF1KE3 LSAPSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARIYQMVRDENLKF . :::. :. ::. : . :: .:..: CCDS43 -------------TTRPHQ-------II----------------MPSAIERSVRKQNVQF 1980 1990 2130 2140 2150 2160 2170 pF1KE3 MKNRDVYSSDYFSFVLSLASLNATKLKHP-----YYPC---MAKVSLQLAIQFLFQTYLR :.:: :: .::.:. .: . :.. :. : : .. .:.::: .::: : .. CCDS43 MHNRMQYSMEYFQFMKKLLTCNGVYLNPPPGQDHLLPEAEEITMISIQLAARFLFTTGFH 2000 2010 2020 2030 2040 2050 2180 2190 2200 2210 2220 2230 pF1KE3 TKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLECNVREVRVAVA ::: .: .. .: .. :: .: .. :... . . . .. . .:::: ::: : : CCDS43 TKKVVRGSASDWYDALCILLRHSKNVRFWFAHNVLFNVSNRFSE-YLLECPSAEVRGAFA 2060 2070 2080 2090 2100 2110 2240 2250 2260 2270 2280 pF1KE3 TILEKTLDSAL--------FYQ--------DKLKSLHQLLEVLLALLDKDVPENCKNCAQ .. .: : . :.:. .::...: :: ..: :. .. : CCDS43 KLIVFIAHFSLQDGPCPSPFASPGPSSQAYDNLSLSDHLLRAVLNLLRREVSEHGRHLQQ 2120 2130 2140 2150 2160 2170 2290 2300 2310 2320 2330 2340 pF1KE3 YFFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWSSAQAREFGNLH :: :: ... :. ::. : : ..:. : . :. : :.:.:. CCDS43 YFNLFVMYAN-LGVAEKTQLLKLSVPATFMLVSLDEG---PGPPIKY----QYAELGKLY 2180 2190 2200 2210 2220 2350 2360 2370 2380 2390 pF1KE3 NTVALLVLHSDVSSQRNVAPGIFKQRPPISIA---P--SSPLLPLHEEVEALLFMSEGKP ..:. :. .:::. . . .. ::. : :.:..:....: .::. . CCDS43 SVVSQLIRCCNVSSRMQSS---INGNPPLPNPFGDPNLSQPIMPIQQNVADILFVRTS-- 2230 2240 2250 2260 2270 2280 2400 2410 2420 2430 2440 2450 pF1KE3 YLLEVMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHELKNTFQLL :. ... : .. .... .::. : .:: :.: . :. . .::. ..:: CCDS43 YVKKII----EDCSNSEETVKLLRFCCWENPQFSSTVLSELLWQVAYSYTYELRPYLDLL 2290 2300 2310 2320 2330 2340 2460 2470 2480 2490 2500 2510 pF1KE3 HEILVIEDPIQAERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLVTLAQKCPA .::.::: :..:. : . . ..::. ...:.. ..: :::.: .:.: ..::. CCDS43 LQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMVALFSNCPV 2350 2360 2370 2380 2390 2400 2520 2530 2540 2550 pF1KE3 AKEYFKENS---HHWSWAVQWLQKKM-------SEHY----WTPQSNVSNETSTGKTFQR : . .. :. ..:.:::.:: .. . .: :.: . :::::.: ..: CCDS43 AYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYTYNNWSPPVQ-SNETSNGYFLER 2410 2420 2430 2440 2450 2560 2570 2580 2590 2600 2610 pF1KE3 TISAQDTLAYATALLNEKEQSGSSNGS-ESSPANENGDRHLQQGSESPMMIGELRSDLDD . ::. ::: : : :. ....: . : ..: :. . ::: CCDS43 SHSARMTLAKACELCPEEVKKATSVQQIEMEESKEPDDQDAPDEHESPPPEDAPLYPHSP 2460 2470 2480 2490 2500 2510 2620 pF1KE3 VDP CCDS43 GSQYQQNNHVHGQPYTGPAAHHMNNPQRTGQRAQENYEGSEEVSPPQTKDQ 2520 2530 2540 2550 2560 2570 >>CCDS14781.1 USP9Y gene_id:8287|Hs108|chrY (2555 aa) initn: 1866 init1: 744 opt: 1096 Z-score: 701.1 bits: 144.0 E(32554): 9.9e-33 Smith-Waterman score: 3474; 30.2% identity (59.0% similar) in 2650 aa overlap (97-2590:47-2492) 70 80 90 100 110 120 pF1KE3 GGGPRGDGGGDGGGGGPSRGGSTGGGGGFDPPPAYHEVVDAEKNDENGNCSGEGIEFPTT ::: . :: . :. : :: : CCDS14 GQVLDGQSQHLFQQNQTSSPDSSNENSVATPPPEEQGQGDAPPQHED-----EEPAFPHT 20 30 40 50 60 70 130 140 150 160 170 180 pF1KE3 NLYELESRVLTDHWSIPYKREESLGKCLLASTYLARLGLSESDENCRRFMDRCMPEAFKK .: .:.. . .: .: . : : :. :. ::. ..: :.::. . .: : CCDS14 ELANLDDMINRPRWVVPVLPKGELEVLLEAAIDLSVKGLDVKSEACQRFFRDGLTISFTK 80 90 100 110 120 130 190 200 210 220 230 240 pF1KE3 LLTSSAVHKWGTEIHEGIYNMLMLLIELVAERIKQDPIPIGLLGVLTMAFNPDNEYHFKN .: . :: : :::. : : :.:: . ...:: .: :: .:.::.:: ..:. : CCDS14 ILMDEAVSGWKFEIHRCIINNTHRLVELCVAKLSQDWFP--LLELLAMALNPHCKFHIYN 140 150 160 170 180 250 260 270 280 290 300 pF1KE3 RMKVSQRNWAEV-FGEGNMFAVSPVSTFQKEPHGWVVDLVNKFGELGGFAAIQAKL-HSE . . ... . : ..:: :. . :.::.:::.:::: :.:: .. .. .. CCDS14 GTRPCELISSNAQLPEDELFAR---SSDPRSPKGWLVDLINKFGTLNGFQILHDRFFNGS 190 200 210 220 230 240 310 320 330 340 350 pF1KE3 DIELGAVSALIQPLGVCAEYLNSSVVQPMLDPVILTTIQDVRSVEEKDLK-----DKRLV ... ..:::.:.: : :.:.. ... .. ::: . . .... ...:: . . CCDS14 ALNIQIIAALIKPFGQCYEFLSQHTLKKYFIPVIEIVPHLLENLTDEELKKEAKNEAKND 250 260 270 280 290 300 360 370 380 390 400 410 pF1KE3 SIPELLSAVKLLCMRF--QPDLVTIVDDLRLDILLRMLKSPHFSAKMNSLKEVTKLIED- .. .....: : :. : . . .. .:: ..::.:. :..:::.:.:..:.: . CCDS14 ALSMIIKSLKNLASRISGQDETIKNLEIFRLKMILRLLQISSFNGKMNALNEINKVISSV 310 320 330 340 350 360 420 430 440 450 460 pF1KE3 STLSKSVKNA-----IDTDRLLDWLVENSVLSIALEGNIDQAQYCDRIKGIIELLGSK-- : .. .: . ..:. .:. .:..:::.:. .. : :: .... :.... .. CCDS14 SYYTHRHSNPEEEEWLTAERMAEWIQQNNILSIVLQDSLHQPQYVEKLEKILRFVIKEKA 370 380 390 400 410 420 470 480 490 500 510 520 pF1KE3 LSLDELTKIWKIQSGQSSTVIENIHTIIAAAAVKFNSDQLNHLFVLIQKSWETESDRVRQ :.:..: .:: :.:. ....:.: ..: : :. ::.::: .. :: . : . :. CCDS14 LTLQDLDNIWAAQAGKHEAIVKNVHDLLAKLAWDFSPGQLDHLFDCFKASWTNASKKQRE 430 440 450 460 470 480 530 540 550 560 570 580 pF1KE3 KLLSLIGRIGREARFETTSGKVLDVLWELAHLPTLPSSLIQQALEEHLTILSDAYAV-KE ::: :: :.... . . . :::..::.::. .: .... :: :. ::. . . .. CCDS14 KLLELIRRLAEDDKDGVMAHKVLNLLWNLAQSDDVPVDIMDLALSAHIKILDYSCSQDRD 490 500 510 520 530 540 590 600 610 620 630 640 pF1KE3 AIKRSYIIKCIEDIKRPGEWSGLEKNKKDGFKSSQLNNPQFVWVVPALRQLHEITRSF-- : : ..: . ::... : : ::.:::.:..:: : CCDS14 AQKIQWIDHFIEELRT---------NDK--------------WVIPALKQIREICSLFGE 550 560 570 580 650 660 670 680 690 pF1KE3 IKQTYQKQDKS--------IIQDLKKNFEIVKLVTGSLIACHRLAAAVAGPG-GLSGSTL .:. .. ..: .:..:..: .: ::. .: . :: . .:. CCDS14 ASQNLSQTQRSPHIFYRHDLINQLQQNHALVTLVAENLATYMNSIRLYAGDHEDYDPQTV 590 600 610 620 630 640 700 710 720 730 740 750 pF1KE3 VDG-RYTYREYLEAHLKFLAFFLQEATLYLGWNRAKEIWECLVTGQDVCELDREMCFEWF : ::.. . .. .:.:: :.:... :.: .::.::.::. . : ::: ::.:. CCDS14 RLGSRYSHVQEVQERLNFLRFLLKDGQLWLCAPQAKQIWKCLAENA-VYLCDREACFKWY 650 660 670 680 690 700 760 770 780 790 800 810 pF1KE3 TK---GQHDLESDVQQQLFKEKILKLESYEITMNGFNLFKTFFENVNLCDHRLKRQGAQL .: . ::. :.....:. ..:.:. .: ::.. :. ::. :: ...: . . CCDS14 SKLMGDEPDLDPDINKDFFESNVLQLDPSLLTENGMKCFERFFKAVNCRERKLIAKRRSY 710 720 730 740 750 760 820 830 840 850 860 870 pF1KE3 YVEKLELIGMDFIWKIAMESPDEEIANEAIQLIINYSYINLNPRLKKDSVSLHKKFIADC ... :::::.:..:.....: :: :::.::.:. . : ::.:::: ..: .:. :: .: CCDS14 MMDDLELIGLDYLWRVVIQSSDE-IANRAIDLLKEI-YTNLGPRLKANQVVIHEDFIQSC 770 780 790 800 810 820 880 890 900 910 920 930 pF1KE3 YTRLEAASSALGGPTLTHAVTRATKMLTATAMPTVATSVQSPYRSTKLVIIERLLLLAER . ::.:. ..: : . : .. . : : . :.: . .. CCDS14 FDRLKASYDTL-------CVFDGDKN-------SINCARQEAIR------MVRVLTVIKE 830 840 850 860 940 950 960 970 980 990 pF1KE3 YVITIEDFYSVPRTILPHGASFHGHLLTLNVTYESTK---DTFTVEAHSNETIGSVRWKI :. .. : : ::: . .:.:. :.: : . . : . . .:.:.:::::: : CCDS14 YINECDSDYHKERMILPMSRAFRGKHLSLIVRFPNQGRQVDELDIWSHTNDTIGSVRRCI 870 880 890 900 910 920 1000 1010 1020 1030 1040 pF1KE3 AKQLCSPVDN--IQIFTNDSLLTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSS .... . : . :..:.. :. . :.::. ::...:....:.: . . :: ::: CCDS14 VNRIKANVAHKKIELFVGGELIDSEDDRKLIGQLNLKDKSLITAKLTQINFNMPSSPDSS 930 940 950 960 970 980 1050 1060 1070 1080 1090 1100 pF1KE3 TSSSSSSSGVFSSSYA----MEQEKSLPGVVMALVCNVFDMLYQLA----NLEEPRITLR ..::..: : . : .: :. ::::.:.. ...:.:.: ::. : . CCDS14 SDSSTASPGNHRNHYNDGPNLEVESCLPGVIMSVHPRYISFLWQVADLGSNLNMPPLRDG 990 1000 1010 1020 1030 1040 1110 1120 1130 1140 1150 1160 pF1KE3 VRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSKSPSLSSKQQHQPSASSILES .: :. :.: : . :...: .. .. :.: .. :: : :.: CCDS14 ARVLMKLMPPD---RTAVEKLRAVCLDHAKLGE----GKLSP---------P-----LDS 1050 1060 1070 1170 1180 1190 1200 1210 1220 pF1KE3 LFRSFAPGMSTFRVLYNLEVLSSKLMPTADDDMARSCAKSFCENFLKAGGLSLVVNVMQR :: :.:. : .::: ::. . ::: : .. . ...: .:::.::: ::.... : CCDS14 LF--FGPSAS--QVLYLTEVVYALLMP-AGVPLTDG-SSDFQVHFLKSGGLPLVLSMLIR 1080 1090 1100 1110 1120 1130 1230 1240 1250 1260 1270 pF1KE3 DSIPSEVDYETRQGVYSICLQLARFLL--VGQTMPTLLDEDLTK--DGIEALSSRPFRNV ... ..:.:::.:.: :..:..:: .: . : :: . :. .. CCDS14 NNFLPNTDMETRRGAYLNALKIAKLLLTAIGYGHVRAVAEACQPVVDGTD-----PITQI 1140 1150 1160 1170 1180 1280 1290 1300 1310 1320 1330 pF1KE3 SRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQTMEVSDFTSTVACFMR .. : : . . .: . :.. .: : :. : ... .. . .. ... CCDS14 NQVTHDQAVVLQSALQSIP---NPSSECVLRNESILLAQEISNEASRYMPDICVIRAIQK 1190 1200 1210 1220 1230 1240 1340 1350 1360 1370 1380 1390 pF1KE3 LSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHAGICVRQ . ::.: : : :: : : .: ... .....::: CCDS14 IIWASACGALGLVFS--PNEEITKI------YQMTTNGSN-------------------- 1250 1260 1270 1400 1410 1420 1430 1440 1450 pF1KE3 QSVSTKDSLIAGEALSLLVTCLQLRSQQLASFYNLPCVADFIIDILLGSPSAEIRRVACD .. ..: . ::: ... :. : : .. . ::::.:: :: .:..: . CCDS14 -KLEVEDEQVCCEALEVMTLCFALLPTALDALSKEKAWQTFIIDLLLHCPSKTVRQLAQE 1280 1290 1300 1310 1320 1330 1460 1470 1480 1490 1500 1510 pF1KE3 QLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLPLWSPTSIMRGVNQRLLSQCMEYFDLRC :.. . .: .: :.. ...: . . :. .: . .:: : CCDS14 QFFLMCTRCCMGH----RPLLFFITLLFT----ILGSTAREKG------KYSGDYFTLLR 1340 1350 1360 1370 1380 1520 1530 1540 1550 1560 1570 pF1KE3 QLLDDLTTSEMEQLRISPA-TMLEDEITWLDNFEPNRTAECETSEADNILLAGHLRLIKT .::. ..... : : ..: .:: :: .. : ::. ... .: ::: . : CCDS14 HLLNYAYNGNIN---IPNAEVLLVSEIDWLKRIRDNVKNTGETG-VEEPILEGHLGVTKE 1390 1400 1410 1420 1430 1580 1590 1600 1610 1620 pF1KE3 LLSLCGAEK------EMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAISQQDFHPKCS ::.. .:: : :..::: :.:::.: ::.. :. :. . .. : :: CCDS14 LLAFQTSEKKYHFGCEKGGANLIKELIDDFIFPASKVYLQYLR---SGELPAEQAIPVCS 1440 1450 1460 1470 1480 1490 1630 1640 1650 1660 1670 1680 pF1KE3 TANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALT----KEFDYLPPVDSRSS . . :..:.:: :: . ::. :. : :... : :..::::: : CCDS14 SPVTINAGFELLVALAIGCVRNLKQIVDCLTEMYYMGTAITTCEALTEWEYLPPVGPRPP 1500 1510 1520 1530 1540 1550 1690 1700 1710 1720 pF1KE3 SGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSV--------DD-------DTD---NP .:::::.:.:::::::.:.::::: :.. .:.:.. :: :.. .: CCDS14 KGFVGLKNAGATCYMNSVIQQLYMIPSIRNSILAIEGTGSDLHDDMFGDEKQDSESNVDP 1560 1570 1580 1590 1600 1610 1730 1740 1750 1760 pF1KE3 DDSVF--------------------YQV------QSLFGHLMESKLQYYVPENFWKIFKM :.:: :.. : .:::: :.::::::..::: :.. CCDS14 RDDVFGYPHQFEDKPALSKTEDRKEYNIGVLRHLQVIFGHLAASQLQYYVPRGFWKQFRL 1620 1630 1640 1650 1660 1670 1770 1780 1790 1800 1810 1820 pF1KE3 WNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKNTFQGIYSDQKICKDCPHRYER :.. . .:::.:: :::.::.:..:: :: .:. :..... : ..:::::. :::::: CCDS14 WGEPVNLREQHDALEFFNSLVDSLDEALKALGHPAILSKVLGGSFADQKICQGCPHRYEC 1680 1690 1700 1710 1720 1730 1830 1840 1850 1860 1870 1880 pF1KE3 EEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCEKCKEKRITVKRTCIKSLPSVL ::.: .::. . . :.: ::.:...:..:::.:::.:::: .: :::: ::.:: :: CCDS14 EESFTTLNVDIRNHQNLLDSLEQYIKGDLLEGANAYHCEKCDKKVDTVKRLLIKKLPRVL 1740 1750 1760 1770 1780 1790 1890 1900 1910 1920 1930 1940 pF1KE3 VIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGMARQDSSSEVGENGRSVDQGGG .:.: :: .::: .::... ..:: :.: ::::.:.: . .. .:: . ..: CCDS14 AIQLKRFDYDWERECAIKFNDYFEFPRELDMGPYTVAGVANLERDNVNSEN-ELIEQKEQ 1800 1810 1820 1830 1840 1850 1950 1960 1970 1980 1990 pF1KE3 GSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKDRRGCGK--GKWYKFNDTVIEEFDL .. ...: .:.::::.:::::: .:::::.: .: : .::::.: . : . CCDS14 SD--NETAGGTKYRLVGVLVHSGQASGGHYYSYIIQRNGKDDQTDHWYKFDDGDVTECKM 1860 1870 1880 1890 1900 1910 2000 2010 2020 2030 2040 2050 pF1KE3 ND-ETLEYECFGGEYRPKVYDQTNPYTDVRR--RYWNAYMLFYQRVSDQNSPVLPKKSRV .: : .. .:::::: .:.:. . :: :.::::.:::.... CCDS14 DDDEEMKNQCFGGEYMGEVFDHMMKRMSYRRQKRWWNAYILFYEQMD------------- 1920 1930 1940 1950 2060 2070 2080 2090 2100 2110 pF1KE3 SVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTKLVKKGEKKGLFVEKMPARI .. .. : . :: . :::. :.. :: : CCDS14 -MIDEDDEMIRY-------ISELTIARPHQ------IIMS----------------PA-I 1960 1970 1980 2120 2130 2140 2150 2160 pF1KE3 YQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKH--------PYYPCMAKVSLQL . :: .:.:::.:: :: .::.:: .: . :.. :. : .. .:.:: CCDS14 ERSVRKQNVKFMHNRLQYSLEYFQFVKKLLTCNGVYLNPAPGQDYLLPEAEEITMISIQL 1990 2000 2010 2020 2030 2040 2170 2180 2190 2200 2210 2220 pF1KE3 AIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSEGRELIKIFLLE : .::: : ..::: .: . .: .. .:: .: .. :... . . . .. . .::: CCDS14 AARFLFTTGFHTKKIVRGPASDWYDALCVLLRHSKNVRFWFTHNVLFNVSNRFSE-YLLE 2050 2060 2070 2080 2090 2100 2230 2240 2250 2260 2270 pF1KE3 CNVREVRVAVATILEKTLDSAL--------FYQ--------DKLKSLHQLLEVLLALLDK : ::: : : .. .: : . :.:. .::.. : :: . CCDS14 CPSAEVRGAFAKLIVFIAHFSLQDGSCPSPFASPGPSSQACDNLSLSDHLLRATLNLLRR 2110 2120 2130 2140 2150 2160 2280 2290 2300 2310 2320 2330 pF1KE3 DVPENCKNCAQYFFLFNTFVQKQGIRAGDLLLRHS--ALRHMISFLLGASRQNNQIRRWS .: :. .. ::: :: ... :. ::. . : ..:. : . :. CCDS14 EVSEHGHHLQQYFNLFVMYAN-LGVAEKTQLLKLNVPATFMLVSLDEG---PGPPIKY-- 2170 2180 2190 2200 2210 2220 2340 2350 2360 2370 2380 pF1KE3 SAQAREFGNLHNTVALLVLHSDVSS--QRNVAPGIFKQRPPISIAPSSPLLPLHEEVEAL : :.:.:...:. :. .::: : .. . : .. :.:..:....: . CCDS14 --QYAELGKLYSVVSQLIRCCNVSSTMQSSINGNPPLPNPFGDLNLSQPIMPIQQNVLDI 2230 2240 2250 2260 2270 2390 2400 2410 2420 2430 2440 pF1KE3 LFMSEGKPYLLEVMFALRELTGSLLALIEMVVYCCFCNEHFSFTMLHFIKNQLETAPPHE ::. . :. ... : .. :... .: . : .:: :.: . :. . .: CCDS14 LFVRTS--YVKKII----EDCSNSEDTIKLLRFCSWENPQFSSTVLSELLWQVAYSYTYE 2280 2290 2300 2310 2320 2330 2450 2460 2470 2480 2490 2500 pF1KE3 LKNTFQLLHEILVIEDPIQAERV----KFVFETENGLLALMHHSNHVDSSRCYQCVKFLV :. ..:: .::.::: :..:. : . . ..::. ...:.. ..: :::.: .: CCDS14 LRPYLDLLFQILLIEDSWQTHRIHNALKGIPDDRDGLFDTIQRSKNHYQKRAYQCIKCMV 2340 2350 2360 2370 2380 2390 2510 2520 2530 2540 2550 pF1KE3 TLAQKCPAAKEYFKENS---HHWSWAVQWLQKKM-----------SEHYWTPQSNVSNET .: ..::.: . .. :. ..:.:::.:: .. : . :.: . :::: CCDS14 ALFSSCPVAYQILQGNGDLKRKWTWAVEWLGDELERRPYTGNPQYSYNNWSPPVQ-SNET 2400 2410 2420 2430 2440 2450 2560 2570 2580 2590 2600 2610 pF1KE3 STGKTFQRTISAQDTLAYATALLNEKEQSGSSNGSESSPANENGDRHLQQGSESPMMIGE ..: ..:. ::. ::: : : :.: . .. .: :. CCDS14 ANGYFLERSHSARMTLAKACELCPEEEPDDQDAPDEHEPSPSEDAPLYPHSPASQYQQNN 2460 2470 2480 2490 2500 2510 2620 pF1KE3 LRSDLDDVDP CCDS14 HVHGQPYTGPAAHHLNNPQKTGQRTQENYEGNEEVSSPQMKDQ 2520 2530 2540 2550 >>CCDS42686.1 USP34 gene_id:9736|Hs108|chr2 (3546 aa) initn: 872 init1: 276 opt: 652 Z-score: 418.8 bits: 92.2 E(32554): 5.2e-17 Smith-Waterman score: 1183; 23.8% identity (53.0% similar) in 1733 aa overlap (702-2336:978-2494) 680 690 700 710 720 pF1KE3 VTGSLIACHRLAAAVAGPGGLSGSTLVDGRYTYREYLEAHLKFLAFFLQEAT----LYLG :.. ....:.::. .. . :. CCDS42 EKELNMMKLFFDNLVYYIQTVREGRQKHALYSHSAEVQVRLQFLTCVFSTLGSPDHFRLS 950 960 970 980 990 1000 730 740 750 760 770 780 pF1KE3 WNRAKEIWECLVTGQDVCELDREMCFEWF-----TKGQHDLESDVQQQLFKEKILKLESY ... .:.::: .. : : ..:: .: :: . .. ..:: ::. .:. CCDS42 LEQVDILWHCLVEDSE-CYDD---ALHWFLNQVRSKDQHAMGMETYKHLFLEKMPQLKPE 1010 1020 1030 1040 1050 1060 790 800 810 820 830 840 pF1KE3 EITMNGFNLFKTFFENVNLCDHRLKRQGAQLY--VEKLELIGMDFIWKIAMESPDEEIAN :.:.:.:::. .::. : : ... : . :: ::: .: ::... . ... CCDS42 TISMTGLNLFQ------HLCN--LARLATSAYDGCSNSELCGMDQFWGIALRAQSGDVSR 1070 1080 1090 1100 1110 850 860 870 880 890 pF1KE3 EAIQLIINYSYINLNPRLKKDSVSLHKKFIADCYTRLEAASSALGGPTLTH--AVTRATK ::: : .: ::: . :.:. ..::. :. : :::.: . . .. :. CCDS42 AAIQYINSY-YINGKTGLEKE-----QEFISKCMESLMIASSSLEQESHSSLMVIERGLL 1120 1130 1140 1150 1160 900 910 920 930 940 950 pF1KE3 MLTATAMPTVATSVQSPYRSTKLVIIERLLLLAERYVITIEDFYSVPRTILPHGASFHGH :: : . . :. . :: . . .. .. : :.: .. . :.. . CCDS42 MLK-THLEAFRRRFAYHLRQWQ---IEGTGISS--HLKALSDKQSLPLRVVCQPAGLPDK 1170 1180 1190 1200 1210 1220 960 970 980 990 1000 pF1KE3 L------------LTLNVT--YEST-KDTFTVEAHSNETIGSVRW-KIAKQLCSPVDNIQ . : .:: ::. :. .. .:. .: : : .. : .:: . CCDS42 MTIEMYPSDQVADLRAEVTHWYENLQKEQINQQAQLQEFGQSNRKGEFPGGLMGPV---R 1230 1240 1250 1260 1270 1280 1010 1020 1030 1040 1050 1060 pF1KE3 IFTNDSLLTVNKDQKLLHQLGFSDEQILTVKTSGSGTPSGSSADSSTSSSSSSSGVFSSS .... ::.. :.: ::.:::.: :.. :. :.: ... . .: CCDS42 MISSGHELTTDYDEKALHELGFKDMQMVFVSL---GAPRRERKGEGVQ-------LPASC 1290 1300 1310 1320 1330 1070 1080 1090 pF1KE3 YAMEQEKSLPGVVMAL---VCNVFDMLYQLANLEEPR----------------------I :. ..: ... . ..::.: .::... : . CCDS42 LPPPQKDNIPMLLLLQEPHLTTLFDLLEMLASFKPPSGKVAVDDSESLRCEELHLHAENL 1340 1350 1360 1370 1380 1390 1100 1110 1120 1130 1140 1150 pF1KE3 TLRVRKLLLLIPTDPAIQEALDQLDSLGRKKTLLSESSSQSSKSPSLSSKQQHQP-SASS . :: .::.:.:: : . :...... .:.. . . :. :. :. : CCDS42 SRRVWELLMLLPTCPNMLMAFQNISD--------EQSNDGFNWKELLKIKSAHKLLYALE 1400 1410 1420 1430 1440 1160 1170 1180 1190 1200 1210 pF1KE3 ILESLFRSFAPGMSTFRVLYNLEVLSSKLMPTADD---DMARSCAKSFCENFLKAGGLSL :.:.: : . :. . : :.: .:: :.... .:. .:. ::::. CCDS42 IIEAL------GKPNRRIRRESTGSYSDLYPDSDDSSEDQVENSKNSWSCKFVAAGGLQQ 1450 1460 1470 1480 1490 1220 1230 1240 1250 1260 1270 pF1KE3 VVNVMQRDSI-PSEVDYETRQGVYSI-CLQLARFL-LVGQTMPTLLDEDLTKDGIEALSS ...... . :.: . : :... :: : .: :. : : ::. . : : CCDS42 LLEIFNSGILEPKEQESWT---VWQLDCL--ACLLKLICQFAVDPSDLDLAYHDVFAWS- 1500 1510 1520 1530 1540 1550 1280 1290 1300 1310 1320 1330 pF1KE3 RPFRNVSRQTSRQMSLCGTPEKSSYRQLSVSDRSSIRVEEIIPAARVAIQTMEVSDFTST ... .. :. . : :: :. . . ..... .. . : .: :: CCDS42 ----GIA-ESHRKRTW---PGKS--RKAAGDHAKGLHIPRLTEVFLVLVQG------TSL 1560 1570 1580 1590 1340 1350 1360 1370 1380 1390 pF1KE3 VACFMRLSWAAAAGRLDLVGSSQPIKESNSLCPAGIRNRLSSSGSNCSSGSEGEPVALHA . .: .... ..: : :. .. :. : : CCDS42 IQRLMSVAYTY-----------------DNLAP-----RVLKAQSDHRSRHE-------- 1600 1610 1620 1400 1410 1420 1430 1440 pF1KE3 GICVRQQSVSTKDSLIAGEALSLLVT---CLQLRSQQLASFYNLPCVADFIIDILLGSPS .. .. :::. : .: ...::. .: :.. . : : CCDS42 ---------------VSHYSMWLLVSWAHCCSLVKSSLADSDHLQ---DWLKKLTLLIPE 1630 1640 1650 1660 1450 1460 1470 1480 1490 1500 pF1KE3 AEIRRVACDQLYTLSQTDTSAHPDVQKPNQFLLGVILTAQLP---LWSPTSIMRGVNQRL . .:. .:. :: :: . .. .... .: . : :: .: : .. . CCDS42 TAVRHESCSGLYKLSLSGLDGGDSINRSFLLLAASTLLKFLPDAQALKPIRIDDYEEEPI 1670 1680 1690 1700 1710 1720 1510 1520 1530 1540 1550 1560 pF1KE3 LSQ-CMEYFDLRCQLLDDLTTSEMEQLRISPATMLEDEITWLDNFEPNRTAECETSEADN :. : ::: : :.:.:.. .. : . : ... : .. . . . ..... CCDS42 LKPGCKEYFWLLCKLVDNIHIKDASQTTLLDLDALARHLA--DCIRSREILDHQDGNVED 1730 1740 1750 1760 1770 1780 1570 1580 1590 1600 1610 1620 pF1KE3 ILLAGHLRLIKTLLSLCGAEK-EMLGSSLIKPLLDDFLFRASRIILNSHSPAGSAAISQQ :.: ::: .... : :. ... ... .:: .: : . :: CCDS42 DGLTGLLRLATSVVKHKPPFKFSREGQEFLRDIFN-LLF-----LLPSLKD------RQQ 1790 1800 1810 1820 1830 1630 1640 1650 1660 1670 1680 pF1KE3 DFHPKCSTANSRLAAYEVLVMLADSSPSNLQIIIKELLSMHHQPDPALTKEFDYLPPVDS :::.. .:: :::..:: .. .: : ..: . ....: : ..:: : : CCDS42 ---PKCKSHSSRAAAYDLLVEMVKGSVENYRLIHNWVMAQHMQSHAPY--KWDYWPHEDV 1840 1850 1860 1870 1880 1690 1700 1710 1720 1730 1740 pF1KE3 RSSSGFVGLRNGGATCYMNAVFQQLYMQPGLPESLLSVDDDTDNPDDSVFYQVQSLFGHL :. :::: : :::::. ...::::: : ...... . : ... ..:..: .: CCDS42 RAECRFVGLTNLGATCYLASTIQQLYMIPEARQAVFTAKYSEDMKHKTTLLELQKMFTYL 1890 1900 1910 1920 1930 1940 1750 1760 1770 1780 1790 1800 pF1KE3 MESKLQYYVPENFWKIFKMWNKELYVREQQDAYEFFTSLIDQMDEYLKKMGRDQIFKNTF :::. . : :. : : . : .. : . ::.: ::::.:: ...:. .. .. . :. : CCDS42 MESECKAYNPRPFCKTYTMDKQPLNTGEQKDMTEFFTDLITKIEEMSPEL-KNTV-KSLF 1950 1960 1970 1980 1990 2000 1810 1820 1830 1840 1850 1860 pF1KE3 QGIYSDQKICKDCPHRYEREEAFMALNLGVTSCQSLEISLDQFVRGEVLEGSNAYYCEKC :. ... . :: : . : :... :.. ... :::. . ..:::.: : : .: CCDS42 GGVITNNVVSLDCEHVSQTAEEFYTVRCQVADMKNIYESLDEVTIKDTLEGDNMYTCSHC 2010 2020 2030 2040 2050 2060 1870 1880 1890 1900 1910 1920 pF1KE3 KEKRITVKRTCIKSLPSVLVIHLMRFGFDWESGRSIKYDEQIRFPWMLNMEPYTVSGMAR .: . ::.:.:.:: .: .. ::. :. . . : . .. :: :.: ::: . . CCDS42 GKKVRAEKRACFKKLPRILSFNTMRYTFNMVTMMKEKVNTHFSFPLRLDMTPYTEDFLM- 2070 2080 2090 2100 2110 2120 1930 1940 1950 1960 1970 pF1KE3 QDSSSEVGENGRSVDQGGGGSPRKKVALTENYELVGVIVHSGQAHAGHYYSFIKD---RR ..:: :. . : : ..: . . .:.:.:: ::.: : .:::::::.: . CCDS42 --GKSERKEGFKEV------SDHSKDSESYEYDLIGVTVHTGTADGGHYYSFIRDIVNPH 2130 2140 2150 2160 2170 1980 1990 2000 2010 2020 2030 pF1KE3 GCGKGKWYKFNDTVIEEFDLNDETLEYECFGGEYRPKVYDQ-TNPYTDVR-RRYWNAYML . ..::: :::. .. :: . : ::::::. :.::. :. . : .. .:::: CCDS42 AYKNNKWYLFNDAEVKPFD--SAQLASECFGGEMTTKTYDSVTDKFMDFSFEKTHSAYML 2180 2190 2200 2210 2220 2230 2040 2050 2060 2070 2080 2090 pF1KE3 FYQRVSDQNSPVLPKKSRVSVVRQEAEDLSLSAPSSPEISPQSSPRPHRPNNDRLSILTK ::.:. :: . . : .. ... .. CCDS42 FYKRME------------------------------PE---EENGREYK-----FDVSSE 2240 2250 2100 2110 2120 2130 2140 2150 pF1KE3 LVKKGEKKGLFVEKMPARIYQMVRDENLKFMKNRDVYSSDYFSFVLSLASLNATKLKHPY :. . . .:..:....... ::.:. .: : . : : CCDS42 LL------------------EWIWHDNMQFLQDKNIFEHTYFGFMWQLCSCIPSTLPDP- 2260 2270 2280 2290 2160 2170 2180 2190 2200 2210 pF1KE3 YPCMAKVSLQLAIQFLFQTYLRTKKKLRVDTEEWIATIEALLSKSFDACQWLVEYFISSE .. .. .:. .:...:....:.: . .:: . ...: ::.:... . ... CCDS42 -KAVSLMTAKLSTSFVLETFIHSKEKPTM--LQWIELLTKQFNNSQAACEWFLDRMADDD 2300 2310 2320 2330 2340 2350 2220 2230 2240 2250 pF1KE3 GRELIKIFLLECN---VREV--RVAVATILE-KTLDSALFYQDKLKS------------- . .:..: ::.. :. . .: . . . . :. : ... CCDS42 WWPM--QILIKCPNQIVRQMFQRLCIHVIQRLRPVHAHLYLQPGMEDGSDDMDTSVEDIG 2360 2370 2380 2390 2400 2410 2260 2270 2280 2290 2300 2310 pF1KE3 ----LHQLLEVLLALLDKDVPENCKNCAQYFFLFNTFVQKQGIRAGDLLLRHSALRHMIS . .....:: .... : . :. ..:: .. :. :.: . ...:: .:. :. CCDS42 GRSCVTRFVRTLLLIMEHGVKPHSKHLTEYFAFLYEFA-KMGEEESQFLLSLQAISTMVH 2420 2430 2440 2450 2460 2470 2320 2330 2340 2350 2360 2370 pF1KE3 FLLGASR-QNNQIRRWSSAQAREFGNLHNTVALLVLHSDVSSQRNVAPGIFKQRPPISIA : .:.. .: :.. : ...: CCDS42 FYMGTKGPENPQVEVLSEEEGEEEEEEEDILSLAEEKYRPAALEKMIALVALLVEQSRSE 2480 2490 2500 2510 2520 2530 2620 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:11:20 2016 done: Mon Nov 7 19:11:21 2016 Total Scan time: 5.320 Total Display time: 0.930 Function used was FASTA [36.3.4 Apr, 2011]