FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4261, 1057 aa 1>>>pF1KE4261 1057 - 1057 aa - 1057 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0766+/-0.00117; mu= 17.0927+/- 0.070 mean_var=71.9677+/-14.423, 0's: 0 Z-trim(101.7): 78 B-trim: 0 in 0/50 Lambda= 0.151184 statistics sampled from 6573 (6651) to 6573 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.558), E-opt: 0.2 (0.204), width: 16 Scan time: 4.300 The best scores are: opt bits E(32554) CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057) 7135 1566.5 0 CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049) 7055 1549.0 0 CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 ( 979) 5336 1174.1 0 CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 3972 876.6 0 CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 1449 326.2 8.2e-89 CCDS32177.1 UBE3A gene_id:7337|Hs108|chr15 ( 852) 1022 233.1 1.9e-60 CCDS45191.1 UBE3A gene_id:7337|Hs108|chr15 ( 872) 1022 233.1 2e-60 CCDS45192.1 UBE3A gene_id:7337|Hs108|chr15 ( 875) 1022 233.1 2e-60 CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 ( 986) 912 209.2 3.7e-53 CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022) 912 209.2 3.8e-53 CCDS3630.1 HERC5 gene_id:51191|Hs108|chr4 (1024) 763 176.7 2.3e-43 CCDS58477.1 WWP2 gene_id:11060|Hs108|chr16 ( 431) 623 146.0 1.6e-34 CCDS58476.1 WWP2 gene_id:11060|Hs108|chr16 ( 754) 623 146.1 2.7e-34 CCDS10885.1 WWP2 gene_id:11060|Hs108|chr16 ( 870) 623 146.1 3.1e-34 CCDS77499.1 HECW2 gene_id:57520|Hs108|chr2 (1216) 625 146.6 3.1e-34 CCDS33354.1 HECW2 gene_id:57520|Hs108|chr2 (1572) 625 146.6 3.9e-34 CCDS32707.1 SMURF2 gene_id:64750|Hs108|chr17 ( 748) 616 144.6 7.7e-34 CCDS45876.1 NEDD4L gene_id:23327|Hs108|chr18 ( 834) 609 143.1 2.5e-33 CCDS45875.1 NEDD4L gene_id:23327|Hs108|chr18 ( 854) 609 143.1 2.5e-33 CCDS58632.1 NEDD4L gene_id:23327|Hs108|chr18 ( 911) 609 143.1 2.7e-33 CCDS59323.1 NEDD4L gene_id:23327|Hs108|chr18 ( 947) 609 143.1 2.8e-33 CCDS45873.1 NEDD4L gene_id:23327|Hs108|chr18 ( 955) 609 143.1 2.8e-33 CCDS45874.1 NEDD4L gene_id:23327|Hs108|chr18 ( 967) 609 143.1 2.8e-33 CCDS45872.1 NEDD4L gene_id:23327|Hs108|chr18 ( 975) 609 143.1 2.8e-33 CCDS69286.1 HECW1 gene_id:23072|Hs108|chr7 (1572) 607 142.7 6e-33 CCDS5469.2 HECW1 gene_id:23072|Hs108|chr7 (1606) 607 142.7 6.1e-33 CCDS58769.1 ITCH gene_id:83737|Hs108|chr20 ( 752) 596 140.2 1.6e-32 CCDS13234.1 ITCH gene_id:83737|Hs108|chr20 ( 862) 596 140.2 1.8e-32 CCDS58768.1 ITCH gene_id:83737|Hs108|chr20 ( 903) 596 140.2 1.9e-32 CCDS45265.1 NEDD4 gene_id:4734|Hs108|chr15 ( 900) 592 139.4 3.5e-32 CCDS10156.1 NEDD4 gene_id:4734|Hs108|chr15 (1247) 592 139.4 4.7e-32 CCDS61643.1 NEDD4 gene_id:4734|Hs108|chr15 (1303) 592 139.4 4.9e-32 CCDS61644.1 NEDD4 gene_id:4734|Hs108|chr15 (1319) 592 139.4 4.9e-32 CCDS6242.1 WWP1 gene_id:11059|Hs108|chr8 ( 922) 587 138.3 7.5e-32 CCDS10021.1 HERC2 gene_id:8924|Hs108|chr15 (4834) 581 137.2 8.5e-31 CCDS35301.1 HUWE1 gene_id:10075|Hs108|chrX (4374) 579 136.7 1.1e-30 CCDS5050.1 HACE1 gene_id:57531|Hs108|chr6 ( 909) 562 132.8 3.3e-30 CCDS14246.1 RPGR gene_id:6103|Hs108|chrX ( 815) 559 132.2 4.6e-30 CCDS35229.1 RPGR gene_id:6103|Hs108|chrX (1152) 559 132.2 6.4e-30 CCDS34789.1 UBE3C gene_id:9690|Hs108|chr7 (1083) 558 132.0 7e-30 CCDS60542.1 HERC4 gene_id:26091|Hs108|chr10 ( 110) 540 127.8 1.3e-29 CCDS73571.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 527) 533 126.4 1.6e-28 CCDS9411.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 551) 533 126.4 1.6e-28 CCDS73572.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 556) 533 126.4 1.7e-28 CCDS34689.1 SMURF1 gene_id:57154|Hs108|chr7 ( 731) 530 125.8 3.4e-28 CCDS34690.1 SMURF1 gene_id:57154|Hs108|chr7 ( 757) 530 125.8 3.5e-28 CCDS9418.1 RCBTB1 gene_id:55213|Hs108|chr13 ( 531) 521 123.8 9.8e-28 CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861) 497 118.8 2.8e-25 CCDS7414.1 HECTD2 gene_id:143279|Hs108|chr10 ( 776) 421 102.0 5.1e-21 CCDS60591.1 HECTD2 gene_id:143279|Hs108|chr10 ( 780) 421 102.0 5.1e-21 >>CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057 aa) initn: 7135 init1: 7135 opt: 7135 Z-score: 8402.9 bits: 1566.5 E(32554): 0 Smith-Waterman score: 7135; 100.0% identity (100.0% similar) in 1057 aa overlap (1-1057:1-1057) 10 20 30 40 50 60 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE4 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI ::::::::::::::::::::::::::::::::::::: CCDS41 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI 1030 1040 1050 >>CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049 aa) initn: 7067 init1: 4387 opt: 7055 Z-score: 8308.7 bits: 1549.0 E(32554): 0 Smith-Waterman score: 7055; 99.2% identity (99.2% similar) in 1057 aa overlap (1-1057:1-1049) 10 20 30 40 50 60 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT :::::::::::::::::::::::::::::::::::::::::: :::::::::: CCDS72 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGM--------LADIPVTICT 610 620 630 640 650 670 680 690 700 710 720 pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG 660 670 680 690 700 710 730 740 750 760 770 780 pF1KE4 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR 720 730 740 750 760 770 790 800 810 820 830 840 pF1KE4 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD 780 790 800 810 820 830 850 860 870 880 890 900 pF1KE4 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY 840 850 860 870 880 890 910 920 930 940 950 960 pF1KE4 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KE4 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP 960 970 980 990 1000 1010 1030 1040 1050 pF1KE4 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI ::::::::::::::::::::::::::::::::::::: CCDS72 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI 1020 1030 1040 >>CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 (979 aa) initn: 6592 init1: 5336 opt: 5336 Z-score: 6282.9 bits: 1174.1 E(32554): 0 Smith-Waterman score: 6440; 92.6% identity (92.6% similar) in 1057 aa overlap (1-1057:1-979) 10 20 30 40 50 60 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD ::::::: CCDS60 LIWFSDK----------------------------------------------------- 850 860 870 880 890 900 pF1KE4 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY ::::::::::::::::::::::::::::::::::: CCDS60 -------------------------ITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY 790 800 810 820 910 920 930 940 950 960 pF1KE4 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG 830 840 850 860 870 880 970 980 990 1000 1010 1020 pF1KE4 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP 890 900 910 920 930 940 1030 1040 1050 pF1KE4 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI ::::::::::::::::::::::::::::::::::::: CCDS60 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI 950 960 970 >>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa) initn: 3818 init1: 2042 opt: 3972 Z-score: 4674.5 bits: 876.6 E(32554): 0 Smith-Waterman score: 3972; 56.0% identity (78.7% similar) in 1057 aa overlap (1-1056:1-1049) 10 20 30 40 50 60 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC ::::: :.:: :.. . :: ::. :. .. :..:.:: :.::.:.:: ::::: CCDS34 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG : ::::::. .::::. :: :.:. :.:::.:.:::.:.::...:: :::::::. CCDS34 NTKGQLGHEREGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS .:. . ::: :..:.. :.::.:: .: :::. .. : ::.:..:::::: . .:.: CCDS34 TEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFFTWGKNSHGQLGLGKEFPSQAS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR :: ..:: :::. ::::::::::.:.::::.:::: :. :::::.::.:: : .: :: CCDS34 PQRVRSLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA .::.::: :::.:::.::: :::::::::. :::::.: . :.:::.:.::::: ::.:: CCDS34 TQKVVYISCGEEHTAVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE :::::: ::::::: ::.:: :. :::::: : : : : ::: : ..:: : . CCDS34 CGRQHTLAFVPSSGLIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARADRFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV : ::.:::::::.: :. .: .: ::: : .. .:. : : . : . . CCDS34 YHIVKQIFSGGDQTFVLCSKYENYSPAVDFRTMNQAHYTSLINDETIAVWRQKLSEHNNA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ . : . .::..: ::::: . :.:..:. .. :.:.:..:.::.::.. .: .: . CCDS34 NTINGVVQILSSAACWNGSFLEKKIDEHFKTSPKIPGIDLNSTRVLFEKLMNSQHSMILE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP :. :.:. :::.:.:: :::::.:.:: ::: ::..::. . :..::.. :.. :. : CCDS34 QILNSFESCLIPQLSSSPPDVEAMRIYLILPEFPLLQDSKYYITLTIPLAMAILRLDTNP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL :::.:::: . : :.:.:.:.: .:..::. : . : .::... .:::.:: : CCDS34 SKVLDNWWSQVCPKYFMKLVNLYKGAVLYLLRGRKTFLIPV---LFNNYITAALKLLEKL 550 560 570 580 590 610 620 630 640 650 660 pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT ..:: :. .. .:: ::: :...:.::..::. : .:: :: . .. . : ::.:. CCDS34 YKVNLKVKHV-EYDTFYIPEISNLVDIQEDYLMWFLHQA-GMKARPSI--IQDT-VTLCS 600 610 620 630 640 650 670 680 690 700 710 pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLF-LPVIESVNPCLILVVRRENIV :::.::::::: .::::: ::::.:.. :. ::: :. : . . .: :.: :::.:.: CCDS34 YPFIFDAQAKTKMLQTDAELQMQVAVNGANLQNVFMLLTLEPLLARSPFLVLHVRRNNLV 660 670 680 690 700 710 720 730 740 750 760 770 pF1KE4 GDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDS :::.. : ..:: :::::::: ::.::::::: ::::::...:::.: :::: ::.:: CCDS34 GDALRELSIHSDIDLKKPLKVIFDGEEAVDAGGVTKEFFLLLLKELLNPIYGMFTYYQDS 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE4 RLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMP :.:::: : . . :::::. ::::::: :.::::::::::::::. ::.:.::::: : CCDS34 NLLWFSDTCFVEHNWFHLIGITCGLAIYNSTVVDLHFPLALYKKLLNVKPGLEDLKELSP 780 790 800 810 820 830 840 850 860 870 880 890 pF1KE4 DVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDA :::.:.::::: .:.:::::::::: :..:. : :.:. .: ...: :.:::::::: CCDS34 TEGRSLQELLDYPGEDVEETFCLNFTICRESYGVIEQKKLIPGGDNVTVCKDNRQEFVDA 840 850 860 870 880 890 900 910 920 930 940 950 pF1KE4 YVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYK ::.:.:. :: . :: .:: :::::::: ::::.::.::..::.::.:.:::... :: CCDS34 YVNYVFQISVHEWYTAFSSGFLKVCGGKVLELFQPSELRAMMVGNSNYNWEELEETAIYK 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KE4 GEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYL :.: : :::.:.:::.:::.::::::.::::::::::::: :: ::..:::::..::::: CCDS34 GDYSATHPTVKLFWETFHEFPLEKKKKFLLFLTGSDRIPIYGMASLQIVIQSTASGEEYL 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE4 PVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI ::.:::.::::::::. :: : ..: ::.:. ::::: CCDS34 PVAHTCYNLLDLPKYSSKEILSARLTQALDNYEGFSLA 1020 1030 1040 1050 >>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa) initn: 1449 init1: 1449 opt: 1449 Z-score: 1708.0 bits: 326.2 E(32554): 8.2e-89 Smith-Waterman score: 1449; 59.3% identity (79.8% similar) in 351 aa overlap (1-351:1-351) 10 20 30 40 50 60 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC ::::: :.:: :.. . :: ::. :. .. :..:.:: :.::.:.:: ::::: CCDS82 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG : ::::::. .::::. :: :.:. :.:::.:.:::.:.::...:: :::::::. CCDS82 NTKGQLGHEREGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS .:. . ::: :..:.. :.::.:: .: :::. .. : ::.:..:::::: . .:.: CCDS82 TEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFFTWGKNSHGQLGLGKEFPSQAS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR :: ..:: :::. ::::::::::.:.::::.:::: :. :::::.::.:: : .: :: CCDS82 PQRVRSLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA .::.::: :::.:::.::: :::::::::. :::::.: . :.:::.:.::::: ::.:: CCDS82 TQKVVYISCGEEHTAVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE :::::: ::::::: ::.:: :. :::::: : : : : ::: : ..:: CCDS82 CGRQHTLAFVPSSGLIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARAGKND 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV CCDS82 CLWNLKVF >>CCDS32177.1 UBE3A gene_id:7337|Hs108|chr15 (852 aa) initn: 957 init1: 521 opt: 1022 Z-score: 1198.6 bits: 233.1 E(32554): 1.9e-60 Smith-Waterman score: 1022; 38.6% identity (68.3% similar) in 435 aa overlap (630-1057:425-852) 600 610 620 630 640 650 pF1KE4 LHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTEL-ADIPVTI ..:: ... :: .. . .. .. .. CCDS32 RNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLEMDKDYTFFKVETENKFSF 400 410 420 430 440 450 660 670 680 690 700 710 pF1KE4 CTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVI-ESVNPCLILVVRREN : ::...: .:. : : ..: ..:. .. :. : ...:: : : :::.. CCDS32 MTCPFILNAVTKNLGLYYDNRIRMY-----SERR-ITVLYSLVQGQQLNPYLRLKVRRDH 460 470 480 490 500 720 730 740 750 760 770 pF1KE4 IVGDAM---EVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFR :. ::. :.. . : :: : : : ::..:: ::: :::: :...:...: ::: CCDS32 IIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGGVSKEFFQLVVEEIFNPDIGMFT 510 520 530 540 550 560 780 790 800 810 820 830 pF1KE4 YYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDL : :...:.::. ..:: : :::.. :::::: :.:.:::...:.::. :: .. :: CCDS32 YDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCILDVHFPMVVYRKLMGKKGTFRDL 570 580 590 600 610 620 840 850 860 870 880 890 pF1KE4 KELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVEN-FGATEVKELVLNGADTAVNKQNR . : . .:...::.: : ..:. . ..: :. . :: . .: :: ....:: CCDS32 GDSHPVLYQSLKDLLEY-EGNVEDDMMITFQISQTDLFGNPMMYDLKENGDKIPITNENR 630 640 650 660 670 680 900 910 920 930 940 950 pF1KE4 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVL-LLFQPNELQAMVIGNTNYDWKEL .:::. : :::.:::: . : ::. ::: : . . : ::.:.:.. .. :. : :.. : CCDS32 KEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPLKYLFRPEEIELLICGSRNLDFQAL 690 700 710 720 730 740 960 970 980 990 1000 1010 pF1KE4 EKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQST :..::: : : . :. :::. : . :.:. :: : ::.:: :. :. .::..: .. CCDS32 EETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFLQFTTGTDRAPVGGLGKLKMIIAKN 750 760 770 780 790 800 1020 1030 1040 1050 pF1KE4 GGGEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI : : ::.::::::.: ::.:. :: :. .:..:: . .::... CCDS32 GPDTERLPTSHTCFNVLLLPEYSSKEKLKERLLKAITYAKGFGML 810 820 830 840 850 >>CCDS45191.1 UBE3A gene_id:7337|Hs108|chr15 (872 aa) initn: 957 init1: 521 opt: 1022 Z-score: 1198.4 bits: 233.1 E(32554): 2e-60 Smith-Waterman score: 1022; 38.6% identity (68.3% similar) in 435 aa overlap (630-1057:445-872) 600 610 620 630 640 650 pF1KE4 LHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTEL-ADIPVTI ..:: ... :: .. . .. .. .. CCDS45 RNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLEMDKDYTFFKVETENKFSF 420 430 440 450 460 470 660 670 680 690 700 710 pF1KE4 CTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVI-ESVNPCLILVVRREN : ::...: .:. : : ..: ..:. .. :. : ...:: : : :::.. CCDS45 MTCPFILNAVTKNLGLYYDNRIRMY-----SERR-ITVLYSLVQGQQLNPYLRLKVRRDH 480 490 500 510 520 720 730 740 750 760 770 pF1KE4 IVGDAM---EVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFR :. ::. :.. . : :: : : : ::..:: ::: :::: :...:...: ::: CCDS45 IIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGGVSKEFFQLVVEEIFNPDIGMFT 530 540 550 560 570 580 780 790 800 810 820 830 pF1KE4 YYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDL : :...:.::. ..:: : :::.. :::::: :.:.:::...:.::. :: .. :: CCDS45 YDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCILDVHFPMVVYRKLMGKKGTFRDL 590 600 610 620 630 640 840 850 860 870 880 890 pF1KE4 KELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVEN-FGATEVKELVLNGADTAVNKQNR . : . .:...::.: : ..:. . ..: :. . :: . .: :: ....:: CCDS45 GDSHPVLYQSLKDLLEY-EGNVEDDMMITFQISQTDLFGNPMMYDLKENGDKIPITNENR 650 660 670 680 690 700 900 910 920 930 940 950 pF1KE4 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVL-LLFQPNELQAMVIGNTNYDWKEL .:::. : :::.:::: . : ::. ::: : . . : ::.:.:.. .. :. : :.. : CCDS45 KEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPLKYLFRPEEIELLICGSRNLDFQAL 710 720 730 740 750 760 960 970 980 990 1000 1010 pF1KE4 EKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQST :..::: : : . :. :::. : . :.:. :: : ::.:: :. :. .::..: .. CCDS45 EETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFLQFTTGTDRAPVGGLGKLKMIIAKN 770 780 790 800 810 820 1020 1030 1040 1050 pF1KE4 GGGEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI : : ::.::::::.: ::.:. :: :. .:..:: . .::... CCDS45 GPDTERLPTSHTCFNVLLLPEYSSKEKLKERLLKAITYAKGFGML 830 840 850 860 870 >>CCDS45192.1 UBE3A gene_id:7337|Hs108|chr15 (875 aa) initn: 957 init1: 521 opt: 1022 Z-score: 1198.4 bits: 233.1 E(32554): 2e-60 Smith-Waterman score: 1022; 38.6% identity (68.3% similar) in 435 aa overlap (630-1057:448-875) 600 610 620 630 640 650 pF1KE4 LHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTEL-ADIPVTI ..:: ... :: .. . .. .. .. CCDS45 RNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLEMDKDYTFFKVETENKFSF 420 430 440 450 460 470 660 670 680 690 700 710 pF1KE4 CTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVI-ESVNPCLILVVRREN : ::...: .:. : : ..: ..:. .. :. : ...:: : : :::.. CCDS45 MTCPFILNAVTKNLGLYYDNRIRMY-----SERR-ITVLYSLVQGQQLNPYLRLKVRRDH 480 490 500 510 520 530 720 730 740 750 760 770 pF1KE4 IVGDAM---EVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFR :. ::. :.. . : :: : : : ::..:: ::: :::: :...:...: ::: CCDS45 IIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGGVSKEFFQLVVEEIFNPDIGMFT 540 550 560 570 580 590 780 790 800 810 820 830 pF1KE4 YYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDL : :...:.::. ..:: : :::.. :::::: :.:.:::...:.::. :: .. :: CCDS45 YDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCILDVHFPMVVYRKLMGKKGTFRDL 600 610 620 630 640 650 840 850 860 870 880 890 pF1KE4 KELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVEN-FGATEVKELVLNGADTAVNKQNR . : . .:...::.: : ..:. . ..: :. . :: . .: :: ....:: CCDS45 GDSHPVLYQSLKDLLEY-EGNVEDDMMITFQISQTDLFGNPMMYDLKENGDKIPITNENR 660 670 680 690 700 710 900 910 920 930 940 950 pF1KE4 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVL-LLFQPNELQAMVIGNTNYDWKEL .:::. : :::.:::: . : ::. ::: : . . : ::.:.:.. .. :. : :.. : CCDS45 KEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPLKYLFRPEEIELLICGSRNLDFQAL 720 730 740 750 760 770 960 970 980 990 1000 1010 pF1KE4 EKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQST :..::: : : . :. :::. : . :.:. :: : ::.:: :. :. .::..: .. CCDS45 EETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFLQFTTGTDRAPVGGLGKLKMIIAKN 780 790 800 810 820 830 1020 1030 1040 1050 pF1KE4 GGGEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI : : ::.::::::.: ::.:. :: :. .:..:: . .::... CCDS45 GPDTERLPTSHTCFNVLLLPEYSSKEKLKERLLKAITYAKGFGML 840 850 860 870 >>CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 (986 aa) initn: 2020 init1: 586 opt: 912 Z-score: 1067.9 bits: 209.2 E(32554): 3.7e-53 Smith-Waterman score: 2157; 36.9% identity (65.4% similar) in 1065 aa overlap (2-1054:3-978) 10 20 30 40 50 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG .::: : .: :. :.. . .. ... : ::....: . : .:: CCDS54 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG 10 20 30 40 60 70 80 90 100 110 pF1KE4 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG :. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.:::: CCDS54 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK . .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . . CCDS54 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN :.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . : CCDS54 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS . .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . . CCDS54 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP .:..: :: :: :.: ..:.. ::: : ..::. : .. : .. .:: CCDS54 LVSQIDCGSYHTLAYVHTTGQVVSFGHG------PSDTSKPTHPEALTEN---FDISCL- 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 DIDSEEYF--CVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL :..:.. ::.::.: .: .. :. .. : :. : .: ..... .::. CCDS54 -ISAEDFVDVQVKHIFAGTYANF--VTTHQD---TSSTRAPGKTLPEISRISQSMAEKWI 340 350 360 370 380 390 420 430 440 450 460 pF1KE4 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK . :.: .:: ::: .::..::: . :: : ::.. :: :.: CCDS54 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK 400 410 420 430 440 470 480 490 500 510 520 pF1KE4 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF : . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....:: CCDS54 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF 450 460 470 480 490 500 530 540 550 560 570 580 pF1KE4 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS . :. .. : :.::.. :. :. . .....: ... .::. : .:. : CCDS54 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN- 510 520 530 540 550 590 600 610 620 630 640 pF1KE4 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGL ... : ... ::.:: : . . . : :.:...:. : ::. .: :: . CCDS54 -VKALLGMMKELHKVN-KANCRLPENTFNINELSNLL---NFYIDRGRQLFRD---NHLM 560 570 580 590 600 610 650 660 670 680 690 700 pF1KE4 TELADIPVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPC .: :. .:. ...:: . :. : : .: CCDS54 SE------------------KKAYMLMHETILQKK---DE---------FPP-----SPR 620 630 710 720 730 740 750 760 pF1KE4 LILVVRRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDP .:: ::: .: ::.. : ... :. : : : :..: ..::: .::: ...:. : CCDS54 FILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTKP 640 650 660 670 680 690 770 780 790 800 810 820 pF1KE4 KYGMFRYYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKK .:::: : : . .:: : .. . :.:..:::...: ....: :::::::::: .: CCDS54 EYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQK 700 710 720 730 740 750 830 840 850 860 870 880 pF1KE4 PSLDDLKELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAV :::.::::: : .:.:.:..:: ::: ...:. :.: .. ..: .:. :: . : CCDS54 PSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSI---HWDQNDV-DLIPNGISIPV 760 770 780 790 800 810 890 900 910 920 930 940 pF1KE4 NKQNRQEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYD .. :....:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.:: CCDS54 DQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDYD 820 830 840 850 860 870 950 960 970 980 990 1000 pF1KE4 WKELEKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLV ::..:.:..:. : ::::..::..::.: :..::.::.:::: ::. :......: CCDS54 WKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEIV 880 890 900 910 920 930 1010 1020 1030 1040 1050 pF1KE4 IQSTGG-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI .. .:. :.: :: :.:.::::. : .. : ::..:.:: CCDS54 FRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS 940 950 960 970 980 >>CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022 aa) initn: 1762 init1: 586 opt: 912 Z-score: 1067.6 bits: 209.2 E(32554): 3.8e-53 Smith-Waterman score: 2276; 37.5% identity (66.7% similar) in 1066 aa overlap (2-1054:3-1014) 10 20 30 40 50 pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG .::: : .: :. :.. . .. ... : ::....: . : .:: CCDS47 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG 10 20 30 40 60 70 80 90 100 110 pF1KE4 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG :. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.:::: CCDS47 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK . .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . . CCDS47 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN :.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . : CCDS47 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS . .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . . CCDS47 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP .:..: :: :: :.: ..:.. ::: : ..::. : .. : .. .:: CCDS47 LVSQIDCGSYHTLAYVHTTGQVVSFGHG------PSDTSKPTHPEALTEN---FDISCL- 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 DIDSEEYF--CVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL :..:.. ::.::.: .: .. :. .. : :. : .: ..... .::. CCDS47 -ISAEDFVDVQVKHIFAGTYANF--VTTHQD---TSSTRAPGKTLPEISRISQSMAEKWI 340 350 360 370 380 390 420 430 440 450 460 pF1KE4 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK . :.: .:: ::: .::..::: . :: : ::.. :: :.: CCDS47 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK 400 410 420 430 440 470 480 490 500 510 520 pF1KE4 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF : . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....:: CCDS47 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF 450 460 470 480 490 500 530 540 550 560 570 580 pF1KE4 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS . :. .. : :.::.. :. :. . .....: ... .::. : .:. : CCDS47 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN- 510 520 530 540 550 590 600 610 620 630 640 pF1KE4 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGL ... : ... ::.:: : . . . : :.:...:. : ::. .: :: . CCDS47 -VKALLGMMKELHKVN-KANCRLPENTFNINELSNLL---NFYIDRGRQLFRD---NHLI 560 570 580 590 600 610 650 660 670 680 690 700 pF1KE4 TELADIPVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIE-SVNP . :: . .::.:.. .: :::.:. ..:::. .:. ... : .: CCDS47 PAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSP 620 630 640 650 660 670 710 720 730 740 750 760 pF1KE4 CLILVVRRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLD .:: ::: .: ::.. : ... :. : : : :..: ..::: .::: ...:. CCDS47 RFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTK 680 690 700 710 720 730 770 780 790 800 810 820 pF1KE4 PKYGMFRYYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKK :.:::: : : . .:: : .. . :.:..:::...: ....: :::::::::: . CCDS47 PEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQ 740 750 760 770 780 790 830 840 850 860 870 880 pF1KE4 KPSLDDLKELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTA ::::.::::: : .:.:.:..:: ::: ...:. :.: .. ..: .:. :: . CCDS47 KPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSI---HWDQNDV-DLIPNGISIP 800 810 820 830 840 890 900 910 920 930 940 pF1KE4 VNKQNRQEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNY :.. :....:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.: CCDS47 VDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDY 850 860 870 880 890 900 950 960 970 980 990 1000 pF1KE4 DWKELEKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKL :::..:.:..:. : ::::..::..::.: :..::.::.:::: ::. :...... CCDS47 DWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEI 910 920 930 940 950 960 1010 1020 1030 1040 1050 pF1KE4 VIQSTGG-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI :.. .:. :.: :: :.:.::::. : .. : ::..:.:: CCDS47 VFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS 970 980 990 1000 1010 1020 1057 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:24:45 2016 done: Sun Nov 6 01:24:46 2016 Total Scan time: 4.300 Total Display time: 0.360 Function used was FASTA [36.3.4 Apr, 2011]