FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4261, 1057 aa
1>>>pF1KE4261 1057 - 1057 aa - 1057 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0766+/-0.00117; mu= 17.0927+/- 0.070
mean_var=71.9677+/-14.423, 0's: 0 Z-trim(101.7): 78 B-trim: 0 in 0/50
Lambda= 0.151184
statistics sampled from 6573 (6651) to 6573 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.558), E-opt: 0.2 (0.204), width: 16
Scan time: 4.300
The best scores are: opt bits E(32554)
CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057) 7135 1566.5 0
CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049) 7055 1549.0 0
CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 ( 979) 5336 1174.1 0
CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 3972 876.6 0
CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 1449 326.2 8.2e-89
CCDS32177.1 UBE3A gene_id:7337|Hs108|chr15 ( 852) 1022 233.1 1.9e-60
CCDS45191.1 UBE3A gene_id:7337|Hs108|chr15 ( 872) 1022 233.1 2e-60
CCDS45192.1 UBE3A gene_id:7337|Hs108|chr15 ( 875) 1022 233.1 2e-60
CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 ( 986) 912 209.2 3.7e-53
CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022) 912 209.2 3.8e-53
CCDS3630.1 HERC5 gene_id:51191|Hs108|chr4 (1024) 763 176.7 2.3e-43
CCDS58477.1 WWP2 gene_id:11060|Hs108|chr16 ( 431) 623 146.0 1.6e-34
CCDS58476.1 WWP2 gene_id:11060|Hs108|chr16 ( 754) 623 146.1 2.7e-34
CCDS10885.1 WWP2 gene_id:11060|Hs108|chr16 ( 870) 623 146.1 3.1e-34
CCDS77499.1 HECW2 gene_id:57520|Hs108|chr2 (1216) 625 146.6 3.1e-34
CCDS33354.1 HECW2 gene_id:57520|Hs108|chr2 (1572) 625 146.6 3.9e-34
CCDS32707.1 SMURF2 gene_id:64750|Hs108|chr17 ( 748) 616 144.6 7.7e-34
CCDS45876.1 NEDD4L gene_id:23327|Hs108|chr18 ( 834) 609 143.1 2.5e-33
CCDS45875.1 NEDD4L gene_id:23327|Hs108|chr18 ( 854) 609 143.1 2.5e-33
CCDS58632.1 NEDD4L gene_id:23327|Hs108|chr18 ( 911) 609 143.1 2.7e-33
CCDS59323.1 NEDD4L gene_id:23327|Hs108|chr18 ( 947) 609 143.1 2.8e-33
CCDS45873.1 NEDD4L gene_id:23327|Hs108|chr18 ( 955) 609 143.1 2.8e-33
CCDS45874.1 NEDD4L gene_id:23327|Hs108|chr18 ( 967) 609 143.1 2.8e-33
CCDS45872.1 NEDD4L gene_id:23327|Hs108|chr18 ( 975) 609 143.1 2.8e-33
CCDS69286.1 HECW1 gene_id:23072|Hs108|chr7 (1572) 607 142.7 6e-33
CCDS5469.2 HECW1 gene_id:23072|Hs108|chr7 (1606) 607 142.7 6.1e-33
CCDS58769.1 ITCH gene_id:83737|Hs108|chr20 ( 752) 596 140.2 1.6e-32
CCDS13234.1 ITCH gene_id:83737|Hs108|chr20 ( 862) 596 140.2 1.8e-32
CCDS58768.1 ITCH gene_id:83737|Hs108|chr20 ( 903) 596 140.2 1.9e-32
CCDS45265.1 NEDD4 gene_id:4734|Hs108|chr15 ( 900) 592 139.4 3.5e-32
CCDS10156.1 NEDD4 gene_id:4734|Hs108|chr15 (1247) 592 139.4 4.7e-32
CCDS61643.1 NEDD4 gene_id:4734|Hs108|chr15 (1303) 592 139.4 4.9e-32
CCDS61644.1 NEDD4 gene_id:4734|Hs108|chr15 (1319) 592 139.4 4.9e-32
CCDS6242.1 WWP1 gene_id:11059|Hs108|chr8 ( 922) 587 138.3 7.5e-32
CCDS10021.1 HERC2 gene_id:8924|Hs108|chr15 (4834) 581 137.2 8.5e-31
CCDS35301.1 HUWE1 gene_id:10075|Hs108|chrX (4374) 579 136.7 1.1e-30
CCDS5050.1 HACE1 gene_id:57531|Hs108|chr6 ( 909) 562 132.8 3.3e-30
CCDS14246.1 RPGR gene_id:6103|Hs108|chrX ( 815) 559 132.2 4.6e-30
CCDS35229.1 RPGR gene_id:6103|Hs108|chrX (1152) 559 132.2 6.4e-30
CCDS34789.1 UBE3C gene_id:9690|Hs108|chr7 (1083) 558 132.0 7e-30
CCDS60542.1 HERC4 gene_id:26091|Hs108|chr10 ( 110) 540 127.8 1.3e-29
CCDS73571.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 527) 533 126.4 1.6e-28
CCDS9411.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 551) 533 126.4 1.6e-28
CCDS73572.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 556) 533 126.4 1.7e-28
CCDS34689.1 SMURF1 gene_id:57154|Hs108|chr7 ( 731) 530 125.8 3.4e-28
CCDS34690.1 SMURF1 gene_id:57154|Hs108|chr7 ( 757) 530 125.8 3.5e-28
CCDS9418.1 RCBTB1 gene_id:55213|Hs108|chr13 ( 531) 521 123.8 9.8e-28
CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861) 497 118.8 2.8e-25
CCDS7414.1 HECTD2 gene_id:143279|Hs108|chr10 ( 776) 421 102.0 5.1e-21
CCDS60591.1 HECTD2 gene_id:143279|Hs108|chr10 ( 780) 421 102.0 5.1e-21
>>CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057 aa)
initn: 7135 init1: 7135 opt: 7135 Z-score: 8402.9 bits: 1566.5 E(32554): 0
Smith-Waterman score: 7135; 100.0% identity (100.0% similar) in 1057 aa overlap (1-1057:1-1057)
10 20 30 40 50 60
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE4 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE4 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE4 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE4 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE4 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP
970 980 990 1000 1010 1020
1030 1040 1050
pF1KE4 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
:::::::::::::::::::::::::::::::::::::
CCDS41 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
1030 1040 1050
>>CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049 aa)
initn: 7067 init1: 4387 opt: 7055 Z-score: 8308.7 bits: 1549.0 E(32554): 0
Smith-Waterman score: 7055; 99.2% identity (99.2% similar) in 1057 aa overlap (1-1057:1-1049)
10 20 30 40 50 60
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT
:::::::::::::::::::::::::::::::::::::::::: ::::::::::
CCDS72 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGM--------LADIPVTICT
610 620 630 640 650
670 680 690 700 710 720
pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG
660 670 680 690 700 710
730 740 750 760 770 780
pF1KE4 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR
720 730 740 750 760 770
790 800 810 820 830 840
pF1KE4 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD
780 790 800 810 820 830
850 860 870 880 890 900
pF1KE4 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY
840 850 860 870 880 890
910 920 930 940 950 960
pF1KE4 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KE4 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP
960 970 980 990 1000 1010
1030 1040 1050
pF1KE4 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
:::::::::::::::::::::::::::::::::::::
CCDS72 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
1020 1030 1040
>>CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 (979 aa)
initn: 6592 init1: 5336 opt: 5336 Z-score: 6282.9 bits: 1174.1 E(32554): 0
Smith-Waterman score: 6440; 92.6% identity (92.6% similar) in 1057 aa overlap (1-1057:1-979)
10 20 30 40 50 60
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPCLILVVRRENIVG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE4 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 DAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDSR
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE4 LIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMPD
:::::::
CCDS60 LIWFSDK-----------------------------------------------------
850 860 870 880 890 900
pF1KE4 VGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY
:::::::::::::::::::::::::::::::::::
CCDS60 -------------------------ITVENFGATEVKELVLNGADTAVNKQNRQEFVDAY
790 800 810 820
910 920 930 940 950 960
pF1KE4 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 VDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYKG
830 840 850 860 870 880
970 980 990 1000 1010 1020
pF1KE4 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 EYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYLP
890 900 910 920 930 940
1030 1040 1050
pF1KE4 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
:::::::::::::::::::::::::::::::::::::
CCDS60 VSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
950 960 970
>>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa)
initn: 3818 init1: 2042 opt: 3972 Z-score: 4674.5 bits: 876.6 E(32554): 0
Smith-Waterman score: 3972; 56.0% identity (78.7% similar) in 1057 aa overlap (1-1056:1-1049)
10 20 30 40 50 60
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
::::: :.:: :.. . :: ::. :. .. :..:.:: :.::.:.:: :::::
CCDS34 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
: ::::::. .::::. :: :.:. :.:::.:.:::.:.::...:: :::::::.
CCDS34 NTKGQLGHEREGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
.:. . ::: :..:.. :.::.:: .: :::. .. : ::.:..:::::: . .:.:
CCDS34 TEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFFTWGKNSHGQLGLGKEFPSQAS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
:: ..:: :::. ::::::::::.:.::::.:::: :. :::::.::.:: : .: ::
CCDS34 PQRVRSLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
.::.::: :::.:::.::: :::::::::. :::::.: . :.:::.:.::::: ::.::
CCDS34 TQKVVYISCGEEHTAVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
:::::: ::::::: ::.:: :. :::::: : : : : ::: : ..:: : .
CCDS34 CGRQHTLAFVPSSGLIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARADRFK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
: ::.:::::::.: :. .: .: ::: : .. .:. : : . : . .
CCDS34 YHIVKQIFSGGDQTFVLCSKYENYSPAVDFRTMNQAHYTSLINDETIAVWRQKLSEHNNA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 EIANEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFSGVDMNAARLLFHKLIQPDHPQISQ
. : . .::..: ::::: . :.:..:. .. :.:.:..:.::.::.. .: .: .
CCDS34 NTINGVVQILSSAACWNGSFLEKKIDEHFKTSPKIPGIDLNSTRVLFEKLMNSQHSMILE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 QVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPFGTALVNLEKAP
:. :.:. :::.:.:: :::::.:.:: ::: ::..::. . :..::.. :.. :. :
CCDS34 QILNSFESCLIPQLSSSPPDVEAMRIYLILPEFPLLQDSKYYITLTIPLAMAILRLDTNP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 LKVLENWWSVLEPPLFLKIVELFKEVVVHLLKLYKIGIPPSERRIFNSFLHTALKVLEIL
:::.:::: . : :.:.:.:.: .:..::. : . : .::... .:::.:: :
CCDS34 SKVLDNWWSQVCPKYFMKLVNLYKGAVLYLLRGRKTFLIPV---LFNNYITAALKLLEKL
550 560 570 580 590
610 620 630 640 650 660
pF1KE4 HRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTELADIPVTICT
..:: :. .. .:: ::: :...:.::..::. : .:: :: . .. . : ::.:.
CCDS34 YKVNLKVKHV-EYDTFYIPEISNLVDIQEDYLMWFLHQA-GMKARPSI--IQDT-VTLCS
600 610 620 630 640 650
670 680 690 700 710
pF1KE4 YPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLF-LPVIESVNPCLILVVRRENIV
:::.::::::: .::::: ::::.:.. :. ::: :. : . . .: :.: :::.:.:
CCDS34 YPFIFDAQAKTKMLQTDAELQMQVAVNGANLQNVFMLLTLEPLLARSPFLVLHVRRNNLV
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE4 GDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFRYYEDS
:::.. : ..:: :::::::: ::.::::::: ::::::...:::.: :::: ::.::
CCDS34 GDALRELSIHSDIDLKKPLKVIFDGEEAVDAGGVTKEFFLLLLKELLNPIYGMFTYYQDS
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE4 RLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDLKELMP
:.:::: : . . :::::. ::::::: :.::::::::::::::. ::.:.::::: :
CCDS34 NLLWFSDTCFVEHNWFHLIGITCGLAIYNSTVVDLHFPLALYKKLLNVKPGLEDLKELSP
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE4 DVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNRQEFVDA
:::.:.::::: .:.:::::::::: :..:. : :.:. .: ...: :.::::::::
CCDS34 TEGRSLQELLDYPGEDVEETFCLNFTICRESYGVIEQKKLIPGGDNVTVCKDNRQEFVDA
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE4 YVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELEKNTEYK
::.:.:. :: . :: .:: :::::::: ::::.::.::..::.::.:.:::... ::
CCDS34 YVNYVFQISVHEWYTAFSSGFLKVCGGKVLELFQPSELRAMMVGNSNYNWEELEETAIYK
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KE4 GEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTGGGEEYL
:.: : :::.:.:::.:::.::::::.::::::::::::: :: ::..:::::..:::::
CCDS34 GDYSATHPTVKLFWETFHEFPLEKKKKFLLFLTGSDRIPIYGMASLQIVIQSTASGEEYL
960 970 980 990 1000 1010
1020 1030 1040 1050
pF1KE4 PVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
::.:::.::::::::. :: : ..: ::.:. :::::
CCDS34 PVAHTCYNLLDLPKYSSKEILSARLTQALDNYEGFSLA
1020 1030 1040 1050
>>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa)
initn: 1449 init1: 1449 opt: 1449 Z-score: 1708.0 bits: 326.2 E(32554): 8.2e-89
Smith-Waterman score: 1449; 59.3% identity (79.8% similar) in 351 aa overlap (1-351:1-351)
10 20 30 40 50 60
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGC
::::: :.:: :.. . :: ::. :. .. :..:.:: :.::.:.:: :::::
CCDS82 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 NDLGQLGHEKSRKKPEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLGLVG
: ::::::. .::::. :: :.:. :.:::.:.:::.:.::...:: :::::::.
CCDS82 NTKGQLGHEREGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTS
.:. . ::: :..:.. :.::.:: .: :::. .. : ::.:..:::::: . .:.:
CCDS82 TEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFFTWGKNSHGQLGLGKEFPSQAS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 PQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLR
:: ..:: :::. ::::::::::.:.::::.:::: :. :::::.::.:: : .: ::
CCDS82 PQRVRSLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIA
.::.::: :::.:::.::: :::::::::. :::::.: . :.:::.:.::::: ::.::
CCDS82 TQKVVYISCGEEHTAVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 CGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEE
:::::: ::::::: ::.:: :. :::::: : : : : ::: : ..::
CCDS82 CGRQHTLAFVPSSGLIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARAGKND
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 YFCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPTKQIWTVNEALIQKWLSYPSGRFPV
CCDS82 CLWNLKVF
>>CCDS32177.1 UBE3A gene_id:7337|Hs108|chr15 (852 aa)
initn: 957 init1: 521 opt: 1022 Z-score: 1198.6 bits: 233.1 E(32554): 1.9e-60
Smith-Waterman score: 1022; 38.6% identity (68.3% similar) in 435 aa overlap (630-1057:425-852)
600 610 620 630 640 650
pF1KE4 LHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTEL-ADIPVTI
..:: ... :: .. . .. .. ..
CCDS32 RNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLEMDKDYTFFKVETENKFSF
400 410 420 430 440 450
660 670 680 690 700 710
pF1KE4 CTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVI-ESVNPCLILVVRREN
: ::...: .:. : : ..: ..:. .. :. : ...:: : : :::..
CCDS32 MTCPFILNAVTKNLGLYYDNRIRMY-----SERR-ITVLYSLVQGQQLNPYLRLKVRRDH
460 470 480 490 500
720 730 740 750 760 770
pF1KE4 IVGDAM---EVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFR
:. ::. :.. . : :: : : : ::..:: ::: :::: :...:...: :::
CCDS32 IIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGGVSKEFFQLVVEEIFNPDIGMFT
510 520 530 540 550 560
780 790 800 810 820 830
pF1KE4 YYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDL
: :...:.::. ..:: : :::.. :::::: :.:.:::...:.::. :: .. ::
CCDS32 YDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCILDVHFPMVVYRKLMGKKGTFRDL
570 580 590 600 610 620
840 850 860 870 880 890
pF1KE4 KELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVEN-FGATEVKELVLNGADTAVNKQNR
. : . .:...::.: : ..:. . ..: :. . :: . .: :: ....::
CCDS32 GDSHPVLYQSLKDLLEY-EGNVEDDMMITFQISQTDLFGNPMMYDLKENGDKIPITNENR
630 640 650 660 670 680
900 910 920 930 940 950
pF1KE4 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVL-LLFQPNELQAMVIGNTNYDWKEL
.:::. : :::.:::: . : ::. ::: : . . : ::.:.:.. .. :. : :.. :
CCDS32 KEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPLKYLFRPEEIELLICGSRNLDFQAL
690 700 710 720 730 740
960 970 980 990 1000 1010
pF1KE4 EKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQST
:..::: : : . :. :::. : . :.:. :: : ::.:: :. :. .::..: ..
CCDS32 EETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFLQFTTGTDRAPVGGLGKLKMIIAKN
750 760 770 780 790 800
1020 1030 1040 1050
pF1KE4 GGGEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
: : ::.::::::.: ::.:. :: :. .:..:: . .::...
CCDS32 GPDTERLPTSHTCFNVLLLPEYSSKEKLKERLLKAITYAKGFGML
810 820 830 840 850
>>CCDS45191.1 UBE3A gene_id:7337|Hs108|chr15 (872 aa)
initn: 957 init1: 521 opt: 1022 Z-score: 1198.4 bits: 233.1 E(32554): 2e-60
Smith-Waterman score: 1022; 38.6% identity (68.3% similar) in 435 aa overlap (630-1057:445-872)
600 610 620 630 640 650
pF1KE4 LHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTEL-ADIPVTI
..:: ... :: .. . .. .. ..
CCDS45 RNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLEMDKDYTFFKVETENKFSF
420 430 440 450 460 470
660 670 680 690 700 710
pF1KE4 CTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVI-ESVNPCLILVVRREN
: ::...: .:. : : ..: ..:. .. :. : ...:: : : :::..
CCDS45 MTCPFILNAVTKNLGLYYDNRIRMY-----SERR-ITVLYSLVQGQQLNPYLRLKVRRDH
480 490 500 510 520
720 730 740 750 760 770
pF1KE4 IVGDAM---EVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFR
:. ::. :.. . : :: : : : ::..:: ::: :::: :...:...: :::
CCDS45 IIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGGVSKEFFQLVVEEIFNPDIGMFT
530 540 550 560 570 580
780 790 800 810 820 830
pF1KE4 YYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDL
: :...:.::. ..:: : :::.. :::::: :.:.:::...:.::. :: .. ::
CCDS45 YDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCILDVHFPMVVYRKLMGKKGTFRDL
590 600 610 620 630 640
840 850 860 870 880 890
pF1KE4 KELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVEN-FGATEVKELVLNGADTAVNKQNR
. : . .:...::.: : ..:. . ..: :. . :: . .: :: ....::
CCDS45 GDSHPVLYQSLKDLLEY-EGNVEDDMMITFQISQTDLFGNPMMYDLKENGDKIPITNENR
650 660 670 680 690 700
900 910 920 930 940 950
pF1KE4 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVL-LLFQPNELQAMVIGNTNYDWKEL
.:::. : :::.:::: . : ::. ::: : . . : ::.:.:.. .. :. : :.. :
CCDS45 KEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPLKYLFRPEEIELLICGSRNLDFQAL
710 720 730 740 750 760
960 970 980 990 1000 1010
pF1KE4 EKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQST
:..::: : : . :. :::. : . :.:. :: : ::.:: :. :. .::..: ..
CCDS45 EETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFLQFTTGTDRAPVGGLGKLKMIIAKN
770 780 790 800 810 820
1020 1030 1040 1050
pF1KE4 GGGEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
: : ::.::::::.: ::.:. :: :. .:..:: . .::...
CCDS45 GPDTERLPTSHTCFNVLLLPEYSSKEKLKERLLKAITYAKGFGML
830 840 850 860 870
>>CCDS45192.1 UBE3A gene_id:7337|Hs108|chr15 (875 aa)
initn: 957 init1: 521 opt: 1022 Z-score: 1198.4 bits: 233.1 E(32554): 2e-60
Smith-Waterman score: 1022; 38.6% identity (68.3% similar) in 435 aa overlap (630-1057:448-875)
600 610 620 630 640 650
pF1KE4 LHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGLTEL-ADIPVTI
..:: ... :: .. . .. .. ..
CCDS45 RNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLEMDKDYTFFKVETENKFSF
420 430 440 450 460 470
660 670 680 690 700 710
pF1KE4 CTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVI-ESVNPCLILVVRREN
: ::...: .:. : : ..: ..:. .. :. : ...:: : : :::..
CCDS45 MTCPFILNAVTKNLGLYYDNRIRMY-----SERR-ITVLYSLVQGQQLNPYLRLKVRRDH
480 490 500 510 520 530
720 730 740 750 760 770
pF1KE4 IVGDAM---EVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMFR
:. ::. :.. . : :: : : : ::..:: ::: :::: :...:...: :::
CCDS45 IIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGGVSKEFFQLVVEEIFNPDIGMFT
540 550 560 570 580 590
780 790 800 810 820 830
pF1KE4 YYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDDL
: :...:.::. ..:: : :::.. :::::: :.:.:::...:.::. :: .. ::
CCDS45 YDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCILDVHFPMVVYRKLMGKKGTFRDL
600 610 620 630 640 650
840 850 860 870 880 890
pF1KE4 KELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVEN-FGATEVKELVLNGADTAVNKQNR
. : . .:...::.: : ..:. . ..: :. . :: . .: :: ....::
CCDS45 GDSHPVLYQSLKDLLEY-EGNVEDDMMITFQISQTDLFGNPMMYDLKENGDKIPITNENR
660 670 680 690 700 710
900 910 920 930 940 950
pF1KE4 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVL-LLFQPNELQAMVIGNTNYDWKEL
.:::. : :::.:::: . : ::. ::: : . . : ::.:.:.. .. :. : :.. :
CCDS45 KEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPLKYLFRPEEIELLICGSRNLDFQAL
720 730 740 750 760 770
960 970 980 990 1000 1010
pF1KE4 EKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQST
:..::: : : . :. :::. : . :.:. :: : ::.:: :. :. .::..: ..
CCDS45 EETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFLQFTTGTDRAPVGGLGKLKMIIAKN
780 790 800 810 820 830
1020 1030 1040 1050
pF1KE4 GGGEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
: : ::.::::::.: ::.:. :: :. .:..:: . .::...
CCDS45 GPDTERLPTSHTCFNVLLLPEYSSKEKLKERLLKAITYAKGFGML
840 850 860 870
>>CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 (986 aa)
initn: 2020 init1: 586 opt: 912 Z-score: 1067.9 bits: 209.2 E(32554): 3.7e-53
Smith-Waterman score: 2157; 36.9% identity (65.4% similar) in 1065 aa overlap (2-1054:3-978)
10 20 30 40 50
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG
.::: : .: :. :.. . .. ... : ::....: . : .::
CCDS54 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG
10 20 30 40
60 70 80 90 100 110
pF1KE4 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG
:. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.::::
CCDS54 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE4 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK
. .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . .
CCDS54 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE4 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN
:.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . :
CCDS54 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE4 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS
. .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . .
CCDS54 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE4 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP
.:..: :: :: :.: ..:.. ::: : ..::. : .. : .. .::
CCDS54 LVSQIDCGSYHTLAYVHTTGQVVSFGHG------PSDTSKPTHPEALTEN---FDISCL-
290 300 310 320 330
360 370 380 390 400 410
pF1KE4 DIDSEEYF--CVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL
:..:.. ::.::.: .: .. :. .. : :. : .: ..... .::.
CCDS54 -ISAEDFVDVQVKHIFAGTYANF--VTTHQD---TSSTRAPGKTLPEISRISQSMAEKWI
340 350 360 370 380 390
420 430 440 450 460
pF1KE4 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK
. :.: .:: ::: .::..::: . :: : ::.. :: :.:
CCDS54 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK
400 410 420 430 440
470 480 490 500 510 520
pF1KE4 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF
: . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....::
CCDS54 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF
450 460 470 480 490 500
530 540 550 560 570 580
pF1KE4 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS
. :. .. : :.::.. :. :. . .....: ... .::. : .:. :
CCDS54 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN-
510 520 530 540 550
590 600 610 620 630 640
pF1KE4 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGL
... : ... ::.:: : . . . : :.:...:. : ::. .: :: .
CCDS54 -VKALLGMMKELHKVN-KANCRLPENTFNINELSNLL---NFYIDRGRQLFRD---NHLM
560 570 580 590 600 610
650 660 670 680 690 700
pF1KE4 TELADIPVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIESVNPC
.: :. .:. ...:: . :. : : .:
CCDS54 SE------------------KKAYMLMHETILQKK---DE---------FPP-----SPR
620 630
710 720 730 740 750 760
pF1KE4 LILVVRRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDP
.:: ::: .: ::.. : ... :. : : : :..: ..::: .::: ...:. :
CCDS54 FILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTKP
640 650 660 670 680 690
770 780 790 800 810 820
pF1KE4 KYGMFRYYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKK
.:::: : : . .:: : .. . :.:..:::...: ....: :::::::::: .:
CCDS54 EYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQK
700 710 720 730 740 750
830 840 850 860 870 880
pF1KE4 PSLDDLKELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAV
:::.::::: : .:.:.:..:: ::: ...:. :.: .. ..: .:. :: . :
CCDS54 PSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSI---HWDQNDV-DLIPNGISIPV
760 770 780 790 800 810
890 900 910 920 930 940
pF1KE4 NKQNRQEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYD
.. :....:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.::
CCDS54 DQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDYD
820 830 840 850 860 870
950 960 970 980 990 1000
pF1KE4 WKELEKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLV
::..:.:..:. : ::::..::..::.: :..::.::.:::: ::. :......:
CCDS54 WKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEIV
880 890 900 910 920 930
1010 1020 1030 1040 1050
pF1KE4 IQSTGG-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
.. .:. :.: :: :.:.::::. : .. : ::..:.::
CCDS54 FRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS
940 950 960 970 980
>>CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022 aa)
initn: 1762 init1: 586 opt: 912 Z-score: 1067.6 bits: 209.2 E(32554): 3.8e-53
Smith-Waterman score: 2276; 37.5% identity (66.7% similar) in 1066 aa overlap (2-1054:3-1014)
10 20 30 40 50
pF1KE4 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG
.::: : .: :. :.. . .. ... : ::....: . : .::
CCDS47 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG
10 20 30 40
60 70 80 90 100 110
pF1KE4 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG
:. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.::::
CCDS47 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE4 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK
. .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . .
CCDS47 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE4 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN
:.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . :
CCDS47 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE4 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS
. .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . .
CCDS47 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE4 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP
.:..: :: :: :.: ..:.. ::: : ..::. : .. : .. .::
CCDS47 LVSQIDCGSYHTLAYVHTTGQVVSFGHG------PSDTSKPTHPEALTEN---FDISCL-
290 300 310 320 330
360 370 380 390 400 410
pF1KE4 DIDSEEYF--CVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL
:..:.. ::.::.: .: .. :. .. : :. : .: ..... .::.
CCDS47 -ISAEDFVDVQVKHIFAGTYANF--VTTHQD---TSSTRAPGKTLPEISRISQSMAEKWI
340 350 360 370 380 390
420 430 440 450 460
pF1KE4 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK
. :.: .:: ::: .::..::: . :: : ::.. :: :.:
CCDS47 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK
400 410 420 430 440
470 480 490 500 510 520
pF1KE4 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF
: . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....::
CCDS47 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF
450 460 470 480 490 500
530 540 550 560 570 580
pF1KE4 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS
. :. .. : :.::.. :. :. . .....: ... .::. : .:. :
CCDS47 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN-
510 520 530 540 550
590 600 610 620 630 640
pF1KE4 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGL
... : ... ::.:: : . . . : :.:...:. : ::. .: :: .
CCDS47 -VKALLGMMKELHKVN-KANCRLPENTFNINELSNLL---NFYIDRGRQLFRD---NHLI
560 570 580 590 600 610
650 660 670 680 690 700
pF1KE4 TELADIPVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIE-SVNP
. :: . .::.:.. .: :::.:. ..:::. .:. ... : .:
CCDS47 PAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSP
620 630 640 650 660 670
710 720 730 740 750 760
pF1KE4 CLILVVRRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLD
.:: ::: .: ::.. : ... :. : : : :..: ..::: .::: ...:.
CCDS47 RFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTK
680 690 700 710 720 730
770 780 790 800 810 820
pF1KE4 PKYGMFRYYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKK
:.:::: : : . .:: : .. . :.:..:::...: ....: :::::::::: .
CCDS47 PEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQ
740 750 760 770 780 790
830 840 850 860 870 880
pF1KE4 KPSLDDLKELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTA
::::.::::: : .:.:.:..:: ::: ...:. :.: .. ..: .:. :: .
CCDS47 KPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSI---HWDQNDV-DLIPNGISIP
800 810 820 830 840
890 900 910 920 930 940
pF1KE4 VNKQNRQEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNY
:.. :....:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.:
CCDS47 VDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDY
850 860 870 880 890 900
950 960 970 980 990 1000
pF1KE4 DWKELEKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKL
:::..:.:..:. : ::::..::..::.: :..::.::.:::: ::. :......
CCDS47 DWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEI
910 920 930 940 950 960
1010 1020 1030 1040 1050
pF1KE4 VIQSTGG-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI
:.. .:. :.: :: :.:.::::. : .. : ::..:.::
CCDS47 VFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS
970 980 990 1000 1010 1020
1057 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:24:45 2016 done: Sun Nov 6 01:24:46 2016
Total Scan time: 4.300 Total Display time: 0.360
Function used was FASTA [36.3.4 Apr, 2011]