FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4255, 1022 aa 1>>>pF1KE4255 1022 - 1022 aa - 1022 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8189+/-0.00102; mu= 18.7228+/- 0.061 mean_var=72.8849+/-14.506, 0's: 0 Z-trim(104.4): 77 B-trim: 7 in 1/48 Lambda= 0.150230 statistics sampled from 7815 (7893) to 7815 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.611), E-opt: 0.2 (0.242), width: 16 Scan time: 4.600 The best scores are: opt bits E(32554) CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022) 6881 1501.4 0 CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 ( 986) 4076 893.5 0 CCDS3630.1 HERC5 gene_id:51191|Hs108|chr4 (1024) 3158 694.5 2.9e-199 CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 1024 232.0 5e-60 CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 1009 228.6 1.9e-59 CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 ( 979) 912 207.7 9.6e-53 CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049) 912 207.7 1e-52 CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057) 912 207.7 1e-52 CCDS32177.1 UBE3A gene_id:7337|Hs108|chr15 ( 852) 802 183.9 1.3e-45 CCDS45191.1 UBE3A gene_id:7337|Hs108|chr15 ( 872) 802 183.9 1.3e-45 CCDS45192.1 UBE3A gene_id:7337|Hs108|chr15 ( 875) 802 183.9 1.3e-45 CCDS45876.1 NEDD4L gene_id:23327|Hs108|chr18 ( 834) 528 124.5 9.4e-28 CCDS45875.1 NEDD4L gene_id:23327|Hs108|chr18 ( 854) 528 124.5 9.6e-28 CCDS34690.1 SMURF1 gene_id:57154|Hs108|chr7 ( 757) 527 124.2 1e-27 CCDS58632.1 NEDD4L gene_id:23327|Hs108|chr18 ( 911) 528 124.5 1e-27 CCDS59323.1 NEDD4L gene_id:23327|Hs108|chr18 ( 947) 528 124.5 1e-27 CCDS45873.1 NEDD4L gene_id:23327|Hs108|chr18 ( 955) 528 124.5 1.1e-27 CCDS45874.1 NEDD4L gene_id:23327|Hs108|chr18 ( 967) 528 124.5 1.1e-27 CCDS45872.1 NEDD4L gene_id:23327|Hs108|chr18 ( 975) 528 124.5 1.1e-27 CCDS34689.1 SMURF1 gene_id:57154|Hs108|chr7 ( 731) 524 123.6 1.5e-27 CCDS32707.1 SMURF2 gene_id:64750|Hs108|chr17 ( 748) 522 123.2 2.1e-27 CCDS45265.1 NEDD4 gene_id:4734|Hs108|chr15 ( 900) 499 118.2 7.8e-26 CCDS10156.1 NEDD4 gene_id:4734|Hs108|chr15 (1247) 499 118.3 1e-25 CCDS61643.1 NEDD4 gene_id:4734|Hs108|chr15 (1303) 499 118.3 1.1e-25 CCDS61644.1 NEDD4 gene_id:4734|Hs108|chr15 (1319) 499 118.3 1.1e-25 CCDS14246.1 RPGR gene_id:6103|Hs108|chrX ( 815) 493 116.9 1.8e-25 CCDS35229.1 RPGR gene_id:6103|Hs108|chrX (1152) 493 116.9 2.4e-25 CCDS73571.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 527) 473 112.5 2.4e-24 CCDS9411.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 551) 473 112.5 2.5e-24 CCDS73572.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 556) 473 112.5 2.6e-24 CCDS58477.1 WWP2 gene_id:11060|Hs108|chr16 ( 431) 462 110.0 1.1e-23 CCDS58476.1 WWP2 gene_id:11060|Hs108|chr16 ( 754) 462 110.2 1.7e-23 CCDS10885.1 WWP2 gene_id:11060|Hs108|chr16 ( 870) 462 110.2 2e-23 CCDS9418.1 RCBTB1 gene_id:55213|Hs108|chr13 ( 531) 451 107.7 6.7e-23 CCDS5050.1 HACE1 gene_id:57531|Hs108|chr6 ( 909) 454 108.5 6.8e-23 CCDS77499.1 HECW2 gene_id:57520|Hs108|chr2 (1216) 455 108.7 7.6e-23 CCDS33354.1 HECW2 gene_id:57520|Hs108|chr2 (1572) 455 108.8 9.5e-23 CCDS58769.1 ITCH gene_id:83737|Hs108|chr20 ( 752) 447 106.9 1.7e-22 CCDS13234.1 ITCH gene_id:83737|Hs108|chr20 ( 862) 447 106.9 1.9e-22 CCDS58768.1 ITCH gene_id:83737|Hs108|chr20 ( 903) 447 106.9 1.9e-22 CCDS69286.1 HECW1 gene_id:23072|Hs108|chr7 (1572) 421 101.4 1.6e-20 CCDS5469.2 HECW1 gene_id:23072|Hs108|chr7 (1606) 421 101.4 1.6e-20 CCDS35301.1 HUWE1 gene_id:10075|Hs108|chrX (4374) 413 99.8 1.3e-19 CCDS5577.1 RCC1L gene_id:81554|Hs108|chr7 ( 464) 397 96.0 2e-19 CCDS7414.1 HECTD2 gene_id:143279|Hs108|chr10 ( 776) 390 94.6 8.9e-19 CCDS60591.1 HECTD2 gene_id:143279|Hs108|chr10 ( 780) 390 94.6 8.9e-19 CCDS64683.1 RCC1L gene_id:81554|Hs108|chr7 ( 454) 379 92.1 2.9e-18 CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861) 376 91.8 3.6e-17 CCDS34789.1 UBE3C gene_id:9690|Hs108|chr7 (1083) 353 86.6 3.1e-16 CCDS6242.1 WWP1 gene_id:11059|Hs108|chr8 ( 922) 351 86.1 3.6e-16 >>CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022 aa) initn: 6881 init1: 6881 opt: 6881 Z-score: 8051.8 bits: 1501.4 E(32554): 0 Smith-Waterman score: 6881; 100.0% identity (100.0% similar) in 1022 aa overlap (1-1022:1-1022) 10 20 30 40 50 60 pF1KE4 MYFCWGADSRELQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCGDNSRGQLGRRGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MYFCWGADSRELQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCGDNSRGQLGRRGA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 QRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLGIGEFKEISFTPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLGIGEFKEISFTPK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 KIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPSQASPQRVRSLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPSQASPQRVRSLEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 IPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPLSVGALKNLGVVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPLSVGALKNLGVVY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLVERIDGLVSQIDCGSYHTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLVERIDGLVSQIDCGSYHTL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 AYVHTTGQVVSFGHGPSDTSKPTHPEALTENFDISCLISAEDFVDVQVKHIFAGTYANFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AYVHTTGQVVSFGHGPSDTSKPTHPEALTENFDISCLISAEDFVDVQVKHIFAGTYANFV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 TTHQDTSSTRAPGKTLPEISRISQSMAEKWIAVKRRSTEHEMAKSEIRMIFSSPACLTAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TTHQDTSSTRAPGKTLPEISRISQSMAEKWIAVKRRSTEHEMAKSEIRMIFSSPACLTAS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 FLKKRGTGETTSIDVDLEMARDTFKKLTKKEWISSMITTCLEDDLLRALPCHSPHQEALS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FLKKRGTGETTSIDVDLEMARDTFKKLTKKEWISSMITTCLEDDLLRALPCHSPHQEALS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 VFLLLPECPVMHDSKNWKNLVVPFAKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VFLLLPECPVMHDSKNWKNLVVPFAKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 AIISQLLHQTKTEQDHCNVKALLGMMKELHKVNKANCRLPENTFNINELSNLLNFYIDRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AIISQLLHQTKTEQDHCNVKALLGMMKELHKVNKANCRLPENTFNINELSNLLNFYIDRG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 RQLFRDNHLIPAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RQLFRDNHLIPAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETIL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 QKKDEFPPSPRFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QKKDEFPPSPRFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEF 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 FHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFP 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 LALYKKLLDQKPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQNDVDLIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LALYKKLLDQKPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQNDVDLIP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 NGISIPVDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NGISIPVDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAI 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 IGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 IQKMEIVFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IQKMEIVFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLT 970 980 990 1000 1010 1020 pF1KE4 QS :: CCDS47 QS >>CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 (986 aa) initn: 4076 init1: 4076 opt: 4076 Z-score: 4766.5 bits: 893.5 E(32554): 0 Smith-Waterman score: 6564; 96.5% identity (96.5% similar) in 1022 aa overlap (1-1022:1-986) 10 20 30 40 50 60 pF1KE4 MYFCWGADSRELQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCGDNSRGQLGRRGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MYFCWGADSRELQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCGDNSRGQLGRRGA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 QRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLGIGEFKEISFTPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLGIGEFKEISFTPK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 KIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPSQASPQRVRSLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPSQASPQRVRSLEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 IPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPLSVGALKNLGVVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPLSVGALKNLGVVY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLVERIDGLVSQIDCGSYHTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLVERIDGLVSQIDCGSYHTL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 AYVHTTGQVVSFGHGPSDTSKPTHPEALTENFDISCLISAEDFVDVQVKHIFAGTYANFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AYVHTTGQVVSFGHGPSDTSKPTHPEALTENFDISCLISAEDFVDVQVKHIFAGTYANFV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 TTHQDTSSTRAPGKTLPEISRISQSMAEKWIAVKRRSTEHEMAKSEIRMIFSSPACLTAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TTHQDTSSTRAPGKTLPEISRISQSMAEKWIAVKRRSTEHEMAKSEIRMIFSSPACLTAS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 FLKKRGTGETTSIDVDLEMARDTFKKLTKKEWISSMITTCLEDDLLRALPCHSPHQEALS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 FLKKRGTGETTSIDVDLEMARDTFKKLTKKEWISSMITTCLEDDLLRALPCHSPHQEALS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 VFLLLPECPVMHDSKNWKNLVVPFAKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VFLLLPECPVMHDSKNWKNLVVPFAKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 AIISQLLHQTKTEQDHCNVKALLGMMKELHKVNKANCRLPENTFNINELSNLLNFYIDRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AIISQLLHQTKTEQDHCNVKALLGMMKELHKVNKANCRLPENTFNINELSNLLNFYIDRG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 RQLFRDNHLIPAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETIL ::::::::: ::::::::::::::: CCDS54 RQLFRDNHL------------------------------------MSEKKAYMLMHETIL 610 620 670 680 690 700 710 720 pF1KE4 QKKDEFPPSPRFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QKKDEFPPSPRFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEF 630 640 650 660 670 680 730 740 750 760 770 780 pF1KE4 FHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 FHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFP 690 700 710 720 730 740 790 800 810 820 830 840 pF1KE4 LALYKKLLDQKPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQNDVDLIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LALYKKLLDQKPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQNDVDLIP 750 760 770 780 790 800 850 860 870 880 890 900 pF1KE4 NGISIPVDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NGISIPVDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAI 810 820 830 840 850 860 910 920 930 940 950 960 pF1KE4 IGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARG 870 880 890 900 910 920 970 980 990 1000 1010 1020 pF1KE4 IQKMEIVFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IQKMEIVFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLT 930 940 950 960 970 980 pF1KE4 QS :: CCDS54 QS >>CCDS3630.1 HERC5 gene_id:51191|Hs108|chr4 (1024 aa) initn: 3054 init1: 1754 opt: 3158 Z-score: 3690.9 bits: 694.5 E(32554): 2.9e-199 Smith-Waterman score: 3181; 49.8% identity (74.3% similar) in 1017 aa overlap (18-1014:26-1023) 10 20 30 40 pF1KE4 MYFCWGADSRELQRRRTAGSPGAEL--LQAASGERHSLLLLTN-HRVLSCGD : ::::.: . .:.: ...:: .. : : :. CCDS36 MERRSRRKSRRNGRSTAGKAAATQPAKSPGAQLWLFPSAAGLHRALLRRVEVTRQLCCSP 10 20 30 40 50 60 50 60 70 80 90 pF1KE4 NSRGQLGRRGA--QRGEL---------PEPIQALETLIVDLVSCGKEHSLAVCHKGRVFA . . : : :: : .: :. :. ... . :. : :: : . :. : CCDS36 GRLAVLERGGAGVQVHQLLAGSGGARTPKCIKLGKNMKIHSVDQGAEHMLILSSDGKPFE 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 WGAGSEGQLGIGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHG . : .: .:. : :.. ::::..:: :::::::: ...:.::.: :: CCDS36 YDNYSMKHL---RFESI---------LQEKKIIQITCGDYHSLALSKGGELFAWGQNLHG 130 140 150 160 160 170 180 190 200 210 pF1KE4 QLGLGKEFPSQASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGR :::.:..::: ..:: :. : :.::::..:: :::.:::. :. ..::.: :::.:. CCDS36 QLGVGRKFPSTTTPQIVEHLAGVPLAQISAGEAHSMALSMSGNIYSWGKNECGQLGLGHT 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE4 NVPVQSNKPLSVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRG . ... : . .: : : ...:: .:.:.::::: .:::: .. ::::.. : .. CCDS36 E---SKDDPSLIEGLDNQKVEFVACGGSHSALLTQDGLLFTFGAGKHGQLGHNSTQNELR 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE4 PQLVERIDGL-VSQIDCGSYHTLAYVHTTGQVVSFGHGPSDT--SKPTHPEALTENFDIS : :: .. : :.:: :: .:::::: :.: ::: : . . :. . . .: CCDS36 PCLVAELVGYRVTQIACGRWHTLAYVSDLGKVFSFGSGKDGQLGNGGTRDQLMPLPVKVS 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 CL--ISAEDFVDVQVKHIFAGTYANFVTTHQDTSSTRAPGKTLPEISRISQSMAEKWIAV .. :. .. . ..:: ... . .: .:.: . ... ...::: CCDS36 SSEELKLESHTSEKELIMIAGGNQSILLWIKKENSYVNLKRTIPTL---NEGTVKRWIA- 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE4 KRRSTEHEMAKSEIRMIFSSPACLTASFLKKRGTGETTSIDVDLEMARDTFKKLTKKEWI .. . . .: ::. :::::::::.:::.:: : : . .::. ::. ::.::.:.:: CCDS36 DVETKRWQSTKREIQEIFSSPACLTGSFLRKRRTTEMMPVYLDLNKARNIFKELTQKDWI 410 420 430 440 450 460 460 470 480 490 500 510 pF1KE4 SSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPFAKAVCEMSK ..::::::.:.::. :: ::: :::: .:.::::::.:: :.::..:::::::.::.:: CCDS36 TNMITTCLKDNLLKRLPFHSPPQEALEIFFLLPECPMMHISNNWESLVVPFAKVVCKMSD 470 480 490 500 510 520 520 530 540 550 560 570 pF1KE4 QSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTKTEQDHCNVKALLGMMKELHKVN :: ::.. :: ::::... :.::.:.:.: :: . .. ... ::.::: :.:.::.:: CCDS36 QSSLVLEEYWATLQESTFSKLVQMFKTAVICQLDYWDESAEENGNVQALLEMLKKLHRVN 530 540 550 560 570 580 580 590 600 610 620 630 pF1KE4 KANCRLPENTFNINELSNLLNFYIDRGRQLFRDNHLIPAET-PSPVIFSDFPFIFNSLSK ...:.:::. :...:: . :::... :. . . .:. :::: ::::::.::: CCDS36 QVKCQLPESIFQVDELLHRLNFFVEVCRRYLWKMTVDASENVQCCVIFSHFPFIFNNLSK 590 600 610 620 630 640 640 650 660 670 680 690 pF1KE4 IKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSPRFILRVRRSRLVKDALRQLSQA ::::..:. .:.. ...:::. ....:: : : : :::..:..:.: :::: CCDS36 IKLLHTDTLLKIESKKHKAYLRSAAIEEERESEFALRPTFDLTVRRNHLIEDVLNQLSQF 650 660 670 680 690 700 700 710 720 730 740 750 pF1KE4 EATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPK : :. : : : : .:: . :::..:::.:.: :: .:::::::::: .::::::.::: CCDS36 ENEDLRKELWVSFSGEIGYDLGGVKKEFFYCLFAEMIQPEYGMFMYPEGASCMWFPVKPK 710 720 730 740 750 760 760 770 780 790 800 810 pF1KE4 PEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQKPSLEDLKELSPRLGKSLQEVL ::::::.::.:::::::: :::::::::::.:::::: ::::::::::: :::.:: .: CCDS36 FEKKRYFFFGVLCGLSLFNCNVANLPFPLALFKKLLDQMPSLEDLKELSPDLGKNLQTLL 770 780 790 800 810 820 820 830 840 850 860 870 pF1KE4 DDAADDIGDALCIRFSIHWDQNDVDLIPNGISIPVDQTNKRDYVSKYIDYIFNVSVKAVY :: .:.. ... :.:..:::.::..::::: :: :.::::::::::::.:::: :::::: CCDS36 DDEGDNFEEVFYIHFNVHWDRNDTNLIPNGSSITVNQTNKRDYVSKYINYIFNDSVKAVY 830 840 850 860 870 880 880 890 900 910 920 930 pF1KE4 EEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFW :::.::::..:...:.. :.:::: .:.:::::::: ::.:..:: ::..::::: .:: CCDS36 EEFRRGFYKMCDEDIIKLFHPEELKDVIVGNTDYDWKTFEKNARYEPGYNSSHPTIVMFW 890 900 910 920 930 940 940 950 960 970 980 990 pF1KE4 KAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEIVFRCPETFSERDHPTSITCHNILSLP ::::::::.:::::: :::: :::. . ...:.:.: :::...::: ..:: ..: :: CCDS36 KAFHKLTLEEKKKFLVFLTGTDRLQMKDLNNMKITFCCPESWNERDPIRALTCFSVLFLP 950 960 970 980 990 1000 1000 1010 1020 pF1KE4 KYSTMERMEEALQVAINNNRGFVSPMLTQS :::::: .::::: :::::::: CCDS36 KYSTMETVEEALQEAINNNRGFG 1010 1020 >>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa) initn: 1777 init1: 676 opt: 1024 Z-score: 1191.1 bits: 232.0 E(32554): 5e-60 Smith-Waterman score: 2319; 39.2% identity (68.2% similar) in 1018 aa overlap (27-1014:38-1047) 10 20 30 40 50 pF1KE4 MYFCWGADSRELQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCGDNSRGQLG ..: : ::..:: . .: .:: :..:::: CCDS34 SLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGLNTKGQLG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 RRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLGIGEFKEIS .. ..:. :: : :: . :.::. ::::. .:..:.:::::.::::. .. CCDS34 HE--REGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMTTEDSV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 FTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPSQASPQRVR .:. :. ::. :.:::::..: :::. :.: :.::::::::::::::::::::::::: CCDS34 AVPRLIQKLNQQTILQVSCGNWHCLALAADGQFFTWGKNSHGQLGLGKEFPSQASPQRVR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPLSVGALKNL :::::::::::::::::::::: :. :::: :.::::.:: .. . ..: : :.. CCDS34 SLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEK---DRESPCHVKLLRTQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 GVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDGLVSQIDCG :::::::. ::::::..: ::::: . ::::.. .. .:. : : . . :.:: :: CCDS34 KVVYISCGEEHTAVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIACG 250 260 270 280 290 300 300 310 320 330 340 pF1KE4 SYHTLAYVHTTGQVVSFGHGPS---------DTSKPTHPEALTENFDISCLISAEDFVDV ::::.: ..: . .:: : ... :. .. . . :. : CCDS34 RQHTLAFVPSSGLIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARADRFKYH 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE4 QVKHIFAGTYANFVT-THQDTSSTRAPGKTLPEISRISQSMAEKWIAVKRRS-TEHEMAK ::.::.: .:: .. .. : . .:. . .. .. . .. ::: :.. .::. :. CCDS34 IVKQIFSGGDQTFVLCSKYENYSPAVDFRTMNQ-AHYTSLINDETIAVWRQKLSEHNNAN 370 380 390 400 410 420 410 420 430 440 450 pF1KE4 S--EIRMIFSSPACLTASFLKKR-GTGETTSIDV---DLEMARDTFKKL--TKKEWISSM . . .:.:: :: ..:::.:. :: . ::. .: :.:: ... : . CCDS34 TINGVVQILSSAACWNGSFLEKKIDEHFKTSPKIPGIDLNSTRVLFEKLMNSQHSMILEQ 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE4 ITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPFAKAVCEMSKQSL : . .:. :. : : ::. ..:.::: :...::: . .:..:.: :. ... . CCDS34 ILNSFESCLIPQLSSSPPDVEAMRIYLILPEFPLLQDSKYYITLTIPLAMAILRLDTNPS 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE4 QVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTKTEQD----HCNVKALLGMMKELHKV .:: . :. . . . :... :.:.. ::. :: . . : : ....:.:: CCDS34 KVLDNWWSQVCPKYFMKLVNLYKGAVL-YLLRGRKTFLIPVLFNNYITAALKLLEKLYKV 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE4 NKANCRLPENTFNINELSNLLNFYIDRGRQLFRDNHLI--PAETPSPVIFSDFPFIFNSL : .. .:: : :.:::... : .... . :. . : . ..::::.. CCDS34 NLKVKHVEYDTFYIPEISNLVDIQEDYLMWFLHQAGMKARPSIIQDTVTLCSYPFIFDAQ 610 620 630 640 650 660 640 650 660 670 680 690 pF1KE4 SKIKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSPRFILRVRRSRLVKDALRQLS .: :.::.:....::.. . : . .: . . :: ..:.:::. :: ::::.:: CCDS34 AKTKMLQTDAELQMQVAVNGANLQNVFMLLTLEPLLARSPFLVLHVRRNNLVGDALRELS 670 680 690 700 710 720 700 710 720 730 740 750 pF1KE4 QAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTKPEYGMFMYPEMGSCMWFPAK :. : : : : .: ..:::..::: ...:. .: :::: : . .. .:: CCDS34 IHSDIDLKKPLKVIFDGEEAVDAGGVTKEFFLLLLKELLNPIYGMFTYYQDSNLLWFSDT 730 740 750 760 770 780 760 770 780 790 800 810 pF1KE4 PKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQKPSLEDLKELSPRLGKSLQE :.. . :.:. :::...: .:..: ::::::::::. ::.::::::::: :.:::: CCDS34 CFVEHNWFHLIGITCGLAIYNSTVVDLHFPLALYKKLLNVKPGLEDLKELSPTEGRSLQE 790 800 810 820 830 840 820 830 840 850 860 pF1KE4 VLDDAADDIGDALCIRFSIHWDQNDV----DLIPNGISIPVDQTNKRDYVSKYIDYIFNV .:: ..:. ...:. :.: .. : :::.: .. : . :....:. :..:.:.. CCDS34 LLDYPGEDVEETFCLNFTICRESYGVIEQKKLIPGGDNVTVCKDNRQEFVDAYVNYVFQI 850 860 870 880 890 900 870 880 890 900 910 920 pF1KE4 SVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDYDWKQFEQNSKYEQGYQKSHP ::. : :. :: .:: ..:. : : :: . ..::..:.:...:... :. :. .:: CCDS34 SVHEWYTAFSSGFLKVCGGKVLELFQPSELRAMMVGNSNYNWEELEETAIYKGDYSATHP 910 920 930 940 950 960 930 940 950 960 970 980 pF1KE4 TIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEIVFRCPETFSERDHPTSITCH :..:::..::.. :..:::::.:::: ::. :. ...::.. . .:. :.. ::. CCDS34 TVKLFWETFHEFPLEKKKKFLLFLTGSDRIPIYGMASLQIVIQSTAS-GEEYLPVAHTCY 970 980 990 1000 1010 990 1000 1010 1020 pF1KE4 NILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS :.:.:::::. : . : :..: .:: CCDS34 NLLDLPKYSSKEILSARLTQALDNYEGFSLA 1020 1030 1040 1050 >>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa) initn: 906 init1: 676 opt: 1009 Z-score: 1180.7 bits: 228.6 E(32554): 1.9e-59 Smith-Waterman score: 1009; 54.1% identity (76.2% similar) in 290 aa overlap (27-315:38-322) 10 20 30 40 50 pF1KE4 MYFCWGADSRELQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCGDNSRGQLG ..: : ::..:: . .: .:: :..:::: CCDS82 SLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGLNTKGQLG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 RRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLGIGEFKEIS .. ..:. :: : :: . :.::. ::::. .:..:.:::::.::::. .. CCDS82 HE--REGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMTTEDSV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 FTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPSQASPQRVR .:. :. ::. :.:::::..: :::. :.: :.::::::::::::::::::::::::: CCDS82 AVPRLIQKLNQQTILQVSCGNWHCLALAADGQFFTWGKNSHGQLGLGKEFPSQASPQRVR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPLSVGALKNL :::::::::::::::::::::: :. :::: :.::::.:: .. . ..: : :.. CCDS82 SLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEK---DRESPCHVKLLRTQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 GVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDGLVSQIDCG :::::::. ::::::..: ::::: . ::::.. .. .:. : : . . :.:: :: CCDS82 KVVYISCGEEHTAVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIACG 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 SYHTLAYVHTTGQVVSFGHGPSDTSKPTHPEALTENFDISCLISAEDFVDVQVKHIFAGT ::::.: ..: . .:: : CCDS82 RQHTLAFVPSSGLIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARAGKNDCL 310 320 330 340 350 360 >>CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 (979 aa) initn: 1481 init1: 586 opt: 912 Z-score: 1060.4 bits: 207.7 E(32554): 9.6e-53 Smith-Waterman score: 1871; 34.5% identity (61.4% similar) in 1062 aa overlap (3-1014:2-976) 10 20 30 40 pF1KE4 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG .::: : .: :. :.. . .. ... : ::....: . : .:: CCDS60 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG 10 20 30 40 50 50 60 70 80 90 100 pF1KE4 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG :. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.:::: CCDS60 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS . .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . . CCDS60 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL :.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . : CCDS60 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG . .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . . CCDS60 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS 240 250 260 270 280 290 290 300 310 320 330 pF1KE4 LVSQIDCGSYHTLAYVHTTGQVVSFGHGPS------DTSKPTHPEALTEN---FDISCL- .:..: :: :: :.: ..:.. ::: : . .::. : .. : .. .:: CCDS60 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 -ISAEDFVDVQVKHIFAGTYANF--VTTHQDTSST---RAPGKTLPEISRISQSMAEKWI :..:.. ::.::.: .: .. :. . : :. : .: ..... .::. CCDS60 DIDSEEY--FCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL 360 370 380 390 400 410 400 410 420 430 440 pF1KE4 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK . :.: .:: ::: .::..::: . :: : ::.. :: :.: CCDS60 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK 420 430 440 450 460 450 460 470 480 490 500 pF1KE4 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF : . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....:: CCDS60 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF 470 480 490 500 510 520 510 520 530 540 550 pF1KE4 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN- . :. .. : :.::.. :. :. . .....: ... .::. : .:. : CCDS60 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE4 -VKALLGMMKELHKVNKANCRLPE-NTFNINELSNLLNF---YIDRGRQLFRD---NHLI ... : ... ::.::. .. . . : :.:...:... ::. .: :: . CCDS60 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGL 590 600 610 620 630 640 620 630 640 650 660 670 pF1KE4 PAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSP . :: . .::.:.. .: :::.:. ..:::. .:. ... : .: CCDS60 TELADIPVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIE-SVNP 650 660 670 680 690 700 680 690 700 710 720 730 pF1KE4 RFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTK .:: ::: .: ::.. : ... :. : : : :..: ..::: .::: ...:. CCDS60 CLILVVRRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLD 710 720 730 740 750 760 740 750 760 770 780 790 pF1KE4 PEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQ :.:::: : : . .:: : :. :: CCDS60 PKYGMFRYYEDSRLIWFSDKITVEN-----FGAT-------------------------- 770 780 790 800 810 820 830 840 850 pF1KE4 KPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQNDVDLIPNGISIPVDQT ..::: :: :: . :.. CCDS60 -----EVKEL----------VL----------------------------NGADTAVNKQ 800 810 860 870 880 890 900 910 pF1KE4 NKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDYDWKQ :....:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.::::. CCDS60 NRQEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKE 820 830 840 850 860 870 920 930 940 950 960 970 pF1KE4 FEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEIVFRC .:.:..:. : ::::..::..::.: :..::.::.:::: ::. :......:.. CCDS60 LEKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQS 880 890 900 910 920 930 980 990 1000 1010 1020 pF1KE4 PETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS .:. :.: :: :.:.::::. : .. : ::..:.:: CCDS60 TGG-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI 940 950 960 970 >>CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049 aa) initn: 1762 init1: 586 opt: 912 Z-score: 1060.0 bits: 207.7 E(32554): 1e-52 Smith-Waterman score: 2275; 37.3% identity (67.1% similar) in 1060 aa overlap (3-1014:2-1046) 10 20 30 40 pF1KE4 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG .::: : .: :. :.. . .. ... : ::....: . : .:: CCDS72 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG 10 20 30 40 50 50 60 70 80 90 100 pF1KE4 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG :. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.:::: CCDS72 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS . .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . . CCDS72 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL :.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . : CCDS72 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG . .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . . CCDS72 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS 240 250 260 270 280 290 290 300 310 320 330 pF1KE4 LVSQIDCGSYHTLAYVHTTGQVVSFGHGPS------DTSKPTHPEALTEN---FDISCL- .:..: :: :: :.: ..:.. ::: : . .::. : .. : .. .:: CCDS72 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 -ISAEDFVDVQVKHIFAGTYANF--VTTHQDTSST---RAPGKTLPEISRISQSMAEKWI :..:.. ::.::.: .: .. :. . : :. : .: ..... .::. CCDS72 DIDSEEY--FCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL 360 370 380 390 400 410 400 410 420 430 440 pF1KE4 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK . :.: .:: ::: .::..::: . :: : ::.. :: :.: CCDS72 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK 420 430 440 450 460 450 460 470 480 490 500 pF1KE4 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF : . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....:: CCDS72 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF 470 480 490 500 510 520 510 520 530 540 550 pF1KE4 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN- . :. .. : :.::.. :. :. . .....: ... .::. : .:. : CCDS72 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE4 -VKALLGMMKELHKVNKANCRLPE-NTFNINELSNLLNFYIDRGRQLFRDNHLIPAETPS ... : ... ::.::. .. . . : :.:...:... : . .. . . :. CCDS72 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMLADI-- 590 600 610 620 630 640 620 630 640 650 660 670 pF1KE4 PVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSPRFILRV :: . .::.:.. .: :::.:. ..:::. .:. ... : .: .:: : CCDS72 PVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIE-SVNPCLILVV 650 660 670 680 690 700 680 690 700 710 720 730 pF1KE4 RRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTKPEYGMF :: .: ::.. : ... :. : : : :..: ..::: .::: ...:. :.:::: CCDS72 RRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLDPKYGMF 710 720 730 740 750 760 740 750 760 770 780 790 pF1KE4 MYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQKPSLED : : . .:: : .. . :.:..:::...: ....: :::::::::: .::::.: CCDS72 RYYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKKKPSLDD 770 780 790 800 810 820 800 810 820 830 840 850 pF1KE4 LKELSPRLGKSLQEVLDDAADDIGDALCIRFSI---HWDQNDV-DLIPNGISIPVDQTNK :::: : .:.:.:..:: ::: ...:. :.: .. ..: .:. :: . :.. :. CCDS72 LKELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTAVNKQNR 830 840 850 860 870 880 860 870 880 890 900 910 pF1KE4 RDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDYDWKQFE ...:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.::::..: CCDS72 QEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNYDWKELE 890 900 910 920 930 940 920 930 940 950 960 970 pF1KE4 QNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEIVFRCPE .:..:. : ::::..::..::.: :..::.::.:::: ::. :......:.. CCDS72 KNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKLVIQSTG 950 960 970 980 990 1000 980 990 1000 1010 1020 pF1KE4 TFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS .:. :.: :: :.:.::::. : .. : ::..:.:: CCDS72 G-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI 1010 1020 1030 1040 >>CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057 aa) initn: 1762 init1: 586 opt: 912 Z-score: 1059.9 bits: 207.7 E(32554): 1e-52 Smith-Waterman score: 2276; 37.3% identity (66.8% similar) in 1066 aa overlap (3-1014:2-1054) 10 20 30 40 pF1KE4 MYFCWGADS----------RE--LQRRRTAGSPGAELLQAASGERHSLLLLTNHRVLSCG .::: : .: :. :.. . .. ... : ::....: . : .:: CCDS41 MLCWGNASFGQLGLGGIDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCG 10 20 30 40 50 50 60 70 80 90 100 pF1KE4 DNSRGQLGRRGAQRGELPEPIQALETLIVDLVSCGKEHSLAVCHKGRVFAWGAGSEGQLG :. ::::.. ... :: . ::.. . ::::. :.::. ::.:.::: :.:::: CCDS41 CNDLGQLGHEKSRKK--PEQVVALDAQNIVAVSCGEAHTLALNDKGQVYAWGLDSDGQLG 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 IGEFKEISFTPKKIMTLNDIKIIQVSCGHYHSLALSKDSQVFSWGKNSHGQLGLGKEFPS . .: .:..: .:.::.:.::.::.:::::::: :.:: ::.:..:::::: . . CCDS41 LVGSEECIRVPRNIKSLSDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 QASPQRVRSLEGIPLAQVAAGGAHSFALSLCGTSFGWGSNSAGQLALSGRNVPVQSNKPL :.::: ..:: :::. ::::::::::.:.: :. :::: :. :::.:. .: . : CCDS41 QTSPQLLKSLLGIPFMQVAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDEN---DRYVPN 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SVGALKNLGVVYISCGDAHTAVLTQDGKVFTFGDNRSGQLGYSPTPEKRGPQLV-ERIDG . .:.. .::: ::. :::.::..: ::::: . ::::.. : .. .:. : : . . CCDS41 LLKSLRSQKIVYICCGEDHTAALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGS 240 250 260 270 280 290 290 300 310 320 330 pF1KE4 LVSQIDCGSYHTLAYVHTTGQVVSFGHGPS------DTSKPTHPEALTEN---FDISCL- .:..: :: :: :.: ..:.. ::: : . .::. : .. : .. .:: CCDS41 IVTEIACGRQHTSAFVPSSGRIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLP 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 -ISAEDFVDVQVKHIFAGTYANF--VTTHQDTSST---RAPGKTLPEISRISQSMAEKWI :..:.. ::.::.: .: .. :. . : :. : .: ..... .::. CCDS41 DIDSEEY--FCVKRIFSGGDQSFSHYSSPQNCGPPDDFRCPNPT-KQIWTVNEALIQKWL 360 370 380 390 400 410 400 410 420 430 440 pF1KE4 AVKRRSTEHEMAKSEIRMIFSSPACLTASFLKKRG-----TGETTSIDVDLEMARDTFKK . :.: .:: ::: .::..::: . :: : ::.. :: :.: CCDS41 SYPSGRFPVEIA-NEIDGTFSSSGCLNGSFLAVSNDDHYRTGTRFS-GVDMNAARLLFHK 420 430 440 450 460 450 460 470 480 490 500 pF1KE4 LTKKE--WISSMITTCLEDDLLRALPCHSPHQEALSVFLLLPECPVMHDSKNWKNLVVPF : . . ::..... :: .:. : : ::: .: :::::.: ::.:. ....:: CCDS41 LIQPDHPQISQQVAASLEKNLIPKLTSSLPDVEALRFYLTLPECPLMSDSNNFTTIAIPF 470 480 490 500 510 520 510 520 530 540 550 pF1KE4 AKAVCEMSKQSLQVLKKCWAFLQESSLNPLIQMLKAAIISQLLHQTK-----TEQDHCN- . :. .. : :.::.. :. :. . .....: ... .::. : .:. : CCDS41 GTALVNLEKAPLKVLENWWSVLEPPLFLKIVELFKEVVV-HLLKLYKIGIPPSERRIFNS 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE4 -VKALLGMMKELHKVNKANCRLPE-NTFNINELSNLLNF---YIDRGRQLFRD---NHLI ... : ... ::.::. .. . . : :.:...:... ::. .: :: . CCDS41 FLHTALKVLEILHRVNEKMGQIIQYDKFYIHEVQELIDIRNDYINWVQQQAYGMDVNHGL 590 600 610 620 630 640 620 630 640 650 660 670 pF1KE4 PAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHETILQKKDEFPPSP . :: . .::.:.. .: :::.:. ..:::. .:. ... : .: CCDS41 TELADIPVTICTYPFVFDAQAKTTLLQTDAVLQMQMAIDQAHRQNVSSLFLPVIE-SVNP 650 660 670 680 690 700 680 690 700 710 720 730 pF1KE4 RFILRVRRSRLVKDALRQLSQAEATDFCKVLVVEFINEICPESGGVSSEFFHCMFEEMTK .:: ::: .: ::.. : ... :. : : : :..: ..::: .::: ...:. CCDS41 CLILVVRRENIVGDAMEVLRKTKNIDYKKPLKVIFVGEDAVDAGGVRKEFFLLIMRELLD 710 720 730 740 750 760 740 750 760 770 780 790 pF1KE4 PEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVANLPFPLALYKKLLDQ :.:::: : : . .:: : .. . :.:..:::...: ....: :::::::::: . CCDS41 PKYGMFRYYEDSRLIWFSDKTFEDSDLFHLIGVICGLAIYNCTIVDLHFPLALYKKLLKK 770 780 790 800 810 820 800 810 820 830 840 pF1KE4 KPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSI---HWDQNDV-DLIPNGISIP ::::.::::: : .:.:.:..:: ::: ...:. :.: .. ..: .:. :: . CCDS41 KPSLDDLKELMPDVGRSMQQLLDYPEDDIEETFCLNFTITVENFGATEVKELVLNGADTA 830 840 850 860 870 880 850 860 870 880 890 900 pF1KE4 VDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEILRHFYPEELMTAIIGNTDY :.. :....:. :.::::: :: .... :. ::..:: ..: : :.::.. .::::.: CCDS41 VNKQNRQEFVDAYVDYIFNKSVASLFDAFHAGFHKVCGGKVLLLFQPNELQAMVIGNTNY 890 900 910 920 930 940 910 920 930 940 950 960 pF1KE4 DWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFLFFLTGRDRLHARGIQKMEI :::..:.:..:. : ::::..::..::.: :..::.::.:::: ::. :...... CCDS41 DWKELEKNTEYKGEYWAEHPTIKIFWEVFHELPLEKKKQFLLFLTGSDRIPILGMKSLKL 950 960 970 980 990 1000 970 980 990 1000 1010 1020 pF1KE4 VFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVAINNNRGFVSPMLTQS :.. .:. :.: :: :.:.::::. : .. : ::..:.:: CCDS41 VIQSTGG-GEEYLPVSHTCFNLLDLPKYTEKETLRSKLIQAIDHNEGFSLI 1010 1020 1030 1040 1050 >>CCDS32177.1 UBE3A gene_id:7337|Hs108|chr15 (852 aa) initn: 501 init1: 262 opt: 802 Z-score: 932.5 bits: 183.9 E(32554): 1.3e-45 Smith-Waterman score: 804; 33.3% identity (64.3% similar) in 457 aa overlap (572-1014:411-849) 550 560 570 580 590 pF1KE4 IISQLLHQTKTEQDHCNVKALLGMMKELHKVNKANCRLPENTFN--INE-LSNLLNFYID :. .:: : :. ::: :...:. .: CCDS32 SSELTLQELLGEERRNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLE--MD 390 400 410 420 430 600 610 620 630 640 650 pF1KE4 RGRQLFRDNHLIPAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHET . .:. .:: . : :::.:...: : :..:.: .::.. .:. . CCDS32 KDYTFFK------VETENKFSFMTCPFILNAVTKNLGLYYDNRIRM-YSERRITVLY--S 440 450 460 470 480 660 670 680 690 700 710 pF1KE4 ILQKKDEFPPSPRFILRVRRSRLVKDALRQL---SQAEATDFCKVLVVEFINEICPESGG ..: .. .: . :.:::.... ::: .: .. . .:. : : ::: .: . :: CCDS32 LVQGQQL---NPYLRLKVRRDHIIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGG 490 500 510 520 530 540 720 730 740 750 760 770 pF1KE4 VSSEFFHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVA ::.:::. . ::. .:. ::: : : . .:: . . .. :.:.. ::...: . CCDS32 VSKEFFQLVVEEIFNPDIGMFTYDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCIL 550 560 570 580 590 600 780 790 800 810 820 830 pF1KE4 NLPFPLALYKKLLDQKPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQND .. ::...:.::. .: ...:: . : : .::...:. .. : . : :.: .:.: CCDS32 DVHFPMVVYRKLMGKKGTFRDLGDSHPVLYQSLKDLLE-YEGNVEDDMMITFQI--SQTD 610 620 630 640 650 660 840 850 860 870 880 pF1KE4 V-------DLIPNGISIPVDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEIL . :: :: .::. . :....:. : :::.: ::. .. :.:::. : .. : CCDS32 LFGNPMMYDLKENGDKIPITNENRKEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPL 670 680 690 700 710 720 890 900 910 920 930 940 pF1KE4 RH-FYPEELMTAIIGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFL .. : :::. : :. . :.. .:....:. :: .. :. ::. :..: ..:. :: CCDS32 KYLFRPEEIELLICGSRNLDFQALEETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFL 730 740 750 760 770 780 950 960 970 980 990 1000 pF1KE4 FFLTGRDRLHARGIQKMEIVFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVA : :: :: . :. :..... .:: ::: :: :.: ::.::. :...: : : CCDS32 QFTTGTDRAPVGGLGKLKMIIAKNGPDTER-LPTSHTCFNVLLLPEYSSKEKLKERLLKA 790 800 810 820 830 840 1010 1020 pF1KE4 INNNRGFVSPMLTQS :. .:: CCDS32 ITYAKGFGML 850 >>CCDS45191.1 UBE3A gene_id:7337|Hs108|chr15 (872 aa) initn: 501 init1: 262 opt: 802 Z-score: 932.4 bits: 183.9 E(32554): 1.3e-45 Smith-Waterman score: 804; 33.3% identity (64.3% similar) in 457 aa overlap (572-1014:431-869) 550 560 570 580 590 pF1KE4 IISQLLHQTKTEQDHCNVKALLGMMKELHKVNKANCRLPENTFN--INE-LSNLLNFYID :. .:: : :. ::: :...:. .: CCDS45 SSELTLQELLGEERRNKKGPRVDPLETELGVKTLDCRKPLIPFEEFINEPLNEVLE--MD 410 420 430 440 450 600 610 620 630 640 650 pF1KE4 RGRQLFRDNHLIPAETPSPVIFSDFPFIFNSLSKIKLLQADSHIKMQMSEKKAYMLMHET . .:. .:: . : :::.:...: : :..:.: .::.. .:. . CCDS45 KDYTFFK------VETENKFSFMTCPFILNAVTKNLGLYYDNRIRM-YSERRITVLY--S 460 470 480 490 500 660 670 680 690 700 710 pF1KE4 ILQKKDEFPPSPRFILRVRRSRLVKDALRQL---SQAEATDFCKVLVVEFINEICPESGG ..: .. .: . :.:::.... ::: .: .. . .:. : : ::: .: . :: CCDS45 LVQGQQL---NPYLRLKVRRDHIIDDALVRLEMIAMENPADLKKQLYVEFEGEQGVDEGG 510 520 530 540 550 560 720 730 740 750 760 770 pF1KE4 VSSEFFHCMFEEMTKPEYGMFMYPEMGSCMWFPAKPKPEKKRYFLFGMLCGLSLFNLNVA ::.:::. . ::. .:. ::: : : . .:: . . .. :.:.. ::...: . CCDS45 VSKEFFQLVVEEIFNPDIGMFTYDESTKLFWFNPSSFETEGQFTLIGIVLGLAIYNNCIL 570 580 590 600 610 620 780 790 800 810 820 830 pF1KE4 NLPFPLALYKKLLDQKPSLEDLKELSPRLGKSLQEVLDDAADDIGDALCIRFSIHWDQND .. ::...:.::. .: ...:: . : : .::...:. .. : . : :.: .:.: CCDS45 DVHFPMVVYRKLMGKKGTFRDLGDSHPVLYQSLKDLLE-YEGNVEDDMMITFQI--SQTD 630 640 650 660 670 680 840 850 860 870 880 pF1KE4 V-------DLIPNGISIPVDQTNKRDYVSKYIDYIFNVSVKAVYEEFQRGFYRVCEKEIL . :: :: .::. . :....:. : :::.: ::. .. :.:::. : .. : CCDS45 LFGNPMMYDLKENGDKIPITNENRKEFVNLYSDYILNKSVEKQFKAFRRGFHMVTNESPL 690 700 710 720 730 740 890 900 910 920 930 940 pF1KE4 RH-FYPEELMTAIIGNTDYDWKQFEQNSKYEQGYQKSHPTIQLFWKAFHKLTLDEKKKFL .. : :::. : :. . :.. .:....:. :: .. :. ::. :..: ..:. :: CCDS45 KYLFRPEEIELLICGSRNLDFQALEETTEYDGGYTRDSVLIREFWEIVHSFTDEQKRLFL 750 760 770 780 790 800 950 960 970 980 990 1000 pF1KE4 FFLTGRDRLHARGIQKMEIVFRCPETFSERDHPTSITCHNILSLPKYSTMERMEEALQVA : :: :: . :. :..... .:: ::: :: :.: ::.::. :...: : : CCDS45 QFTTGTDRAPVGGLGKLKMIIAKNGPDTER-LPTSHTCFNVLLLPEYSSKEKLKERLLKA 810 820 830 840 850 860 1010 1020 pF1KE4 INNNRGFVSPMLTQS :. .:: CCDS45 ITYAKGFGML 870 1022 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:26:22 2016 done: Mon Nov 7 16:26:23 2016 Total Scan time: 4.600 Total Display time: 0.400 Function used was FASTA [36.3.4 Apr, 2011]