FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1769, 2080 aa
1>>>pF1KSDA1769 2080 - 2080 aa - 2080 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1663+/-0.0009; mu= 21.1681+/- 0.054
mean_var=88.8651+/-17.648, 0's: 0 Z-trim(107.8): 32 B-trim: 0 in 0/51
Lambda= 0.136053
statistics sampled from 9748 (9777) to 9748 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.635), E-opt: 0.2 (0.3), width: 16
Scan time: 5.870
The best scores are: opt bits E(32554)
CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080) 14093 2777.4 0
CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649) 14050 2769.0 0
CCDS42374.1 HELZ gene_id:9931|Hs108|chr17 (1942) 770 162.3 1.8e-38
CCDS82192.1 HELZ gene_id:9931|Hs108|chr17 (1943) 770 162.3 1.8e-38
CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 ( 971) 433 96.0 8.2e-19
CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054) 433 96.0 8.7e-19
CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 ( 796) 323 74.4 2.2e-12
CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 ( 928) 323 74.4 2.5e-12
CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 ( 958) 323 74.4 2.5e-12
CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 603) 302 70.2 3e-11
CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 885) 302 70.3 4.2e-11
>>CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080 aa)
initn: 14093 init1: 14093 opt: 14093 Z-score: 14936.8 bits: 2777.4 E(32554): 0
Smith-Waterman score: 14093; 99.8% identity (100.0% similar) in 2080 aa overlap (1-2080:1-2080)
10 20 30 40 50 60
pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVMYTDRPLSQTDPVTLQYCCLTDDRQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVMYTDRPLSQTDPVTLQYCCLTDDRQA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD FRPPTRAELARHRVVVTTTSQARELRVPVGFFSHILIDEAAQMLECEALTPLAYASHGTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 FRPPTRAELARHRVVVTTTSQARELRVPVGFFSHILIDEAAQMLECEALTPLAYASHGTR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCYQQETHEVARQSRLVFHENYRCTDAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCYQQETHEVARQSRLVFHENYRCTDAI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD VSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCHVAGNPDRDMSMASWLNLAEIAQVVE
::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::::
CCDS13 VSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCHVAGSPDRDMSMASWLNLAEIAQVVE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD KVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQELRRRDLGQVSVGSFEILPGRQFRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQELRRRDLGQVSVGSFEILPGRQFRV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD AVVTAMVKAEPGDEALSPASRDITATTAQTEAAAAPAGDAVKEDVVPGACAAGAAAAAGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AVVTAMVKAEPGDEALSPASRDITATTAQTEAAAAPAGDAVKEDVVPGACAAGAAAAAGV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD ESTEAEDAEADFWPWDGELNADDAILRELLDESQKVMVTVGEDGLLDTVARPESLQQARL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ESTEAEDAEADFWPWDGELNADDAILRELLDESQKVMVTVGEDGLLDTVARPESLQQARL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD YENLPPAALRKLLRAEPERYRHCSFVPETFERASAIPLDDASSGPIQVRGRLDCGMAFAG
:::::::::::::.::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 YENLPPAALRKLLHAEPERYRHCSFVPETFERASAIPLDDASSGPIQVRGRLDCGMAFAG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD DEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVPINGSVTKIFVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVPINGSVTKIFVA
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD ELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD ASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCRAFLTFTVDPQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCRAFLTFTVDPQG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD ACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD SLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD GAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLGFRAAHIMVKEYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLGFRAAHIMVKEYM
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD IQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGGG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD SPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDDMHPFLAPAGRDLRKALERSAFGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDDMHPFLAPAGRDLRKALERSAFGR
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD CARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHGGSAYSARDIDGLCQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHGGSAYSARDIDGLCQA
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFRLLFPSNRETLPDPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 FSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFRLLFPSNRETLPDPC
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD PVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTVPDPHTLAVETALWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTVPDPHTLAVETALWK
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD QLLELVELQRWPEAAALIQEKGEASQRRELVQVQRSHCGHFLEVARELGSGDTLQVQLGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QLLELVELQRWPEAAALIQEKGEASQRRELVQVQRSHCGHFLEVARELGSGDTLQVQLGT
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFSGRVYRAPRDRYRDVDEYACVWEPFC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFSGRVYRAPRDRYRDVDEYACVWEPFC
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KSD ALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQGAFRLEAAFLEENCADINFSCCYLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQGAFRLEAAFLEENCADINFSCCYLC
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KSD IRLEGLLAPTASPRPGPSSLGPGLNVDPGTYTWVAHGQTEDWDQERRADRQEAPRRVHLF
:::::: ::::::::::::::::::::::::::::::::.::::::::::::::::::::
CCDS13 IRLEGLPAPTASPRPGPSSLGPGLNVDPGTYTWVAHGQTQDWDQERRADRQEAPRRVHLF
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KSD VHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKEEAVRGLEEASPLVTSIALGRPVPQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKEEAVRGLEEASPLVTSIALGRPVPQP
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KSD LCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREALEKPFTVIQGPPGTGKTIVGLHIVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREALEKPFTVIQGPPGTGKTIVGLHIVF
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KSD WFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNKSVDVLAGLLLRRMELKPLRVYSEQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 WFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNKSVDVLAGLLLRRMELKPLRVYSEQA
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KSD EASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLHHRIRQAPNPYSSEIKAFDTRLQRGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLHHRIRQAPNPYSSEIKAFDTRLQRGE
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KSD LFSREDLVWYKKVLWEARKFELDRHEVILCTCSCAASASLKILDVRQILVDEAGMATEPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LFSREDLVWYKKVLWEARKFELDRHEVILCTCSCAASASLKILDVRQILVDEAGMATEPE
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KSD TLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNLGLDRSLFERYHEDAHMLDTQYRMHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNLGLDRSLFERYHEDAHMLDTQYRMHE
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KSD GICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKESCPVIFGHVQGHERSLLVSTDEGNEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKESCPVIFGHVQGHERSLLVSTDEGNEN
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KSD SKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPYNAQASEISKALRREGIAGVAVSSIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPYNAQASEISKALRREGIAGVAVSSIT
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KSD KSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKFLGFVVDPNQVNVAVTRAQEGLCLIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKFLGFVVDPNQVNVAVTRAQEGLCLIG
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080
pF1KSD DHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRRPTMPS
::::::::::::::::::::::::::::::::::::::::
CCDS13 DHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRRPTMPS
2050 2060 2070 2080
>>CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649 aa)
initn: 14050 init1: 14050 opt: 14050 Z-score: 14889.6 bits: 2769.0 E(32554): 0
Smith-Waterman score: 14050; 99.7% identity (99.9% similar) in 2075 aa overlap (6-2080:575-2649)
10 20 30
pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVM
. ::::::::::::::::::::::::::::
CCDS33 PFGTGKTYTLAMASLEVIRRPETKVLICTHTNSAADIYIREYFHSHVSGGHPEATPLRVM
550 560 570 580 590 600
40 50 60 70 80 90
pF1KSD YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTTTSQARELRVPVGFFSHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTTTSQARELRVPVGFFSHI
610 620 630 640 650 660
100 110 120 130 140 150
pF1KSD LIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCY
670 680 690 700 710 720
160 170 180 190 200 210
pF1KSD QQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCH
730 740 750 760 770 780
220 230 240 250 260 270
pF1KSD VAGNPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQ
:::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VAGSPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQ
790 800 810 820 830 840
280 290 300 310 320 330
pF1KSD ELRRRDLGQVSVGSFEILPGRQFRVVVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ELRRRDLGQVSVGSFEILPGRQFRVVVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTR
850 860 870 880 890 900
340 350 360 370 380 390
pF1KSD AQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPR
910 920 930 940 950 960
400 410 420 430 440 450
pF1KSD GTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEALSPASRDITATTAQTEAAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEALSPASRDITATTAQTEAAAA
970 980 990 1000 1010 1020
460 470 480 490 500 510
pF1KSD PAGDAVKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNADDAILRELLDESQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PAGDAVKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNADDAILRELLDESQK
1030 1040 1050 1060 1070 1080
520 530 540 550 560 570
pF1KSD VMVTVGEDGLLDTVARPESLQQARLYENLPPAALRKLLRAEPERYRHCSFVPETFERASA
::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::::
CCDS33 VMVTVGEDGLLDTVARPESLQQARLYENLPPAALRKLLHAEPERYRHCSFVPETFERASA
1090 1100 1110 1120 1130 1140
580 590 600 610 620 630
pF1KSD IPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 IPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAF
1150 1160 1170 1180 1190 1200
640 650 660 670 680 690
pF1KSD VCRMDTWDPRIMVPINGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VCRMDTWDPRIMVPINGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRL
1210 1220 1230 1240 1250 1260
700 710 720 730 740 750
pF1KSD FWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYH
1270 1280 1290 1300 1310 1320
760 770 780 790 800 810
pF1KSD TELGRVAGRREDCRAFLTFTVDPQGACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TELGRVAGRREDCRAFLTFTVDPQGACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGV
1330 1340 1350 1360 1370 1380
820 830 840 850 860 870
pF1KSD LDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLR
1390 1400 1410 1420 1430 1440
880 890 900 910 920 930
pF1KSD FAPSVVQSDRQLSYEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FAPSVVQSDRQLSYEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSD
1450 1460 1470 1480 1490 1500
940 950 960 970 980 990
pF1KSD CFYEQPDEDGTLGFRAAHIMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CFYEQPDEDGTLGFRAAHIMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLK
1510 1520 1530 1540 1550 1560
1000 1010 1020 1030 1040 1050
pF1KSD ALCEKHGDRVPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ALCEKHGDRVPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTT
1570 1580 1590 1600 1610 1620
1060 1070 1080 1090 1100 1110
pF1KSD DDMHPFLAPAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DDMHPFLAPAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQ
1630 1640 1650 1660 1670 1680
1120 1130 1140 1150 1160 1170
pF1KSD RQILLALGHGGSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RQILLALGHGGSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFV
1690 1700 1710 1720 1730 1740
1180 1190 1200 1210 1220 1230
pF1KSD VDVEAGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VDVEAGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQG
1750 1760 1770 1780 1790 1800
1240 1250 1260 1270 1280 1290
pF1KSD SSPPLPLPGTVPDPHTLAVETALWKQLLELVELQRWPEAAALIQEKGEASQRRELVQVQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SSPPLPLPGTVPDPHTLAVETALWKQLLELVELQRWPEAAALIQEKGEASQRRELVQVQR
1810 1820 1830 1840 1850 1860
1300 1310 1320 1330 1340 1350
pF1KSD SHCGHFLEVARELGSGDTLQVQLGTSLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SHCGHFLEVARELGSGDTLQVQLGTSLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFS
1870 1880 1890 1900 1910 1920
1360 1370 1380 1390 1400 1410
pF1KSD GRVYRAPRDRYRDVDEYACVWEPFCALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GRVYRAPRDRYRDVDEYACVWEPFCALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQ
1930 1940 1950 1960 1970 1980
1420 1430 1440 1450 1460 1470
pF1KSD GAFRLEAAFLEENCADINFSCCYLCIRLEGLLAPTASPRPGPSSLGPGLNVDPGTYTWVA
::::::::::::::::::::::::::::::: ::::::::::::::::::::::::::::
CCDS33 GAFRLEAAFLEENCADINFSCCYLCIRLEGLPAPTASPRPGPSSLGPGLNVDPGTYTWVA
1990 2000 2010 2020 2030 2040
1480 1490 1500 1510 1520 1530
pF1KSD HGQTEDWDQERRADRQEAPRRVHLFVHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKE
::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HGQTQDWDQERRADRQEAPRRVHLFVHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKE
2050 2060 2070 2080 2090 2100
1540 1550 1560 1570 1580 1590
pF1KSD EAVRGLEEASPLVTSIALGRPVPQPLCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EAVRGLEEASPLVTSIALGRPVPQPLCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREA
2110 2120 2130 2140 2150 2160
1600 1610 1620 1630 1640 1650
pF1KSD LEKPFTVIQGPPGTGKTIVGLHIVFWFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LEKPFTVIQGPPGTGKTIVGLHIVFWFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNK
2170 2180 2190 2200 2210 2220
1660 1670 1680 1690 1700 1710
pF1KSD SVDVLAGLLLRRMELKPLRVYSEQAEASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SVDVLAGLLLRRMELKPLRVYSEQAEASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLH
2230 2240 2250 2260 2270 2280
1720 1730 1740 1750 1760 1770
pF1KSD HRIRQAPNPYSSEIKAFDTRLQRGELFSREDLVWYKKVLWEARKFELDRHEVILCTCSCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HRIRQAPNPYSSEIKAFDTRLQRGELFSREDLVWYKKVLWEARKFELDRHEVILCTCSCA
2290 2300 2310 2320 2330 2340
1780 1790 1800 1810 1820 1830
pF1KSD ASASLKILDVRQILVDEAGMATEPETLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ASASLKILDVRQILVDEAGMATEPETLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNL
2350 2360 2370 2380 2390 2400
1840 1850 1860 1870 1880 1890
pF1KSD GLDRSLFERYHEDAHMLDTQYRMHEGICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GLDRSLFERYHEDAHMLDTQYRMHEGICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKES
2410 2420 2430 2440 2450 2460
1900 1910 1920 1930 1940 1950
pF1KSD CPVIFGHVQGHERSLLVSTDEGNENSKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CPVIFGHVQGHERSLLVSTDEGNENSKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPY
2470 2480 2490 2500 2510 2520
1960 1970 1980 1990 2000 2010
pF1KSD NAQASEISKALRREGIAGVAVSSITKSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NAQASEISKALRREGIAGVAVSSITKSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKF
2530 2540 2550 2560 2570 2580
2020 2030 2040 2050 2060 2070
pF1KSD LGFVVDPNQVNVAVTRAQEGLCLIGDHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LGFVVDPNQVNVAVTRAQEGLCLIGDHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRR
2590 2600 2610 2620 2630 2640
2080
pF1KSD PTMPS
:::::
CCDS33 PTMPS
>>CCDS42374.1 HELZ gene_id:9931|Hs108|chr17 (1942 aa)
initn: 906 init1: 229 opt: 770 Z-score: 804.2 bits: 162.3 E(32554): 1.8e-38
Smith-Waterman score: 931; 41.0% identity (66.3% similar) in 398 aa overlap (6-383:699-1086)
10 20 30
pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVM
: ::::.::..:.: .: .:.:.: ::::.
CCDS42 PYGTGKTFTLAQAVKHILQQQETRILICTHSNSAADLYIKDYLHPYVEAGNPQARPLRVY
670 680 690 700 710 720
40 50 60 70 80 90
pF1KSD YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTT--TSQAR-ELRVPVGFF
. .: .. . ::. ::: ... ...:. : . .. .:::::.: ::: .: . :::
CCDS42 FRNRWVKTVHPVVHQYCLISSAHSTFQMPQKEDILKHRVVVVTLNTSQYLCQLDLEPGFF
730 740 750 760 770 780
100 110 120 130 140 150
pF1KSD SHILIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFS-VARARAAEHTLLHRL
.:::.::::: .:::.. ::: :...::.::::::::..: ..: :: : . .:: ::
CCDS42 THILLDEAAQAMECETIMPLALATQNTRIVLAGDHMQLSPFVYSEFARERNLHVSLLDRL
790 800 810 820 830 840
160 170 180 190 200 210
pF1KSD FLCYQQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPL
. : : :... :::: .::... :. :: .: . : :: : : :::
CCDS42 YEHYPAEF-----PCRILLCENYRSHEAIINYTSELFYEGK---LMASGKQPAHKDFYPL
850 860 870 880 890 900
220 230 240 250 260 270
pF1KSD MFCHVAGNPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGA-QV
: . :. .. . ... : ::. .:::.:.: :: :: .. : ::. : ::
CCDS42 TFFTARGEDVQEKNSTAFYNNAEVFEVVERVEELRRKWPVAWGKLDDGSIGVVTPYADQV
910 920 930 940 950 960
280 290 300 310 320
pF1KSD SALRQELRRRDLGQVSVGSFEILPGRQFRVVVLSTV---HTCQSLLSPGALAPE------
.: :::.. :..:.: . :.::::. :::: :::. .: .
CCDS42 FRIRAELRKKRLSDVNVERVLNVQGKQFRVLFLSTVRTRHTCKHKQTPIKKKEQLLEDST
970 980 990 1000 1010 1020
330 340 350 360 370
pF1KSD ------FFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPE
:... ..:::..::::: ..:::: .::::.: : :.:: :: : : :. .
CCDS42 EDLDYGFLSNYKLLNTAITRAQSLVAVVGDPIALCSIGRCRKFWERFIALCHENSSL--H
1030 1040 1050 1060 1070
380 390 400 410 420 430
pF1KSD GLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEA
:...::..
CCDS42 GITFEQIKAQLEALELKKTYVLNPLAPEFIPRALRLQHSGSTNKQQQSPPKGKSLHHTQN
1080 1090 1100 1110 1120 1130
>>CCDS82192.1 HELZ gene_id:9931|Hs108|chr17 (1943 aa)
initn: 906 init1: 229 opt: 770 Z-score: 804.2 bits: 162.3 E(32554): 1.8e-38
Smith-Waterman score: 931; 41.0% identity (66.3% similar) in 398 aa overlap (6-383:700-1087)
10 20 30
pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVM
: ::::.::..:.: .: .:.:.: ::::.
CCDS82 YGTGKTFTLAQAVKHILQQQETSRILICTHSNSAADLYIKDYLHPYVEAGNPQARPLRVY
670 680 690 700 710 720
40 50 60 70 80 90
pF1KSD YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTT--TSQAR-ELRVPVGFF
. .: .. . ::. ::: ... ...:. : . .. .:::::.: ::: .: . :::
CCDS82 FRNRWVKTVHPVVHQYCLISSAHSTFQMPQKEDILKHRVVVVTLNTSQYLCQLDLEPGFF
730 740 750 760 770 780
100 110 120 130 140 150
pF1KSD SHILIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFS-VARARAAEHTLLHRL
.:::.::::: .:::.. ::: :...::.::::::::..: ..: :: : . .:: ::
CCDS82 THILLDEAAQAMECETIMPLALATQNTRIVLAGDHMQLSPFVYSEFARERNLHVSLLDRL
790 800 810 820 830 840
160 170 180 190 200 210
pF1KSD FLCYQQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPL
. : : :... :::: .::... :. :: .: . : :: : : :::
CCDS82 YEHYPAEF-----PCRILLCENYRSHEAIINYTSELFYEGK---LMASGKQPAHKDFYPL
850 860 870 880 890 900
220 230 240 250 260 270
pF1KSD MFCHVAGNPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGA-QV
: . :. .. . ... : ::. .:::.:.: :: :: .. : ::. : ::
CCDS82 TFFTARGEDVQEKNSTAFYNNAEVFEVVERVEELRRKWPVAWGKLDDGSIGVVTPYADQV
910 920 930 940 950 960
280 290 300 310 320
pF1KSD SALRQELRRRDLGQVSVGSFEILPGRQFRVVVLSTV---HTCQSLLSPGALAPE------
.: :::.. :..:.: . :.::::. :::: :::. .: .
CCDS82 FRIRAELRKKRLSDVNVERVLNVQGKQFRVLFLSTVRTRHTCKHKQTPIKKKEQLLEDST
970 980 990 1000 1010 1020
330 340 350 360 370
pF1KSD ------FFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPE
:... ..:::..::::: ..:::: .::::.: : :.:: :: : : :. .
CCDS82 EDLDYGFLSNYKLLNTAITRAQSLVAVVGDPIALCSIGRCRKFWERFIALCHENSSL--H
1030 1040 1050 1060 1070
380 390 400 410 420 430
pF1KSD GLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEA
:...::..
CCDS82 GITFEQIKAQLEALELKKTYVLNPLAPEFIPRALRLQHSGSTNKQQQSPPKGKSLHHTQN
1080 1090 1100 1110 1120 1130
>>CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 (971 aa)
initn: 284 init1: 185 opt: 433 Z-score: 451.3 bits: 96.0 E(32554): 8.2e-19
Smith-Waterman score: 496; 24.6% identity (52.9% similar) in 731 aa overlap (491-1165:108-781)
470 480 490 500 510
pF1KSD VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD----DAIL---RELLDES
.::: .:.: :.:: :: .::
CCDS10 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP---DLKAAHELCDSILQSRRERENES
80 90 100 110 120 130
520 530 540 550 560 570
pF1KSD QKVMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLRAEPERYRHCSFVPETFER
:. . :.. :: : : .. . .. .: .. .: . .:: ..
CCDS10 QE---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQG
140 150 160 170 180
580 590 600 610 620 630
pF1KSD ASAIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHE
::. : .:. : ..: . .. :: :.:.:: :... .::.... . .
CCDS10 ASSKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDD
190 200 210 220 230
640 650 660 670
pF1KSD LAFVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG-----------
. . .: .: .: :. :. . .: ::. . : :.
CCDS10 -----KASGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDY
240 250 260 270 280
680 690 700 710 720 730
pF1KSD RLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYS
:. .. . ::. .. :.: :.. :: : .:: . . : . . .: :
CCDS10 RIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENS
290 300 310 320 330 340
740 750 760 770 780 790
pF1KSD LRVPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVR
. : : ..: . .. . .:. .:.: : . :.:..::.: ..::.::::
CCDS10 ISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVR
350 360 370 380 390 400
800 810 820 830 840 850
pF1KSD DLGP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLL
:. :..:::.::. :: .. .:.::: .....: :. :::. : :. :::
CCDS10 TLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLL
410 420 430 440 450 460
860 870 880 890 900
pF1KSD PGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP---
: :: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..:
CCDS10 GGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFK
470 480 490 500 510 520
910 920 930 940 950
pF1KSD -----ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVK
.: ... : : .. . :. : . : : : . . . . : ..
CCDS10 DLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIP
530 540 550 560 570 580
960 970 980 990 1000 1010
pF1KSD EYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHG
. .. .. ::: .. . .. :. :. :. .:: ..: :
CCDS10 KQPLEVHETVAECMILA--NHWVAKKIWESFPH----QALLRQH----P-----------
590 600 610 620
1020 1030 1040 1050 1060 1070
pF1KSD GGGSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKAL
:: .. : : : :.. . ..: : ...: : :.. :.. .:.
CCDS10 ----PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAM
630 640 650 660 670 680
1080 1090 1100 1110 1120
pF1KSD ERSAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG-----
. . : :: ... ::.: .: :: ::::::: :.:..: .. :...
CCDS10 SNALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEI
690 700 710 720 730 740
1130 1140 1150 1160 1170 1180
pF1KSD -GSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRC
:. .: .:.. ::. .. .. :: :... : . .:
CCDS10 KGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSI
750 760 770 780 790 800
1190 1200 1210 1220 1230 1240
pF1KSD FRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPG
CCDS10 RTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESV
810 820 830 840 850 860
>>CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054 aa)
initn: 284 init1: 185 opt: 433 Z-score: 450.7 bits: 96.0 E(32554): 8.7e-19
Smith-Waterman score: 496; 24.6% identity (52.9% similar) in 731 aa overlap (491-1165:191-864)
470 480 490 500 510
pF1KSD VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD----DAIL---RELLDES
.::: .:.: :.:: :: .::
CCDS45 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP---DLKAAHELCDSILQSRRERENES
170 180 190 200 210
520 530 540 550 560 570
pF1KSD QKVMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLRAEPERYRHCSFVPETFER
:. . :.. :: : : .. . .. .: .. .: . .:: ..
CCDS45 QE---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQG
220 230 240 250 260
580 590 600 610 620 630
pF1KSD ASAIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHE
::. : .:. : ..: . .. :: :.:.:: :... .::.... . .
CCDS45 ASSKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDD
270 280 290 300 310
640 650 660 670
pF1KSD LAFVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG-----------
. . .: .: .: :. :. . .: ::. . : :.
CCDS45 -----KASGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDY
320 330 340 350 360 370
680 690 700 710 720 730
pF1KSD RLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYS
:. .. . ::. .. :.: :.. :: : .:: . . : . . .: :
CCDS45 RIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENS
380 390 400 410 420 430
740 750 760 770 780 790
pF1KSD LRVPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVR
. : : ..: . .. . .:. .:.: : . :.:..::.: ..::.::::
CCDS45 ISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVR
440 450 460 470 480 490
800 810 820 830 840 850
pF1KSD DLGP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLL
:. :..:::.::. :: .. .:.::: .....: :. :::. : :. :::
CCDS45 TLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLL
500 510 520 530 540 550
860 870 880 890 900
pF1KSD PGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP---
: :: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..:
CCDS45 GGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFK
560 570 580 590 600 610
910 920 930 940 950
pF1KSD -----ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVK
.: ... : : .. . :. : . : : : . . . . : ..
CCDS45 DLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIP
620 630 640 650 660 670
960 970 980 990 1000 1010
pF1KSD EYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHG
. .. .. ::: .. . .. :. :. :. .:: ..: :
CCDS45 KQPLEVHETVAECMILA--NHWVAKKIWESFPH----QALLRQH----P-----------
680 690 700 710
1020 1030 1040 1050 1060 1070
pF1KSD GGGSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKAL
:: .. : : : :.. . ..: : ...: : :.. :.. .:.
CCDS45 ----PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAM
720 730 740 750 760
1080 1090 1100 1110 1120
pF1KSD ERSAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG-----
. . : :: ... ::.: .: :: ::::::: :.:..: .. :...
CCDS45 SNALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEI
770 780 790 800 810 820
1130 1140 1150 1160 1170 1180
pF1KSD -GSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRC
:. .: .:.. ::. .. .. :: :... : . .:
CCDS45 KGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSI
830 840 850 860 870 880
1190 1200 1210 1220 1230 1240
pF1KSD FRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPG
CCDS45 RTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESV
890 900 910 920 930 940
>>CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 (796 aa)
initn: 290 init1: 123 opt: 323 Z-score: 335.9 bits: 74.4 E(32554): 2.2e-12
Smith-Waterman score: 424; 24.0% identity (53.2% similar) in 558 aa overlap (620-1167:181-681)
590 600 610 620 630 640
pF1KSD GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP
:::.:..::. : :
CCDS81 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC---
160 170 180 190
650 660 670 680 690 700
pF1KSD INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY
: ..: ...:. :. ... :. :. .: : . ..: . : : : .. :
CCDS81 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY
200 210 220 230 240
710 720 730 740 750 760
pF1KSD PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR
: : . : ... : ..: ::... : .::... . . . . ::: :
CCDS81 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR
250 260 270 280 290 300
770 780 790 800 810 820
pF1KSD AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY
. .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. :
CCDS81 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY
310 320 330 340 350 360
830 840 850 860 870 880
pF1KSD APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS
.. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:.
CCDS81 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT
370 380 390 400 410 420
890 900 910 920 930 940
pF1KSD YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG
: ::. : .:. . :.. . . . ....:...:... . . :
CCDS81 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM
430 440 450 460 470
950 960 970 980 990 1000
pF1KSD FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR
.: ...:: . . : .: ::.. .. . . : . :. ...
CCDS81 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH
480 490 500 510 520
1010 1020 1030 1040 1050 1060
pF1KSD VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDD--MHPFL
. : : .:: . ..:.. .. .. .:. ..... . . :.:
CCDS81 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL
530 540 550 560 570
1070 1080 1090 1100 1110 1120
pF1KSD APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL
: : .: :. : ... ::.: :: ::::::: ::...: . .:.
CCDS81 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI
580 590 600 610 620 630
1130 1140 1150 1160 1170
pF1KSD GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE
: . : . .:. ....: .:: :: . ..: . .:..
CCDS81 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV
640 650 660 670 680 690
1180 1190 1200 1210 1220 1230
pF1KSD AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP
CCDS81 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS
700 710 720 730 740 750
>>CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 (928 aa)
initn: 290 init1: 123 opt: 323 Z-score: 334.9 bits: 74.4 E(32554): 2.5e-12
Smith-Waterman score: 424; 24.0% identity (53.2% similar) in 558 aa overlap (620-1167:313-813)
590 600 610 620 630 640
pF1KSD GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP
:::.:..::. : :
CCDS45 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC---
290 300 310 320
650 660 670 680 690 700
pF1KSD INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY
: ..: ...:. :. ... :. :. .: : . ..: . : : : .. :
CCDS45 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY
330 340 350 360 370 380
710 720 730 740 750 760
pF1KSD PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR
: : . : ... : ..: ::... : .::... . . . . ::: :
CCDS45 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR
390 400 410 420 430 440
770 780 790 800 810 820
pF1KSD AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY
. .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. :
CCDS45 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY
450 460 470 480 490 500
830 840 850 860 870 880
pF1KSD APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS
.. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:.
CCDS45 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT
510 520 530 540 550
890 900 910 920 930 940
pF1KSD YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG
: ::. : .:. . :.. . . . ....:...:... . . :
CCDS45 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM
560 570 580 590 600 610
950 960 970 980 990 1000
pF1KSD FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR
.: ...:: . . : .: ::.. .. . . : . :. ...
CCDS45 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH
620 630 640 650
1010 1020 1030 1040 1050 1060
pF1KSD VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDD--MHPFL
. : : .:: . ..:.. .. .. .:. ..... . . :.:
CCDS45 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL
660 670 680 690 700
1070 1080 1090 1100 1110 1120
pF1KSD APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL
: : .: :. : ... ::.: :: ::::::: ::...: . .:.
CCDS45 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI
710 720 730 740 750 760
1130 1140 1150 1160 1170
pF1KSD GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE
: . : . .:. ....: .:: :: . ..: . .:..
CCDS45 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV
770 780 790 800 810 820
1180 1190 1200 1210 1220 1230
pF1KSD AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP
CCDS45 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS
830 840 850 860 870 880
>>CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 (958 aa)
initn: 290 init1: 123 opt: 323 Z-score: 334.7 bits: 74.4 E(32554): 2.5e-12
Smith-Waterman score: 424; 24.0% identity (53.2% similar) in 558 aa overlap (620-1167:343-843)
590 600 610 620 630 640
pF1KSD GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP
:::.:..::. : :
CCDS94 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC---
320 330 340 350
650 660 670 680 690 700
pF1KSD INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY
: ..: ...:. :. ... :. :. .: : . ..: . : : : .. :
CCDS94 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY
360 370 380 390 400 410
710 720 730 740 750 760
pF1KSD PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR
: : . : ... : ..: ::... : .::... . . . . ::: :
CCDS94 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR
420 430 440 450 460 470
770 780 790 800 810 820
pF1KSD AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY
. .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. :
CCDS94 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY
480 490 500 510 520 530
830 840 850 860 870 880
pF1KSD APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS
.. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:.
CCDS94 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT
540 550 560 570 580
890 900 910 920 930 940
pF1KSD YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG
: ::. : .:. . :.. . . . ....:...:... . . :
CCDS94 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM
590 600 610 620 630 640
950 960 970 980 990 1000
pF1KSD FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR
.: ...:: . . : .: ::.. .. . . : . :. ...
CCDS94 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH
650 660 670 680
1010 1020 1030 1040 1050 1060
pF1KSD VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDD--MHPFL
. : : .:: . ..:.. .. .. .:. ..... . . :.:
CCDS94 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL
690 700 710 720 730
1070 1080 1090 1100 1110 1120
pF1KSD APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL
: : .: :. : ... ::.: :: ::::::: ::...: . .:.
CCDS94 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI
740 750 760 770 780 790
1130 1140 1150 1160 1170
pF1KSD GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE
: . : . .:. ....: .:: :: . ..: . .:..
CCDS94 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV
800 810 820 830 840 850
1180 1190 1200 1210 1220 1230
pF1KSD AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP
CCDS94 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS
860 870 880 890 900 910
>>CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 (603 aa)
initn: 124 init1: 124 opt: 302 Z-score: 315.4 bits: 70.2 E(32554): 3e-11
Smith-Waterman score: 302; 25.9% identity (53.8% similar) in 424 aa overlap (499-909:106-511)
470 480 490 500 510 520
pF1KSD ACAAGAAAAAGVESTEAEDAEADFWPWDGELNADDAILRELLDESQKVMVTVGEDGLLDT
::.: .... : .: ::. ..: .:
CCDS58 NPKKFHEAFIPSPDGDRDIFIDGVVARNRALNGDLVVVKLLPEEHWKVVKPESNDK--ET
80 90 100 110 120 130
530 540 550 560 570 580
pF1KSD VARPES-LQQARLYENLPPAALRKLLRAEPERYRHCSFVPETFERASAIP----LDDASS
: :: . . ..:: .:.. :. . .: : . .: .: ...
CCDS58 EAAYESDIPEELCGHHLPQQSLKSY-NDSPDVIVEAQFDGSDSEDGHGITQNVLVDGVKK
140 150 160 170 180 190
590 600 610 620 630
pF1KSD GPIQV--RGRLDCGMAFAGDEVLVQLLSGDKAPEGRLR--GRVLGVLKRKRHELAFVCRM
. : .:: : . ::. . : :. ..:. .:..:. :
CCDS58 LSVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSAKVVYILEKKHS------RA
200 210 220 230 240
640 650 660 670 680 690
pF1KSD DTWDPRIMVPINGSVTKIFVAELKDPSQVP-IYSLRKGRLQRVGLERLTAEARHSRLFWV
: .... :. . . .. . .:: :: : : . : : . ::
CCDS58 ATGFLKLLADKNSELFRKYALFSPSDHRVPRIYVPLKDCPQDF-VARPKDYA--NTLFIC
250 260 270 280 290 300
700 710 720 730 740 750
pF1KSD QIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTEL
.:: :.. . :: . . : .:. : . . ::.. .. .. . : .
CCDS58 RIVDWKEDCNFALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEVLECLPQGLPWTI
310 320 330 340 350 360
760 770 780 790 800 810
pF1KSD G-RVAGRREDCRAFLTFTVDPQGACNLDDALSVRDLGP-RCEVAVHITDVASFVPRDGVL
. ..:.: : ::.::. : .:::::: . :. .:.:::.::. :::. . :
CCDS58 PPEEFSKRRDLRKDCIFTIDPSTARDLDDALSCKPLADGNFKVGVHIADVSYFVPEGSDL
370 380 390 400 410 420
820 830 840 850 860 870
pF1KSD D-VEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLR
: : :.: ... . .. ::::: ::... :: : :.:..:.. :. :.. .
CCDS58 DKVAAERATSVYLV--QKVVPMLPRLLCEELCSLNPMSDKLTFSVIWTLTPE-GKILDEW
430 440 450 460 470 480
880 890 900 910 920 930
pF1KSD FAPSVVQSDRQLSYEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSD
:. ....: .::::.:. .: . : ...::.
CCDS58 FGRTIIRSCTKLSYEHAQSMI-ESP--TEKIPAKELPPISPEHSSEEVHQQNADKDGAAH
490 500 510 520 530
940 950 960 970 980 990
pF1KSD CFYEQPDEDGTLGFRAAHIMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLK
CCDS58 LQASHSPSAEDAEAQPSTEERLPETRGICDRDPDTRLFFLQQQSRVLEAKPQNTIRVEEQ
540 550 560 570 580 590
2080 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:10:15 2016 done: Thu Nov 3 19:10:16 2016
Total Scan time: 5.870 Total Display time: 0.590
Function used was FASTA [36.3.4 Apr, 2011]