FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4367, 1124 aa
1>>>pF1KB4367 1124 - 1124 aa - 1124 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.2145+/-0.00118; mu= -8.0253+/- 0.071
mean_var=465.7472+/-96.890, 0's: 0 Z-trim(114.3): 754 B-trim: 0 in 0/54
Lambda= 0.059429
statistics sampled from 14012 (14849) to 14012 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.747), E-opt: 0.2 (0.456), width: 16
Scan time: 6.030
The best scores are: opt bits E(32554)
CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124) 7521 660.4 6.5e-189
CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125) 7501 658.7 2.1e-188
CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108) 7360 646.6 9.2e-185
CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057) 6922 609.0 1.8e-173
CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104) 6813 599.7 1.2e-170
CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190) 1071 107.4 2e-22
CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214) 1071 107.4 2e-22
>>CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124 aa)
initn: 7521 init1: 7521 opt: 7521 Z-score: 3505.1 bits: 660.4 E(32554): 6.5e-189
Smith-Waterman score: 7521; 100.0% identity (100.0% similar) in 1124 aa overlap (1-1124:1-1124)
10 20 30 40 50 60
pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDECESDAENEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 LPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDECESDAENEQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB4 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120
pF1KB4 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1090 1100 1110 1120
>>CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125 aa)
initn: 6925 init1: 6925 opt: 7501 Z-score: 3495.8 bits: 658.7 E(32554): 2.1e-188
Smith-Waterman score: 7501; 99.8% identity (99.8% similar) in 1125 aa overlap (1-1124:1-1125)
10 20 30 40 50 60
pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
10 20 30 40 50 60
70 80 90 100 110
pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDR-KEGQEILGPEAQADEAGCTVKDDECESDAENE
:::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::
CCDS53 LPTDQTVLPGRSSEREGNAKNCWEDDTGKEGQEILGPEAQADEAGCTVKDDECESDAENE
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB4 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB4 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB4 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB4 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB4 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB4 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL
430 440 450 460 470 480
480 490 500 510 520 530
pF1KB4 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG
490 500 510 520 530 540
540 550 560 570 580 590
pF1KB4 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY
550 560 570 580 590 600
600 610 620 630 640 650
pF1KB4 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN
610 620 630 640 650 660
660 670 680 690 700 710
pF1KB4 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY
670 680 690 700 710 720
720 730 740 750 760 770
pF1KB4 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK
730 740 750 760 770 780
780 790 800 810 820 830
pF1KB4 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP
790 800 810 820 830 840
840 850 860 870 880 890
pF1KB4 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT
850 860 870 880 890 900
900 910 920 930 940 950
pF1KB4 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP
910 920 930 940 950 960
960 970 980 990 1000 1010
pF1KB4 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ
970 980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KB4 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE
1030 1040 1050 1060 1070 1080
1080 1090 1100 1110 1120
pF1KB4 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
:::::::::::::::::::::::::::::::::::::::::::::
CCDS53 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1090 1100 1110 1120
>>CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108 aa)
initn: 6925 init1: 6925 opt: 7360 Z-score: 3430.5 bits: 646.6 E(32554): 9.2e-185
Smith-Waterman score: 7360; 99.8% identity (99.8% similar) in 1106 aa overlap (20-1124:3-1108)
10 20 30 40 50 60
pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
:::::::::::::::::::::::::::::::::::::::::
CCDS44 MKVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
10 20 30 40
70 80 90 100 110
pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDR-KEGQEILGPEAQADEAGCTVKDDECESDAENE
:::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::
CCDS44 LPTDQTVLPGRSSEREGNAKNCWEDDTGKEGQEILGPEAQADEAGCTVKDDECESDAENE
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB4 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB4 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB4 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB4 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB4 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB4 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB4 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG
470 480 490 500 510 520
540 550 560 570 580 590
pF1KB4 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY
530 540 550 560 570 580
600 610 620 630 640 650
pF1KB4 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN
590 600 610 620 630 640
660 670 680 690 700 710
pF1KB4 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY
650 660 670 680 690 700
720 730 740 750 760 770
pF1KB4 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK
710 720 730 740 750 760
780 790 800 810 820 830
pF1KB4 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP
770 780 790 800 810 820
840 850 860 870 880 890
pF1KB4 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT
830 840 850 860 870 880
900 910 920 930 940 950
pF1KB4 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP
890 900 910 920 930 940
960 970 980 990 1000 1010
pF1KB4 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ
950 960 970 980 990 1000
1020 1030 1040 1050 1060 1070
pF1KB4 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE
1010 1020 1030 1040 1050 1060
1080 1090 1100 1110 1120
pF1KB4 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
:::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1070 1080 1090 1100
>>CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057 aa)
initn: 6920 init1: 6920 opt: 6922 Z-score: 3227.9 bits: 609.0 E(32554): 1.8e-173
Smith-Waterman score: 6922; 98.7% identity (99.2% similar) in 1055 aa overlap (70-1124:4-1057)
40 50 60 70 80 90
pF1KB4 HIVEEESVTDAADCEGVPEDDLPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQ
: .:. .: : ... ::::::::::::
CCDS53 MADGPRCKRRKQA-NPRRNNGKEGQEILGPEAQ
10 20 30
100 110 120 130 140 150
pF1KB4 ADEAGCTVKDDECESDAENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ADEAGCTVKDDECESDAENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDE
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB4 NGTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 NGTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHM
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB4 TSHKSGRDQRHVTQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TSHKSGRDQRHVTQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSH
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB4 SGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQE
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB4 QLSVNQIKTEPVDYEFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QLSVNQIKTEPVDYEFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTV
280 290 300 310 320 330
400 410 420 430 440 450
pF1KB4 GLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISA
340 350 360 370 380 390
460 470 480 490 500 510
pF1KB4 ISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKD
400 410 420 430 440 450
520 530 540 550 560 570
pF1KB4 KSFEGGVNDSTCLLCDDCPGDINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KSFEGGVNDSTCLLCDDCPGDINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGD
460 470 480 490 500 510
580 590 600 610 620 630
pF1KB4 GNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV
520 530 540 550 560 570
640 650 660 670 680 690
pF1KB4 QSSEPSSPEPGKVNIPAKNNDQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QSSEPSSPEPGKVNIPAKNNDQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSR
580 590 600 610 620 630
700 710 720 730 740 750
pF1KB4 SSTPSPSPLNLSSSRNTQGYLYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SSTPSPSPLNLSSSRNTQGYLYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNS
640 650 660 670 680 690
760 770 780 790 800 810
pF1KB4 VYSVQEEPLNLSCAKKEPQKDSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VYSVQEEPLNLSCAKKEPQKDSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIAD
700 710 720 730 740 750
820 830 840 850 860 870
pF1KB4 QNSVPCLRALAANKQTILIPQVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QNSVPCLRALAANKQTILIPQVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVS
760 770 780 790 800 810
880 890 900 910 920 930
pF1KB4 NVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 NVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKK
820 830 840 850 860 870
940 950 960 970 980 990
pF1KB4 AFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 AFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE
880 890 900 910 920 930
1000 1010 1020 1030 1040 1050
pF1KB4 EAGPEILSNEHVGARASPSQGDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EAGPEILSNEHVGARASPSQGDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKP
940 950 960 970 980 990
1060 1070 1080 1090 1100 1110
pF1KB4 QGDEEEEEEEEEVEEEEVEEAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QGDEEEEEEEEEVEEEEVEEAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEE
1000 1010 1020 1030 1040 1050
1120
pF1KB4 KTNEA
:::::
CCDS53 KTNEA
>>CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104 aa)
initn: 6789 init1: 6789 opt: 6813 Z-score: 3177.1 bits: 599.7 E(32554): 1.2e-170
Smith-Waterman score: 7334; 98.1% identity (98.2% similar) in 1124 aa overlap (1-1124:1-1104)
10 20 30 40 50 60
pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDECESDAENEQ
:::::::::::::::::::::::::: .:::::::::::::
CCDS53 LPTDQTVLPGRSSEREGNAKNCWEDD--------------------IKDDECESDAENEQ
70 80 90 100
130 140 150 160 170 180
pF1KB4 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB4 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB4 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB4 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB4 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB4 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE
410 420 430 440 450 460
490 500 510 520 530 540
pF1KB4 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD
470 480 490 500 510 520
550 560 570 580 590 600
pF1KB4 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY
530 540 550 560 570 580
610 620 630 640 650 660
pF1KB4 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND
590 600 610 620 630 640
670 680 690 700 710 720
pF1KB4 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL
650 660 670 680 690 700
730 740 750 760 770 780
pF1KB4 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD
710 720 730 740 750 760
790 800 810 820 830 840
pF1KB4 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ
770 780 790 800 810 820
850 860 870 880 890 900
pF1KB4 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE
830 840 850 860 870 880
910 920 930 940 950 960
pF1KB4 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY
890 900 910 920 930 940
970 980 990 1000 1010 1020
pF1KB4 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG
950 960 970 980 990 1000
1030 1040 1050 1060 1070 1080
pF1KB4 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA
1010 1020 1030 1040 1050 1060
1090 1100 1110 1120
pF1KB4 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1070 1080 1090 1100
>>CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190 aa)
initn: 2009 init1: 781 opt: 1071 Z-score: 516.0 bits: 107.4 E(32554): 2e-22
Smith-Waterman score: 2812; 45.1% identity (70.0% similar) in 1151 aa overlap (35-1099:40-1171)
10 20 30 40 50
pF1KB4 PRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVP------E
.::::::.:...... : : : :
CCDS54 PRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQETSPASVPNHE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 DDLPTDQTVLPGRSSE---REGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDE--CE
.. ..:..:: . : :::.... :.... . :: . .:.:: .: .
CCDS54 SSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGP---VKNANCTSDFEEYFAK
70 80 90 100 110 120
120 130 140 150 160
pF1KB4 SDAENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GTPDAFSQL
:....: ..::.::..:::.:.:::::: .: :::::.:..:: ::::::.::
CCDS54 RKLEERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGTPDAFAQL
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB4 LTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQR
::::::::::::.:::::::::::::::.:::: ::::::::::::::::..:: : ::.
CCDS54 LTCPYCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTHKPGTDQH
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB4 HV-TQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHIS
.. ::.. ::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QMLTQGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHIS
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB4 SKKCISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ--EQLSVN
:::::.:: :::: :...::. ::: :.:.:: . . :.:.:.:: :::. :: ..
CCDS54 SKKCIGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSMSEQTGLL
310 320 330 340 350 360
350 360 370 380 390
pF1KB4 QIKTEPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL----PTV
.:::::.:. ..: .... :.. ..:..:: . . .:: . : :. .: . . : .
CCDS54 KIKTEPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGVGMEAPLL
370 380 390 400 410 420
400 410 420 430 440 450
pF1KB4 GLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPIQQGGHSV
:. . .. :::..:.::.. ::..: :: .. . ..: . ... ..: .:: :
CCDS54 GFPT-MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPEEQGVTSP
430 440 450 460 470 480
460 470 480 490 500 510
pF1KB4 -ISAISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVK
: ..::.:...:.:: ::.:.::. .. .. :.: .. .. :.::: . .
CCDS54 NIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKLRTLIDLV
490 500 510 520 530 540
520 530 540 550 560
pF1KB4 SEKDKSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP-----PP
.. :: .:. : :: . :. : :: : : . ..: ..: :: :
CCDS54 TD-DKMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQPHENIVPN
550 560 570 580 590
570 580 590 600 610 620
pF1KB4 LPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNL
.. ... .::. .. ... : :. .:.::::::.: .:...:: ::. .:.:
CCDS54 KAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLKISIAVGL
600 610 620 630 640 650
630 640 650 660
pF1KB4 PLDVVKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNNDQPQSAN
: . ::.:::. .. : : .::.: .:. : : .. :.: :. : .
CCDS54 PQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPMDSITSPS
660 670 680 690 700 710
670 680 690 700 710 720
pF1KB4 ANEPQDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYLYT
: ..:..: . ::..:. . . :: . :::.:::: :. .::.:... ::
CCDS54 IAELHNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKNSHSSSYT
720 730 740 750 760 770
730 740 750 760 770
pF1KB4 AEG-AQEEPQVEPLDLSLPKQQGE---LLE-----RSTITSVYQNSVYSVQE---EPLNL
.. ..:: :.::::::::::. : .. ... :. .::: : .: :::::
CCDS54 PNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSENSDEPLNL
780 790 800 810 820 830
780 790 800 810 820
pF1KB4 SCAKKEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRA
. ::: .... . . ..:: .. : ::.:. :.: .: :. :.:.: ::
CCDS54 TFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQTSIPGLRP
840 850 860 870 880 890
830 840 850 860 870 880
pF1KB4 LAANKQTILIPQVAYTYSTTVSP-AVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDS
. : ..:..:::: : .. : .. : . .: : : : ... .:...:..::
CCDS54 YPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSGLDDMTDS
900 910 920 930 940 950
890 900 910 920 930 940
pF1KB4 DSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHL
:: .::..:::.:::::::::: ::::::::::::::::::::.: ::::::::::::
CCDS54 DSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKAFKHKHHL
960 970 980 990 1000 1010
950 960 970 980 990 1000
pF1KB4 IEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE--EAG---
::: ::::::::::::::::::::::::::::::::::::::::::...:.: : :
CCDS54 IEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREAREKGHLE
1020 1030 1040 1050 1060 1070
1010 1020 1030 1040 1050
pF1KB4 P-EILSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKP
: :.: :. .: :: ::.::::. : : .::::.:.: .. . .
CCDS54 PTELLMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY-----GKLGRQ
1080 1090 1100 1110 1120 1130
1060 1070 1080 1090 1100 1110
pF1KB4 QGDEEEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSE
.:::: :::::: :.. .. . :. .: .: :: .:
CCDS54 DGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEEDNMEDGM
1140 1150 1160 1170 1180 1190
1120
pF1KB4 EKTNEA
>>CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214 aa)
initn: 2009 init1: 781 opt: 1071 Z-score: 515.9 bits: 107.4 E(32554): 2e-22
Smith-Waterman score: 2772; 45.2% identity (69.4% similar) in 1147 aa overlap (56-1099:65-1195)
30 40 50 60 70 80
pF1KB4 VVETNSDSDDEDKLHIVEEESVTDAADCEGVP--EDDLPTDQTVLPGRSSE---REGNAK
:: :.. ..:..:: . : :::...
CCDS21 GSETDEEDKLHIAEDDGIANPLDQETSPASVPNHESSPHVSQALLPREEEEDEIREGGVE
40 50 60 70 80 90
90 100 110
pF1KB4 NCWEDDR------------KEGQEILGPEAQADEA--GCTVKDDECESD---------AE
. :.... :: . .:::: . : . :::. .: :: :
CCDS21 HPWHNNEILQASVDGPEEMKEDYDTMGPEATIQTAINNGTVKNANCTSDFEEYFAKRKLE
100 110 120 130 140 150
120 130 140 150 160 170
pF1KB4 NEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GTPDAFSQLLTCP
....: ..::.::..:::.:.:::::: .: :::::.:..:: ::::::.::::::
CCDS21 ERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGTPDAFAQLLTCP
160 170 180 190 200 210
180 190 200 210 220 230
pF1KB4 YCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-T
::::::::.:::::::::::::::.:::: ::::::::::::::::..:: : ::... :
CCDS21 YCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLT
220 230 240 250 260 270
240 250 260 270 280 290
pF1KB4 QSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKC
:.. ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 QGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKC
280 290 300 310 320 330
300 310 320 330 340
pF1KB4 ISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKT
:.:: :::: :...::. ::: :.:.:: . . :.:.:.:: :::. :: .. .:::
CCDS21 IGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKT
340 350 360 370 380 390
350 360 370 380 390 400
pF1KB4 EPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL----PTVGLVS
::.:. ..: .... :.. ..:..:: . . .:: . : :. .: . . : .:. .
CCDS21 EPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT
400 410 420 430 440 450
410 420 430 440 450
pF1KB4 PISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPIQQGGHSV-ISA
.. :::..:.::.. ::..: :: .. . ..: . ... ..: .:: : :
CCDS21 -MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPP
460 470 480 490 500 510
460 470 480 490 500 510
pF1KB4 ISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKD
..::.:...:.:: ::.:.::. .. .. :.: .. .. :.::: . . .. :
CCDS21 VGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-D
520 530 540 550 560
520 530 540 550 560
pF1KB4 KSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP-----PPLPAA
: .:. : :: . :. : :: : : . ..: ..: :: : ..
CCDS21 KMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGV
570 580 590 600 610 620
570 580 590 600 610 620
pF1KB4 EAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNLPLDV
... .::. .. ... : :. .:.::::::.: .:...:: ::. .:.:: .
CCDS21 FVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEF
630 640 650 660 670 680
630 640 650 660 670
pF1KB4 VKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNNDQPQSANANEP
::.:::. .. : : .::.: .:. : : .. :.: :. : . :
CCDS21 VKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAEL
690 700 710 720 730 740
680 690 700 710 720
pF1KB4 QDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-
..:..: . ::..:. . . :: . :::.:::: :. .::.:... :: ..
CCDS21 HNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSF
750 760 770 780 790 800
730 740 750 760 770
pF1KB4 AQEEPQVEPLDLSLPKQQGE------LLERSTITSVY--QNSVYSVQE---EPLNLSCAK
..:: :.::::::::::. : ... .:. .::: : .: :::::. :
CCDS21 SSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSENSDEPLNLTFIK
810 820 830 840 850 860
780 790 800 810 820 830
pF1KB4 KEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAAN
:: .... . . ..:: .. : ::.:. :.: .: :. :.:.: :: .
CCDS21 KEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGL
870 880 890 900 910 920
840 850 860 870 880 890
pF1KB4 KQTILIPQVAYTYSTTVSP-AVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTP
: ..:..:::: : .. : .. : . .: : : : ... .:...:..::::
CCDS21 DQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCL
930 940 950 960 970 980
900 910 920 930 940 950
pF1KB4 PKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHM
.::..:::.:::::::::: ::::::::::::::::::::.: :::::::::::::::
CCDS21 SRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHS
990 1000 1010 1020 1030 1040
960 970 980 990 1000
pF1KB4 RLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE--EAG---P-EI
::::::::::::::::::::::::::::::::::::::::::...:.: : : : :.
CCDS21 RLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREAREKGHLEPTEL
1050 1060 1070 1080 1090 1100
1010 1020 1030 1040 1050 1060
pF1KB4 LSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDE
: :. .: :: ::.::::. : : .::::.:.: .. . . .:::
CCDS21 LMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY-----GKLGRQDGDE
1110 1120 1130 1140 1150
1070 1080 1090 1100 1110 1120
pF1KB4 EEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTN
: :::::: :.. .. . :. .: .: :: .:
CCDS21 EFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEEDNMEDGM
1160 1170 1180 1190 1200 1210
pF1KB4 EA
1124 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:50:37 2016 done: Thu Nov 3 14:50:38 2016
Total Scan time: 6.030 Total Display time: 0.430
Function used was FASTA [36.3.4 Apr, 2011]