FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0569, 1214 aa
1>>>pF1KA0569 1214 - 1214 aa - 1214 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.4599+/-0.00126; mu= 0.0901+/- 0.075
mean_var=378.7673+/-79.817, 0's: 0 Z-trim(112.1): 767 B-trim: 678 in 1/51
Lambda= 0.065900
statistics sampled from 12016 (12894) to 12016 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.396), width: 16
Scan time: 5.970
The best scores are: opt bits E(32554)
CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214) 8206 795.8 0
CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190) 7315 711.0 4.2e-204
CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057) 1071 117.4 2e-25
CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104) 1071 117.4 2e-25
CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108) 1071 117.4 2e-25
CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124) 1071 117.4 2.1e-25
CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125) 1071 117.4 2.1e-25
>>CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214 aa)
initn: 8206 init1: 8206 opt: 8206 Z-score: 4235.4 bits: 795.8 E(32554): 0
Smith-Waterman score: 8206; 100.0% identity (100.0% similar) in 1214 aa overlap (1-1214:1-1214)
10 20 30 40 50 60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA0 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA0 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA0 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA0 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA0 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA0 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA0 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA0 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA0 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA0 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA0 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KA0 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KA0 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KA0 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
1150 1160 1170 1180 1190 1200
1210
pF1KA0 TKSDHEEDNMEDGM
::::::::::::::
CCDS21 TKSDHEEDNMEDGM
1210
>>CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190 aa)
initn: 7303 init1: 7303 opt: 7315 Z-score: 3777.7 bits: 711.0 E(32554): 4.2e-204
Smith-Waterman score: 7993; 98.0% identity (98.0% similar) in 1214 aa overlap (1-1214:1-1190)
10 20 30 40 50 60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGP----------
70 80 90 100 110
130 140 150 160 170 180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 --------------VKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
120 130 140 150
190 200 210 220 230 240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
160 170 180 190 200 210
250 260 270 280 290 300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
220 230 240 250 260 270
310 320 330 340 350 360
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
280 290 300 310 320 330
370 380 390 400 410 420
pF1KA0 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
340 350 360 370 380 390
430 440 450 460 470 480
pF1KA0 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
400 410 420 430 440 450
490 500 510 520 530 540
pF1KA0 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
460 470 480 490 500 510
550 560 570 580 590 600
pF1KA0 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
520 530 540 550 560 570
610 620 630 640 650 660
pF1KA0 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
580 590 600 610 620 630
670 680 690 700 710 720
pF1KA0 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
640 650 660 670 680 690
730 740 750 760 770 780
pF1KA0 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
700 710 720 730 740 750
790 800 810 820 830 840
pF1KA0 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
760 770 780 790 800 810
850 860 870 880 890 900
pF1KA0 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
820 830 840 850 860 870
910 920 930 940 950 960
pF1KA0 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
880 890 900 910 920 930
970 980 990 1000 1010 1020
pF1KA0 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
940 950 960 970 980 990
1030 1040 1050 1060 1070 1080
pF1KA0 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
1000 1010 1020 1030 1040 1050
1090 1100 1110 1120 1130 1140
pF1KA0 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
1060 1070 1080 1090 1100 1110
1150 1160 1170 1180 1190 1200
pF1KA0 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
1120 1130 1140 1150 1160 1170
1210
pF1KA0 TKSDHEEDNMEDGM
::::::::::::::
CCDS54 TKSDHEEDNMEDGM
1180 1190
>>CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057 aa)
initn: 1888 init1: 781 opt: 1071 Z-score: 570.1 bits: 117.4 E(32554): 2e-25
Smith-Waterman score: 2759; 46.2% identity (70.3% similar) in 1098 aa overlap (114-1195:21-1032)
90 100 110 120 130 140
pF1KA0 EEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTMGPEATIQTAINNGTVKNANCTSD
:: . .:::: . : . :::. .: ::
CCDS53 MADGPRCKRRKQANPRRNNGKEGQEILGPEAQADEA--GCTVKDDECESD
10 20 30 40
150 160 170 180 190 200
pF1KA0 FEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGT
:....: ..::.::..:::.:.:::::: .: :::::.:..:: ::
CCDS53 ---------AENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GT
50 60 70 80 90
210 220 230 240 250 260
pF1KA0 PDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTH
::::.::::::::::::::.:::::::::::::::.:::: ::::::::::::::::..:
CCDS53 PDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSH
100 110 120 130 140 150
270 280 290 300 310 320
pF1KA0 KPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSG
: : ::... ::.. :::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSG
160 170 180 190 200 210
330 340 350 360 370 380
pF1KA0 SYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSM
::::::::::::.:: :::: :...::. ::: :.:.:: . . :.:.:.:: :::.
CCDS53 SYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ-
220 230 240 250 260 270
390 400 410 420 430 440
pF1KA0 SEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGV
:: .. .:::::.:. ..: .... :.. ..:..:: . . .:: . : :. .: . .
CCDS53 -EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL
280 290 300 310 320
450 460 470 480 490
pF1KA0 GMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPE
: .:. . .. :::..:.::.. ::..: :: .. . ..: . ... ..:
CCDS53 ----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPI
330 340 350 360 370 380
500 510 520 530 540 550
pF1KA0 EQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKL
.:: : : ..::.:...:.:: ::.:.::. .. .. :.: .. .. :.:::
CCDS53 QQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKL
390 400 410 420 430 440
560 570 580 590 600 610
pF1KA0 RTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQP
. . .. :: .:. : :: . :. : :: : : . ..: ..: ::
CCDS53 PEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP
450 460 470 480 490
620 630 640 650 660 670
pF1KA0 HENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLK
: .. ... .::. .. ... : :. .:.::::::.: .:...:: :
CCDS53 -----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSK
500 510 520 530 540
680 690 700 710 720 730
pF1KA0 ISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPM
:. .:.:: . ::.:::. .. : : .::.: .:. : : .. :.:
CCDS53 IADSVNLPLDVVKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNN
550 560 570 580 590
740 750 760 770 780 790
pF1KA0 DSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKN
:. : . : ..:..: . ::..:. . . :: . :::.:::: :. .::.:
CCDS53 DQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRN
600 610 620 630 640
800 810 820 830 840 850
pF1KA0 SHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSEN
... :: .. ..:: :.::::::::::. : .. ... :. .::: : .:
CCDS53 TQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE-----RSTITSVYQNSVYSVQE-
650 660 670 680 690
860 870 880 890 900 910
pF1KA0 SDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQT
:::::. ::: .... . . ..:: .. : ::.:. :.: .: :. :.
CCDS53 --EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQN
700 710 720 730 740 750
920 930 940 950 960 970
pF1KA0 SIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSG
:.: :: . : ..:..:::: : ... : .. : . .: : : : ... .:.
CCDS53 SVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSN
760 770 780 790 800 810
980 990 1000 1010 1020 1030
pF1KA0 LDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKA
..:..:::: .::..:::.:::::::::: ::::::::::::::::::::.: :::::
CCDS53 VEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKA
820 830 840 850 860 870
1040 1050 1060 1070 1080 1090
pF1KA0 FKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREA
:::::::::: ::::::::::::::::::::::::::::::::::::::::::...:.:
CCDS53 FKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE-
880 890 900 910 920 930
1100 1110 1120 1130 1140
pF1KA0 REKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY----
: : : :.: :. .: :: ::.::::. : : .::::.:.: ..
CCDS53 -EAG---P-EILSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQE
940 950 960 970 980
1150 1160 1170 1180 1190 1200
pF1KA0 -GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEE
. . .:::: :::::: :.. .. . :. .: .: :: .:
CCDS53 EKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGE
990 1000 1010 1020 1030 1040
1210
pF1KA0 DNMEDGM
CCDS53 SSEQVSEEKTNEA
1050
>>CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104 aa)
initn: 2009 init1: 781 opt: 1071 Z-score: 569.8 bits: 117.4 E(32554): 2e-25
Smith-Waterman score: 2933; 45.0% identity (69.2% similar) in 1206 aa overlap (6-1195:1-1079)
10 20 30 40 50 60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
:::::::::::::::::.::.::..::.:.:..:.::::::.:...... : :
CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
10 20 30 40 50
70 80 90 100 110 120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
: :.. ..:..:: . : :::.... :...
CCDS53 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDD--------------------
60 70 80
130 140 150 160 170 180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
.:. .: :: :....: ..::.::..:::.:.::::
CCDS53 --------------IKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
90 100 110 120
190 200 210 220 230 240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
:: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.:
CCDS53 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
130 140 150 160 170
250 260 270 280 290 300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS53 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
180 190 200 210 220 230
310 320 330 340 350
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
:::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.:
CCDS53 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
240 250 260 270 280 290
360 370 380 390 400 410
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
.:: . . :.:.:.:: :::. :: .. .:::::.:. ..: .... :.. ..:..::
CCDS53 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
300 310 320 330 340 350
420 430 440 450 460 470
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
. . .:: . : :. .: . . : .:. . .. :::..:.::.. ::..: :: .
CCDS53 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
360 370 380 390 400
480 490 500 510 520 530
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
. . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. ..
CCDS53 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
410 420 430 440 450 460
540 550 560 570 580 590
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
.. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: :
CCDS53 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
470 480 490 500 510 520
600 610 620 630 640 650
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
: . ..: ..: :: : .. ... .::. .. ... : :
CCDS53 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
530 540 550 560 570
660 670 680 690 700 710
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
. .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::.
CCDS53 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
580 590 600 610 620
720 730 740 750 760 770
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
: .:. : : .. :.: :. : . : ..:..: . ::..:. . . ::
CCDS53 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
630 640 650 660 670
780 790 800 810 820 830
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
. :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : ..
CCDS53 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
680 690 700 710 720
840 850 860 870 880 890
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
... :. .::: : .: :::::. ::: .... . . ..:: .. : ::.
CCDS53 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
730 740 750 760 770
900 910 920 930 940 950
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
:. :.: .: :. :.:.: :: . : ..:..:::: : ... : ..
CCDS53 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
780 790 800 810 820 830
960 970 980 990 1000 1010
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
: . .: : : : ... .:...:..:::: .::..:::.:::::::::: :::::
CCDS53 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
840 850 860 870 880 890
1020 1030 1040 1050 1060 1070
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
:::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS53 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
900 910 920 930 940 950
1080 1090 1100 1110 1120 1130
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
::::::::::::::::...:.: : : : :.: :. .: :: ::.::::.
CCDS53 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
960 970 980 990 1000
1140 1150 1160 1170 1180
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
: : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: .
CCDS53 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
1010 1020 1030 1040 1050 1060
1190 1200 1210
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM
: :: .:
CCDS53 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1070 1080 1090 1100
>>CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108 aa)
initn: 1826 init1: 781 opt: 1071 Z-score: 569.8 bits: 117.4 E(32554): 2e-25
Smith-Waterman score: 2876; 45.1% identity (69.8% similar) in 1187 aa overlap (25-1195:3-1083)
10 20 30 40 50 60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
:.::..::.:.:..:.::::::.:...... : :
CCDS44 MKVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
10 20 30
70 80 90 100 110 120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
: :.. ..:..:: . : :::.... :... : :: . .
CCDS44 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDT-------G----KEGQEIL
40 50 60 70
130 140 150 160 170 180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
:::: . : . :::. .: :: :....: ..::.::..:::.:.::::
CCDS44 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
80 90 100 110 120
190 200 210 220 230 240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
:: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.:
CCDS44 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
130 140 150 160 170 180
250 260 270 280 290 300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS44 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
190 200 210 220 230 240
310 320 330 340 350
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
:::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.:
CCDS44 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
250 260 270 280 290 300
360 370 380 390 400 410
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
.:: . . :.:.:.:: ::: .:: .. .:::::.:. ..: .... :.. ..:..::
CCDS44 ASPGSPTRPQIRQKIEN-KPL--QEQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
310 320 330 340 350
420 430 440 450 460 470
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
. . .:: . : :. .: .. : .:. . .. :::..:.::.. ::..: :: .
CCDS44 VFTGGGPLQATSSPQGMVQ----AVVLPTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
360 370 380 390 400 410
480 490 500 510 520 530
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
. . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. ..
CCDS44 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
420 430 440 450 460
540 550 560 570 580 590
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
.. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: :
CCDS44 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
470 480 490 500 510 520
600 610 620 630 640 650
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
: . ..: ..: :: : .. ... .::. .. ... : :
CCDS44 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
530 540 550 560 570
660 670 680 690 700 710
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
. .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::.
CCDS44 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
580 590 600 610 620
720 730 740 750 760 770
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
: .:. : : .. :.: :. : . : ..:..: . ::..:. . . ::
CCDS44 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
630 640 650 660 670
780 790 800 810 820 830
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
. :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : ..
CCDS44 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
680 690 700 710 720 730
840 850 860 870 880 890
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
... :. .::: : .: :::::. ::: .... . . ..:: .. : ::.
CCDS44 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
740 750 760 770 780
900 910 920 930 940 950
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
:. :.: .: :. :.:.: :: . : ..:..:::: : ... : ..
CCDS44 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
790 800 810 820 830 840
960 970 980 990 1000 1010
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
: . .: : : : ... .:...:..:::: .::..:::.:::::::::: :::::
CCDS44 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
850 860 870 880 890 900
1020 1030 1040 1050 1060 1070
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
:::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS44 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
910 920 930 940 950 960
1080 1090 1100 1110 1120 1130
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
::::::::::::::::...:.: : : : :.: :. .: :: ::.::::.
CCDS44 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
970 980 990 1000 1010
1140 1150 1160 1170 1180
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
: : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: .
CCDS44 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
1020 1030 1040 1050 1060 1070
1190 1200 1210
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM
: :: .:
CCDS44 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1080 1090 1100
>>CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124 aa)
initn: 2009 init1: 781 opt: 1071 Z-score: 569.7 bits: 117.4 E(32554): 2.1e-25
Smith-Waterman score: 3011; 45.8% identity (70.3% similar) in 1206 aa overlap (6-1195:1-1099)
10 20 30 40 50 60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
:::::::::::::::::.::.::..::.:.:..:.::::::.:...... : :
CCDS71 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
10 20 30 40 50
70 80 90 100 110 120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
: :.. ..:..:: . : :::.... :.... :: . .
CCDS71 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDR------------KEGQEIL
60 70 80 90
130 140 150 160 170 180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
:::: . : . :::. .: :: :....: ..::.::..:::.:.::::
CCDS71 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
100 110 120 130 140
190 200 210 220 230 240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
:: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.:
CCDS71 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
150 160 170 180 190
250 260 270 280 290 300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS71 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
200 210 220 230 240 250
310 320 330 340 350
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
:::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.:
CCDS71 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
260 270 280 290 300 310
360 370 380 390 400 410
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
.:: . . :.:.:.:: :::. :: .. .:::::.:. ..: .... :.. ..:..::
CCDS71 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
320 330 340 350 360 370
420 430 440 450 460 470
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
. . .:: . : :. .: . . : .:. . .. :::..:.::.. ::..: :: .
CCDS71 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
380 390 400 410 420
480 490 500 510 520 530
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
. . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. ..
CCDS71 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
.. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: :
CCDS71 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
490 500 510 520 530 540
600 610 620 630 640 650
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
: . ..: ..: :: : .. ... .::. .. ... : :
CCDS71 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
550 560 570 580 590
660 670 680 690 700 710
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
. .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::.
CCDS71 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
600 610 620 630 640
720 730 740 750 760 770
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
: .:. : : .. :.: :. : . : ..:..: . ::..:. . . ::
CCDS71 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
650 660 670 680 690
780 790 800 810 820 830
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
. :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : ..
CCDS71 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
700 710 720 730 740
840 850 860 870 880 890
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
... :. .::: : .: :::::. ::: .... . . ..:: .. : ::.
CCDS71 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
750 760 770 780 790
900 910 920 930 940 950
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
:. :.: .: :. :.:.: :: . : ..:..:::: : ... : ..
CCDS71 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
800 810 820 830 840 850
960 970 980 990 1000 1010
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
: . .: : : : ... .:...:..:::: .::..:::.:::::::::: :::::
CCDS71 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
860 870 880 890 900 910
1020 1030 1040 1050 1060 1070
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
:::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS71 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
920 930 940 950 960 970
1080 1090 1100 1110 1120 1130
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
::::::::::::::::...:.: : : : :.: :. .: :: ::.::::.
CCDS71 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
980 990 1000 1010 1020
1140 1150 1160 1170 1180
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
: : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: .
CCDS71 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
1030 1040 1050 1060 1070 1080
1190 1200 1210
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM
: :: .:
CCDS71 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1090 1100 1110 1120
>>CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125 aa)
initn: 2009 init1: 781 opt: 1071 Z-score: 569.7 bits: 117.4 E(32554): 2.1e-25
Smith-Waterman score: 3010; 45.9% identity (70.3% similar) in 1206 aa overlap (6-1195:1-1100)
10 20 30 40 50 60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
:::::::::::::::::.::.::..::.:.:..:.::::::.:...... : :
CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
10 20 30 40 50
70 80 90 100 110 120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
: :.. ..:..:: . : :::.... :... : :: . .
CCDS53 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDT-------G----KEGQEIL
60 70 80 90
130 140 150 160 170 180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
:::: . : . :::. .: :: :....: ..::.::..:::.:.::::
CCDS53 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
100 110 120 130 140
190 200 210 220 230 240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
:: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.:
CCDS53 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
150 160 170 180 190 200
250 260 270 280 290 300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS53 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
210 220 230 240 250
310 320 330 340 350
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
:::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.:
CCDS53 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
260 270 280 290 300 310
360 370 380 390 400 410
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
.:: . . :.:.:.:: :::. :: .. .:::::.:. ..: .... :.. ..:..::
CCDS53 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
320 330 340 350 360 370
420 430 440 450 460 470
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
. . .:: . : :. .: . . : .:. . .. :::..:.::.. ::..: :: .
CCDS53 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
380 390 400 410 420 430
480 490 500 510 520 530
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
. . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. ..
CCDS53 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
440 450 460 470 480
540 550 560 570 580 590
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
.. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: :
CCDS53 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
490 500 510 520 530 540
600 610 620 630 640 650
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
: . ..: ..: :: : .. ... .::. .. ... : :
CCDS53 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
550 560 570 580 590
660 670 680 690 700 710
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
. .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::.
CCDS53 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
600 610 620 630 640
720 730 740 750 760 770
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
: .:. : : .. :.: :. : . : ..:..: . ::..:. . . ::
CCDS53 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
650 660 670 680 690
780 790 800 810 820 830
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
. :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : ..
CCDS53 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
700 710 720 730 740
840 850 860 870 880 890
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
... :. .::: : .: :::::. ::: .... . . ..:: .. : ::.
CCDS53 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
750 760 770 780 790
900 910 920 930 940 950
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
:. :.: .: :. :.:.: :: . : ..:..:::: : ... : ..
CCDS53 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
800 810 820 830 840 850
960 970 980 990 1000 1010
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
: . .: : : : ... .:...:..:::: .::..:::.:::::::::: :::::
CCDS53 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
860 870 880 890 900 910
1020 1030 1040 1050 1060 1070
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
:::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS53 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
920 930 940 950 960 970
1080 1090 1100 1110 1120 1130
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
::::::::::::::::...:.: : : : :.: :. .: :: ::.::::.
CCDS53 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
980 990 1000 1010 1020 1030
1140 1150 1160 1170 1180
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
: : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: .
CCDS53 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
1040 1050 1060 1070 1080
1190 1200 1210
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM
: :: .:
CCDS53 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
1090 1100 1110 1120
1214 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 00:45:18 2016 done: Fri Nov 4 00:45:19 2016
Total Scan time: 5.970 Total Display time: 0.480
Function used was FASTA [36.3.4 Apr, 2011]