Result of FASTA (ccds) for pF1KA0569
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KA0569, 1214 aa
  1>>>pF1KA0569 1214 - 1214 aa - 1214 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 10.4599+/-0.00126; mu= 0.0901+/- 0.075
 mean_var=378.7673+/-79.817, 0's: 0 Z-trim(112.1): 767  B-trim: 678 in 1/51
 Lambda= 0.065900
 statistics sampled from 12016 (12894) to 12016 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.396), width:  16
 Scan time:  5.970

The best scores are:                                      opt bits E(32554)
CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2            (1214) 8206 795.8       0
CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2           (1190) 7315 711.0 4.2e-204
CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10          (1057) 1071 117.4   2e-25
CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10          (1104) 1071 117.4   2e-25
CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10          (1108) 1071 117.4   2e-25
CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10           (1124) 1071 117.4 2.1e-25
CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10          (1125) 1071 117.4 2.1e-25


>>CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2                 (1214 aa)
 initn: 8206 init1: 8206 opt: 8206  Z-score: 4235.4  bits: 795.8 E(32554):    0
Smith-Waterman score: 8206; 100.0% identity (100.0% similar) in 1214 aa overlap (1-1214:1-1214)

               10        20        30        40        50        60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA0 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA0 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KA0 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KA0 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KA0 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KA0 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KA0 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KA0 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KA0 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KA0 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KA0 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KA0 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130      1140
pF1KA0 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
             1090      1100      1110      1120      1130      1140

             1150      1160      1170      1180      1190      1200
pF1KA0 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
             1150      1160      1170      1180      1190      1200

             1210    
pF1KA0 TKSDHEEDNMEDGM
       ::::::::::::::
CCDS21 TKSDHEEDNMEDGM
             1210    

>>CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2                (1190 aa)
 initn: 7303 init1: 7303 opt: 7315  Z-score: 3777.7  bits: 711.0 E(32554): 4.2e-204
Smith-Waterman score: 7993; 98.0% identity (98.0% similar) in 1214 aa overlap (1-1214:1-1190)

               10        20        30        40        50        60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
       ::::::::::::::::::::::::::::::::::::::::::::::::::          
CCDS54 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGP----------
               70        80        90       100       110          

              130       140       150       160       170       180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
                     ::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 --------------VKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
                            120       130       140       150      

              190       200       210       220       230       240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
        160       170       180       190       200       210      

              250       260       270       280       290       300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
        220       230       240       250       260       270      

              310       320       330       340       350       360
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS
        280       290       300       310       320       330      

              370       380       390       400       410       420
pF1KA0 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL
        340       350       360       370       380       390      

              430       440       450       460       470       480
pF1KA0 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA
        400       410       420       430       440       450      

              490       500       510       520       530       540
pF1KA0 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL
        460       470       480       490       500       510      

              550       560       570       580       590       600
pF1KA0 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE
        520       530       540       550       560       570      

              610       620       630       640       650       660
pF1KA0 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK
        580       590       600       610       620       630      

              670       680       690       700       710       720
pF1KA0 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN
        640       650       660       670       680       690      

              730       740       750       760       770       780
pF1KA0 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS
        700       710       720       730       740       750      

              790       800       810       820       830       840
pF1KA0 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS
        760       770       780       790       800       810      

              850       860       870       880       890       900
pF1KA0 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP
        820       830       840       850       860       870      

              910       920       930       940       950       960
pF1KA0 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG
        880       890       900       910       920       930      

              970       980       990      1000      1010      1020
pF1KA0 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE
        940       950       960       970       980       990      

             1030      1040      1050      1060      1070      1080
pF1KA0 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY
       1000      1010      1020      1030      1040      1050      

             1090      1100      1110      1120      1130      1140
pF1KA0 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH
       1060      1070      1080      1090      1100      1110      

             1150      1160      1170      1180      1190      1200
pF1KA0 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME
       1120      1130      1140      1150      1160      1170      

             1210    
pF1KA0 TKSDHEEDNMEDGM
       ::::::::::::::
CCDS54 TKSDHEEDNMEDGM
       1180      1190

>>CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10               (1057 aa)
 initn: 1888 init1: 781 opt: 1071  Z-score: 570.1  bits: 117.4 E(32554): 2e-25
Smith-Waterman score: 2759; 46.2% identity (70.3% similar) in 1098 aa overlap (114-1195:21-1032)

            90       100       110       120       130       140   
pF1KA0 EEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTMGPEATIQTAINNGTVKNANCTSD
                                     ::  . .::::  . :  . :::. .: ::
CCDS53           MADGPRCKRRKQANPRRNNGKEGQEILGPEAQADEA--GCTVKDDECESD
                         10        20        30          40        

           150       160       170       180       190       200   
pF1KA0 FEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGT
                 :....:  ..::.::..:::.:.:::::: .: :::::.:..::    ::
CCDS53 ---------AENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GT
                50        60        70        80        90         

           210       220       230       240       250       260   
pF1KA0 PDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTH
       ::::.::::::::::::::.:::::::::::::::.:::: ::::::::::::::::..:
CCDS53 PDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSH
         100       110       120       130       140       150     

           270       280       290       300       310       320   
pF1KA0 KPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSG
       : : ::... ::.. :::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSG
         160        170       180       190       200       210    

           330       340       350         360       370       380 
pF1KA0 SYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSM
       ::::::::::::.:: :::: :...::.  ::: :.:.:: . .  :.:.:.:: :::. 
CCDS53 SYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ-
          220       230       240        250       260        270  

             390       400       410       420       430       440 
pF1KA0 SEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGV
        :: .. .:::::.:. ..: .... :.. ..:..:: . . .:: .  : :. .: . .
CCDS53 -EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL
              280        290       300       310       320         

             450        460        470       480       490         
pF1KA0 GMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPE
           : .:. . .. :::..:.::.. ::..: :: .. .    ..: . ...   ..: 
CCDS53 ----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPI
         330       340       350       360          370       380  

     500       510       520       530       540       550         
pF1KA0 EQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKL
       .::  :  :  ..::.:...:.:: ::.:.::. .. ..  :.:  ..    .. :.:::
CCDS53 QQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKL
             390       400       410       420       430       440 

     560        570        580       590        600       610      
pF1KA0 RTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQP
          . . .. :: .:.  : :: . :. :    :: :  : . ..:      ..:   ::
CCDS53 PEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP
             450       460       470           480             490 

        620       630       640       650       660       670      
pF1KA0 HENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLK
            :   .. ...    .::. .. ...    : :. .:.::::::.: .:...:: :
CCDS53 -----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSK
                  500       510       520       530       540      

        680       690       700       710       720       730      
pF1KA0 ISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPM
       :. .:.:: . ::.:::. .. : :        .::.: .:.   : : ..    :.:  
CCDS53 IADSVNLPLDVVKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNN
        550       560       570              580              590  

        740       750       760       770        780       790     
pF1KA0 DSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKN
       :.  : .  : ..:..: . ::..:.    . . ::    . :::.::::  :. .::.:
CCDS53 DQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRN
            600       610           620       630       640        

         800       810       820       830       840       850     
pF1KA0 SHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSEN
       ...  :: .. ..:: :.::::::::::. :   ..      ...  :. .::: : .: 
CCDS53 TQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE-----RSTITSVYQNSVYSVQE-
      650        660       670          680            690         

         860       870       880       890       900       910     
pF1KA0 SDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQT
         :::::.  ::: .... . .  ..:: .. : ::.:.  :.:  .:  :.      :.
CCDS53 --EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQN
        700       710         720       730       740       750    

         920       930       940       950       960       970     
pF1KA0 SIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSG
       :.: ::   .  :  ..:..:::: : ... : ..   :  . .: : :  : ... .:.
CCDS53 SVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSN
          760       770       780        790       800       810   

         980       990      1000      1010      1020      1030     
pF1KA0 LDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKA
       ..:..::::   .::..:::.:::::::::: ::::::::::::::::::::.: :::::
CCDS53 VEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKA
           820       830       840       850       860       870   

        1040      1050      1060      1070      1080      1090     
pF1KA0 FKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREA
       :::::::::: ::::::::::::::::::::::::::::::::::::::::::...:.: 
CCDS53 FKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE-
           880       890       900       910       920       930   

        1100      1110       1120      1130        1140            
pF1KA0 REKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY----
        : :   : :.: :.      .: ::  ::.::::. :  : .::::.:.: ..      
CCDS53 -EAG---P-EILSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQE
                 940       950         960       970       980     

      1150      1160      1170      1180      1190      1200       
pF1KA0 -GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEE
         .  . .:::: :::::: :.. .. . :.  .: .:     :: .:            
CCDS53 EKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGE
         990      1000      1010       1020      1030      1040    

      1210          
pF1KA0 DNMEDGM      
                    
CCDS53 SSEQVSEEKTNEA
         1050       

>>CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10               (1104 aa)
 initn: 2009 init1: 781 opt: 1071  Z-score: 569.8  bits: 117.4 E(32554): 2e-25
Smith-Waterman score: 2933; 45.0% identity (69.2% similar) in 1206 aa overlap (6-1195:1-1079)

               10        20        30        40        50        60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
            :::::::::::::::::.::.::..::.:.:..:.::::::.:......  : : 
CCDS53      MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
                    10        20        30        40        50     

               70        80        90       100       110       120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
        :      :..  ..:..:: .  :   :::.... :...                    
CCDS53 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDD--------------------
                60        70           80                          

              130       140       150       160       170       180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
                     .:. .: ::          :....:  ..::.::..:::.:.::::
CCDS53 --------------IKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
                       90                100       110       120   

              190       200       210       220       230       240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
       :: .: :::::.:..::    ::::::.::::::::::::::.:::::::::::::::.:
CCDS53 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
           130       140           150       160       170         

              250       260       270       280       290       300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
       ::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS53 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
     180       190       200       210        220       230        

              310       320       330       340       350          
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
       :::::::::::::::::::::::::::::::::::.:: :::: :...::.  ::: :.:
CCDS53 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
      240       250       260       270       280       290        

      360       370       380       390       400       410        
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
       .:: . .  :.:.:.:: :::.  :: .. .:::::.:. ..: .... :.. ..:..::
CCDS53 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
       300       310          320       330        340       350   

      420       430       440       450        460        470      
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
        . . .:: .  : :. .: . .    : .:. . .. :::..:.::.. ::..: :: .
CCDS53 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
           360       370           380       390       400         

        480       490       500       510       520       530      
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
       . .    ..: . ...   ..: .::  :  :  ..::.:...:.:: ::.:.::. .. 
CCDS53 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
     410          420       430        440       450       460     

        540       550       560        570        580       590    
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
       ..  :.:  ..    .. :.:::   . . .. :: .:.  : :: . :. :    :: :
CCDS53 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
         470       480       490       500       510           520 

           600       610       620       630       640       650   
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
         : . ..:      ..:   ::     :   .. ...    .::. .. ...    : :
CCDS53 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
             530                  540       550       560       570

           660       670       680       690       700       710   
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
       . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : :        .::.
CCDS53 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
              580       590       600       610              620   

           720       730       740       750       760       770   
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
       : .:.   : : ..    :.:  :.  : .  : ..:..: . ::..:.    . . :: 
CCDS53 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
              630           640       650       660           670  

            780       790       800       810       820       830  
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
          . :::.::::  :. .::.:...  :: .. ..:: :.::::::::::. :   .. 
CCDS53 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
            680       690       700        710       720           

            840       850       860       870       880       890  
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
            ...  :. .::: : .:   :::::.  ::: .... . .  ..:: .. : ::.
CCDS53 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
           730       740          750       760         770        

            900       910       920       930       940       950  
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
       :.  :.:  .:  :.      :.:.: ::   .  :  ..:..:::: : ... : ..  
CCDS53 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
      780       790       800       810       820        830       

            960       970       980       990      1000      1010  
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
        :  . .: : :  : ... .:...:..::::   .::..:::.:::::::::: :::::
CCDS53 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
       840       850       860       870       880       890       

           1020      1030      1040      1050      1060      1070  
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
       :::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS53 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
       900       910       920       930       940       950       

           1080      1090      1100      1110       1120      1130 
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
       ::::::::::::::::...:.:  : :   : :.: :.      .: ::  ::.::::. 
CCDS53 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
       960       970         980           990      1000           

              1140           1150      1160      1170      1180    
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
       :  : .::::.:.: ..        .  . .:::: :::::: :.. .. . :.  .: .
CCDS53 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
    1010      1020      1030      1040      1050       1060        

         1190      1200      1210          
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM      
       :     :: .:                         
CCDS53 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
     1070      1080      1090      1100    

>>CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10               (1108 aa)
 initn: 1826 init1: 781 opt: 1071  Z-score: 569.8  bits: 117.4 E(32554): 2e-25
Smith-Waterman score: 2876; 45.1% identity (69.8% similar) in 1187 aa overlap (25-1195:3-1083)

               10        20        30        40        50        60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
                               :.::..::.:.:..:.::::::.:......  : : 
CCDS44                       MKVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
                                     10        20        30        

               70        80        90       100       110       120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
        :      :..  ..:..:: .  :   :::.... :...        :    ::  . .
CCDS44 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDT-------G----KEGQEIL
       40              50           60        70                   

              130       140       150       160       170       180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
       ::::  . :  . :::. .: ::          :....:  ..::.::..:::.:.::::
CCDS44 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
       80          90                100       110       120       

              190       200       210       220       230       240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
       :: .: :::::.:..::    ::::::.::::::::::::::.:::::::::::::::.:
CCDS44 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
       130       140           150       160       170       180   

              250       260       270       280       290       300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
       ::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS44 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
           190       200       210        220       230       240  

              310       320       330       340       350          
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
       :::::::::::::::::::::::::::::::::::.:: :::: :...::.  ::: :.:
CCDS44 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
            250       260       270       280       290        300 

      360       370       380       390       400       410        
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
       .:: . .  :.:.:.:: :::  .:: .. .:::::.:. ..: .... :.. ..:..::
CCDS44 ASPGSPTRPQIRQKIEN-KPL--QEQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
             310        320         330        340       350       

      420       430       440       450        460        470      
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
        . . .:: .  : :. .:    ..  : .:. . .. :::..:.::.. ::..: :: .
CCDS44 VFTGGGPLQATSSPQGMVQ----AVVLPTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
       360       370           380       390       400       410   

        480       490       500       510       520       530      
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
       . .    ..: . ...   ..: .::  :  :  ..::.:...:.:: ::.:.::. .. 
CCDS44 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
              420       430       440        450       460         

        540       550       560        570        580       590    
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
       ..  :.:  ..    .. :.:::   . . .. :: .:.  : :: . :. :    :: :
CCDS44 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
     470       480       490       500       510       520         

           600       610       620       630       640       650   
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
         : . ..:      ..:   ::     :   .. ...    .::. .. ...    : :
CCDS44 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
         530             540            550       560       570    

           660       670       680       690       700       710   
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
       . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : :        .::.
CCDS44 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
          580       590       600       610       620              

           720       730       740       750       760       770   
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
       : .:.   : : ..    :.:  :.  : .  : ..:..: . ::..:.    . . :: 
CCDS44 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
       630              640       650       660           670      

            780       790       800       810       820       830  
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
          . :::.::::  :. .::.:...  :: .. ..:: :.::::::::::. :   .. 
CCDS44 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
        680       690       700        710       720          730  

            840       850       860       870       880       890  
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
            ...  :. .::: : .:   :::::.  ::: .... . .  ..:: .. : ::.
CCDS44 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
                 740          750       760         770       780  

            900       910       920       930       940       950  
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
       :.  :.:  .:  :.      :.:.: ::   .  :  ..:..:::: : ... : ..  
CCDS44 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
            790       800       810       820       830        840 

            960       970       980       990      1000      1010  
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
        :  . .: : :  : ... .:...:..::::   .::..:::.:::::::::: :::::
CCDS44 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
             850       860       870       880       890       900 

           1020      1030      1040      1050      1060      1070  
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
       :::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS44 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
             910       920       930       940       950       960 

           1080      1090      1100      1110       1120      1130 
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
       ::::::::::::::::...:.:  : :   : :.: :.      .: ::  ::.::::. 
CCDS44 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
             970       980             990      1000        1010   

              1140           1150      1160      1170      1180    
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
       :  : .::::.:.: ..        .  . .:::: :::::: :.. .. . :.  .: .
CCDS44 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
          1020      1030      1040      1050      1060       1070  

         1190      1200      1210          
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM      
       :     :: .:                         
CCDS44 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
           1080      1090      1100        

>>CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10                (1124 aa)
 initn: 2009 init1: 781 opt: 1071  Z-score: 569.7  bits: 117.4 E(32554): 2.1e-25
Smith-Waterman score: 3011; 45.8% identity (70.3% similar) in 1206 aa overlap (6-1195:1-1099)

               10        20        30        40        50        60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
            :::::::::::::::::.::.::..::.:.:..:.::::::.:......  : : 
CCDS71      MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
                    10        20        30        40        50     

               70        80        90       100       110       120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
        :      :..  ..:..:: .  :   :::.... :....            ::  . .
CCDS71 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDR------------KEGQEIL
                60        70           80                    90    

              130       140       150       160       170       180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
       ::::  . :  . :::. .: ::          :....:  ..::.::..:::.:.::::
CCDS71 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
          100         110                120       130       140   

              190       200       210       220       230       240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
       :: .: :::::.:..::    ::::::.::::::::::::::.:::::::::::::::.:
CCDS71 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
           150       160           170       180       190         

              250       260       270       280       290       300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
       ::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS71 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
     200       210       220       230        240       250        

              310       320       330       340       350          
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
       :::::::::::::::::::::::::::::::::::.:: :::: :...::.  ::: :.:
CCDS71 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
      260       270       280       290       300       310        

      360       370       380       390       400       410        
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
       .:: . .  :.:.:.:: :::.  :: .. .:::::.:. ..: .... :.. ..:..::
CCDS71 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
       320       330          340       350        360       370   

      420       430       440       450        460        470      
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
        . . .:: .  : :. .: . .    : .:. . .. :::..:.::.. ::..: :: .
CCDS71 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
           380       390           400       410       420         

        480       490       500       510       520       530      
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
       . .    ..: . ...   ..: .::  :  :  ..::.:...:.:: ::.:.::. .. 
CCDS71 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
     430          440       450        460       470       480     

        540       550       560        570        580       590    
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
       ..  :.:  ..    .. :.:::   . . .. :: .:.  : :: . :. :    :: :
CCDS71 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
         490       500       510       520       530           540 

           600       610       620       630       640       650   
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
         : . ..:      ..:   ::     :   .. ...    .::. .. ...    : :
CCDS71 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
             550                  560       570       580       590

           660       670       680       690       700       710   
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
       . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : :        .::.
CCDS71 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
              600       610       620       630              640   

           720       730       740       750       760       770   
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
       : .:.   : : ..    :.:  :.  : .  : ..:..: . ::..:.    . . :: 
CCDS71 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
              650           660       670       680           690  

            780       790       800       810       820       830  
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
          . :::.::::  :. .::.:...  :: .. ..:: :.::::::::::. :   .. 
CCDS71 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
            700       710       720        730       740           

            840       850       860       870       880       890  
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
            ...  :. .::: : .:   :::::.  ::: .... . .  ..:: .. : ::.
CCDS71 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
           750       760          770       780         790        

            900       910       920       930       940       950  
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
       :.  :.:  .:  :.      :.:.: ::   .  :  ..:..:::: : ... : ..  
CCDS71 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
      800       810       820       830       840        850       

            960       970       980       990      1000      1010  
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
        :  . .: : :  : ... .:...:..::::   .::..:::.:::::::::: :::::
CCDS71 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
       860       870       880       890       900       910       

           1020      1030      1040      1050      1060      1070  
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
       :::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS71 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
       920       930       940       950       960       970       

           1080      1090      1100      1110       1120      1130 
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
       ::::::::::::::::...:.:  : :   : :.: :.      .: ::  ::.::::. 
CCDS71 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
       980       990        1000          1010      1020           

              1140           1150      1160      1170      1180    
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
       :  : .::::.:.: ..        .  . .:::: :::::: :.. .. . :.  .: .
CCDS71 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
    1030      1040      1050      1060      1070       1080        

         1190      1200      1210          
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM      
       :     :: .:                         
CCDS71 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
     1090      1100      1110      1120    

>>CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10               (1125 aa)
 initn: 2009 init1: 781 opt: 1071  Z-score: 569.7  bits: 117.4 E(32554): 2.1e-25
Smith-Waterman score: 3010; 45.9% identity (70.3% similar) in 1206 aa overlap (6-1195:1-1100)

               10        20        30        40        50        60
pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET
            :::::::::::::::::.::.::..::.:.:..:.::::::.:......  : : 
CCDS53      MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG
                    10        20        30        40        50     

               70        80        90       100       110       120
pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM
        :      :..  ..:..:: .  :   :::.... :...        :    ::  . .
CCDS53 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDT-------G----KEGQEIL
                60        70           80                   90     

              130       140       150       160       170       180
pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP
       ::::  . :  . :::. .: ::          :....:  ..::.::..:::.:.::::
CCDS53 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP
         100         110                120       130       140    

              190       200       210       220       230       240
pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN
       :: .: :::::.:..::    ::::::.::::::::::::::.:::::::::::::::.:
CCDS53 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN
          150       160           170       180       190       200

              250       260       270       280       290       300
pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH
       ::: ::::::::::::::::..:: : ::... ::.. ::::::::::::::::::::::
CCDS53 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH
              210       220       230        240       250         

              310       320       330       340       350          
pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS
       :::::::::::::::::::::::::::::::::::.:: :::: :...::.  ::: :.:
CCDS53 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS
     260       270       280       290       300       310         

      360       370       380       390       400       410        
pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG
       .:: . .  :.:.:.:: :::.  :: .. .:::::.:. ..: .... :.. ..:..::
CCDS53 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG
      320       330          340       350        360       370    

      420       430       440       450        460        470      
pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM
        . . .:: .  : :. .: . .    : .:. . .. :::..:.::.. ::..: :: .
CCDS53 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL
          380       390           400       410       420       430

        480       490       500       510       520       530      
pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA
       . .    ..: . ...   ..: .::  :  :  ..::.:...:.:: ::.:.::. .. 
CCDS53 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL
                 440       450        460       470       480      

        540       550       560        570        580       590    
pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI
       ..  :.:  ..    .. :.:::   . . .. :: .:.  : :: . :. :    :: :
CCDS53 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI
        490       500       510       520       530           540  

           600       610       620       630       640       650   
pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK
         : . ..:      ..:   ::     :   .. ...    .::. .. ...    : :
CCDS53 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK
            550                  560       570       580       590 

           660       670       680       690       700       710   
pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK
       . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : :        .::.
CCDS53 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE
             600       610       620       630       640           

           720       730       740       750       760       770   
pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-
       : .:.   : : ..    :.:  :.  : .  : ..:..: . ::..:.    . . :: 
CCDS53 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG
             650           660       670       680           690   

            780       790       800       810       820       830  
pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA
          . :::.::::  :. .::.:...  :: .. ..:: :.::::::::::. :   .. 
CCDS53 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE
           700       710       720        730       740            

            840       850       860       870       880       890  
pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK
            ...  :. .::: : .:   :::::.  ::: .... . .  ..:: .. : ::.
CCDS53 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN
          750       760          770       780         790         

            900       910       920       930       940       950  
pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR
       :.  :.:  .:  :.      :.:.: ::   .  :  ..:..:::: : ... : ..  
CCDS53 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP
     800       810       820       830       840        850        

            960       970       980       990      1000      1010  
pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS
        :  . .: : :  : ... .:...:..::::   .::..:::.:::::::::: :::::
CCDS53 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS
      860       870       880       890       900       910        

           1020      1030      1040      1050      1060      1070  
pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ
       :::::::::::::::.: ::::::::::::::: ::::::::::::::::::::::::::
CCDS53 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ
      920       930       940       950       960       970        

           1080      1090      1100      1110       1120      1130 
pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP
       ::::::::::::::::...:.:  : :   : :.: :.      .: ::  ::.::::. 
CCDS53 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT
      980       990      1000            1010      1020        1030

              1140           1150      1160      1170      1180    
pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE
       :  : .::::.:.: ..        .  . .:::: :::::: :.. .. . :.  .: .
CCDS53 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK
             1040      1050      1060      1070       1080         

         1190      1200      1210          
pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM      
       :     :: .:                         
CCDS53 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA
    1090      1100      1110      1120     




1214 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 00:45:18 2016 done: Fri Nov  4 00:45:19 2016
 Total Scan time:  5.970 Total Display time:  0.480

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com