Result of FASTA (ccds) for pF1KB5285
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB5285, 727 aa
  1>>>pF1KB5285 727 - 727 aa - 727 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.0362+/-0.00101; mu= 6.2213+/- 0.061
 mean_var=297.0005+/-61.542, 0's: 0 Z-trim(114.0): 875  B-trim: 0 in 0/54
 Lambda= 0.074421
 statistics sampled from 13576 (14546) to 13576 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.75), E-opt: 0.2 (0.447), width:  16
 Scan time:  3.970

The best scores are:                                      opt bits E(32554)
CCDS10841.1 CTCF gene_id:10664|Hs108|chr16         ( 727) 5025 553.5 4.2e-157
CCDS54029.1 CTCF gene_id:10664|Hs108|chr16         ( 399) 2819 316.3 5.6e-86
CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20       ( 663) 1894 217.3 6.2e-56
CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20       ( 700) 1894 217.3 6.5e-56
CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20       ( 665) 1883 216.1 1.4e-55
CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20       ( 460) 1850 212.4 1.3e-54
CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20       ( 573) 1819 209.1 1.5e-53
CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20       ( 627) 1819 209.2 1.6e-53
CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20       ( 422) 1786 205.4 1.4e-52
CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20       ( 403) 1766 203.3 6.1e-52
CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20       ( 299) 1702 196.3 5.9e-50
CCDS58779.1 CTCFL gene_id:140690|Hs108|chr20       ( 613)  983 119.4 1.6e-26
CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19      ( 717)  849 105.1 3.9e-22
CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16       ( 869)  839 104.1 9.4e-22
CCDS33093.2 ZNF28 gene_id:7576|Hs108|chr19         ( 718)  829 102.9 1.7e-21
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19      ( 936)  827 102.9 2.4e-21
CCDS69562.1 ZNF34 gene_id:80778|Hs108|chr8         ( 539)  813 101.1 4.7e-21
CCDS12946.1 ZFP28 gene_id:140612|Hs108|chr19       ( 868)  817 101.7 4.8e-21
CCDS47945.1 ZNF34 gene_id:80778|Hs108|chr8         ( 560)  813 101.1 4.8e-21
CCDS13442.1 ZFP64 gene_id:55734|Hs108|chr20        ( 679)  813 101.2 5.5e-21
CCDS13440.1 ZFP64 gene_id:55734|Hs108|chr20        ( 681)  813 101.2 5.5e-21
CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19        ( 665)  809 100.8 7.3e-21
CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19        ( 667)  809 100.8 7.3e-21
CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19       ( 687)  809 100.8 7.5e-21
CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19        ( 692)  809 100.8 7.5e-21
CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19       ( 715)  809 100.8 7.7e-21
CCDS75077.1 ZNF595 gene_id:152687|Hs108|chr4       ( 465)  798 99.4 1.3e-20
CCDS12854.1 ZNF83 gene_id:55769|Hs108|chr19        ( 516)  798 99.5 1.4e-20
CCDS75076.1 ZNF595 gene_id:152687|Hs108|chr4       ( 616)  798 99.5 1.6e-20
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19        ( 616)  798 99.5 1.6e-20
CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19      ( 580)  797 99.4 1.6e-20
CCDS75075.1 ZNF595 gene_id:152687|Hs108|chr4       ( 648)  798 99.6 1.6e-20
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19        ( 658)  798 99.6 1.6e-20
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19        ( 670)  798 99.6 1.7e-20
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19        ( 682)  798 99.6 1.7e-20
CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19      ( 644)  797 99.5 1.7e-20
CCDS74692.1 ZNF343 gene_id:79175|Hs108|chr20       ( 509)  789 98.5 2.7e-20
CCDS13028.1 ZNF343 gene_id:79175|Hs108|chr20       ( 599)  789 98.6   3e-20
CCDS74693.1 ZNF343 gene_id:79175|Hs108|chr20       ( 640)  789 98.6 3.2e-20
CCDS12972.1 ZNF329 gene_id:79673|Hs108|chr19       ( 541)  787 98.3 3.3e-20
CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5        ( 568)  782 97.8 4.9e-20
CCDS4311.2 ZNF300 gene_id:91975|Hs108|chr5         ( 604)  782 97.8 5.1e-20
CCDS54940.1 ZNF300 gene_id:91975|Hs108|chr5        ( 620)  782 97.8 5.2e-20
CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15       ( 614)  780 97.6   6e-20
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9        (1059)  783 98.2 6.9e-20
CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19       ( 782)  778 97.5 8.2e-20
CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19       ( 818)  778 97.5 8.4e-20
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19       ( 700)  776 97.2 8.8e-20
CCDS46166.1 ZNF534 gene_id:147658|Hs108|chr19      ( 661)  771 96.7 1.2e-19
CCDS46165.1 ZNF534 gene_id:147658|Hs108|chr19      ( 674)  771 96.7 1.2e-19


>>CCDS10841.1 CTCF gene_id:10664|Hs108|chr16              (727 aa)
 initn: 5025 init1: 5025 opt: 5025  Z-score: 2933.9  bits: 553.5 E(32554): 4.2e-157
Smith-Waterman score: 5025; 100.0% identity (100.0% similar) in 727 aa overlap (1-727:1-727)

               10        20        30        40        50        60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQLVQVPV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQLVQVPV
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB5 PVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVKVGANGEVETLEQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVKVGANGEVETLEQ
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB5 GELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEV
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB5 NAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 NAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCG
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB5 RAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYAS
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB5 VEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSG
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB5 TMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERY
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB5 ALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDM
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB5 HFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 HFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKR
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB5 KMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTN
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB5 QPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTPEM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTPEM
              670       680       690       700       710       720

              
pF1KB5 ILSMMDR
       :::::::
CCDS10 ILSMMDR
              

>>CCDS54029.1 CTCF gene_id:10664|Hs108|chr16              (399 aa)
 initn: 2819 init1: 2819 opt: 2819  Z-score: 1657.0  bits: 316.3 E(32554): 5.6e-86
Smith-Waterman score: 2819; 100.0% identity (100.0% similar) in 399 aa overlap (329-727:1-399)

      300       310       320       330       340       350        
pF1KB5 CGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDY
                                     ::::::::::::::::::::::::::::::
CCDS54                               MAFVTSGELVRHRRYKHTHEKPFKCSMCDY
                                             10        20        30

      360       370       380       390       400       410        
pF1KB5 ASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQ
               40        50        60        70        80        90

      420       430       440       450       460       470        
pF1KB5 SGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHE
              100       110       120       130       140       150

      480       490       500       510       520       530        
pF1KB5 RYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLL
              160       170       180       190       200       210

      540       550       560       570       580       590        
pF1KB5 DMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 DMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGR
              220       230       240       250       260       270

      600       610       620       630       640       650        
pF1KB5 KRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGR
              280       290       300       310       320       330

      660       670       680       690       700       710        
pF1KB5 TNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTP
              340       350       360       370       380       390

      720       
pF1KB5 EMILSMMDR
       :::::::::
CCDS54 EMILSMMDR
                

>>CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20            (663 aa)
 initn: 1806 init1: 1806 opt: 1894  Z-score: 1117.6  bits: 217.3 E(32554): 6.2e-56
Smith-Waterman score: 1894; 47.4% identity (70.1% similar) in 639 aa overlap (13-631:10-618)

               10        20        30        40        50        60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
                   :: : : :: . . ..    .:.:.    ... . .:.  . .:..  
CCDS13    MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
                  10        20        30        40        50       

               70        80        90       100       110          
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
            .. ..:. ..:..   .::  :.   .  :.:::.:..  . ... ...:     
CCDS13 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
               60           70           80        90       100    

                120       130       140       150       160        
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
              :: : :  . .     . ::      ...:  . .:  . .   : :. .:..
CCDS13 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
          110       120       130       140       150       160    

      170       180       190       200       210            220   
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
         ..  :   :   :   :. . .:.   :  :..::.    .: ..:     : .:   
CCDS13 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
          170       180           190           200       210      

              230       240       250       260       270       280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
       . ::  . ::....   ....:::.    :  :  . : ::.: ::.:..: .:  : :.
CCDS13 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
        220       230       240            250       260       270 

              290       300       310       320       330       340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
       ..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS13 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
             280       290       300       310       320       330 

              350       360       370       380       390       400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
       :::::::::::::::: :::::.::::::.:::::::::::  :::::::::::::::::
CCDS13 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
             340       350       360       370       380       390 

              410       420       430       440       450       460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
       :::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS13 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
             400       410       420       430       440       450 

              470       480       490       500       510       520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
       .:     :::::.::::::::::::::.::::::::: .:.:::.:::::  : ::::::
CCDS13 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
             460       470       480       490       500       510 

              530       540       550       560       570       580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
       ::..:  :.: :::::::. ::..::: ::.:... :::::: :.:  .. ::...:.. 
CCDS13 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSG
             520       530       540       550       560       570 

              590       600       610       620       630       640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
       ..  . .:    :..: ::::.   :: .. ...:     .  . .: :.:         
CCDS13 EAKSAASG----KGRRTRKRKQTILKEATKGQKEAAKGWKEAANGDEAAAEEASTTKGEQ
                 580       590       600       610       620       

              650       660       670       680       690       700
pF1KB5 VTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGE
                                                                   
CCDS13 FPGEMFPVACRETTARVKEEVDEGVTCEMLLNTMDK                        
       630       640       650       660                           

>>CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20            (700 aa)
 initn: 1806 init1: 1806 opt: 1894  Z-score: 1117.3  bits: 217.3 E(32554): 6.5e-56
Smith-Waterman score: 1894; 47.4% identity (70.1% similar) in 639 aa overlap (13-631:10-618)

               10        20        30        40        50        60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
                   :: : : :: . . ..    .:.:.    ... . .:.  . .:..  
CCDS58    MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
                  10        20        30        40        50       

               70        80        90       100       110          
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
            .. ..:. ..:..   .::  :.   .  :.:::.:..  . ... ...:     
CCDS58 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
               60           70           80        90       100    

                120       130       140       150       160        
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
              :: : :  . .     . ::      ...:  . .:  . .   : :. .:..
CCDS58 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
          110       120       130       140       150       160    

      170       180       190       200       210            220   
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
         ..  :   :   :   :. . .:.   :  :..::.    .: ..:     : .:   
CCDS58 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
          170       180           190           200       210      

              230       240       250       260       270       280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
       . ::  . ::....   ....:::.    :  :  . : ::.: ::.:..: .:  : :.
CCDS58 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
        220       230       240            250       260       270 

              290       300       310       320       330       340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
       ..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS58 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
             280       290       300       310       320       330 

              350       360       370       380       390       400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
       :::::::::::::::: :::::.::::::.:::::::::::  :::::::::::::::::
CCDS58 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
             340       350       360       370       380       390 

              410       420       430       440       450       460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
       :::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS58 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
             400       410       420       430       440       450 

              470       480       490       500       510       520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
       .:     :::::.::::::::::::::.::::::::: .:.:::.:::::  : ::::::
CCDS58 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
             460       470       480       490       500       510 

              530       540       550       560       570       580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
       ::..:  :.: :::::::. ::..::: ::.:... :::::: :.:  .. ::...:.. 
CCDS58 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSG
             520       530       540       550       560       570 

              590       600       610       620       630       640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
       ..  . .:    :..: ::::.   :: .. ...:     .  . .: :.:         
CCDS58 EAKSAASG----KGRRTRKRKQTILKEATKGQKEAAKGWKEAANGDEAAAEEASTTKGEQ
                 580       590       600       610       620       

              650       660       670       680       690       700
pF1KB5 VTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGE
                                                                   
CCDS58 FPGEMFPVACRETTARVKEEVDEGVTCEMLLNTMDNSAGCTGRMMLVSAWLLGRPQETYN
       630       640       650       660       670       680       

>>CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20            (665 aa)
 initn: 1806 init1: 1806 opt: 1883  Z-score: 1111.2  bits: 216.1 E(32554): 1.4e-55
Smith-Waterman score: 1883; 48.2% identity (70.8% similar) in 623 aa overlap (13-615:10-602)

               10        20        30        40        50        60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
                   :: : : :: . . ..    .:.:.    ... . .:.  . .:..  
CCDS58    MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
                  10        20        30        40        50       

               70        80        90       100       110          
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
            .. ..:. ..:..   .::  :.   .  :.:::.:..  . ... ...:     
CCDS58 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
               60           70           80        90       100    

                120       130       140       150       160        
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
              :: : :  . .     . ::      ...:  . .:  . .   : :. .:..
CCDS58 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
          110       120       130       140       150       160    

      170       180       190       200       210            220   
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
         ..  :   :   :   :. . .:.   :  :..::.    .: ..:     : .:   
CCDS58 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
          170       180           190           200       210      

              230       240       250       260       270       280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
       . ::  . ::....   ....:::.    :  :  . : ::.: ::.:..: .:  : :.
CCDS58 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
        220       230       240            250       260       270 

              290       300       310       320       330       340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
       ..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS58 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
             280       290       300       310       320       330 

              350       360       370       380       390       400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
       :::::::::::::::: :::::.::::::.:::::::::::  :::::::::::::::::
CCDS58 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
             340       350       360       370       380       390 

              410       420       430       440       450       460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
       :::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS58 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
             400       410       420       430       440       450 

              470       480       490       500       510       520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
       .:     :::::.::::::::::::::.::::::::: .:.:::.:::::  : ::::::
CCDS58 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
             460       470       480       490       500       510 

              530       540       550       560       570       580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
       ::..:  :.: :::::::. ::..::: ::.:... :::::: :.:  .. ::...:.. 
CCDS58 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSG
             520       530       540       550       560       570 

              590       600       610       620       630       640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
       ..  . .:    :..: ::::.   :: .. ...:                         
CCDS58 EAKSAASG----KGRRTRKRKQTILKEATKGQKEAAKGWKEAANGDGVISAHRNLCLLGS
                 580       590       600       610       620       

              650       660       670       680       690       700
pF1KB5 VTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGE
                                                                   
CCDS58 SDSHASVSGAGITDARHHAWLIVLLFLVEMGFYHVSHS                      
       630       640       650       660                           

>>CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20            (460 aa)
 initn: 1806 init1: 1806 opt: 1850  Z-score: 1094.0  bits: 212.4 E(32554): 1.3e-54
Smith-Waterman score: 1850; 64.9% identity (83.5% similar) in 393 aa overlap (223-615:14-397)

            200       210       220       230       240       250  
pF1KB5 KDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPP
                                     ::  . ::....   ....:::.    :  
CCDS68                  MSGDERSDEIVLTVSNSNVEEQEDQPTAGQADAEKA----KST
                                10        20        30             

            260       270       280       290       300       310  
pF1KB5 KPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCGRAFRTVTLLRNH
       :  . : ::.: ::.:..: .:  : :...::::.::.:.:: :::: ..::::::::::
CCDS68 KNQR-KTKGAKGTFHCDVCMFTSSRMSSFNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNH
      40         50        60        70        80        90        

            320       330       340       350       360       370  
pF1KB5 LNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYASVEVSKLKRHIRS
       .::::::::.:: ::.:::::::::::::::::::::::::::: :::::.::::::.::
CCDS68 VNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASVEASKLKRHVRS
      100       110       120       130       140       150        

            380       390       400       410       420       430  
pF1KB5 HTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSGTMKMHILQKHTE
       :::::::::  ::::::::::::::::::::::::::.:::.:::::::::.:::::: :
CCDS68 HTGERPFQCCQCSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQSGTMKIHILQKHGE
      160       170       180       190       200       210        

            440       450       460       470       480       490  
pF1KB5 NVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERYALIQHQKSHKNE
       :: :..:::: :.::::::: ::.:. :.:     :::::.::::::::::::::.::::
CCDS68 NVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHERYALIQHQKTHKNE
      220       230       240       250       260       270        

            500       510       520       530       540       550  
pF1KB5 KRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDMHFKRYHDPNFVP
       ::::: .:.:::.:::::  : ::::::::..:  :.: :::::::. ::..::: ::.:
CCDS68 KRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCFRQKQLLNAHFRKYHDANFIP
      280       290       300       310       320       330        

            560       570       580       590       600       610  
pF1KB5 AAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKRKMRSKKEDSSDS
       ... :::::: :.:  .. ::...:.. ..  . .:    :..: ::::.   :: .. .
CCDS68 TVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASG----KGRRTRKRKQTILKEATKGQ
      340       350       360       370           380       390    

            620       630       640       650       660       670  
pF1KB5 ENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQ
       ..:                                                         
CCDS68 KEAAKGWKEAANGDGVISAHRNLCLLGSSDSHASVSGAGITDARHHAWLIVLLFLVEMGF
          400       410       420       430       440       450    

>>CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20            (573 aa)
 initn: 2457 init1: 1761 opt: 1819  Z-score: 1074.9  bits: 209.1 E(32554): 1.5e-53
Smith-Waterman score: 1819; 50.0% identity (71.3% similar) in 574 aa overlap (13-566:10-557)

               10        20        30        40        50        60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
                   :: : : :: . . ..    .:.:.    ... . .:.  . .:..  
CCDS58    MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
                  10        20        30        40        50       

               70        80        90       100       110          
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
            .. ..:. ..:..   .::  :.   .  :.:::.:..  . ... ...:     
CCDS58 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
               60           70           80        90       100    

                120       130       140       150       160        
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
              :: : :  . .     . ::      ...:  . .:  . .   : :. .:..
CCDS58 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
          110       120       130       140       150       160    

      170       180       190       200       210            220   
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
         ..  :   :   :   :. . .:.   :  :..::.    .: ..:     : .:   
CCDS58 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
          170       180           190           200       210      

              230       240       250       260       270       280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
       . ::  . ::....   ....:::.    :  :  . : ::.: ::.:..: .:  : :.
CCDS58 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
        220       230       240            250       260       270 

              290       300       310       320       330       340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
       ..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS58 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
             280       290       300       310       320       330 

              350       360       370       380       390       400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
       :::::::::::::::: :::::.::::::.:::::::::::  :::::::::::::::::
CCDS58 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
             340       350       360       370       380       390 

              410       420       430       440       450       460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
       :::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS58 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
             400       410       420       430       440       450 

              470       480       490       500       510       520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
       .:     :::::.::::::::::::::.::::::::: .:.:::.:::::  : ::::::
CCDS58 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
             460       470       480       490       500       510 

              530       540       550       560       570       580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
       ::..:  :.: :::::::. ::..::: ::.:... :::::: :.:              
CCDS58 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWITSKWSGLKPQTF
             520       530       540       550       560       570 

              590       600       610       620       630       640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
                                                                   
CCDS58 IT                                                          
                                                                   

>>CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20            (627 aa)
 initn: 2457 init1: 1761 opt: 1819  Z-score: 1074.4  bits: 209.2 E(32554): 1.6e-53
Smith-Waterman score: 1819; 50.0% identity (71.3% similar) in 574 aa overlap (13-566:10-557)

               10        20        30        40        50        60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
                   :: : : :: . . ..    .:.:.    ... . .:.  . .:..  
CCDS68    MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
                  10        20        30        40        50       

               70        80        90       100       110          
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
            .. ..:. ..:..   .::  :.   .  :.:::.:..  . ... ...:     
CCDS68 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
               60           70           80        90       100    

                120       130       140       150       160        
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
              :: : :  . .     . ::      ...:  . .:  . .   : :. .:..
CCDS68 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
          110       120       130       140       150       160    

      170       180       190       200       210            220   
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
         ..  :   :   :   :. . .:.   :  :..::.    .: ..:     : .:   
CCDS68 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
          170       180           190           200       210      

              230       240       250       260       270       280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
       . ::  . ::....   ....:::.    :  :  . : ::.: ::.:..: .:  : :.
CCDS68 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
        220       230       240            250       260       270 

              290       300       310       320       330       340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
       ..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS68 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
             280       290       300       310       320       330 

              350       360       370       380       390       400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
       :::::::::::::::: :::::.::::::.:::::::::::  :::::::::::::::::
CCDS68 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
             340       350       360       370       380       390 

              410       420       430       440       450       460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
       :::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS68 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
             400       410       420       430       440       450 

              470       480       490       500       510       520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
       .:     :::::.::::::::::::::.::::::::: .:.:::.:::::  : ::::::
CCDS68 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
             460       470       480       490       500       510 

              530       540       550       560       570       580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
       ::..:  :.: :::::::. ::..::: ::.:... :::::: :.:              
CCDS68 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWILWVGNSEVAELG
             520       530       540       550       560       570 

              590       600       610       620       630       640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
                                                                   
CCDS68 GPGSGPLLRLQSGCPPGLHHPKAGLGPEDPLPGQLRHTTAGTGLSSLLQGPLCRAA    
             580       590       600       610       620           

>>CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20            (422 aa)
 initn: 2457 init1: 1761 opt: 1786  Z-score: 1057.3  bits: 205.4 E(32554): 1.4e-52
Smith-Waterman score: 1786; 70.3% identity (86.0% similar) in 344 aa overlap (223-566:14-352)

            200       210       220       230       240       250  
pF1KB5 KDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPP
                                     ::  . ::....   ....:::.    :  
CCDS58                  MSGDERSDEIVLTVSNSNVEEQEDQPTAGQADAEKA----KST
                                10        20        30             

            260       270       280       290       300       310  
pF1KB5 KPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCGRAFRTVTLLRNH
       :  . : ::.: ::.:..: .:  : :...::::.::.:.:: :::: ..::::::::::
CCDS58 KNQR-KTKGAKGTFHCDVCMFTSSRMSSFNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNH
      40         50        60        70        80        90        

            320       330       340       350       360       370  
pF1KB5 LNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYASVEVSKLKRHIRS
       .::::::::.:: ::.:::::::::::::::::::::::::::: :::::.::::::.::
CCDS58 VNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASVEASKLKRHVRS
      100       110       120       130       140       150        

            380       390       400       410       420       430  
pF1KB5 HTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSGTMKMHILQKHTE
       :::::::::  ::::::::::::::::::::::::::.:::.:::::::::.:::::: :
CCDS58 HTGERPFQCCQCSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQSGTMKIHILQKHGE
      160       170       180       190       200       210        

            440       450       460       470       480       490  
pF1KB5 NVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERYALIQHQKSHKNE
       :: :..:::: :.::::::: ::.:. :.:     :::::.::::::::::::::.::::
CCDS58 NVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHERYALIQHQKTHKNE
      220       230       240       250       260       270        

            500       510       520       530       540       550  
pF1KB5 KRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDMHFKRYHDPNFVP
       ::::: .:.:::.:::::  : ::::::::..:  :.: :::::::. ::..::: ::.:
CCDS58 KRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCFRQKQLLNAHFRKYHDANFIP
      280       290       300       310       320       330        

            560       570       580       590       600       610  
pF1KB5 AAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKRKMRSKKEDSSDS
       ... :::::: :.:                                              
CCDS58 TVYKCSKCGKGFSRWILWVGNSEVAELGGPGSGPLLRLQSGCPPGLHHPKAGLGPEDPLP
      340       350       360       370       380       390        

>>CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20            (403 aa)
 initn: 1742 init1: 1742 opt: 1766  Z-score: 1046.0  bits: 203.3 E(32554): 6.1e-52
Smith-Waterman score: 1766; 69.4% identity (86.3% similar) in 343 aa overlap (273-615:2-340)

            250       260       270       280       290       300  
pF1KB5 EKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCGRA
                                     .:  : :...::::.::.:.:: :::: ..
CCDS58                              MFTSSRMSSFNRHMKTHTSEKPHLCHLCLKT
                                            10        20        30 

            310       320       330       340       350       360  
pF1KB5 FRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYASVE
       ::::::::::.::::::::.:: ::.:::::::::::::::::::::::::::: :::::
CCDS58 FRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASVE
              40        50        60        70        80        90 

            370       380       390       400       410       420  
pF1KB5 VSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSGTM
       .::::::.:::::::::::  ::::::::::::::::::::::::::.:::.::::::::
CCDS58 ASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQSGTM
             100       110       120       130       140       150 

            430       440       450       460       470       480  
pF1KB5 KMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERYAL
       :.:::::: ::: :..:::: :.::::::: ::.:. :.:     :::::.:::::::::
CCDS58 KIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHERYAL
             160       170       180       190       200       210 

            490       500       510       520       530       540  
pF1KB5 IQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDMHF
       :::::.::::::::: .:.:::.:::::  : ::::::::..:  :.: :::::::. ::
CCDS58 IQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCFRQKQLLNAHF
             220       230       240       250       260       270 

            550       560       570       580       590       600  
pF1KB5 KRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKRKM
       ..::: ::.:... :::::: :.:  .. ::...:.. ..  . .:    :..: ::::.
CCDS58 RKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASG----KGRRTRKRKQ
             280       290       300       310           320       

            610       620       630       640       650       660  
pF1KB5 RSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTNQP
          :: .. ...:                                               
CCDS58 TILKEATKGQKEAAKGWKEAANGDGVISAHRNLCLLGSSDSHASVSGAGITDARHHAWLI
       330       340       350       360       370       380       




727 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 22:26:35 2016 done: Thu Nov  3 22:26:36 2016
 Total Scan time:  3.970 Total Display time:  0.150

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com