Result of FASTA (ccds) for pF1KB3810
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB3810, 500 aa
  1>>>pF1KB3810 500 - 500 aa - 500 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.2986+/-0.00119; mu= -1.0245+/- 0.069
 mean_var=306.3465+/-69.252, 0's: 0 Z-trim(110.4): 783  B-trim: 0 in 0/51
 Lambda= 0.073277
 statistics sampled from 10701 (11606) to 10701 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.711), E-opt: 0.2 (0.357), width:  16
 Scan time:  3.360

The best scores are:                                      opt bits E(32554)
CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8           ( 500) 3399 373.6 2.8e-103
CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8          ( 418) 2831 313.5   3e-85
CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20        ( 496) 1458 168.4 1.7e-41
CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6          ( 463) 1293 150.9 2.8e-36
CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6          ( 411) 1029 122.9 6.5e-28
CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20       ( 299)  497 66.6 4.5e-11
CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20       ( 403)  497 66.7 5.5e-11
CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20       ( 422)  497 66.7 5.7e-11
CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20       ( 460)  497 66.8   6e-11
CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20       ( 573)  497 66.9   7e-11
CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20       ( 627)  497 66.9 7.4e-11
CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20       ( 663)  497 66.9 7.7e-11
CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20       ( 665)  497 66.9 7.7e-11
CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20       ( 700)  497 66.9   8e-11


>>CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8                (500 aa)
 initn: 3399 init1: 3399 opt: 3399  Z-score: 1967.6  bits: 373.6 E(32554): 2.8e-103
Smith-Waterman score: 3399; 99.8% identity (100.0% similar) in 500 aa overlap (1-500:1-500)

               10        20        30        40        50        60
pF1KB3 MATVIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MATVIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGER
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB3 PYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKET
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKET
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB3 FKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAGKSSGGV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 FKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAGKSSGGV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB3 KEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 KEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQEL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB3 LKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPFTNTLQLNLYNTPFQSMQS
       :::::::::::::::::::::::::::::::::::.::::::::::::::::::::::::
CCDS61 LKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELLSKPFTNTLQLNLYNTPFQSMQS
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB3 SGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESYL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 SGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESYL
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB3 MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPALDFSQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPALDFSQ
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB3 LFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLHSLSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 LFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLHSLSA
              430       440       450       460       470       480

              490       500
pF1KB3 AFTSSLSTSTTLPRFHQAFQ
       ::::::::::::::::::::
CCDS61 AFTSSLSTSTTLPRFHQAFQ
              490       500

>>CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8               (418 aa)
 initn: 2831 init1: 2831 opt: 2831  Z-score: 1644.0  bits: 313.5 E(32554): 3e-85
Smith-Waterman score: 2831; 99.8% identity (100.0% similar) in 418 aa overlap (83-500:1-418)

             60        70        80        90       100       110  
pF1KB3 SYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLH
                                     ::::::::::::::::::::::::::::::
CCDS47                               MATHSPEKTHKCNYCEKMFHRKDHLKNHLH
                                             10        20        30

            120       130       140       150       160       170  
pF1KB3 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
               40        50        60        70        80        90

            180       190       200       210       220       230  
pF1KB3 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM
              100       110       120       130       140       150

            240       250       260       270       280       290  
pF1KB3 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPFTNTLQLNLYN
       :::::::::::::::::::::::::::::::::::::::::::.::::::::::::::::
CCDS47 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELLSKPFTNTLQLNLYN
              160       170       180       190       200       210

            300       310       320       330       340       350  
pF1KB3 TPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
              220       230       240       250       260       270

            360       370       380       390       400       410  
pF1KB3 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
              280       290       300       310       320       330

            420       430       440       450       460       470  
pF1KB3 TPALDFSQLFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TPALDFSQLFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGL
              340       350       360       370       380       390

            480       490       500
pF1KB3 GSLHSLSAAFTSSLSTSTTLPRFHQAFQ
       ::::::::::::::::::::::::::::
CCDS47 GSLHSLSAAFTSSLSTSTTLPRFHQAFQ
              400       410        

>>CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20             (496 aa)
 initn: 1626 init1: 1238 opt: 1458  Z-score: 858.7  bits: 168.4 E(32554): 1.7e-41
Smith-Waterman score: 1715; 52.2% identity (75.2% similar) in 504 aa overlap (3-500:6-496)

                  10        20           30        40        50    
pF1KB3    MATVIPGDLSEVRDTQKVPSG--KRKRG-ETKPRKNFPCQLCDKAFNSVEKLKVHSY
            : .:  ...... ..:      : :: :.. . .  :..    :.. :::. :: 
CCDS13 MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL
               10        20        30        40        50        60

           60        70        80        90       100       110    
pF1KB3 SHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTH
        .  .:::.: :  : :::.::::: ::::::: .: :.: ::.:::::::::.:::.::
CCDS13 PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH
               70        80        90       100       110       120

          120       130       140       150       160       170    
pF1KB3 DPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG
       :::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.:. 
CCDS13 DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR
              130       140       150       160       170       180

          180       190       200       210       220       230    
pF1KB3 KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKK
       . .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::.::
CCDS13 RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK
              190       200       210       220       230       240

          240       250       260       270        280       290   
pF1KB3 SHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLL-SKPFTNTLQLNLYNT
       ::.:::::.::::::.:  ..:. .: .:.:: ::. . : :.. .: : . : ...:..
CCDS13 SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA
              250       260       270       280       290       300

           300        310       320       330       340       350  
pF1KB3 PFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
        . .: :.:  :... .:::.::. :.. . .    .:  :: ..::::   .:.:  : 
CCDS13 HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-LP-
              310       320       330       340          350       

            360       370       380       390       400       410  
pF1KB3 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
       : :..:.: :: :..  :: . : .:       :: ..      .  :.::  ..:. : 
CCDS13 KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEALC
         360       370       380              390       400        

            420       430        440       450       460       470 
pF1KB3 TPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIG
       .  .:::.:..:.::: :: ::  ..:.: :.::: ::.  .. :  : ::    .. ..
CCDS13 AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLN
      410       420       430       440       450       460        

             480       490       500
pF1KB3 LGSLHSLSAAFTSSLSTSTTLPRFHQAFQ
       .: ::::  .:::.:: ::::::::::::
CCDS13 FGPLHSLPPVFTSGLS-STTLPRFHQAFQ
      470       480        490      

>>CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6               (463 aa)
 initn: 1221 init1: 751 opt: 1293  Z-score: 764.8  bits: 150.9 E(32554): 2.8e-36
Smith-Waterman score: 1306; 46.6% identity (68.9% similar) in 476 aa overlap (34-500:4-463)

            10        20        30        40        50        60   
pF1KB3 VIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGERPYK
                                     :::::: :.: ..::. .:.:::. :::::
CCDS52                            MATFPCQLCGKTFLTLEKFTIHNYSHSRERPYK
                                          10        20        30   

            70        80        90       100       110       120   
pF1KB3 CIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKETFKC
       :.: :: :::::.:::.::::::::.:.:.: .::: :.:::::::::.:::::: .: :
CCDS52 CVQPDCGKAFVSRYKLMRHMATHSPQKSHQCAHCEKTFNRKDHLKNHLQTHDPNKMAFGC
            40        50        60        70        80        90   

           130       140       150       160       170        180  
pF1KB3 EECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG-KSSGGVKE
       :::::.::: ::.:::::::::.:::::: ::   . :: :::.:::.::  :  .:.::
CCDS52 EECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAHAEEKPPSGTKE
           100       110       120       130       140       150   

            190       200       210       220       230       240  
pF1KB3 KKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQELLK
       :::::.::.: ::::::::::.::::: ::::::.:::::::::::::: ::.:.:::.:
CCDS52 KKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRHTKKTHSQELMK
           160       170       180       190       200       210   

            250        260       270         280       290         
pF1KB3 VKTEPVDFLDPF-TCNVSVPIKDELLPVMSLPSS--DLLSKPFTNTLQLNLYNTPFQSMQ
        . .  :.:. : : . :  .:   :: . : .:  . :.. .   ..    . : :. :
CCDS52 ESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHSLTLSPPEQAAQ
           220       230       240       250       260       270   

     300       310       320       330       340       350         
pF1KB3 SSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESY
             . ...:  ... : .     :.:    ::  .::::.   :    :::.. ...
CCDS52 PMQPLPESLASLHPSVS-PGSPPPPLPNH----KYNTTSTSYS---PLASLPLKADTKGF
           280       290        300           310          320     

     360        370       380       390       400       410        
pF1KB3 L-MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPA-LD
         . :   .:   :. :. .. . :.:   :.    :: ..: :   . .  :. :: ::
CCDS52 CNISLFEDLPL--QEPQSPQKLNPGFDLAKGN----AGKVNLPKELPADAVNLTIPASLD
         330         340       350           360       370         

       420       430        440       450       460       470      
pF1KB3 FSQLFNFIPLNGPP-YNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLH
       .: :..:  :  :   : .. ..:... ..   :  .: :  : :.     .:..::.: 
CCDS52 LSPLLGFWQLPPPATQNTFGNSTLALGPGESLPHR-LSCLGQQQQEPPLAMGTVSLGQLP
     380       390       400       410        420       430        

          480       490       500
pF1KB3 --SLSAAFTSSLSTSTTLPRFHQAFQ
          .  .:... . :. ::.::.::.
CCDS52 LPPIPHVFSAG-TGSAILPHFHHAFR
      440        450       460   

>>CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6               (411 aa)
 initn: 957 init1: 487 opt: 1029  Z-score: 614.6  bits: 122.9 E(32554): 6.5e-28
Smith-Waterman score: 1042; 44.3% identity (66.7% similar) in 427 aa overlap (83-500:1-411)

             60        70        80        90       100       110  
pF1KB3 SYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLH
                                     ::::::.:.:.: .::: :.:::::::::.
CCDS52                               MATHSPQKSHQCAHCEKTFNRKDHLKNHLQ
                                             10        20        30

            120       130       140       150       160       170  
pF1KB3 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
       :::::: .: ::::::.::: ::.:::::::::.:::::: ::   . :: :::.:::.:
CCDS52 THDPNKMAFGCEECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAH
               40        50        60        70        80        90

             180       190       200       210       220       230 
pF1KB3 AG-KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRH
       :  :  .:.:::::::.::.: ::::::::::.::::: ::::::.::::::::::::::
CCDS52 AEEKPPSGTKEKKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRH
              100       110       120       130       140       150

             240       250        260       270         280        
pF1KB3 MKKSHNQELLKVKTEPVDFLDPF-TCNVSVPIKDELLPVMSLPSS--DLLSKPFTNTLQL
        ::.:.:::.: . .  :.:. : : . :  .:   :: . : .:  . :.. .   .. 
CCDS52 TKKTHSQELMKESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHS
              160       170       180       190       200       210

      290       300       310       320       330       340        
pF1KB3 NLYNTPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEK
          . : :. :      . ...:  ... : .     :.:    ::  .::::.   :  
CCDS52 LTLSPPEQAAQPMQPLPESLASLHPSVS-PGSPPPPLPNH----KYNTTSTSYS---PLA
              220       230        240           250          260  

      350       360        370       380       390       400       
pF1KB3 EQPLKGEIESYL-MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISI
         :::.. ...  . :   .:   :. :. .. . :.:   :.    :: ..: :   . 
CCDS52 SLPLKADTKGFCNISLFEDLPL--QEPQSPQKLNPGFDLAKGN----AGKVNLPKELPAD
            270       280         290       300           310      

       410        420       430        440       450       460     
pF1KB3 SDPLNTPA-LDFSQLFNFIPLNGPP-YNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQD
       .  :. :: ::.: :..:  :  :   : .. ..:... ..   :  .: :  : :.   
CCDS52 AVNLTIPASLDLSPLLGFWQLPPPATQNTFGNSTLALGPGESLPHR-LSCLGQQQQEPPL
        320       330       340       350       360        370     

         470         480       490       500
pF1KB3 PANTIGLGSLH--SLSAAFTSSLSTSTTLPRFHQAFQ
         .:..::.:    .  .:... . :. ::.::.::.
CCDS52 AMGTVSLGQLPLPPIPHVFSAG-TGSAILPHFHHAFR
         380       390        400       410 

>>CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20            (299 aa)
 initn: 332 init1: 131 opt: 497  Z-score: 312.3  bits: 66.6 E(32554): 4.5e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:61-280)

                            10        20           30        40    
pF1KB3              MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
                                     : ::   ...: .   .: : :..:  :  
CCDS68 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
               40        50        60        70        80        90

           50        60        70        80        90       100    
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
        . ::: :  :::::::..: :  :. :  . :::.::: ::: :: ..:. :.  : ..
CCDS68 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
              100       110         120       130       140        

          110        120       130       140        150       160  
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
         .: : :. :  :   ..: .:.     :  .. :.  ::: ....: :. :  .:.  
CCDS68 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
      150       160       170       180       190       200        

            170       180       190       200       210       220  
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
        .:..: :.: .       ::. .:.::.     .. .  :. .:::.: : :  : . :
CCDS68 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
      210       220              230       240       250       260 

            230       240       250       260       270       280  
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
        .:. :. :..: :. ...                                         
CCDS68 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWVLY                      
             270       280       290                               

>>CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20            (403 aa)
 initn: 315 init1: 131 opt: 497  Z-score: 310.7  bits: 66.7 E(32554): 5.5e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:61-280)

                            10        20           30        40    
pF1KB3              MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
                                     : ::   ...: .   .: : :..:  :  
CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
               40        50        60        70        80        90

           50        60        70        80        90       100    
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
        . ::: :  :::::::..: :  :. :  . :::.::: ::: :: ..:. :.  : ..
CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
              100       110         120       130       140        

          110        120       130       140        150       160  
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
         .: : :. :  :   ..: .:.     :  .. :.  ::: ....: :. :  .:.  
CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
      150       160       170       180       190       200        

            170       180       190       200       210       220  
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
        .:..: :.: .       ::. .:.::.     .. .  :. .:::.: : :  : . :
CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
      210       220              230       240       250       260 

            230       240       250       260       270       280  
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
        .:. :. :..: :. ...                                         
CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASGKGRR
             270       280       290       300       310       320 

>>CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20            (422 aa)
 initn: 332 init1: 131 opt: 497  Z-score: 310.5  bits: 66.7 E(32554): 5.7e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:118-337)

                            10        20           30        40    
pF1KB3              MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
                                     : ::   ...: .   .: : :..:  :  
CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
        90       100       110       120       130       140       

           50        60        70        80        90       100    
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
        . ::: :  :::::::..: :  :. :  . :::.::: ::: :: ..:. :.  : ..
CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
       150       160         170       180       190       200     

          110        120       130       140        150       160  
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
         .: : :. :  :   ..: .:.     :  .. :.  ::: ....: :. :  .:.  
CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
         210       220       230       240       250       260     

            170       180       190       200       210       220  
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
        .:..: :.: .       ::. .:.::.     .. .  :. .:::.: : :  : . :
CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
         270              280       290       300       310        

            230       240       250       260       270       280  
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
        .:. :. :..: :. ...                                         
CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWILWVGNSEVAELGGPGSGPLLRLQS
      320       330       340       350       360       370        

>>CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20            (460 aa)
 initn: 315 init1: 131 opt: 497  Z-score: 310.0  bits: 66.8 E(32554): 6e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:118-337)

                            10        20           30        40    
pF1KB3              MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
                                     : ::   ...: .   .: : :..:  :  
CCDS68 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
        90       100       110       120       130       140       

           50        60        70        80        90       100    
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
        . ::: :  :::::::..: :  :. :  . :::.::: ::: :: ..:. :.  : ..
CCDS68 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
       150       160         170       180       190       200     

          110        120       130       140        150       160  
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
         .: : :. :  :   ..: .:.     :  .. :.  ::: ....: :. :  .:.  
CCDS68 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
         210       220       230       240       250       260     

            170       180       190       200       210       220  
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
        .:..: :.: .       ::. .:.::.     .. .  :. .:::.: : :  : . :
CCDS68 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
         270              280       290       300       310        

            230       240       250       260       270       280  
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
        .:. :. :..: :. ...                                         
CCDS68 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASGKGRR
      320       330       340       350       360       370        

>>CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20            (573 aa)
 initn: 332 init1: 131 opt: 497  Z-score: 308.8  bits: 66.9 E(32554): 7e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:323-542)

                            10        20           30        40    
pF1KB3              MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
                                     : ::   ...: .   .: : :..:  :  
CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
            300       310       320       330       340       350  

           50        60        70        80        90       100    
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
        . ::: :  :::::::..: :  :. :  . :::.::: ::: :: ..:. :.  : ..
CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
            360       370         380       390       400       410

          110        120       130       140        150       160  
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
         .: : :. :  :   ..: .:.     :  .. :.  ::: ....: :. :  .:.  
CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
              420       430       440       450       460       470

            170       180       190       200       210       220  
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
        .:..: :.: .       ::. .:.::.     .. .  :. .:::.: : :  : . :
CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
              480              490       500       510       520   

            230       240       250       260       270       280  
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
        .:. :. :..: :. ...                                         
CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWITSKWSGLKPQTFIT          
           530       540       550       560       570             




500 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 13:59:03 2016 done: Thu Nov  3 13:59:03 2016
 Total Scan time:  3.360 Total Display time:  0.060

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com