Result of FASTA (ccds) for pF1KB8985
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB8985, 387 aa
  1>>>pF1KB8985 387 - 387 aa - 387 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.5883+/-0.000934; mu= 3.0606+/- 0.055
 mean_var=265.7092+/-56.068, 0's: 0 Z-trim(114.4): 857  B-trim: 0 in 0/52
 Lambda= 0.078681
 statistics sampled from 13999 (14974) to 13999 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.791), E-opt: 0.2 (0.46), width:  16
 Scan time:  3.110

The best scores are:                                      opt bits E(32554)
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8            ( 387) 2704 319.9 2.4e-87
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8           ( 349) 2380 283.1 2.6e-76
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5            ( 543)  968 123.0 6.3e-28
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10          ( 426)  768 100.2 3.7e-21
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10           ( 476)  768 100.3 3.9e-21
CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2            ( 589)  574 78.3 1.9e-14


>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8                 (387 aa)
 initn: 2704 init1: 2704 opt: 2704  Z-score: 1681.6  bits: 319.9 E(32554): 2.4e-87
Smith-Waterman score: 2704; 100.0% identity (100.0% similar) in 387 aa overlap (1-387:1-387)

               10        20        30        40        50        60
pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLT
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB8 NEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 NEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGAL
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB8 STQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 STQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB8 PALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIH
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB8 PGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHT
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB8 GHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 GHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKE
              310       320       330       340       350       360

              370       380       
pF1KB8 KKAEKGGAPSASSAPPVSLAPVVTTCA
       :::::::::::::::::::::::::::
CCDS60 KKAEKGGAPSASSAPPVSLAPVVTTCA
              370       380       

>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8                (349 aa)
 initn: 2380 init1: 2380 opt: 2380  Z-score: 1483.4  bits: 283.1 E(32554): 2.6e-76
Smith-Waterman score: 2380; 100.0% identity (100.0% similar) in 336 aa overlap (52-387:14-349)

              30        40        50        60        70        80 
pF1KB8 DNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAPGNK
                                     ::::::::::::::::::::::::::::::
CCDS56                  MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQPAPGNK
                                10        20        30        40   

              90       100       110       120       130       140 
pF1KB8 TVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 TVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMY
            50        60        70        80        90       100   

             150       160       170       180       190       200 
pF1KB8 PALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDYNLYHHPN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDYNLYHHPN
           110       120       130       140       150       160   

             210       220       230       240       250       260 
pF1KB8 DMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLTLKPIRPRKY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 DMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLTLKPIRPRKY
           170       180       190       200       210       220   

             270       280       290       300       310       320 
pF1KB8 PNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLT
           230       240       250       260       270       280   

             330       340       350       360       370       380 
pF1KB8 THIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 THIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAP
           290       300       310       320       330       340   

             
pF1KB8 VVTTCA
       ::::::
CCDS56 VVTTCA
             

>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5                 (543 aa)
 initn: 1043 init1: 716 opt: 968  Z-score: 614.8  bits: 123.0 E(32554): 6.3e-28
Smith-Waterman score: 1025; 48.7% identity (70.0% similar) in 380 aa overlap (31-385:81-449)

               10        20        30        40         50         
pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVH-YNQMATENVMDIGL
                                     :. . :. ..:.  . :.....:.  ::.:
CCDS42 AAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISL
               60        70        80        90       100       110

      60        70        80        90            100       110    
pF1KB8 TNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSN-----WCQDNIISLMSAGILGV-
       .:::   : :: ..    :    .:: :.:...   :     :  . ..::.: :.... 
CCDS42 NNEKVLVETSYPSQTTRLP---PITYTGRFSLEPAPNSGNTLW-PEPLFSLVS-GLVSMT
              120          130       140       150         160     

              120       130              140        150       160  
pF1KB8 -PPASG--ALSTQTSTASMVQ-PP------QGDVEAMYPALPPY-SNCGDLYSEPVSFHD
        ::::.  : :  .:.::  : ::      ..:   .: : : . .   :.. :: :   
CCDS42 NPPASSSSAPSPAASSASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAF
         170       180       190       200       210       220     

            170         180       190       200        210         
pF1KB8 PQGNPGLA--YSPQDYQSAKPALDSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIR
       : :. : :  : :  : .:: ...    :::::: . .. .:.: . :..:::::..  :
CCDS42 P-GSAGTALQYPPPAYPAAKGGFQ---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-R
          230       240          250       260       270        280

     220       230       240          250       260       270      
pF1KB8 VNPPPITPLETIKAFKDKQIHPGFGSLP---QPPLTLKPIRPRKYPNRPSKTPLHERPHA
       .. : .::: :::::  ..    . .:    :  : .:: : ::::::::::: ::::.:
CCDS42 TQQPSLTPLSTIKAFATQSGSQDLKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYA
              290       300       310        320       330         

        280       290       300       310       320       330      
pF1KB8 CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACE
       ::.:.::::::::::::::.:::::.::::::::::.::::::::::::::::::::::.
CCDS42 CPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACD
     340       350       360       370       380       390         

        340       350       360        370       380               
pF1KB8 FCGRKFARSDERKRHAKIHLKQKEKKAEKGG-APSASSAPPVSLAPVVTTCA        
       .::::::::::::::.::::.::.:::.:.  : ::.:.     .::.:.          
CCDS42 ICGRKFARSDERKRHTKIHLRQKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYP
     400       410       420       430       440       450         

CCDS42 SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVT
     460       470       480       490       500       510         

>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10               (426 aa)
 initn: 1136 init1: 731 opt: 768  Z-score: 493.4  bits: 100.2 E(32554): 3.7e-21
Smith-Waterman score: 1124; 51.1% identity (68.7% similar) in 403 aa overlap (47-387:2-394)

         20        30        40        50        60        70      
pF1KB8 LNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQP
                                     : .: .....: .:.:: . .: : .:: :
CCDS44                              MNGVAGDGMINIDMTGEKRSLDLPYPSSFAP
                                            10        20        30 

           80        90          100       110         120         
pF1KB8 --APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTAS-
         :: :.: ::.:::..:   :.  :  ..::...::::: ::  ::: . :.....:: 
CCDS44 VSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASP
              40        50        60        70        80        90 

        130                140          150        160          170
pF1KB8 --MVQPPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHDP---QGNPGLA
         ..  : :         :.. .:   :  ::::.: ::::..: .: .    . . .::
CCDS44 NPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSLA
             100       110       120       130       140       150 

               180       190       200             210        220  
pF1KB8 YSPQ-DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRVNP
       : :  .: : ::: : .::::::::  .  :.    :. :.  :..:::   .: .:: :
CCDS44 YPPPPSYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV-P
             160       170       180        190       200          

            230            240          250                        
pF1KB8 PPITPLETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTLKP
       ::.::: ::. :     .     ::   ::  :. :                   : :.:
CCDS44 PPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRP
     210       220       230       240       250       260         

          260       270       280       290       300       310    
pF1KB8 I-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSF
       : :::::::::::::.::::. :::::::::::::::::::.::::::::::::::::.:
CCDS44 ILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNF
     270       280       290       300       310       320         

          320       330       340       350       360       370    
pF1KB8 SRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSA
       :::::::::::::::::::::..::::::::::::::.::::.:::.:.   .::::: .
CCDS44 SRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS-V
     330       340       350       360       370          380      

          380                                       
pF1KB8 PPVSLAPVVTTCA                                
       :    :: ...:.                                
CCDS44 P----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
             390       400       410       420      

>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10                (476 aa)
 initn: 1228 init1: 731 opt: 768  Z-score: 492.8  bits: 100.3 E(32554): 3.9e-21
Smith-Waterman score: 1125; 50.9% identity (68.9% similar) in 405 aa overlap (45-387:50-444)

           20        30        40        50        60        70    
pF1KB8 SLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSF
                                     ..: .: .....: .:.:: . .: : .::
CCDS72 QLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSF
      20        30        40        50        60        70         

             80        90          100       110         120       
pF1KB8 QP--APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTA
        :  :: :.: ::.:::..:   :.  :  ..::...::::: ::  ::: . :.....:
CCDS72 APVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSA
      80        90       100       110       120       130         

          130                140          150        160           
pF1KB8 S---MVQPPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHDP---QGNPG
       :   ..  : :         :.. .:   :  ::::.: ::::..: .: .    . . .
CCDS72 SPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSS
     140       150       160       170       180       190         

      170        180       190       200             210        220
pF1KB8 LAYSPQ-DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRV
       ::: :  .: : ::: : .::::::::  .  :.    :. :.  :..:::   .: .::
CCDS72 LAYPPPPSYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV
     200       210       220       230        240       250        

              230            240          250                      
pF1KB8 NPPPITPLETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTL
        :::.::: ::. :     .     ::   ::  :. :                   : :
CCDS72 -PPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPL
       260       270       280       290       300       310       

            260       270       280       290       300       310  
pF1KB8 KPI-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMR
       .:: :::::::::::::.::::. :::::::::::::::::::.::::::::::::::::
CCDS72 RPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMR
       320       330       340       350       360       370       

            320       330       340       350       360       370  
pF1KB8 SFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSAS
       .::::::::::::::::::::::..::::::::::::::.::::.:::.:.   .:::::
CCDS72 NFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS
       380       390       400       410       420          430    

            380                                       
pF1KB8 SAPPVSLAPVVTTCA                                
        .:    :: ...:.                                
CCDS72 -VP----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
               440       450       460       470      

>>CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2                 (589 aa)
 initn: 768 init1: 554 opt: 574  Z-score: 372.7  bits: 78.3 E(32554): 1.9e-14
Smith-Waterman score: 600; 34.2% identity (55.2% similar) in 404 aa overlap (9-365:183-573)

                                     10        20        30        
pF1KB8                       MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSG
                                     :  . : ... .:.  .:..  . .::.::
CCDS19 LSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQAVPE--HPHDPEALFNLMSG
            160       170       180       190         200       210

         40        50            60        70        80        90  
pF1KB8 --SSDSVVHYNQMATENVMDI----GLTNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFD
         .       .  :... .:     :     :.:   :: ..  ::  ..    .  :  
CCDS19 ILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEAFWEASPCA-G
              220       230       240       250       260          

            100         110       120       130       140       150
pF1KB8 SPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMYPALPPYSNC
       .::.   .  .:   .. : : .:::: ::    ...:  . : .  : .  . :  .::
CCDS19 APSQCLYEPQLSPPDVKPG-LRAPPASPAL----DAVSAFKGPYAPWELLSVGAP--GNC
     270       280        290           300       310         320  

              160        170       180             190       200   
pF1KB8 GDLYSEPVSFHDPQGN-PGLAYSPQDYQSAK-----PALDSN-LFPMIPDYNLYHHPNDM
       :.  .  ..   :..  : .. . .:  : .     ::. .: :.:      .   :.:.
CCDS19 GSQGDYQAA---PEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFPLAPGDL
            330          340       350       360       370         

           210                    220       230           240      
pF1KB8 GSIPEHKPF-------------QGMDPIRVNPPPITPLETIKA----FKDKQIH--PGFG
       :   :  :              .: . .  . : ..::   .:    :    .   :: .
CCDS19 GEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVADIPGSS
     380       390       400       410       420       430         

          250             260       270              280       290 
pF1KB8 SLPQPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA----CPAEGCDRRFSRSDE
       ..  ::.   :  :      :.   : .:   .    ::::    ::.:.: : :.::::
CCDS19 GVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDE
     440       450       460       470       480       490         

             300       310       320       330       340       350 
pF1KB8 LTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRH
       :.:::::::::::::::::.:.::::::::::.:::::::::::. :::.::::::.:::
CCDS19 LNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRH
     500       510       520       530       540       550         

             360       370       380       
pF1KB8 AKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA
       .:.::::: .  :.                      
CCDS19 SKVHLKQKARAEERLKGLGFYSLGLSFASL      
     560       570       580               




387 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 08:28:10 2016 done: Sat Nov  5 08:28:10 2016
 Total Scan time:  3.110 Total Display time:  0.020

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com