Result of FASTA (ccds) for pFN21AB7053
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7053, 543 aa
  1>>>pF1KB7053 543 - 543 aa - 543 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 12.7062+/-0.00103; mu= -13.0814+/- 0.062
 mean_var=449.9068+/-93.758, 0's: 0 Z-trim(116.2): 829  B-trim: 0 in 0/53
 Lambda= 0.060466
 statistics sampled from 15849 (16756) to 15849 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.786), E-opt: 0.2 (0.515), width:  16
 Scan time:  4.400

The best scores are:                                      opt bits E(32554)
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5            ( 543) 3664 333.7 3.3e-91
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8           ( 349)  968 98.4 1.5e-20
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8            ( 387)  968 98.5 1.6e-20
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10          ( 426)  823 85.8 1.1e-16
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10           ( 476)  823 85.9 1.2e-16


>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5                 (543 aa)
 initn: 3664 init1: 3664 opt: 3664  Z-score: 1751.0  bits: 333.7 E(32554): 3.3e-91
Smith-Waterman score: 3664; 100.0% identity (100.0% similar) in 543 aa overlap (1-543:1-543)

               10        20        30        40        50        60
pF1KB7 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGAPEGSGS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGAPEGSGS
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 NSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 YPSQTTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVSGLVSMTNPPASSSSAPSPAAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 YPSQTTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVSGLVSMTNPPASSSSAPSPAAS
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 SASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFPGSAGTALQYPPPAY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFPGSAGTALQYPPPAY
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 PAAKGGFQVPMIPDYLFPQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PAAKGGFQVPMIPDYLFPQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQSG
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 SQDLKALNTSYQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SQDLKALNTSYQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIR
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 IHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLR
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB7 QKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 QKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSS
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB7 TYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTI
              490       500       510       520       530       540

          
pF1KB7 EIC
       :::
CCDS42 EIC
          

>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8                (349 aa)
 initn: 1004 init1: 716 opt: 968  Z-score: 482.6  bits: 98.4 E(32554): 1.5e-20
Smith-Waterman score: 1010; 50.4% identity (69.7% similar) in 357 aa overlap (103-449:14-347)

             80        90       100       110       120            
pF1KB7 GGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETSYPSQTTRLP---
                                     :.  ::.:.:::   : :: ..    :   
CCDS56                  MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQPAPGNK
                                10        20        30        40   

     130       140       150        160       170       180        
pF1KB7 PITYTGRFSLEPAPNSGNTLW-PEPLFSLVSGLVSMTNPPASSSSAPSPAASSASASQSP
        .:: :.:...   :     :  . ..::.:. . .  ::::  .: :  .:.::  : :
CCDS56 TVTYLGKFAFDSPSN-----WCQDNIISLMSAGI-LGVPPAS--GALSTQTSTASMVQ-P
            50             60        70           80        90     

      190       200       210       220        230       240       
pF1KB7 PLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFP-GSAGTALQYPPPAYPAAKGGF
       :      ..:   .: : : . .   :.. :: :   : :. : :  : :  : .:: ..
CCDS56 P------QGDVEAMYPALPPY-SNCGDLYSEPVSFHDPQGNPGLA--YSPQDYQSAKPAL
                100        110       120       130         140     

          250       260       270        280       290       300   
pF1KB7 Q---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-RTQQPSLTPLSTIKAFATQSGSQD
       .    :::::: . .. .:.: . :..:::::..  :.. : .::: :::::  .   : 
CCDS56 DSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIRVNPPPITPLETIKAFKDK---QI
         150       160        170       180       190          200 

           310        320       330       340       350       360  
pF1KB7 LKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIRIH
         ....  :  : .:: : ::::::::::: ::::.:::.:.::::::::::::::.:::
CCDS56 HPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIH
             210       220       230       240       250       260 

            370       380       390       400       410       420  
pF1KB7 TGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQK
       ::.::::::::::.::::::::::::::::::::::..::::::::::::::.::::.::
CCDS56 TGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQK
             270       280       290       300       310       320 

            430       440       450       460       470       480  
pF1KB7 DKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTY
       .:::.:.  : ::.:.     .::.:.                                 
CCDS56 EKKAEKGG-APSASSAPPVSLAPVVTTCA                               
              330       340                                        

>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8                 (387 aa)
 initn: 1043 init1: 716 opt: 968  Z-score: 482.0  bits: 98.5 E(32554): 1.6e-20
Smith-Waterman score: 1025; 48.9% identity (69.7% similar) in 380 aa overlap (81-449:31-385)

               60        70        80        90       100       110
pF1KB7 AAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISL
                                     :. . :. ..:.  . :.....:.  ::.:
CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVH-YNQMATENVMDIGL
               10        20        30        40         50         

              120          130       140       150        160      
pF1KB7 NNEKVLVETSYPSQTTRLP---PITYTGRFSLEPAPNSGNTLW-PEPLFSLVSGLVSMTN
       .:::   : :: ..    :    .:: :.:...   :     :  . ..::.:. . .  
CCDS60 TNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSN-----WCQDNIISLMSAGI-LGV
      60        70        80        90            100       110    

        170       180       190       200       210        220     
pF1KB7 PPASSSSAPSPAASSASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNT-DIFPEPQSQAF
       ::::  .: :  .:.::  : ::      ..:   .: : :  :  :  :.. :: :   
CCDS60 PPAS--GALSTQTSTASMVQ-PP------QGDVEAMYPALP--PYSNCGDLYSEPVSFHD
             120       130              140         150       160  

          230       240          250       260       270        280
pF1KB7 P-GSAGTALQYPPPAYPAAKGGFQ---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-R
       : :. : :  : :  : .:: ...    :::::: . .. .:.: . :..:::::..  :
CCDS60 PQGNPGLA--YSPQDYQSAKPALDSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIR
            170         180       190       200        210         

              290       300       310        320       330         
pF1KB7 TQQPSLTPLSTIKAFATQSGSQDLKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYA
       .. : .::: :::::  .   :   ....  :  : .:: : ::::::::::: ::::.:
CCDS60 VNPPPITPLETIKAFKDK---QIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHA
     220       230          240       250       260       270      

     340       350       360       370       380       390         
pF1KB7 CPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACD
       ::.:.::::::::::::::.:::::.::::::::::.::::::::::::::::::::::.
CCDS60 CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACE
        280       290       300       310       320       330      

     400       410       420       430       440       450         
pF1KB7 ICGRKFARSDERKRHTKIHLRQKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYP
       .::::::::::::::.::::.::.:::.:.  : ::.:.     .::.:.          
CCDS60 FCGRKFARSDERKRHAKIHLKQKEKKAEKGG-APSASSAPPVSLAPVVTTCA        
        340       350       360        370       380               

     460       470       480       490       500       510         
pF1KB7 SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVT

>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10               (426 aa)
 initn: 939 init1: 708 opt: 823  Z-score: 413.1  bits: 85.8 E(32554): 1.1e-16
Smith-Waterman score: 998; 44.7% identity (66.5% similar) in 418 aa overlap (107-469:11-426)

         80        90       100       110       120            130 
pF1KB7 SNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETSYPSQ-----TTRLPPI
                                     .:....::  ..  :::.     . :   .
CCDS44                     MNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTF
                                   10        20        30        40

             140       150        160       170       180       190
pF1KB7 TYTGRFSLEPAPNSGNTLWPEPLFSLVS-GLVSMTNPPASSSSAPSPAASSASASQSPPL
       :: :.::..:    : . .:: ....:: :... .. :::.... : ...: .   . ::
CCDS44 TYMGKFSIDPQ-YPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPLATGPL
               50         60        70        80        90         

                 200       210           220         230        240
pF1KB7 S-CAVPSN--DSSPIYSAAPTFPTPNT----DIFPEPQS--QAFPGSAGTALQYPPP-AY
       . :.. ..  : . .::  :  : : .    :.. .:..  .:   :....: :::: .:
CCDS44 GVCTMSQTQPDLDHLYSPPPP-PPPYSGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSY
     100       110       120        130       140       150        

                 250         260         270        280       290  
pF1KB7 PAAKGGFQ---VPMIPDY--LFPQQ-QGDL-GLGTPDQKPFQ-GLESRTQQPSLTPLSTI
       :. : . .    ::::::  .::.: : :: : . ::.:::   :..    : :::::::
CCDS44 PSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPPPLTPLSTI
      160       170       180       190       200       210        

                        300                  310          320      
pF1KB7 KAFA------------TQSGSQDLK-----------ALNTSYQSQLI--KPS-RMRKYPN
       . :.            ...::.  .           :  ..:. . .  .:  : :::::
CCDS44 RNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPILRPRKYPN
      220       230       240       250       260       270        

        330       340       350       360       370       380      
pF1KB7 RPSKTPPHERPYACPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTH
       :::::: ::::: ::.:.::::::::::::::::::::.:::::::::::::::::::::
CCDS44 RPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTH
      280       290       300       310       320       330        

        390       400       410       420          430        440  
pF1KB7 IRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQKDKKADK---SVVA-SSATSSLSSY
       ::::::::::::: ::::::::::::::::::::::..:..    :: : :.:. : .  
CCDS44 IRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQ
      340       350       360       370       380       390        

            450        460       470       480       490       500 
pF1KB7 PSPVATSYPSPVTTSYP-SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSS
       :. .  :  :    . : .: ..   .:                                
CCDS44 PGGTLCSSNSSSLGGGPLAPCSSRTRTP                                
      400       410       420                                      

>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10                (476 aa)
 initn: 939 init1: 708 opt: 823  Z-score: 412.4  bits: 85.9 E(32554): 1.2e-16
Smith-Waterman score: 1019; 43.1% identity (66.7% similar) in 448 aa overlap (80-469:32-476)

      50        60        70        80        90       100         
pF1KB7 GAAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTA---ESFP
                                     ...: :. :.:. :  :......   ... 
CCDS72 MTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELG-GPFDQMNGVAGDGMI
              10        20        30        40         50        60

        110       120            130       140       150        160
pF1KB7 DISLNNEKVLVETSYPSQ-----TTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVS-G
       .:....::  ..  :::.     . :   .:: :.::..:    : . .:: ....:: :
CCDS72 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQ-YPGASCYPEGIINIVSAG
               70        80        90       100        110         

              170       180       190          200       210       
pF1KB7 LVSMTNPPASSSSAPSPAASSASASQSPPLS-CAVPSN--DSSPIYSAAPTFPTPNT---
       ... .. :::.... : ...: .   . ::. :.. ..  : . .::  :  : : .   
CCDS72 ILQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPP-PPPYSGCA
     120       130       140       150       160       170         

           220         230        240          250         260     
pF1KB7 -DIFPEPQS--QAFPGSAGTALQYPPP-AYPAAKGGFQ---VPMIPDY--LFPQQ-QGDL
        :.. .:..  .:   :....: :::: .::. : . .    ::::::  .::.: : ::
CCDS72 GDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDL
      180       190       200       210       220       230        

           270        280       290                   300          
pF1KB7 -GLGTPDQKPFQ-GLESRTQQPSLTPLSTIKAFA------------TQSGSQDLK-----
        : . ::.:::   :..    : :::::::. :.            ...::.  .     
CCDS72 HGTAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSS
      240       250       260       270       280       290        

               310          320       330       340       350      
pF1KB7 ------ALNTSYQSQLI--KPS-RMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELT
             :  ..:. . .  .:  : ::::::::::: ::::: ::.:.::::::::::::
CCDS72 SAAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELT
      300       310       320       330       340       350        

        360       370       380       390       400       410      
pF1KB7 RHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTK
       ::::::::.:::::::::::::::::::::::::::::::::: ::::::::::::::::
CCDS72 RHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTK
      360       370       380       390       400       410        

        420          430        440       450        460       470 
pF1KB7 IHLRQKDKKADK---SVVA-SSATSSLSSYPSPVATSYPSPVTTSYP-SPATTSYPSPVP
       ::::::..:..    :: : :.:. : .  :. .  :  :    . : .: ..   .:  
CCDS72 IHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP  
      420       430       440       450       460       470        

             480       490       500       510       520       530 
pF1KB7 TSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDM




543 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 09:59:15 2016 done: Sun Nov  6 09:59:16 2016
 Total Scan time:  4.400 Total Display time:  0.020

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com