Result of FASTA (ccds) for pFN21AE4031
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE4031, 242 aa
  1>>>pF1KE4031 242 - 242 aa - 242 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.9618+/-0.000982; mu= 7.6169+/- 0.059
 mean_var=145.6224+/-30.398, 0's: 0 Z-trim(109.2): 83  B-trim: 0 in 0/50
 Lambda= 0.106282
 statistics sampled from 10648 (10722) to 10648 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.329), width:  16
 Scan time:  2.240

The best scores are:                                      opt bits E(32554)
CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4          ( 242) 1657 265.3 2.6e-71
CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2          ( 259)  448 80.0 1.7e-15
CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17         ( 344)  426 76.7 2.2e-14
CCDS7138.1 BMI1 gene_id:648|Hs108|chr10            ( 326)  415 75.0 6.8e-14
CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10     ( 469)  415 75.1   9e-14
CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10        ( 350)  411 74.4 1.1e-13
CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10         ( 256)  382 69.8 1.9e-12


>>CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4               (242 aa)
 initn: 1657 init1: 1657 opt: 1657  Z-score: 1393.8  bits: 265.3 E(32554): 2.6e-71
Smith-Waterman score: 1657; 100.0% identity (100.0% similar) in 242 aa overlap (1-242:1-242)

               10        20        30        40        50        60
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVIH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVIH
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE4 QSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHLD
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE4 SHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSAQA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSAQA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE4 TVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWRFKKAPLLLHYRPKMD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWRFKKAPLLLHYRPKMD
              190       200       210       220       230       240

         
pF1KE4 LL
       ::
CCDS33 LL
         

>>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2               (259 aa)
 initn: 612 init1: 448 opt: 448  Z-score: 391.5  bits: 80.0 E(32554): 1.7e-15
Smith-Waterman score: 599; 40.8% identity (69.3% similar) in 238 aa overlap (5-238:35-255)

                                         10        20        30    
pF1KE4                           MLTRKIKLWDINAHITCRLCSGYLIDATTVTECL
                                     ..:. :.: ::.: ::.::..::::.::::
CCDS19 QGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL
           10        20        30        40        50        60    

           40        50        60        70        80        90    
pF1KE4 HTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQR
       ::::.::.::::. .. :: : : ::...::  .  ::.:::::::::::::..: .. :
CCDS19 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR
           70        80        90       100       110       120    

          100       110       120       130       140       150    
pF1KE4 EFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQ
       :::.. :..   .  ::    .  :..     .. : :. .            :.: :::
CCDS19 EFYQSRGLDRVTQPTGE----EPALSNLGLPFSSFDHSKAH------------YYRYDEQ
          130       140           150       160                    

          160           170       180       190       200       210
pF1KE4 VSICLE-CNSSKLRG---LKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEIL
       ...:::  .:.: ..   :. :..:::..: : ::.. . ..: :.  .....: ..:.:
CCDS19 LNLCLERLSSGKDKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNP-QHVQLLFDNEVL
      170       180       190       200       210        220       

              220       230       240  
pF1KE4 GKDHTLKFVVVTRWRFKKAPLLLHYRPKMDLL
           :.: . ..::  : .::::.:  :    
CCDS19 PDHMTMKQIWLSRWFGKPSPLLLQYSVKEKRR
       230       240       250         

>>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17              (344 aa)
 initn: 530 init1: 419 opt: 426  Z-score: 371.7  bits: 76.7 E(32554): 2.2e-14
Smith-Waterman score: 528; 36.4% identity (66.9% similar) in 236 aa overlap (3-236:4-228)

                10        20        30        40        50         
pF1KE4  MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI
          : .::. ..: :. : ::.::.:::::..::::.::..:.:.::: :. :: : . .
CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV
               10        20        30        40        50        60

      60        70        80        90       100        110        
pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGM-EVPGDIKGETCSAKQH
       :...::  :  :.:.::::::::::: . ::...:.::    . :::.   : . .  . 
CCDS32 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPN---GSNEDRGEV
               70        80        90       100          110       

      120       130       140       150       160       170        
pF1KE4 LDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSA
       :.... :  . :.  .      .  .: : ...       :: ...  .    ...:: :
CCDS32 LEQEK-GALSDDEIVSLSIEFYEGARDRDEKKGP------LENGDGDKEKTGVRFLRCPA
       120        130       140       150             160       170

      180       190       200       210        220       230       
pF1KE4 QATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTL-KFVVVTRWRFKKAPLLLHYRP
         ::.:: ::. .:... :  ....: ..: : . .::  .. .  :: ...:: :.:: 
CCDS32 AMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWR-RNGPLPLKYRV
              180       190       200       210        220         

       240                                                         
pF1KE4 KMDLL                                                       
                                                                   
CCDS32 QPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSS
     230       240       250       260       270       280         

>>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10                 (326 aa)
 initn: 558 init1: 412 opt: 415  Z-score: 362.9  bits: 75.0 E(32554): 6.8e-14
Smith-Waterman score: 524; 36.6% identity (66.0% similar) in 238 aa overlap (3-236:4-226)

                10        20        30        40        50         
pF1KE4  MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI
          : .::. ..: :. : ::.::.:::::. ::::.::..:.:.::: .. :: : . .
CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCIVRYLETSKYCPICDVQV
               10        20        30        40        50        60

      60        70        80        90       100       110         
pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHL
       :...::  :  :.:.::::::::::: . ::...:.::              . .: .  
CCDS71 HKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFY----------AAHPSADAANGS
               70        80        90                 100       110

     120       130          140       150       160       170      
pF1KE4 DSHRNGETKADDS---SNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRC
       .  : ::.  .:.   .. :    . :   : .: :..:.   . ..:: .   ....::
CCDS71 NEDR-GEVADEDKRIITDDEIISLSIEF-FDQNRLDRKVN--KDKEKSKEEVNDKRYLRC
               120       130        140         150       160      

        180       190       200       210        220       230     
pF1KE4 SAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTL-KFVVVTRWRFKKAPLLLHY
        :  ::.::.::. .:... .  ..:.. .:: :   .::  .. .  :: ...:: :.:
CCDS71 PAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYTWR-RNGPLPLKY
        170       180       190       200       210        220     

         240                                                       
pF1KE4 RPKMDLL                                                     
       :                                                           
CCDS71 RVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLPSPSTPVQSPHPQ
         230       240       250       260       270       280     

>>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10          (469 aa)
 initn: 558 init1: 412 opt: 415  Z-score: 360.8  bits: 75.1 E(32554): 9e-14
Smith-Waterman score: 524; 36.6% identity (66.0% similar) in 238 aa overlap (3-236:147-369)

                                           10        20        30  
pF1KE4                             MLTRKIKLWDINAHITCRLCSGYLIDATTVTE
                                     : .::. ..: :. : ::.::.:::::. :
CCDS59 RTLIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATTIIE
        120       130       140       150       160       170      

             40        50        60        70        80        90  
pF1KE4 CLHTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRK
       :::.::..:.:.::: .. :: : . .:...::  :  :.:.::::::::::: . ::..
CCDS59 CLHSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKR
        180       190       200       210       220       230      

            100       110       120       130          140         
pF1KE4 QREFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDS---SNKEAAEEKPEEDNDYH
       .:.::              . .: .  .  : ::.  .:.   .. :    . :   : .
CCDS59 RRDFY----------AAHPSADAANGSNEDR-GEVADEDKRIITDDEIISLSIEF-FDQN
        240                 250        260       270       280     

     150       160       170       180       190       200         
pF1KE4 RSDEQVSICLECNSSKLRGLKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEI
       : :..:.   . ..:: .   ....:: :  ::.::.::. .:... .  ..:.. .:: 
CCDS59 RLDRKVN--KDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEP
          290         300       310       320       330       340  

     210        220       230       240                            
pF1KE4 LGKDHTL-KFVVVTRWRFKKAPLLLHYRPKMDLL                          
       :   .::  .. .  :: ...:: :.::                                
CCDS59 LKDYYTLMDIAYIYTWR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKA
            350        360       370       380       390       400 

>>CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10             (350 aa)
 initn: 532 init1: 411 opt: 411  Z-score: 359.1  bits: 74.4 E(32554): 1.1e-13
Smith-Waterman score: 506; 36.3% identity (67.9% similar) in 234 aa overlap (4-235:121-340)

                                          10        20        30   
pF1KE4                            MLTRKIKLWDINAHITCRLCSGYLIDATTVTEC
                                     : :.: ... .: : .:.::::::::.:::
CCDS31 EEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATTITEC
              100       110       120       130       140       150

            40        50        60        70        80        90   
pF1KE4 LHTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQ
       :::::.::.:...  .: :: : ::.::..::  :  :: .:::::::: .:.: : ...
CCDS31 LHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNIRLDRQLQDIVYKLVINLEEREKKQM
              160       170       180       190       200       210

           100       110       120       130       140       150   
pF1KE4 REFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDE
       ..::.. :.:::        .. : . : ..   :. .:  .      :: :     :  
CCDS31 HDFYKERGLEVPKP------AVPQPVPSSKGRSKKVLESVFRI----PPELDM----SLL
              220             230       240           250          

           160       170       180       190       200       210   
pF1KE4 QVSICLECNSSKLRGLKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKD
          :  . ...... :..:..: :..::. :..::. .:..:.   ..::.:....: . 
CCDS31 LEFIGANEGTGHFKPLEKKFVRVSGEATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQY
        260       270       280       290       300       310      

             220       230       240     
pF1KE4 HTLKFV--VVTRWRFKKAPLLLHYRPKMDLL   
       .::. .  ..    .. . :.:::          
CCDS31 QTLREIRRAIGDAAMQDGLLVLHYGLVVSPLKIT
        320       330       340       350

>>CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10              (256 aa)
 initn: 739 init1: 376 opt: 382  Z-score: 336.9  bits: 69.8 E(32554): 1.9e-12
Smith-Waterman score: 687; 39.6% identity (68.3% similar) in 268 aa overlap (4-241:5-255)

                10        20        30        40        50         
pF1KE4  MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI
           ::  . :.: .::: .:.::::  :::::::::::..:.:...:..: :: :   .
CCDS74 MATQRKHLVKDFNPYITCYICKGYLIKPTTVTECLHTFCKTCIVQHFEDSNDCPRCGNQV
               10        20        30        40        50        60

      60        70        80        90       100       110         
pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHL
       :...::...  : :...:..::::::.: :.... ::..:                ..  
CCDS74 HETNPLEMLRLDNTLEEIIFKLVPGLREQELERESEFWKK----------------NKPQ
               70        80        90       100                    

     120       130       140       150       160              170  
pF1KE4 DSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLEC--NSSK-----LRGLKRK
       .. ..  .:::  .  : ..:. :.:.:::::: :..:::.:  :...     ..:: .:
CCDS74 ENGQDDTSKADKPKVDEEGDEN-EDDKDYHRSDPQIAICLDCLRNNGQSGDNVVKGLMKK
          110       120        130       140       150       160   

            180       190       200       210       220            
pF1KE4 WIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWR-------
       .::::...::  .:::.. ::.: :  :::.::: ::.:::::..:. .::::       
CCDS74 FIRCSTRVTVGTIKKFLSLKLKLPSSYELDVLCNGEIMGKDHTMEFIYMTRWRLRGENFR
           170       180       190       200       210       220   

                         230       240  
pF1KE4 ----------------FKKAPLLLHYRPKMDLL
                       ... :..:.:::..:. 
CCDS74 CLNCSASQVCSQDGPLYQSYPMVLQYRPRIDFG
           230       240       250      




242 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 04:18:18 2016 done: Sun Nov  6 04:18:19 2016
 Total Scan time:  2.240 Total Display time:  0.010

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com