Result of FASTA (ccds) for pFN21AB7668
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7668, 402 aa
  1>>>pF1KB7668 402 - 402 aa - 402 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.6325+/-0.00105; mu= 0.4627+/- 0.064
 mean_var=344.4001+/-71.518, 0's: 0 Z-trim(115.1): 140  B-trim: 550 in 1/50
 Lambda= 0.069110
 statistics sampled from 15529 (15676) to 15529 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.482), width:  16
 Scan time:  3.520

The best scores are:                                      opt bits E(32554)
CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12          ( 402) 2808 293.4 2.6e-79
CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17          ( 406) 2122 225.0   1e-58
CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1           ( 390)  608 74.0 2.7e-13
CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9            ( 397)  556 68.8   1e-11
CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9            ( 402)  556 68.8   1e-11


>>CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12               (402 aa)
 initn: 2808 init1: 2808 opt: 2808  Z-score: 1537.4  bits: 293.4 E(32554): 2.6e-79
Smith-Waterman score: 2808; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402)

               10        20        30        40        50        60
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 SSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 SSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTKR
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 LSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 LSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHGP
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 PSQAQSPADSSFLAASGPGSTPLGALEPPLAGPHAADNPRFTDMISHPDTPSPEPGLPGT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 PSQAQSPADSSFLAASGPGSTPLGALEPPLAGPHAADNPRFTDMISHPDTPSPEPGLPGT
              310       320       330       340       350       360

              370       380       390       400  
pF1KB7 LHPMPGEVFSGGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
       ::::::::::::::::::::::::::::::::::::::::::
CCDS91 LHPMPGEVFSGGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
              370       380       390       400  

>>CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17               (406 aa)
 initn: 1209 init1: 916 opt: 2122  Z-score: 1167.7  bits: 225.0 E(32554): 1e-58
Smith-Waterman score: 2122; 74.6% identity (90.0% similar) in 409 aa overlap (2-402:1-406)

               10        20        30        40        50        60
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
        :::::::.:::::::::::::::::.::::::::: ::.:::::::::::::::::: :
CCDS11  MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCF
                10        20        30        40        50         

               70        80        90       100       110       120
pF1KB7 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
       ::::::::::::::::::.::::::::::::::.::::::::::::.:::::::::.:::
CCDS11 GTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYL
      60        70        80        90       100       110         

               130       140       150       160       170         
pF1KB7 SSSSL-KEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTK
       :.::. ::.::.:... .: ::::: ::  ::: :...... ::::...:::..:: :.:
CCDS11 SNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAK
     120       130       140       150       160       170         

     180       190       200       210       220       230         
pF1KB7 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK
     180       190       200       210       220       230         

     240       250       260       270       280       290         
pF1KB7 QLSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHG
       ::::::::::::::::::::::  ::. .:.. . :...:::::..::.::.::::: .:
CCDS11 QLSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQG
     240       250       260       270       280       290         

     300        310       320       330        340         350     
pF1KB7 PPS-QAQSPADSSFLAASGPGSTPLGALEPPLAGPH-AADNPRFTDMISHP--DTPSPEP
       ::: :::.:.:  :. .:::..::::.:: :: : : ...  ::::...::  :.:::::
CCDS11 PPSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEP
     300       310       320       330       340       350         

         360       370          380       390       400  
pF1KB7 GLPGTLHPMPGEVFSGGPSPPFP---MSGTSGYSGPLSHPNPELNEAAVW
       .::: :: : .:::  ::::::    ..: ..:.. :::: ::.::::::
CCDS11 SLPGPLHSMSAEVF--GPSPPFSSLSVNGGASYGNHLSHP-PEMNEAAVW
     360       370         380       390        400      

>>CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1                (390 aa)
 initn: 891 init1: 565 opt: 608  Z-score: 352.1  bits: 74.0 E(32554): 2.7e-13
Smith-Waterman score: 836; 37.1% identity (61.0% similar) in 420 aa overlap (4-398:29-384)

                                        10        20        30     
pF1KB7                          MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCEC
                                   .::::.. :::.:.:.:::: :: .:..: .:
CCDS13 MMQSATVPAEGAVKGLPEMLGVPMQQIPQCAGCNQHILDKFILKVLDRHWHSSCLKCADC
               10        20        30        40        50        60

          40        50        60        70        80        90     
pF1KB7 KTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVC
       . .:...:::: :..:::.:::.::::::..: ::: :...::::.. :.::.::.:..:
CCDS13 QMQLADRCFSRAGSVYCKEDFFKRFGTKCTACQQGIPPTQVVRKAQDFVYHLHCFACIIC
               70        80        90       100       110       120

         100       110       120       130       140       150     
pF1KB7 NKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKE
       :.::.::.:.:.......:::.::                                    
CCDS13 NRQLATGDEFYLMEDGRLVCKEDY------------------------------------
              130       140                                        

         160       170       180       190       200       210     
pF1KB7 TDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQ
                :::. .:.....:.::  ::::: :::::::: :.  .:::.::.::::..
CCDS13 ---------ETAK-QNDDSEAGAKR--PRTTITAKQLETLKNAYKNSPKPARHVREQLSS
                    150         160       170       180       190  

         220       230       240       250       260               
pF1KB7 ETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGR----------L
       ::::.:::.::::::::.::.:.:. .:   :   :..: .: :  . .          .
CCDS13 ETGLDMRVVQVWFQNRRAKEKRLKK-DAGRHRWGQFYKSVKRSRGSSKQEKESSAEDCGV
            200       210        220       230       240       250 

         270                   280       290       300       310   
pF1KB7 DESEM----------LGSTPYTY--YGDYQGDYYAPGSNYDFFAHGPPSQAQSPADSS-F
       ..::.          :: :   :   ::  :     ::   :   :  .. :.  :.: .
CCDS13 SDSELSFREDQILSELGHTNRIYGNVGDVTGGQLMNGS---FSMDGTGQSYQDLRDGSPY
             260       270       280          290       300        

            320        330        340       350       360       370
pF1KB7 LAASGPGS-TPLGALEPPLAG-PHAADNPRFTDMISHPDTPSPEPGLPGTLHPMPGEVFS
          ..:.: . : .  : : :  ...:.     .:.:        :.  ::. :     .
CCDS13 GIPQSPSSISSLPSHAPLLNGLDYTVDSN--LGIIAHAG-----QGVSQTLRAM-----A
      310       320       330         340            350           

              380       390       400    
pF1KB7 GGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW  
       :::.  .  ... ::    . :.  :.:      
CCDS13 GGPTSDISTGSSVGYPDFPTSPGSWLDEMDHPPF
        360       370       380       390

>>CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9                 (397 aa)
 initn: 934 init1: 549 opt: 556  Z-score: 324.0  bits: 68.8 E(32554): 1e-11
Smith-Waterman score: 862; 38.7% identity (61.3% similar) in 419 aa overlap (5-398:31-391)

                                         10        20        30    
pF1KB7                           MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCE
                                     ::::.. :::::.:..::: :: ::..: .
CCDS69 MLLETGLERDRARPGAAAVCTLGGTREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD
               10        20        30        40        50        60

           40        50        60        70        80        90    
pF1KB7 CKTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMV
       :.: :.:.::::  ..:::.:::.:::::::.:  :: :...::.:.. :.::.::.:.:
CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV
               70        80        90       100       110       120

          100       110       120       130       140       150    
pF1KB7 CNKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPK
       :..::.::.:.:.......::: ::                                   
CCDS69 CKRQLATGDEFYLMEDSRLVCKADY-----------------------------------
              130       140                                        

          160       170       180       190       200       210    
pF1KB7 ETDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA
                 :::.... :   .: .: ::::: ::::::::.:. ..:::.::.::::.
CCDS69 ----------ETAKQREAE---ATAKR-PRTTITAKQLETLKSAYNTSPKPARHVREQLS
                   150           160       170       180       190 

          220       230       240       250       260          270 
pF1KB7 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGRLDES---EML
       .::::.:::.::::::::.::.:.:. .:   :   .::. .: :  :.. :..   :  
CCDS69 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRG-GSKSDKDSVQEGQ
             200       210        220       230        240         

             280       290       300          310                  
pF1KB7 GSTPYTYYGDYQGDYYAPGSNYDFFAHGPPSQA---QSPADSSFLAASG-----------
        :   . . :  .      .:  . . : :.::    : : ..:    :           
CCDS69 DSDAEVSFPDEPSLAEMGPANGLYGSLGEPTQALGRPSGALGNFSLEHGGLAGPEQYREL
     250       260       270       280       290       300         

        320       330       340        350            360       370
pF1KB7 -PGSTPLGALEPPLAGPHAADNPR-FTDMISHPDT-----PSPEPGLPGTLHPMPGEVFS
        ::: : : . :  :.:..  .:. . . . .:::     ::  :: :    : : .:..
CCDS69 RPGS-PYG-VPPSPAAPQSLPGPQPLLSSLVYPDTSLGLVPSGAPGGP----P-PMRVLA
     310         320       330       340       350            360  

               380       390       400    
pF1KB7 G-GPSPPFPMSGTSGYSGPLSHPNPELNEAAVW  
       : :::  .  ....::    . :   :.:      
CCDS69 GNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF
            370       380       390       

>>CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9                 (402 aa)
 initn: 934 init1: 549 opt: 556  Z-score: 323.9  bits: 68.8 E(32554): 1e-11
Smith-Waterman score: 862; 38.7% identity (61.3% similar) in 419 aa overlap (5-398:36-396)

                                         10        20        30    
pF1KB7                           MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCE
                                     ::::.. :::::.:..::: :: ::..: .
CCDS69 ELGPARESAGGDLLLALLARRADLRREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD
          10        20        30        40        50        60     

           40        50        60        70        80        90    
pF1KB7 CKTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMV
       :.: :.:.::::  ..:::.:::.:::::::.:  :: :...::.:.. :.::.::.:.:
CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV
          70        80        90       100       110       120     

          100       110       120       130       140       150    
pF1KB7 CNKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPK
       :..::.::.:.:.......::: ::                                   
CCDS69 CKRQLATGDEFYLMEDSRLVCKADY-----------------------------------
         130       140       150                                   

          160       170       180       190       200       210    
pF1KB7 ETDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA
                 :::.... :   .: .: ::::: ::::::::.:. ..:::.::.::::.
CCDS69 ----------ETAKQREAE---ATAKR-PRTTITAKQLETLKSAYNTSPKPARHVREQLS
                           160        170       180       190      

          220       230       240       250       260          270 
pF1KB7 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGRLDES---EML
       .::::.:::.::::::::.::.:.:. .:   :   .::. .: :  :.. :..   :  
CCDS69 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRG-GSKSDKDSVQEGQ
        200       210       220        230       240        250    

             280       290       300          310                  
pF1KB7 GSTPYTYYGDYQGDYYAPGSNYDFFAHGPPSQA---QSPADSSFLAASG-----------
        :   . . :  .      .:  . . : :.::    : : ..:    :           
CCDS69 DSDAEVSFPDEPSLAEMGPANGLYGSLGEPTQALGRPSGALGNFSLEHGGLAGPEQYREL
          260       270       280       290       300       310    

        320       330       340        350            360       370
pF1KB7 -PGSTPLGALEPPLAGPHAADNPR-FTDMISHPDT-----PSPEPGLPGTLHPMPGEVFS
        ::: : : . :  :.:..  .:. . . . .:::     ::  :: :    : : .:..
CCDS69 RPGS-PYG-VPPSPAAPQSLPGPQPLLSSLVYPDTSLGLVPSGAPGGP----P-PMRVLA
           320        330       340       350       360            

               380       390       400    
pF1KB7 G-GPSPPFPMSGTSGYSGPLSHPNPELNEAAVW  
       : :::  .  ....::    . :   :.:      
CCDS69 GNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF
       370       380       390       400  




402 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 04:05:34 2016 done: Sat Nov  5 04:05:35 2016
 Total Scan time:  3.520 Total Display time:  0.000

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com