Result of FASTA (ccds) for pF1KB9730
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB9730, 465 aa
  1>>>pF1KB9730 465 - 465 aa - 465 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 7.8750+/-0.000932; mu= 7.3073+/- 0.056
 mean_var=189.0560+/-39.634, 0's: 0 Z-trim(112.1): 47  B-trim: 67 in 1/52
 Lambda= 0.093278
 statistics sampled from 12880 (12912) to 12880 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.741), E-opt: 0.2 (0.397), width:  16
 Scan time:  2.920

The best scores are:                                      opt bits E(32554)
CCDS10150.1 ONECUT1 gene_id:3175|Hs108|chr15       ( 465) 3225 446.4  3e-125
CCDS42440.1 ONECUT2 gene_id:9480|Hs108|chr18       ( 504) 1849 261.3 1.7e-69
CCDS45900.1 ONECUT3 gene_id:390874|Hs108|chr19     ( 494) 1028 150.8 3.1e-36


>>CCDS10150.1 ONECUT1 gene_id:3175|Hs108|chr15            (465 aa)
 initn: 3225 init1: 3225 opt: 3225  Z-score: 2362.2  bits: 446.4 E(32554): 3e-125
Smith-Waterman score: 3225; 100.0% identity (100.0% similar) in 465 aa overlap (1-465:1-465)

               10        20        30        40        50        60
pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVAHRGSHLPPAHPRSMGMASLLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVAHRGSHLPPAHPRSMGMASLLD
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB9 GGSGGGDYHHHHRAPEHSLAGPLHPTMTMACETPPGMSMPTTYTTLTPLQPLPPISTVSD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GGSGGGDYHHHHRAPEHSLAGPLHPTMTMACETPPGMSMPTTYTTLTPLQPLPPISTVSD
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB9 KFPHHHHHHHHHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KFPHHHHHHHHHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLS
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB9 PLSSSGLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLTPTSAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PLSSSGLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLTPTSAG
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB9 MVPINGLPPHHPHAHLNAQGHGQLLGTAREPNPSVTGAQVSNGSNSGQMEEINTKEVAQR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MVPINGLPPHHPHAHLNAQGHGQLLGTAREPNPSVTGAQVSNGSNSGQMEEINTKEVAQR
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB9 ITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQ
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB9 RMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQ
              370       380       390       400       410       420

              430       440       450       460     
pF1KB9 QLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA
       :::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA
              430       440       450       460     

>>CCDS42440.1 ONECUT2 gene_id:9480|Hs108|chr18            (504 aa)
 initn: 1348 init1: 1017 opt: 1849  Z-score: 1361.0  bits: 261.3 E(32554): 1.7e-69
Smith-Waterman score: 1890; 63.4% identity (76.2% similar) in 513 aa overlap (1-465:20-504)

                                  10        20        30           
pF1KB9                    MNAQLTMEAIGELHGVSHEPVPAPADLLGG-----------
                          :: .::::..: ::: .     . .   ::           
CCDS42 MKAAYTAYRCLTKDLEGCAMNPELTMESLGTLHGPAGGGSGGGGGGGGGGGGGGPGHEQE
               10        20        30        40        50        60

                      40         50                         60     
pF1KB9 -----SPH--ARSSVAH-RGSHLPPAHPRSMG-----------------MASLLDGGSGG
            :::  .:....  ::   ::.  . .:                 :::.::    :
CCDS42 LLASPSPHHAGRGAAGSLRGPPPPPTAHQELGTAAAAAAAASRSAMVTSMASILD----G
               70        80        90       100       110          

          70        80        90        100       110       120    
pF1KB9 GDYHHHHRAPEHSLAGPLHPTMTMACET-PPGMSMPTTYTTLTPLQPLPPISTVSDKFPH
       :::.     :: :.  ::: .:.:.:.. ::::.: .::::::::::::::::::::: :
CCDS42 GDYR-----PELSI--PLHHAMSMSCDSSPPGMGMSNTYTTLTPLQPLPPISTVSDKFHH
        120              130       140       150       160         

          130        140       150       160       170       180   
pF1KB9 HHHHHH-HHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLSPLS
        : ::: :::: ::::::.:::::::::::::::: .:::::.:: :.. ::.::::::.
CCDS42 PHPHHHPHHHHHHHHQRLSGNVSGSFTLMRDERGLPAMNNLYSPY-KEMPGMSQSLSPLA
     170       180       190       200       210        220        

               190       200       210       220       230         
pF1KB9 SS----GLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHL-----
       ..    :::..::.::.::.:. ::     ::::.:: :.::: ::: : :::::     
CCDS42 ATPLGNGLGGLHNAQQSLPNYGPPGH----DKMLSPN-FDAHHTAMLTR-GEQHLSRGLG
      230       240       250           260        270        280  

          240       250       260       270        280       290   
pF1KB9 TPTSAGMVPINGLPPHHPHAHLNAQGHGQLLGTARE-PNPSVTGAQVSNGSNSGQMEEIN
       :: .: :  .:::  ::: .:  .:.:: .:. .:: :  : .:.::..   :::.::::
CCDS42 TPPAAMMSHLNGL--HHP-GH--TQSHGPVLAPSRERPPSSSSGSQVAT---SGQLEEIN
            290          300         310       320          330    

           300       310       320       330       340       350   
pF1KB9 TKEVAQRITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKW
       :::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TKEVAQRITAELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKW
          340       350       360       370       380       390    

           360       370       380       390       400       410   
pF1KB9 LQEPEFQRMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKE
       ::::::::::::::::::::::: .:::.:. :: ::::::.::::: ::::::::::::
CCDS42 LQEPEFQRMSALRLAACKRKEQEPNKDRNNSQKKSRLVFTDLQRRTLFAIFKENKRPSKE
          400       410       420       430       440       450    

           420       430       440       450       460     
pF1KB9 LQITISQQLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA
       .::::::::::::.::::::::::::::.::::. :.  :.:::.:::::::
CCDS42 MQITISQQLGLELTTVSNFFMNARRRSLEKWQDDLST--GGSSSTSSTCTKA
          460       470       480       490         500    

>>CCDS45900.1 ONECUT3 gene_id:390874|Hs108|chr19          (494 aa)
 initn: 1320 init1: 963 opt: 1028  Z-score: 764.0  bits: 150.8 E(32554): 3.1e-36
Smith-Waterman score: 1500; 54.3% identity (70.6% similar) in 506 aa overlap (4-465:2-494)

               10        20        30         40        50         
pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVA-HRGSHLPPAHPRSM-GMASL
          .:..:..: ::.:.:    : :  : .  ::::..: :::  . :..:  . :::::
CCDS45   MELSLESLGGLHSVAH----AQAGELLSPGHARSAAAQHRGL-VAPGRPGLVAGMASL
                 10            20        30         40        50   

       60        70                  80        90       100        
pF1KB9 LDGGSGGGDYHHHHRAPEHS----------LAGPLHPTMTMACETPPGMSMPTTYTTLTP
       ::::.:::       .   :          :::::::.: ::::.: :..   :::::::
CCDS45 LDGGGGGGGGGAGGAGGAGSAGGGADFRGELAGPLHPAMGMACEAP-GLG--GTYTTLTP
            60        70        80        90        100         110

      110       120                130                140       150
pF1KB9 LQPLPPISTVSDKFPHHH---------HHHHHHHHPHHH---------QRLAGNVSGSFT
       :: :::...:.::: :.:         :  : : :::           ::::..::::::
CCDS45 LQHLPPLAAVADKF-HQHAAAAAVAGAHGGHPHAHPHPAAAPPPPPPPQRLAASVSGSFT
              120        130       140       150       160         

               160       170       180       190               200 
pF1KB9 LMRDERG-LASMNNLYTPYHKDVAGMGQSLSPLSSSGLGSIHNSQQGLPH--------YA
       ::::::. :::...:: :: :.. .::. :::: ..   ..:.. :  :         :.
CCDS45 LMRDERAALASVGHLYGPYGKELPAMGSPLSPLPNALPPALHGAPQPPPPPPPPPLAAYG
     170       180       190       200       210       220         

             210       220       230          240       250        
pF1KB9 HPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLT---PTSAGMVPINGLPPHHPHAHLNA
        ::  .  ::.: : .:: :  :.::: .:. :.   : ..: .  .:       . :  
CCDS45 PPGH-LAGDKLLPPAAFEPH-AALLGR-AEDALARGLPGGGGGTGSGGAGSGSAAGLLAP
     230        240        250        260       270       280      

      260       270       280         290       300       310      
pF1KB9 QGHGQLLGTAREPNPSVTGAQVSNG--SNSGQMEEINTKEVAQRITTELKRYSIPQAIFA
        : :   . :. :. .  :   :.:  : ..  :::::::::::::.:::::::::::::
CCDS45 LG-GLAAAGAHGPHGGGGGPGGSGGGPSAGAAAEEINTKEVAQRITAELKRYSIPQAIFA
         290       300       310       320       330       340     

        320       330       340       350       360       370      
pF1KB9 QRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEQE
       ::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QRILCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEQE
         350       360       370       380       390       400     

        380       390       400       410       420       430      
pF1KB9 HGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQQLGLELSTVSNFFMNA
       . :.:.  ::: ::::::.::::: ::::::::::::.:.::::::::::.:::::::::
CCDS45 QQKERALQPKKQRLVFTDLQRRTLIAIFKENKRPSKEMQVTISQQLGLELNTVSNFFMNA
         410       420       430       440       450       460     

        440       450       460     
pF1KB9 RRRSLDKWQDEGSSNSGNSSSSSSTCTKA
       ::: ...: .: :.  :. .....: .::
CCDS45 RRRCMNRWAEEPSTAPGGPAGATATFSKA
         470       480       490    




465 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 18:33:55 2016 done: Fri Nov  4 18:33:56 2016
 Total Scan time:  2.920 Total Display time:  0.010

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com