Result of FASTA (ccds) for pFN21ASDA0120
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KSDA0120, 199 aa
  1>>>pF1KSDA0120 199 - 199 aa - 199 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.4700+/-0.000786; mu= 12.2069+/- 0.047
 mean_var=66.2570+/-13.336, 0's: 0 Z-trim(107.8): 42  B-trim: 5 in 1/50
 Lambda= 0.157564
 statistics sampled from 9785 (9826) to 9785 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.693), E-opt: 0.2 (0.302), width:  16
 Scan time:  1.900

The best scores are:                                      opt bits E(32554)
CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1          ( 199) 1356 316.7 5.9e-87
CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1         ( 220) 1356 316.7 6.4e-87
CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3        ( 199) 1003 236.5 8.4e-63
CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11          ( 201)  919 217.4 4.7e-57
CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1           ( 288)  394 98.1 5.4e-21
CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1           ( 329)  394 98.1 6.1e-21
CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19          ( 309)  390 97.2 1.1e-20
CCDS12263.1 CNN1 gene_id:1264|Hs108|chr19          ( 297)  385 96.1 2.3e-20
CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19          ( 247)  371 92.9 1.8e-19
CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19          ( 270)  314 79.9 1.5e-15


>>CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1               (199 aa)
 initn: 1356 init1: 1356 opt: 1356  Z-score: 1674.7  bits: 316.7 E(32554): 5.9e-87
Smith-Waterman score: 1356; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:1-199)

               10        20        30        40        50        60
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD VLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGK
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD NMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGT
              130       140       150       160       170       180

              190         
pF1KSD NRGASQAGMTGYGMPRQIL
       :::::::::::::::::::
CCDS11 NRGASQAGMTGYGMPRQIL
              190         

>>CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1              (220 aa)
 initn: 1356 init1: 1356 opt: 1356  Z-score: 1674.0  bits: 316.7 E(32554): 6.4e-87
Smith-Waterman score: 1356; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:22-220)

                                    10        20        30         
pF1KSD                      MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCR
                            :::::::::::::::::::::::::::::::::::::::
CCDS60 MSAFSLALALVSSPQPPPPIGMANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCR
               10        20        30        40        50        60

      40        50        60        70        80        90         
pF1KSD KDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 KDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQA
               70        80        90       100       110       120

     100       110       120       130       140       150         
pF1KSD AERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 AERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENP
              130       140       150       160       170       180

     160       170       180       190         
pF1KSD RNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
       ::::::::::::::::::::::::::::::::::::::::
CCDS60 RNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
              190       200       210       220

>>CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3             (199 aa)
 initn: 1019 init1: 1003 opt: 1003  Z-score: 1241.0  bits: 236.5 E(32554): 8.4e-63
Smith-Waterman score: 1003; 69.8% identity (89.4% similar) in 199 aa overlap (1-199:1-199)

               10        20        30        40        50        60
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
       ::::::.::::::::.:::..::::::. :..::  :: .:. .: ::: .::.:: :::
CCDS33 MANRGPSYGLSREVQEKIEQKYDADLENKLVDWIILQCAEDIEHPPPGRAHFQKWLMDGT
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD VLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGK
       :::.:::.::: :: :. ::. : :::::::::::::.::: ::. ::::::::::::::
CCDS33 VLCKLINSLYPPGQEPIPKISESKMAFKQMEQISQFLKAAETYGVRTTDIFQTVDLWEGK
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD NMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGT
       .:: :::::: ::..::..::: . :.:.:: .:...: :.::..::..:.::::::::.
CCDS33 DMAAVQRTLMALGSVAVTKDDGCYRGEPSWFHRKAQQNRRGFSEEQLRQGQNVIGLQMGS
              130       140       150       160       170       180

              190         
pF1KSD NRGASQAGMTGYGMPRQIL
       :.::::::::::::::::.
CCDS33 NKGASQAGMTGYGMPRQIM
              190         

>>CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11               (201 aa)
 initn: 930 init1: 567 opt: 919  Z-score: 1137.7  bits: 217.4 E(32554): 4.7e-57
Smith-Waterman score: 919; 65.0% identity (87.5% similar) in 200 aa overlap (1-199:1-200)

               10        20        30        40        50        60
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
       :::.::.::.:::::.::::.:: .::. :..:: .::  :::::. :: .:: :::.:.
CCDS83 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV
               10        20        30        40        50        60

               70        80         90       100       110         
pF1KSD VLCELINALYPEGQAPVKKIQAS-TMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEG
       .: .:.:.:::.:. :::  .   .:.::::::..:::.::: ::.  ::.::::::.::
CCDS83 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG
               70        80        90       100       110       120

     120       130       140       150       160       170         
pF1KSD KNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMG
       :.:: :::::: ::.:::...:: . :::::: ::..:. :.:...::::::.:::::::
CCDS83 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG
              130       140       150       160       170       180

     180       190          
pF1KSD TNRGASQAGMTGYGMPRQIL 
       .::::::::::::: ::::. 
CCDS83 SNRGASQAGMTGYGRPRQIIS
              190       200 

>>CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1                (288 aa)
 initn: 539 init1: 174 opt: 394  Z-score: 490.3  bits: 98.1 E(32554): 5.4e-21
Smith-Waterman score: 394; 45.9% identity (73.0% similar) in 148 aa overlap (51-198:6-147)

               30        40        50        60        70        80
pF1KSD QYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKI
                                     :::  :::: .:::::: : :   . :::.
CCDS65                          MSIGPNFQLGLKDGIILCELINKLQP---GSVKKV
                                        10        20           30  

               90       100       110       120       130       140
pF1KSD QASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARD
       . :.. . :.:.:..:..: . ::..  :::.. ::.:. ::. :: ::. :.::  :. 
CCDS65 NESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLFENGNMTQVQTTLVALAGL--AKT
             40        50        60        70        80          90

              150       160       170       180       190          
pF1KSD DGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL 
        : :    .   : .... : :....:. :..:::::::::. :::::::.::  :..  
CCDS65 KG-FHTTIDIGVKYAEKQTRRFDEGKLKAGQSVIGLQMGTNKCASQAGMTAYGTRRHLYD
               100       110       120       130       140         

CCDS65 PKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRDIYDQKLTLQPVDNSTISLQMGTN
     150       160       170       180       190       200         

>>CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1                (329 aa)
 initn: 640 init1: 174 opt: 394  Z-score: 489.4  bits: 98.1 E(32554): 6.1e-21
Smith-Waterman score: 488; 44.4% identity (70.4% similar) in 196 aa overlap (3-198:5-188)

                 10        20        30        40        50        
pF1KSD   MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKD
           :.::.:::: ::..:: ..:: . :. : .::      ..: :     :::  :::
CCDS30 MTHFNKGPSYGLSAEVKNKIASKYDHQAEEDLRNWIEEVTGMSIG-P-----NFQLGLKD
               10        20        30        40              50    

       60        70        80        90       100       110        
pF1KSD GTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWE
       : .:::::: : :   . :::.. :.. . :.:.:..:..: . ::..  :::.. ::.:
CCDS30 GIILCELINKLQP---GSVKKVNESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLFE
           60           70        80        90       100       110 

      120       130       140       150       160       170        
pF1KSD GKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQM
       . ::. :: ::. :.:::  .  : :    .   : .... : :....:. :..::::::
CCDS30 NGNMTQVQTTLVALAGLA--KTKG-FHTTIDIGVKYAEKQTRRFDEGKLKAGQSVIGLQM
             120         130        140       150       160        

      180       190                                                
pF1KSD GTNRGASQAGMTGYGMPRQIL                                       
       :::. :::::::.::  :..                                        
CCDS30 GTNKCASQAGMTAYGTRRHLYDPKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRDI
      170       180       190       200       210       220        

>>CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19               (309 aa)
 initn: 537 init1: 157 opt: 390  Z-score: 484.9  bits: 97.2 E(32554): 1.1e-20
Smith-Waterman score: 471; 43.4% identity (69.9% similar) in 196 aa overlap (3-198:7-190)

                   10        20        30        40        50      
pF1KSD     MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWL
             :.::.:::: ::.... ..:: . :  :  ::      ..: :     .::. :
CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-P-----DFQKGL
               10        20        30        40              50    

         60        70        80        90       100       110      
pF1KSD KDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDL
       ::::.:: :.: : : :..:  ::. : . ..:.:..:.:..:   ::.: .:.:.. ::
CCDS12 KDGTILCTLMNKLQP-GSVP--KINRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEANDL
           60         70          80        90       100       110 

        120       130       140       150       160       170      
pF1KSD WEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGL
       .:. ::. :: .:. :.: :  .  :: ::  .   : :... :::.:  .. :. ::::
CCDS12 FESGNMTQVQVSLLALAGKA--KTKGLQSG-VDIGVKYSEKQERNFDDATMKAGQCVIGL
             120       130          140       150       160        

        180       190                                              
pF1KSD QMGTNRGASQAGMTGYGMPRQIL                                     
       :::::. :::.:::.::  :..                                      
CCDS12 QMGTNKCASQSGMTAYGTRRHLYDPKNHILPPMDHSTISLQMGTNKCASQVGMTAPGTRR
      170       180       190       200       210       220        

>>CCDS12263.1 CNN1 gene_id:1264|Hs108|chr19               (297 aa)
 initn: 597 init1: 166 opt: 385  Z-score: 479.1  bits: 96.1 E(32554): 2.3e-20
Smith-Waterman score: 494; 42.9% identity (70.9% similar) in 196 aa overlap (3-198:7-188)

                   10        20        30        40        50      
pF1KSD     MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWL
             ::::::::: ::..:. ..:: . :: : .::     . .:      .::.. :
CCDS12 MSSAHFNRGPAYGLSAEVKNKLAQKYDHQREQELREWIEGVTGRRIG------NNFMDGL
               10        20        30        40              50    

         60        70        80        90       100       110      
pF1KSD KDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDL
       ::: .:::.:: : :   . ::::. ::. ..:.:.:..:..:  .::..  :::.. ::
CCDS12 KDGIILCEFINKLQP---GSVKKINESTQNWHQLENIGNFIKAITKYGVKPHDIFEANDL
           60           70        80        90       100       110 

        120       130       140       150       160       170      
pF1KSD WEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGL
       .:. : . :: ::. :...: .. . .  :      : .... :.:  ..:.::.:.:::
CCDS12 FENTNHTQVQSTLLALASMAKTKGNKVNVG-----VKYAEKQERKFEPGKLREGRNIIGL
             120       130       140            150       160      

        180       190                                              
pF1KSD QMGTNRGASQAGMTGYGMPRQIL                                     
       :::::. ::: :::.::  :..                                      
CCDS12 QMGTNKFASQQGMTAYGTRRHLYDPKLGTDQPLDQATISLQMGTNKGASQAGMTAPGTKR
        170       180       190       200       210       220      

>>CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19               (247 aa)
 initn: 466 init1: 166 opt: 371  Z-score: 463.1  bits: 92.9 E(32554): 1.8e-19
Smith-Waterman score: 371; 43.4% identity (73.4% similar) in 143 aa overlap (56-198:4-138)

          30        40        50        60        70        80     
pF1KSD LEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQASTM
                                     :::: .:::.:: : :   . ::::. ::.
CCDS77                            MDGLKDGIILCEFINKLQP---GSVKKINESTQ
                                          10           20        30

          90       100       110       120       130       140     
pF1KSD AFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFS
        ..:.:.:..:..:  .::..  :::.. ::.:. : . :: ::. :...: .. . .  
CCDS77 NWHQLENIGNFIKAITKYGVKPHDIFEANDLFENTNHTQVQSTLLALASMAKTKGNKVNV
               40        50        60        70        80        90

         150       160       170       180       190               
pF1KSD GDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL      
       :      : .... :.:  ..:.::.:.::::::::. ::: :::.::  :..       
CCDS77 G-----VKYAEKQERKFEPGKLREGRNIIGLQMGTNKFASQQGMTAYGTRRHLYDPKLGT
                   100       110       120       130       140     

CCDS77 DQPLDQATISLQMGTNKGASQAGMTAPGTKRQIFEPGLGMEHCDTLNVSLQMGSNKGASQ
         150       160       170       180       190       200     

>>CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19               (270 aa)
 initn: 469 init1: 153 opt: 314  Z-score: 392.5  bits: 79.9 E(32554): 1.5e-15
Smith-Waterman score: 395; 38.3% identity (66.3% similar) in 196 aa overlap (3-198:7-191)

                   10        20        30        40        50      
pF1KSD     MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWL
             :.::.:::: ::.... ..:: . :  :  ::      ..: :     .::. :
CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-P-----DFQKGL
               10        20        30        40              50    

         60        70        80        90       100       110      
pF1KSD KDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDL
       ::::.:: :.: : : :..:  ::. : . ..:.:..:.:..:   ::.: .:.:.. ::
CCDS12 KDGTILCTLMNKLQP-GSVP--KINRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEANDL
           60         70          80        90       100       110 

        120       130       140       150       160       170      
pF1KSD WEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGL
       .:. ::. :: .:. :.:   .   .  ::   .  ..   .:.:     ..  ...:.:
CCDS12 FESGNMTQVQVSLLALAGKMGTNKCASQSGMTAYGTRRHLYDPKNHILPPMD--HSTISL
             120       130       140       150       160           

        180       190                                              
pF1KSD QMGTNRGASQAGMTGYGMPRQIL                                     
       :::::. :::.:::. :  :.:                                      
CCDS12 QMGTNKCASQVGMTAPGTRRHIYDTKLGTDKCDNSSMSLQMGYTQGANQSGQVFGLGRQI
     170       180       190       200       210       220         




199 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 00:05:34 2016 done: Thu Nov  3 00:05:34 2016
 Total Scan time:  1.900 Total Display time:  0.010

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com