Result of FASTA (ccds) for pF1KA1926
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KA1926, 402 aa
  1>>>pF1KA1926 402 - 402 aa - 402 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.3727+/-0.000788; mu= 13.3526+/- 0.047
 mean_var=117.1175+/-24.172, 0's: 0 Z-trim(112.1): 52  B-trim: 0 in 0/51
 Lambda= 0.118512
 statistics sampled from 12846 (12895) to 12846 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.728), E-opt: 0.2 (0.396), width:  16
 Scan time:  2.870

The best scores are:                                      opt bits E(32554)
CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19      ( 402) 2874 502.0 3.9e-142
CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5          ( 354)  779 143.8 2.4e-34
CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15      ( 360)  695 129.4 5.1e-30
CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15      ( 422)  695 129.5 5.7e-30
CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1         ( 340)  566 107.4 2.1e-23
CCDS1150.1 BCAN gene_id:63827|Hs108|chr1           ( 671)  407 80.4 5.4e-15
CCDS1149.1 BCAN gene_id:63827|Hs108|chr1           ( 911)  407 80.5 6.8e-15
CCDS12397.1 NCAN gene_id:1463|Hs108|chr19          (1321)  406 80.5   1e-14
CCDS47242.1 VCAN gene_id:1462|Hs108|chr5           ( 655)  388 77.2 5.1e-14
CCDS53971.1 ACAN gene_id:176|Hs108|chr15           (2431)  387 77.5 1.5e-13
CCDS53970.1 ACAN gene_id:176|Hs108|chr15           (2530)  387 77.5 1.6e-13
CCDS54875.1 VCAN gene_id:1462|Hs108|chr5           (1642)  382 76.5 2.1e-13
CCDS54876.1 VCAN gene_id:1462|Hs108|chr5           (2409)  382 76.6 2.8e-13
CCDS4060.1 VCAN gene_id:1462|Hs108|chr5            (3396)  382 76.7 3.6e-13


>>CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19           (402 aa)
 initn: 2874 init1: 2874 opt: 2874  Z-score: 2665.3  bits: 502.0 E(32554): 3.9e-142
Smith-Waterman score: 2874; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402)

               10        20        30        40        50        60
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA1 GGTIVLPCRYHYEAAAHGHDGVRLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGTIVLPCRYHYEAAAHGHDGVRLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA1 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA1 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA1 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA1 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG
              310       320       330       340       350       360

              370       380       390       400  
pF1KA1 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
       ::::::::::::::::::::::::::::::::::::::::::
CCDS12 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
              370       380       390       400  

>>CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5               (354 aa)
 initn: 916 init1: 646 opt: 779  Z-score: 730.1  bits: 143.8 E(32554): 2.4e-34
Smith-Waterman score: 1216; 50.9% identity (76.8% similar) in 336 aa overlap (35-366:28-352)

           10        20        30        40         50        60   
pF1KA1 RAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS-VVVQTAPGQVVSHRGGT
                                     ...:. ..:.:  ..:..  ..: :::::.
CCDS40    MKSLLLLVLISICWADHLSDNYTLDHDRAIHI-QAENGPHLLVEAEQAKVFSHRGGN
                  10        20        30         40        50      

            70        80          90        100       110       120
pF1KA1 IVLPCRYHYEAAAHGHD--GVRLKWTKVV-DPLAFTDVFVALGPQHRAFGSYRGRAELQG
       ..:::... . .: :     .:.::::.. : :  .::::..: .....:.:.::. :.:
CCDS40 VTLPCKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG
         60        70        80        90       100       110      

              130       140       150       160       170       180
pF1KA1 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE
        . .:::::. ..::.:::::.::: . ::::. .: :::.:::::: :: :::.:.: :
CCDS40 GSDSDASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHE
        120       130       140       150       160       170      

              190       200       210       220       230       240
pF1KA1 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG
       ::.:: .::...:: .::. ::: :::::::::: :::::::...::::::         
CCDS40 AQQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCG---------
        180       190       200       210       220                

              250       260       270       280       290       300
pF1KA1 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV
        : ..  :.::::.  . . :::.::::::. :: ..:     . .. :..::   :: .
CCDS40 -GQNTVPGVRNYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQI
        230       240       250       260       270       280      

              310       320       330       340       350       360
pF1KA1 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG
       :::::.:::::.   ::: ::::::::.::::  :: ::.  . .:: .::::  ..:.:
CCDS40 AKVGQIFAAWKILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYG
        290       300       310       320       330       340      

              370       380       390       400  
pF1KA1 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
       :::.::                                    
CCDS40 VYCFRAYN                                  
        350                                      

>>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15           (360 aa)
 initn: 725 init1: 591 opt: 695  Z-score: 652.4  bits: 129.4 E(32554): 5.1e-30
Smith-Waterman score: 1165; 51.2% identity (76.6% similar) in 320 aa overlap (47-365:49-358)

         20        30        40        50        60        70      
pF1KA1 AWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRYHYEAAA
                                     .::.:    . ...:....:::::.:: : 
CCDS10 PFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRYEPAL
       20        30        40        50        60        70        

         80        90        100       110       120       130     
pF1KA1 HGHDGVRLKWTKVVDPLA-FTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLVLRNVTL
        .   ::.:: :. .  :   ::.::.: .::.::.:.::..:. :   :.:: .... :
CCDS10 VSPRRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLEIQDLRL
       80        90       100       110       120       130        

         140       150       160       170       180       190     
pF1KA1 QDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGILASA
       .:::::.::: . :::..:.:.:.:.::::::.  .:::...: :.:..:::: ...:: 
CCDS10 EDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQAAVVASF
      140       150       160       170       180       190        

         200       210       220       230       240       250     
pF1KA1 EQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRNYGYR
       :::  ::..::::::::::.:..::::.  ::.:::: :             :.:.:: :
CCDS10 EQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPG----------LAPGVRSYGPR
      200       210       220       230                 240        

         260       270       280       290       300       310     
pF1KA1 HNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWKLQLL
       :   .:::.:::.. : :::..:.  . . .. : .::    :..:::::::::::.. :
CCDS10 HRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGL
      250       260       270       280       290       300        

         320       330       340       350       360       370     
pF1KA1 DRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFGVYCYRAPGAPDPAPG
       ::: ::::::::.:::.:.:.  ::  .:::::.::::   ::.::::::          
CCDS10 DRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH        
      310       320       330       340       350       360        

         380       390       400  
pF1KA1 GWGWGWAGGGGWAGGARDPAAWTPLHV

>>CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15           (422 aa)
 initn: 745 init1: 591 opt: 695  Z-score: 651.5  bits: 129.5 E(32554): 5.7e-30
Smith-Waterman score: 1168; 46.4% identity (69.4% similar) in 386 aa overlap (2-365:47-420)

                                            10        20           
pF1KA1                              MVCARAALGPGALWAAAWGVLLL--------
                                     ::  :   ::. :    :.:::        
CCDS76 QDAVCPAPIPSPGLSAQTGLQKIWGTIHCQVCPGAPAWPGSPWHEEMGLLLLVPLLLLPG
         20        30        40        50        60        70      

                        30         40        50        60        70
pF1KA1 ------------TAPAGAQR-GRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRY
                   .  :. :  :  .   .:.: .  .::.:    . ...:....:::::
CCDS76 SYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVK--LVVETPEETLFTYQGASVILPCRY
         80        90       100       110         120       130    

               80        90        100       110       120         
pF1KA1 HYEAAAHGHDGVRLKWTKVVDPLA-FTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLV
       .:: :  .   ::.:: :. .  :   ::.::.: .::.::.:.::..:. :   :.:: 
CCDS76 RYEPALVSPRRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLE
          140       150       160       170       180       190    

     130       140       150       160       170       180         
pF1KA1 LRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQD
       .... :.:::::.::: . :::..:.:.:.:.::::::.  .:::...: :.:..:::: 
CCDS76 IQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQA
          200       210       220       230       240       250    

     190       200       210       220       230       240         
pF1KA1 GILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGL
       ...:: :::  ::..::::::::::.:..::::.  ::.:::: :             :.
CCDS76 AVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPG----------LAPGV
          260       270       280       290                 300    

     250       260       270       280       290       300         
pF1KA1 RNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAA
       :.:: ::   .:::.:::.. : :::..:.  . . .. : .::    :..:::::::::
CCDS76 RSYGPRHRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAA
          310       320       330       340       350       360    

     310       320       330       340       350       360         
pF1KA1 WKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFGVYCYRAPGA
       ::.. :::: ::::::::.:::.:.:.  ::  .:::::.::::   ::.::::::    
CCDS76 WKFHGLDRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH  
          370       380       390       400       410       420    

     370       380       390       400  
pF1KA1 PDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV

>>CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1              (340 aa)
 initn: 867 init1: 488 opt: 566  Z-score: 533.6  bits: 107.4 E(32554): 2.1e-23
Smith-Waterman score: 996; 49.7% identity (70.3% similar) in 310 aa overlap (58-364:47-337)

        30        40        50        60        70        80       
pF1KA1 GAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRYHYEAAAHGHDGVRLKWT
                                     ::::.: .:::       ..     ...:.
CCDS11 AFTIFHKAQGDPASHPGPHYLLPPIHEVIHSHRGATATLPCVLGTTPPSY-----KVRWS
         20        30        40        50        60             70 

        90         100       110       120       130       140     
pF1KA1 KVVDP--LAFTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLVLRNVTLQDYGRYECEV
       :: .:  :  : .... : . :..:   :::...     :::::. .: :.: :::.::.
CCDS11 KV-EPGELRETLILITNGLHARGYGPLGGRARMRRGHRLDASLVIAGVRLEDEGRYRCEL
               80        90       100       110       120       130

         150       160       170       180       190       200     
pF1KA1 TNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDG
        : .::..  . :.::::::::.:  :::.... ::..:: :::: ::.  ::. :: .:
CCDS11 INGIEDESVALTLSLEGVVFPYQPSRGRYQFNYYEAKQACEEQDGRLATYSQLYQAWTEG
              140       150       160       170       180       190

         210       220       230       240       250       260     
pF1KA1 LDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRNYGYRHNAEERYDAF
       ::::::::: .:::.:::   : :::: :             :.:.:: :   ..:::::
CCDS11 LDWCNAGWLLEGSVRYPVLTARAPCGGRG-----------RPGIRSYGPRDRMRDRYDAF
              200       210                  220       230         

         270       280       290       300       310       320     
pF1KA1 CFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLAD
       :::: : :.:::. : : . .: :  ::  :::.:::::.:.::::.. ::.: .:::::
CCDS11 CFTSALAGQVFFV-PGR-LTLSEAHAACRRRGAVVAKVGHLYAAWKFSGLDQCDGGWLAD
     240       250         260       270       280       290       

         330       340        350       360       370       380    
pF1KA1 GSARYPIVNPRARCGGR-RPGVRSLGFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGG
       ::.:.::..:: ::::   :::::.:::   .  .:.:::                    
CCDS11 GSVRFPITTPRPRCGGLPDPGVRSFGFPRPQQAAYGTYCYAEN                 
       300       310       320       330       340                 

          390       400  
pF1KA1 GGWAGGARDPAAWTPLHV

>>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1                (671 aa)
 initn: 695 init1: 318 opt: 407  Z-score: 382.6  bits: 80.4 E(32554): 5.4e-15
Smith-Waterman score: 749; 37.4% identity (62.6% similar) in 374 aa overlap (22-374:8-363)

               10        20        30        40              50    
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS------VVVQTAPG
                            ::.: . :: .   .. ::::.:.        ..  :: 
CCDS11               MAQLFLPLLAALVLAQ-APAALADVLEGDSSEDRAFRVRIAGDAPL
                             10         20        30        40     

           60        70        80            90       100       110
pF1KA1 QVVSHRGGTIVLPCRYHYEAAAHGHDGV----RLKWTKVVDPLAFTDVFVALGPQHRAFG
       : :   ::....::. ::     .. .:    :.:::  ..    ..:.:: : . ..  
CCDS11 QGV--LGGALTIPCHVHYLRPPPSRRAVLGSPRVKWT-FLSRGREAEVLVARGVRVKVNE
            50        60        70        80         90       100  

              120         130       140       150       160        
pF1KA1 SYRGRAELQGDGPG--DASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYH
       .:: :. : .   .  :.::.: ..  .: : :.::: . ..:..  :.. ..:::: :.
CCDS11 AYRFRVALPAYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYR
            110       120       130       140       150       160  

      170       180       190       200       210       220        
pF1KA1 PRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPRE
         ..:: ..:. ::.:::.  . .:. :::.::.  : . :.:::: : .:.::.. :::
CCDS11 EGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPRE
            170       180       190       200       210       220  

      230       240         250       260       270       280      
pF1KA1 PCGGLGGTGSAGGGGDANG--GLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPF
        :            :: .:  :.::::   . .. ::..:.. .: :..:.  : . . .
CCDS11 AC-----------YGDMDGFPGVRNYGVV-DPDDLYDVYCYAEDLNGELFLGDPPEKLTL
                       230       240        250       260       270

        290       300       310       320       330       340      
pF1KA1 SGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGV
         :   :  ::: .: .:::.:::    ::.:. :::::::.:::::.:  ::::  :::
CCDS11 EEARAYCQERGAEIATTGQLYAAWD-GGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGV
              280       290        300       310       320         

               350       360       370       380       390         
pF1KA1 RSL-------GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTP
       ..:       :::.   : :.:::.:  . :.  :                         
CCDS11 KTLFLFPNQTGFPNKHSR-FNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTVTETLE
     330       340        350       360       370       380        

     400                                                           
pF1KA1 LHV                                                         
                                                                   
CCDS11 ELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEE
      390       400       410       420       430       440        

>>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1                (911 aa)
 initn: 695 init1: 318 opt: 407  Z-score: 380.8  bits: 80.5 E(32554): 6.8e-15
Smith-Waterman score: 749; 37.4% identity (62.6% similar) in 374 aa overlap (22-374:8-363)

               10        20        30        40              50    
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS------VVVQTAPG
                            ::.: . :: .   .. ::::.:.        ..  :: 
CCDS11               MAQLFLPLLAALVLAQ-APAALADVLEGDSSEDRAFRVRIAGDAPL
                             10         20        30        40     

           60        70        80            90       100       110
pF1KA1 QVVSHRGGTIVLPCRYHYEAAAHGHDGV----RLKWTKVVDPLAFTDVFVALGPQHRAFG
       : :   ::....::. ::     .. .:    :.:::  ..    ..:.:: : . ..  
CCDS11 QGV--LGGALTIPCHVHYLRPPPSRRAVLGSPRVKWT-FLSRGREAEVLVARGVRVKVNE
            50        60        70        80         90       100  

              120         130       140       150       160        
pF1KA1 SYRGRAELQGDGPG--DASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYH
       .:: :. : .   .  :.::.: ..  .: : :.::: . ..:..  :.. ..:::: :.
CCDS11 AYRFRVALPAYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYR
            110       120       130       140       150       160  

      170       180       190       200       210       220        
pF1KA1 PRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPRE
         ..:: ..:. ::.:::.  . .:. :::.::.  : . :.:::: : .:.::.. :::
CCDS11 EGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPRE
            170       180       190       200       210       220  

      230       240         250       260       270       280      
pF1KA1 PCGGLGGTGSAGGGGDANG--GLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPF
        :            :: .:  :.::::   . .. ::..:.. .: :..:.  : . . .
CCDS11 AC-----------YGDMDGFPGVRNYGVV-DPDDLYDVYCYAEDLNGELFLGDPPEKLTL
                       230       240        250       260       270

        290       300       310       320       330       340      
pF1KA1 SGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGV
         :   :  ::: .: .:::.:::    ::.:. :::::::.:::::.:  ::::  :::
CCDS11 EEARAYCQERGAEIATTGQLYAAWD-GGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGV
              280       290        300       310       320         

               350       360       370       380       390         
pF1KA1 RSL-------GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTP
       ..:       :::.   : :.:::.:  . :.  :                         
CCDS11 KTLFLFPNQTGFPNKHSR-FNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTVTETLE
     330       340        350       360       370       380        

     400                                                           
pF1KA1 LHV                                                         
                                                                   
CCDS11 ELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEE
      390       400       410       420       430       440        

>>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19               (1321 aa)
 initn: 680 init1: 276 opt: 406  Z-score: 377.7  bits: 80.5 E(32554): 1e-14
Smith-Waterman score: 777; 36.2% identity (62.3% similar) in 401 aa overlap (8-394:1-385)

               10        20        30        40        50        60
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR
              .:   .:: .  .: .   .....: . .. .  .: :  . . . :.: .  
CCDS12        MGAPFVWALGLLMLQMLLFVAGEQGTQDITDA--SERGLHMQKLGSGSVQAAL
                      10        20        30          40        50 

               70         80        90          100       110      
pF1KA1 GGTIVLPCRYHYEA-AAHGHDGVRLKWTKVVDPLAFTD---VFVALGPQHRAFGSYRGRA
       .  ..::: .  .   . ..:. :.:::::    .  .   ..::     :.  :..::.
CCDS12 AELVALPCLFTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRV
              60        70        80        90       100       110 

        120          130       140       150       160       170   
pF1KA1 ELQGDGP---GDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGR
        : .  :   ..:.:.:  .  .: : :.:.:.  .::.  .: :.. :::: :.    :
CCDS12 SLPSY-PRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDR
              120       130       140       150       160       170

           180       190       200       210       220       230   
pF1KA1 YKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGL
       : :::::::.::  ...:.:. ..:.::..::.: :.:::: : .:.::... :  :   
CCDS12 YALTFAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGC--Y
              180       190       200       210       220          

           240       250       260       270       280       290   
pF1KA1 GGTGSAGGGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARAC
       :  .:  :       .:.:: :.: .: ::..::. .: :.::.. : : . ..::   :
CCDS12 GDRSSLPG-------VRSYG-RRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQC
      230              240        250       260       270       280

           300       310       320       330       340             
pF1KA1 AARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL----
         .:::.:.::::  ::. . ::.:  :::::::.:::: .:: ::::  ::::..    
CCDS12 RRQGAALASVGQLHLAWH-EGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFA
              290        300       310       320       330         

        350       360       370       380       390       400      
pF1KA1 ---GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV    
          :::. ..: : .::.::   :    :      .:  :   .:. :            
CCDS12 NRTGFPSPAER-FDAYCFRAHH-PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEE
     340       350        360        370       380       390       

CCDS12 EVVTPDFQEPLVSSGEEETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSD
       400       410       420       430       440       450       

>>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5                (655 aa)
 initn: 584 init1: 333 opt: 388  Z-score: 365.2  bits: 77.2 E(32554): 5.1e-14
Smith-Waterman score: 694; 36.3% identity (61.1% similar) in 350 aa overlap (36-367:17-349)

          10        20        30        40        50        60     
pF1KA1 AALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIV
                                     :.:.:.    .: :  .:  : .  .: . 
CCDS47               MFINIKSILWMCSTLIVTHALH----KVKVGKSP-PVRGSLSGKVS
                             10        20            30         40 

          70            80         90           100       110      
pF1KA1 LPCRYH----YEAAAHGHDGVRLKWTKV-VDP----LAFTDVFVALGPQHRAFGSYRGRA
       :::..        . .  . .:.::.:. ::     :  : :.:: . . .   .:.::.
CCDS47 LPCHFSTMPTLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRV
              50        60        70        80        90       100 

          120       130       140       150       160       170    
pF1KA1 EL--QGDGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRY
        .  . .. :::::.. ..  .: : :.:.:   .::    :.: ..:::: :.   .::
CCDS47 SVPTHPEAVGDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRY
             110       120       130       140       150       160 

          180       190       200       210       220       230    
pF1KA1 KLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLG
        :.:  ::.:: .  ...:. ::: ::..::.. :.:::: : .:.::.  ::  : :  
CCDS47 TLNFEAAQKACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYG-D
             170       180       190       200       210        220

          240       250       260       270       280       290    
pF1KA1 GTGSAGGGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACA
         :.::        .:.::.: . .: ::..:....: : :: :       :  ::. : 
CCDS47 KMGKAG--------VRTYGFR-SPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECE
                      230        240       250       260       270 

          300       310       320       330       340              
pF1KA1 ARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-----
        . : .: ::.: :::. . .:.:  :::.:.:.:.:..  ::.:::   :::.:     
CCDS47 NQDARLATVGELQAAWR-NGFDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFEN
             280        290       300       310       320       330

       350       360       370       380       390       400       
pF1KA1 --GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV     
         :::    : : .::.. :                                        
CCDS47 QTGFPPPDSR-FDAYCFKRPDRCKMNPCLNGGTCYPTETSYVCTCVPGYSGDQCELDFDE
              340        350       360       370       380         

>>CCDS53971.1 ACAN gene_id:176|Hs108|chr15                (2431 aa)
 initn: 666 init1: 347 opt: 387  Z-score: 356.6  bits: 77.5 E(32554): 1.5e-13
Smith-Waterman score: 678; 34.5% identity (61.5% similar) in 348 aa overlap (48-380:33-365)

        20        30        40        50        60        70       
pF1KA1 WGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRY----HYE
                                     . : .: .:.   : ....:: .    :  
CCDS53 TLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVL--LGTSLTIPCYFIDPMHPV
             10        20        30        40          50        60

            80          90       100       110       120           
pF1KA1 AAAHGHDGV--RLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQGDG--PGDASLV
       ..: .   .  :.::..:      . ..::   . :. ..:. .. : .    :.::.: 
CCDS53 TTAPSTAPLAPRIKWSRVSKEKEVV-LLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLE
               70        80         90       100       110         

     130       140       150       160       170       180         
pF1KA1 LRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQD
       ....  .: : :.::: . .::. . ... ..:.:: :.  . :: : : .::::: ...
CCDS53 VQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNS
     120       130       140       150       160       170         

     190       200       210       220       230       240         
pF1KA1 GILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGL
       .:.:. :::.::..::.  :.:::: : .:.::.. ::: : :           :   :.
CCDS53 AIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYG---------DKDEFPGV
     180       190       200       210       220                230

     250       260       270       280       290       300         
pF1KA1 RNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAA
       :.:: : ...: ::..::. .. :.::.    .   :. ::  :   :: .: .:::. :
CCDS53 RTYGIR-DTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLA
               240       250       260       270       280         

     310       320       330       340              350       360  
pF1KA1 WKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-------GFPDATRRLFGVY
       :.  . : :.:::::: :.:::: . :  :::   :::..       :.:: . : . . 
CCDS53 WQAGM-DMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSR-YDAI
     290        300       310       320       330       340        

            370       380       390       400                      
pF1KA1 CYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV                    
       :: .    :   . .: :                                          
CCDS53 CYTGEDFVDIPENFFGVGGEEDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV
       350       360       370       380       390       400       

>--
 initn: 629 init1: 282 opt: 652  Z-score: 601.4  bits: 122.8 E(32554): 3.5e-27
Smith-Waterman score: 652; 46.2% identity (68.8% similar) in 221 aa overlap (162-375:477-684)

             140       150       160       170       180       190 
pF1KA1 NVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGI
                                     :::: :.:   ::.::: :::.:: .  ..
CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV
        450       460       470       480       490       500      

             200       210       220       230       240       250 
pF1KA1 LASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRN
       .:: :::.::.. : . :.:::::: .:.::.  :: :: :           :.. :.:.
CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVG---------DKDSSPGVRT
        510       520       530       540                550       

             260       270       280       290       300       310 
pF1KA1 YGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWK
       :: : ..:  ::..::.. : :.:::   :.   :. : . : ...:..: .:::.:::.
CCDS53 YGVRPSTET-YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWS
       560        570       580       590       600       610      

             320       330       340              350       360    
pF1KA1 LQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-------GFPDATRRLFGVYCY
        . ::.: :::::::: :::::.::  ::: .::::..       :.::   :   ..:.
CCDS53 -RGLDKCYAGWLADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSR-HHAFCF
         620       630       640       650       660        670    

          370       380       390       400                        
pF1KA1 RAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV                      
       :. .:  :.::                                                 
CCDS53 RGISAV-PSPGEEEGGTPTSPSGVEEWIVTQVVPGVAAVPVEEETTAVPSGETTAILEFT
          680        690       700       710       720       730   




402 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 06:59:16 2016 done: Sat Nov  5 06:59:16 2016
 Total Scan time:  2.870 Total Display time:  0.040

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com