Result of FASTA (ccds) for pF1KSDA1001
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KSDA1001, 525 aa
  1>>>pF1KSDA1001 525 - 525 aa - 525 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.9331+/-0.000812; mu= 15.7079+/- 0.049
 mean_var=80.9163+/-16.061, 0's: 0 Z-trim(109.3): 24  B-trim: 0 in 0/49
 Lambda= 0.142579
 statistics sampled from 10749 (10773) to 10749 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.696), E-opt: 0.2 (0.331), width:  16
 Scan time:  3.560

The best scores are:                                      opt bits E(32554)
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17         ( 525) 3629 756.1 2.2e-218
CCDS14100.2 ARSA gene_id:410|Hs108|chr22           ( 509)  709 155.5 1.4e-37
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16         ( 522)  487 109.8 7.9e-24
CCDS46736.1 ARSA gene_id:410|Hs108|chr22           ( 423)  410 93.9 3.9e-19
CCDS14123.1 ARSF gene_id:416|Hs108|chrX            ( 590)  394 90.7   5e-18
CCDS75949.1 ARSE gene_id:415|Hs108|chrX            ( 544)  393 90.5 5.4e-18
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX         ( 562)  376 87.0 6.3e-17
CCDS35196.1 ARSD gene_id:414|Hs108|chrX            ( 593)  376 87.0 6.6e-17
CCDS14122.1 ARSE gene_id:415|Hs108|chrX            ( 589)  354 82.5 1.5e-15
CCDS75948.1 ARSE gene_id:415|Hs108|chrX            ( 614)  354 82.5 1.6e-15
CCDS43334.1 ARSB gene_id:411|Hs108|chr5            ( 413)  334 78.3 1.9e-14
CCDS14127.1 STS gene_id:412|Hs108|chrX             ( 583)  336 78.8 1.9e-14
CCDS4043.1 ARSB gene_id:411|Hs108|chr5             ( 533)  334 78.3 2.4e-14
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4          ( 599)  319 75.3 2.2e-13
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5         ( 569)  307 72.8 1.2e-12


>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17              (525 aa)
 initn: 3629 init1: 3629 opt: 3629  Z-score: 4034.2  bits: 756.1 E(32554): 2.2e-218
Smith-Waterman score: 3629; 99.8% identity (99.8% similar) in 525 aa overlap (1-525:1-525)

               10        20        30        40        50        60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETT
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD LAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNHPPCPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNHPPCPA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KSD CPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KSD FLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHTVKENTFLWFT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHTVKENTFLWFT
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KSD GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KSD ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRVLFHPNSGAAGEFGAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRVLFHPNSGAAGEFGAL
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KSD QTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAEAVPLERGGAEYQAVLP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAEAVPLERGGAEYQAVLP
              430       440       450       460       470       480

              490       500       510       520     
pF1KSD EVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
       :::::::::::::::::::: ::::::::::::::::::::::::
CCDS11 EVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQIACRCQAA
              490       500       510       520     

>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22                (509 aa)
 initn: 716 init1: 259 opt: 709  Z-score: 788.2  bits: 155.5 E(32554): 1.4e-37
Smith-Waterman score: 972; 36.6% identity (60.3% similar) in 519 aa overlap (28-522:15-504)

               10        20        30        40        50        60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
                                  .: . .. ::.:.:.:::.:.::::     .. 
CCDS14              MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSST
                            10        20        30        40       

               70        80        90       100        110         
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAV-TSVGGLPLNET
       : :::..:. :.::.::.. .: :.::::.:::::: .: :.  .  : .: :::::.:.
CCDS14 TPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEV
        50        60        70        80        90       100       

     120       130       140         150       160        170      
pF1KSD TLAEVLQQAGYVTGIIGKWHLG--HHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHP
       :.::::   ::.::. ::::::   .:.. :  .::  ..:::::::.: : .   .  :
CCDS14 TVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P
       110       120       130       140       150       160       

        180       190        200       210       220       230     
pF1KSD PCPACPQGDGPSRNLQRDCYTD-VALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS
       :   :  :          :    : .::  ::..  ::  : .:  .:   : ...  :.
CCDS14 PATPCDGG----------CDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQ
         170                 180       190       200       210     

         240       250       260       270       280        290    
pF1KSD TSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKEN
        . :::.:: :  : : :    :  :   ::. .: .: :.:. :: .   . :  . :.
CCDS14 RQDRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEE
         220       230       240       250       260       270     

          300       310       320       330       340       350    
pF1KSD TFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVP
       :.. ::.:::: ...     : :  .:. .  .:      ::.::: : ::::.:::.. 
CCDS14 TLVIFTADNGPETMRM----SRGGCSGLLRCGKG------TTYEGGVREPALAFWPGHIA
         280       290           300             310       320     

          360       370       380       390       400        410   
pF1KSD VNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGA
        .::   : : ::..::..::: : ::.   .:: :.: .:.: .. : . ..:.:.   
CCDS14 PGVTHE-LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--
         330        340       350        360       370       380   

           420       430       440              450       460      
pF1KSD AGEFGALQTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAV
         :  .. .::  .::: ..: :.   : .. :  .       :. ::...:  : .:  
CCDS14 PDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENY
             390       400       410       420       430       440 

        470       480         490        500          510          
pF1KSD PLERGGAEYQAVLPEVRKVLADV--LQDIANDNIS-SPDYT---QDPSVTPCCNP----Y
        :  : :   .. ::: ..: ..  :.   .  .. .:. .   .::..  ::.:     
CCDS14 NLLGGVA---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPR
                450       460       470       480       490        

        520       
pF1KSD QIACRCQAA  
          :.:     
CCDS14 PACCHCPDPHA
      500         

>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16              (522 aa)
 initn: 892 init1: 284 opt: 487  Z-score: 541.3  bits: 109.8 E(32554): 7.9e-24
Smith-Waterman score: 862; 37.8% identity (61.4% similar) in 479 aa overlap (34-486:29-472)

            10        20        30        40        50        60   
pF1KSD LFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKDTAN
                                     : ::....: :::::::::.    ...: :
CCDS10   MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPN
                 10        20        30        40        50        

            70        80        90       100             110       
pF1KSD LDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGV------TRNFAVTS---VGGL
       ::.::.::. : .:..:   ::::::.:::::: .:::       .:: : :    :::.
CCDS10 LDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARN-AYTPQEIVGGI
       60        70        80        90       100        110       

          120       130       140       150       160       170    
pF1KSD PLNETTLAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYN
       : .:  : :.:..::::. :.:::::::. ..::  .::: .:: :  : .:    : :.
CCDS10 PDSEQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCH-FG----P-YD
       120       130       140       150       160             170 

          180       190       200       210           220       230
pF1KSD HPPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSS----LAQKYAEKATQF
       .   :  :        . ::   ...   ::     : :.::..    :.: : ..: .:
CCDS10 NKARPNIP--------VYRD--WEMVGRYYE-----EFPINLKTGEANLTQIYLQEALDF
                     180         190            200       210      

              240       250         260       270       280        
pF1KSD IQRASTSGRPFLLYVALAHMHVPLPVTQ--LPAAPRGRSLYGAGLWEMDSLVGQIKDKV-
       :.: .   .::.:: :.   :.:. ...  : .. :::  :: .. :.:. .:.: . . 
CCDS10 IKRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRGR--YGDAVREIDDSIGKILELLQ
        220        230       240       250         260       270   

       290       300        310       320       330       340      
pF1KSD DHTVKENTFLWFTGDNGP-WAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPAL
       :  : .:::..::.:::    .  : .:: :::            .::::.::: : :::
CCDS10 DLHVADNTFVFFTSDNGAALISAPEQGGSNGPFLC----------GKQTTFEGGMREPAL
           280       290       300                 310       320   

        350       360       370       380       390        400     
pF1KSD AYWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLF-GRSQPGHRV
       :.:::.: .. .:  : :..:.: : .:::  . :. : .::...  .:. :: .     
CCDS10 AWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIF
           330       340       350       360       370       380   

         410       420             430       440        450        
pF1KSD LFHPNSGAAGEFGALQ------TVRLERYKAFYITGGARACDGSTGPELQ-H-KFPLIFN
        .. ..  :. .:  .      :   : ..       ..  .: :  .:. : :.::::.
CCDS10 YYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFH
           390       400       410       420       430       440   

       460       470       480       490       500       510       
pF1KSD LEDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQ
       :  : .:  ::  ..:::: .: .. .:.                               
CCDS10 LGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEK
           450       460       470       480       490       500   

>>CCDS46736.1 ARSA gene_id:410|Hs108|chr22                (423 aa)
 initn: 609 init1: 171 opt: 410  Z-score: 457.1  bits: 93.9 E(32554): 3.9e-19
Smith-Waterman score: 735; 35.2% identity (58.4% similar) in 449 aa overlap (96-522:1-418)

          70        80        90       100       110       120     
pF1KSD KMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETTLAEVL
                                     .:.  ::   .. .: :::::.:.:.::::
CCDS46                               MGMYPGV---LVPSSRGGLPLEEVTVAEVL
                                                10        20       

         130       140         150       160        170       180  
pF1KSD QQAGYVTGIIGKWHLG--HHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHPPCPACP
          ::.::. ::::::   .:.. :  .::  ..:::::::.: : .   .  :  :: :
CCDS46 AARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P--PATP
        30        40        50        60        70            80   

            190       200       210       220       230       240  
pF1KSD QGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFL
          : ...:       : .::  ::..  ::  : .:  .:   : ...  :. . :::.
CCDS46 CDGGCDQGL-------VPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFF
            90              100       110       120       130      

            250       260       270       280        290       300 
pF1KSD LYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKENTFLWFTG
       :: :  : : :    :  :   ::. .: .: :.:. :: .   . :  . :.:.. ::.
CCDS46 LYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTA
        140       150       160       170       180       190      

             310       320       330       340       350       360 
pF1KSD DNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTA
       :::: ...     : :  .:.   : :    : ::.::: : ::::.:::..  .::   
CCDS46 DNGPETMRM----SRGGCSGL--LRCG----KGTTYEGGVREPALAFWPGHIAPGVTHE-
        200           210             220       230       240      

             370       380       390       400        410       420
pF1KSD LLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGAAGEFGAL
       : : ::..::..::: : ::.   .:: :.: .:.: .. : . ..:.:.     :  ..
CCDS46 LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--PDEVRGV
         250       260        270       280       290         300  

              430       440              450       460       470   
pF1KSD QTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAVPLERGGA
        .::  .::: ..: :.   : .. :  .       :. ::...:  : .:   :  : :
CCDS46 FAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVA
            310       320       330       340       350       360  

           480         490        500          510           520   
pF1KSD EYQAVLPEVRKVLADV--LQDIANDNIS-SPDYT---QDPSVTPCCNP----YQIACRCQ
          .. ::: ..: ..  :.   .  .. .:. .   .::..  ::.:        :.: 
CCDS46 ---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCP
               370       380       390       400       410         

           
pF1KSD AA  
           
CCDS46 DPHA
     420   

>>CCDS14123.1 ARSF gene_id:416|Hs108|chrX                 (590 aa)
 initn: 763 init1: 250 opt: 394  Z-score: 437.1  bits: 90.7 E(32554): 5e-18
Smith-Waterman score: 782; 32.3% identity (58.4% similar) in 526 aa overlap (15-468:9-519)

               10        20        30        40        50        60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
                     : ...  :.. : . ... .:::.:.:..::.: ::::    .:  
CCDS14       MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR
                     10        20        30        40        50    

               70        80        90       100               110  
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNG--------VTRNFAVTSVG
       : ..:..: ::.:...  .::: :::::...::::  .:.:        : .:.:: .  
CCDS14 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPA--
           60        70        80        90       100       110    

            120       130       140             150       160      
pF1KSD GLPLNETTLAEVLQQAGYVTGIIGKWHLGHHGS------YHPNFRGFDYYFGIPYSHDMG
       :::::::::: .:.. :: ::.::::: : . .      .::   :::::.:.:..   .
CCDS14 GLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDS
            120       130       140       150       160       170  

        170            180                190                      
pF1KSD CTDTPGYN-----HPPCPACPQ---------GDGPSRN------------------LQRD
       :   :. :     .     : :           :   .                  :   
CCDS14 CWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYA
            180       190       200       210       220       230  

          200             210       220       230       240        
pF1KSD CYTDVALPLYENL------NIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA
        ... . ::: .       .:.:::..    .. ....: .:..: :   . :::. .. 
CCDS14 WFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSK--ETFLLFFSFL
            240       250       260       270       280         290

      250       260       270       280       290        300       
pF1KSD HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA
       :.:.:::.:.  ..   ..::: .. ::::.::.: : .:   ...::...::.:.:   
CCDS14 HVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHL
              300       310       320       330       340       350

       310       320       330       340       350       360       
pF1KSD QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD
       .  .  ...: ..:...  .:     .  :::: :::... :::.::..       :..:
CCDS14 EARRGHAQLGGWNGIYKGGKG-----MGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMD
              360       370            380       390       400     

       370       380       390       400        410       420      
pF1KSD IFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVR-L
       :.:::.... .:::: : .:: :.  .: :  . . :. :::      : .  :..:: .
CCDS14 ILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFH----YCGSY--LHAVRWI
         410       420       430       440           450           

               430                  440       450       460        
pF1KSD ER------YKAFYIT--------GGARA---CDGSTGPELQHKFPLIFNLEDDTAEAVPL
        .      .:: :.:        ::  .   :         :. ::.:.:  : .:..::
CCDS14 PKDDSGSVWKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPL
     460       470       480       490       500       510         

      470       480       490       500       510       520        
pF1KSD ERGGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA   
                                                                   
CCDS14 TPATEPLHDFVIKKVANALKEHQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEE
     520       530       540       550       560       570         

>>CCDS75949.1 ARSE gene_id:415|Hs108|chrX                 (544 aa)
 initn: 646 init1: 200 opt: 393  Z-score: 436.5  bits: 90.5 E(32554): 5.4e-18
Smith-Waterman score: 664; 30.3% identity (55.3% similar) in 535 aa overlap (61-522:18-537)

               40        50        60        70        80        90
pF1KSD TRGQKPNFVIILADDMGWGDLGANWAETKDTANLDKMASEGMRFVDFHAAASTCSPSRAS
                                     : :.:..: .:.....  .::: :.::::.
CCDS75              MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA
                            10        20        30        40       

              100       110             120       130       140    
pF1KSD LLTGRLGLRNGVTRNFAVTSV------GGLPLNETTLAEVLQQAGYVTGIIGKWHLGHH-
       .::::  .:.:.. ...   .      :::: ::::.:..:.. ::.::.::::::: . 
CCDS75 FLTGRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNC
        50        60        70        80        90       100       

                150       160                                   170
pF1KSD -----GSYHPNFRGFDYYFGIPYSHDMGC----------------------------TDT
              .::  .:::...:.:.:    :                            : .
CCDS75 ESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLV
       110       120       130       140       150       160       

                180         190       200             210       220
pF1KSD PG-YNH-PPCPACP--QGDGPSRNLQRDCYTDVALP------LYENLNIVEQPVNLSSLA
        :  .:  :    :   .   .  :  . :   ::       :..: .:.:::. ..  .
CCDS75 AGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTT
       170       180       190       200       210       220       

              230       240       250       260       270       280
pF1KSD QKYAEKATQFIQRASTSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLV
           .....:..: .  : ::::.:.. :.:.:: . .   .   ..::: .. ::: .:
CCDS75 PLILQEVASFLKR-NKHG-PFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMV
       230       240         250       260       270       280     

               290       300       310        320       330        
pF1KSD GQIKDKVD-HTVKENTFLWFTGDNGPWAQKCELAGS-VGPFTGFWQTRQGGSPAKQTTWE
       :.: : .: . ....:...::.:.:  . . .:...  : ..:...  .:     .  ::
CCDS75 GRILDTLDVEGLSNSTLIYFTSDHGG-SLENQLGNTQYGGWNGIYKGGKG-----MGGWE
         290       300       310        320       330              

      340       350       360       370       380       390        
pF1KSD GGHRVPALAYWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGR
       :: :::..  ::: .:.. .     :..:.::::: :: . .:: : .:: :.  .:.: 
CCDS75 GGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGT
     340       350       360       370       380       390         

      400        410       420       430            440            
pF1KSD SQPG-HRVLFHPNSGAAGEFGALQTVRLERYKAFYITG-----GARACDGST-----GPE
       .: . :. :.:            :  :   .:. ..:      :: :: :       : .
CCDS75 AQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEK
     400       410       420       430       440       450         

        450       460       470       480       490        500     
pF1KSD L-QHKFPLIFNLEDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDI-ANDNISSPDYTQ
       . .:  ::.:.:  : .:.  :        :  :   .:.  : : .  ..   ::   :
CCDS75 VVHHDPPLLFDLSRDPSETHILT------PASEPVFYQVMERVQQAVWEHQRTLSPVPLQ
     460       470       480             490       500       510   

                 510       520         
pF1KSD -D-------PSVTPCCNPYQIACRCQAA    
        :       : . :::.:. . : :       
CCDS75 LDRLGNIWRPWLQPCCGPFPL-CWCLREDDPQ
           520       530        540    

>>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX              (562 aa)
 initn: 798 init1: 244 opt: 376  Z-score: 417.4  bits: 87.0 E(32554): 6.3e-17
Smith-Waterman score: 741; 31.9% identity (59.1% similar) in 508 aa overlap (31-468:2-495)

               10        20        30        40        50        60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
                                     ::. .::.:...:::.: :::     .. .
CCDS35                              MTRNARPNIVLLMADDLGVGDLCCYGNNSVS
                                            10        20        30 

               70        80        90       100       110          
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV-------GG
       : :.:..::::.:...  :::: :.::::..::::  .:.:..  . .. .       ::
CCDS35 TPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGG
              40        50        60        70        80        90 

           120       130       140             150       160       
pF1KSD LPLNETTLAEVLQQAGYVTGIIGKWHLG------HHGSYHPNFRGFDYYFGIPYSHDMGC
       :: ::::.:..::. :: ::.:::::::      .   :::  .:: :..:.:..    :
CCDS35 LPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDC
             100       110       120       130       140       150 

         170                       180           190               
pF1KSD --TDTPGYNH----------------PPCPACPQG----DGPSRNLQ----------RDC
         . ::  ..                :     :.     . : . .            . 
CCDS35 QASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSW
             160       170       180       190       200       210 

         200             210       220       230       240         
pF1KSD YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALAH
       :.. ..       :..: .:..::..  ..:. . ..:  ::.: .   .::::. .. :
CCDS35 YSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKR--EPFLLFFSFLH
             220       230       240       250         260         

     250       260        270       280       290        300       
pF1KSD MHVPLPVTQLPAAPRGR-SLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA
       .:.:: ...   . :.. . :: .. ::: .::.: : .:.  . ..:...::.:::   
CCDS35 VHTPL-ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHL
     270        280       290       300       310       320        

       310       320       330       340       350       360       
pF1KSD QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD
       .  . : ..: ..:...  .:     .  :::: :::..  ::. . .. . .   :..:
CCDS35 EPLDGAVQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMD
      330       340            350       360       370       380   

       370       380       390        400       410       420      
pF1KSD IFPTVVALAQASLPQGRRFDGVDVSEVLFGR-SQPGHRVLFHPNSGAAGEFGALQTVRLE
       :.::.  .. . : : : .:: ..  .: :: :.  :. :::      : .  :.::: .
CCDS35 IYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFH----YCGVY--LHTVRWH
           390       400       410       420           430         

              430            440            450       460       470
pF1KSD R------YKAFYITG-----GARACDGS-----TGPELQHKFPLIFNLEDDTAEAVPLER
       .      .:: :.:      :. :: ::     .:    :  ::.:..  : .::.::  
CCDS35 QKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPPLLFDISRDPSEALPLNP
       440       450       460       470       480       490       

              480       490       500       510       520          
pF1KSD GGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA     
                                                                   
CCDS35 DNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI
       500       510       520       530       540       550       

>>CCDS35196.1 ARSD gene_id:414|Hs108|chrX                 (593 aa)
 initn: 742 init1: 240 opt: 376  Z-score: 417.0  bits: 87.0 E(32554): 6.6e-17
Smith-Waterman score: 790; 31.9% identity (58.2% similar) in 545 aa overlap (18-494:23-556)

                    10        20        30        40        50     
pF1KSD      MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANW
                             ::  :.  :    . . :::...:.:::.: ::::   
CCDS35 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
               10        20        30        40        50        60

          60        70        80        90       100       110     
pF1KSD AETKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV----
        .:  : :.:..: ::.:...  :::  :.::::..:::: ..:.:.  . .  ..    
CCDS35 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
               70        80        90       100       110       120

               120       130       140             150       160   
pF1KSD --GGLPLNETTLAEVLQQAGYVTGIIGKWHLG----HHGSY--HPNFRGFDYYFGIPYSH
         :::: ::::.:..::: ::.::.::::: :     .:..  ::  .::::..:.:.. 
CCDS35 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
              130       140       150       160       170       180

           170                             180           190       
pF1KSD DMGCTDTPGYNHPP----------------------CPACPQGDG----PSRNLQR----
          :   ::  .::                        :  :  :     .: .      
CCDS35 TNDCD--PG--RPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGV
                  190       200       210       220       230      

                 200             210       220       230       240 
pF1KSD DC------YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPF
        :      :.. ..       :..: ...:::. : . :. . ..:...:.: . .  ::
CCDS35 GCLFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHG--PF
        240       250       260       270       280       290      

             250       260       270       280        290       300
pF1KSD LLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKENTFLWFT
       ::...: :.:.:: .:.   .   ..::: .. ::: :.:.. . . :. .:..:: .::
CCDS35 LLFLSLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFT
          300       310       320       330       340       350    

              310       320       330       340       350       360
pF1KSD GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST
       .:.:   .  .  ...: ..:...  .:     .  :::: :::.. .::: .:.. .  
CCDS35 SDHGGHLEARDGHSQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFHWPGVLPAGRVIG
          360       370       380            390       400         

              370       380       390        400       410         
pF1KSD ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFG-RSQPGHRVLFHPNSGAAGEFGA
          :..:.::::: :. . .:: : .:: ..  .: : ... .:. :::  .        
CCDS35 EPTSLMDVFPTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARW
     410       420       430       440       450       460         

     420       430            440             450       460        
pF1KSD LQTVRLERYKAFYITG-----GARACDGS-----TGPEL-QHKFPLIFNLEDDTAEAVPL
        :      .:. : :      :: :: :      .:  . .:. ::.:.:  : .:: ::
CCDS35 HQKDSGSVWKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPL
     470       480       490       500       510       520         

      470        480       490       500       510       520       
pF1KSD ERGGAE-YQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA  
          .   :.::. .:  ....  : ..                                 
CCDS35 TPDSEPLYHAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDG
     530       540       550       560       570       580         

>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX                 (589 aa)
 initn: 766 init1: 219 opt: 354  Z-score: 392.6  bits: 82.5 E(32554): 1.5e-15
Smith-Waterman score: 708; 31.1% identity (58.3% similar) in 501 aa overlap (28-464:30-522)

                 10        20        30        40        50        
pF1KSD   MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAET
                                    :.   ...::.....:::.: ::.:    .:
CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNT
               10        20        30        40        50        60

       60        70        80        90       100       110        
pF1KSD KDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV------G
         : :.:..: .:.....  .::: :.::::..::::  .:.:.. ...   .      :
CCDS14 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG
               70        80        90       100       110       120

            120       130       140             150       160      
pF1KSD GLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDMG
       ::: ::::.:..:.. ::.::.::::::: .        .::  .:::...:.:.:    
CCDS14 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD
              130       140       150       160       170       180

                                    170         180         190    
pF1KSD C----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQRD
       :                            : . :  .:  :    :   .   .  :  .
CCDS14 CARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS
              190       200       210       220       230       240

          200             210       220       230       240        
pF1KSD CYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA
        :   ::       :..: .:.:::. ..  .    .....:..: .  : ::::.:.. 
CCDS14 SYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKR-NKHG-PFLLFVSFL
              250       260       270       280         290        

      250       260       270       280        290       300       
pF1KSD HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPWA
       :.:.:: . .   .   ..::: .. ::: .::.: : .: . ....:...::.:.:  .
CCDS14 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG-S
      300       310       320       330       340       350        

       310        320       330       340       350       360      
pF1KSD QKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVL
        . .:...  : ..:...  .:     .  :::: :::..  ::: .:.. .     :..
CCDS14 LENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLM
       360       370            380       390       400       410  

        370       380       390       400        410       420     
pF1KSD DIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVRL
       :.::::: :: . .:: : .:: :.  .:.: .: . :. :.:            :  : 
CCDS14 DVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRG
            420       430       440       450       460       470  

         430            440             450       460       470    
pF1KSD ERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGAE
         .:. ..:      :: :: :       : .. .:  ::.:.:  : .:          
CCDS14 TMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEP
            480       490       500       510       520       530  

          480       490       500       510       520           
pF1KSD YQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA      
                                                                
CCDS14 VFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
            540       550       560       570       580         

>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX                 (614 aa)
 initn: 766 init1: 219 opt: 354  Z-score: 392.4  bits: 82.5 E(32554): 1.6e-15
Smith-Waterman score: 708; 31.1% identity (58.3% similar) in 501 aa overlap (28-464:55-547)

                  10        20        30        40        50       
pF1KSD    MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAE
                                     :.   ...::.....:::.: ::.:    .
CCDS75 IVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNN
           30        40        50        60        70        80    

        60        70        80        90       100       110       
pF1KSD TKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV------
       :  : :.:..: .:.....  .::: :.::::..::::  .:.:.. ...   .      
CCDS75 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS
           90       100       110       120       130       140    

             120       130       140             150       160     
pF1KSD GGLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDM
       :::: ::::.:..:.. ::.::.::::::: .        .::  .:::...:.:.:   
CCDS75 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMG
          150       160       170       180       190       200    

                                     170         180         190   
pF1KSD GC----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQR
        :                            : . :  .:  :    :   .   .  :  
CCDS75 DCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLA
          210       220       230       240       250       260    

           200             210       220       230       240       
pF1KSD DCYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVAL
       . :   ::       :..: .:.:::. ..  .    .....:..: .  : ::::.:..
CCDS75 SSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKR-NKHG-PFLLFVSF
          270       280       290       300       310         320  

       250       260       270       280        290       300      
pF1KSD AHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPW
        :.:.:: . .   .   ..::: .. ::: .::.: : .: . ....:...::.:.:  
CCDS75 LHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG-
            330       340       350       360       370       380  

        310        320       330       340       350       360     
pF1KSD AQKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSV
       . . .:...  : ..:...  .:     .  :::: :::..  ::: .:.. .     :.
CCDS75 SLENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSL
             390       400            410       420       430      

         370       380       390       400        410       420    
pF1KSD LDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVR
       .:.::::: :: . .:: : .:: :.  .:.: .: . :. :.:            :  :
CCDS75 MDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDR
        440       450       460       470       480       490      

          430            440             450       460       470   
pF1KSD LERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGA
          .:. ..:      :: :: :       : .. .:  ::.:.:  : .:         
CCDS75 GTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASE
        500       510       520       530       540       550      

           480       490       500       510       520           
pF1KSD EYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA      
                                                                 
CCDS75 PVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
        560       570       580       590       600       610    




525 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 18:57:37 2016 done: Thu Nov  3 18:57:37 2016
 Total Scan time:  3.560 Total Display time:  0.130

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com