Result of FASTA (ccds) for pF1KE0337
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE0337, 509 aa
  1>>>pF1KE0337 509 - 509 aa - 509 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.6551+/-0.000766; mu= 17.8820+/- 0.046
 mean_var=93.4402+/-18.621, 0's: 0 Z-trim(111.0): 28  B-trim: 0 in 0/51
 Lambda= 0.132681
 statistics sampled from 11999 (12024) to 11999 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.733), E-opt: 0.2 (0.369), width:  16
 Scan time:  3.540

The best scores are:                                      opt bits E(32554)
CCDS14100.2 ARSA gene_id:410|Hs108|chr22           ( 509) 3545 688.7 4.2e-198
CCDS46736.1 ARSA gene_id:410|Hs108|chr22           ( 423) 2972 578.9 3.8e-165
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16         ( 522)  958 193.5   5e-49
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17         ( 525)  709 145.8 1.1e-34
CCDS43334.1 ARSB gene_id:411|Hs108|chr5            ( 413)  517 109.0 1.1e-23
CCDS4043.1 ARSB gene_id:411|Hs108|chr5             ( 533)  517 109.1 1.3e-23
CCDS14122.1 ARSE gene_id:415|Hs108|chrX            ( 589)  422 90.9 4.2e-18
CCDS75948.1 ARSE gene_id:415|Hs108|chrX            ( 614)  422 90.9 4.3e-18
CCDS14127.1 STS gene_id:412|Hs108|chrX             ( 583)  421 90.7 4.7e-18
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX         ( 562)  401 86.9 6.6e-17
CCDS35196.1 ARSD gene_id:414|Hs108|chrX            ( 593)  390 84.8 2.9e-16
CCDS14123.1 ARSF gene_id:416|Hs108|chrX            ( 590)  384 83.6 6.5e-16
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5         ( 569)  368 80.6 5.3e-15
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4          ( 599)  361 79.2 1.4e-14
CCDS75949.1 ARSE gene_id:415|Hs108|chrX            ( 544)  304 68.3 2.5e-11


>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22                (509 aa)
 initn: 3545 init1: 3545 opt: 3545  Z-score: 3670.1  bits: 688.7 E(32554): 4.2e-198
Smith-Waterman score: 3545; 100.0% identity (100.0% similar) in 509 aa overlap (1-509:1-509)

               10        20        30        40        50        60
pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE0 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLT
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE0 GMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQGLVP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQGLVP
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE0 IPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 IPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSF
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE0 AERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGCSGLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 AERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGCSGLL
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE0 RCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLDGFDL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 RCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLDGFDL
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE0 SPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASS
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE0 SLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVA
              430       440       450       460       470       480

              490       500         
pF1KE0 RGEDPALQICCHPGCTPRPACCHCPDPHA
       :::::::::::::::::::::::::::::
CCDS14 RGEDPALQICCHPGCTPRPACCHCPDPHA
              490       500         

>>CCDS46736.1 ARSA gene_id:410|Hs108|chr22                (423 aa)
 initn: 2972 init1: 2972 opt: 2972  Z-score: 3078.4  bits: 578.9 E(32554): 3.8e-165
Smith-Waterman score: 2972; 100.0% identity (100.0% similar) in 423 aa overlap (87-509:1-423)

         60        70        80        90       100       110      
pF1KE0 GGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAAR
                                     ::::::::::::::::::::::::::::::
CCDS46                               MGMYPGVLVPSSRGGLPLEEVTVAEVLAAR
                                             10        20        30

        120       130       140       150       160       170      
pF1KE0 GYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ
               40        50        60        70        80        90

        180       190       200       210       220       230      
pF1KE0 GLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFS
              100       110       120       130       140       150

        240       250       260       270       280       290      
pF1KE0 GQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGC
              160       170       180       190       200       210

        300       310       320       330       340       350      
pF1KE0 SGLLRCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SGLLRCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLD
              220       230       240       250       260       270

        360       370       380       390       400       410      
pF1KE0 GFDLSPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPAC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GFDLSPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPAC
              280       290       300       310       320       330

        420       430       440       450       460       470      
pF1KE0 HASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 HASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGP
              340       350       360       370       380       390

        480       490       500         
pF1KE0 SQVARGEDPALQICCHPGCTPRPACCHCPDPHA
       :::::::::::::::::::::::::::::::::
CCDS46 SQVARGEDPALQICCHPGCTPRPACCHCPDPHA
              400       410       420   

>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16              (522 aa)
 initn: 709 init1: 323 opt: 958  Z-score: 993.7  bits: 193.5 E(32554): 5e-49
Smith-Waterman score: 968; 37.1% identity (59.9% similar) in 534 aa overlap (9-506:13-512)

                   10         20           30        40        50  
pF1KE0     MSMGAPRSLLLAL-AAGLAVA---RPPNIVLIFADDLGYGDLGCYGHPSSTTPNLD
                   :::.: :::....   .::::.:.. ::.:.:::: ::.::  :::::
CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
               10        20        30        40        50        60

             60        70        80        90              100     
pF1KE0 QLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYP------GVLVPSS-RGGLPLE
       ..:: :: : .::    ::.::::::::::::.: :.:       .. .:.   ::.:  
CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
               70        80        90       100       110       120

         110       120       130       140       150       160     
pF1KE0 EVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFP
       :  . :.:   ::.. ..::::::  :.  : : ..:: ...: :  :  :: .: .   
CCDS10 EQLLPELLKKAGYVSKIVGKWHLGHRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--R
              130       140         150       160        170       

         170       180       190       200           210       220 
pF1KE0 PATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEAR----YMAFAHDLMADAQRQDRPF
       :  :     :  .:      .   :  :  :   ::     :.  : :..    :. .::
CCDS10 PNIPVYR--DWEMV------GRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARH-HPF
         180               190       200       210       220       

             230       240       250       260       270       280 
pF1KE0 FLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFT
       :::.:   :: : .... :   : :: .::.. :.: ..: ..  . :: . ..:.:.::
CCDS10 FLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFT
        230       240       250       260       270       280      

             290        300       310       320        330         
pF1KE0 ADNGPETMRMS-RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPG-VTHELASSLDLL
       .:::   .    .:: .: . ::: ::.:::.::::::.::::.. : :.:.:.: .::.
CCDS10 SDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLF
        290       300       310       320       330       340      

     340        350       360       370       380         390      
pF1KE0 PTLAALAG-APLPNVTLDGFDLSPLLLGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKY
        :  :::: .:  . ..::..: : ::  :.   . .:.:       ::  ..:.  :..
CCDS10 TTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYY-------RGDTLMAATLGQH
        350       360       370        380              390        

        400       410          420             430       440       
pF1KE0 KAHFFTQGSAHSDTTAD-PACHAS--SSLTAH------EPPLLYDLSKDPGENYNLLGGV
       ::::.:  ..  .       : ..  :..:.:      . ::.. :..:::: . :    
CCDS10 KAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL----
      400       410       420       430       440       450        

       450       460       470       480       490              500
pF1KE0 AGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQIC-------CHPGCTPRPA
       . :. :  .::...  .  : . :..  :.:      : :..:         :::     
CCDS10 SFASAEYQEALSRITSVVQQHQEALV--PAQ------PQLNVCNWAVMNWAPPGCEKLGK
          460       470       480               490       500      

                       
pF1KE0 CCHCPDPHA       
       :   :.          
CCDS10 CLTPPESIPKKCLWSH
        510       520  

>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17              (525 aa)
 initn: 716 init1: 259 opt: 709  Z-score: 736.1  bits: 145.8 E(32554): 1.1e-34
Smith-Waterman score: 972; 36.6% identity (60.1% similar) in 519 aa overlap (15-504:28-522)

                            10        20        30        40       
pF1KE0              MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSST
                                  .: . .. ::.:.:.:::.:.::::     .. 
CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
               10        20        30        40        50        60

        50        60        70        80        90       100       
pF1KE0 TPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEV
       : :::..:. :.::.::.. .: :.::::.:::::: .: :.  .  : .: :::::.:.
CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAV-TSVGGLPLNET
               70        80        90       100        110         

       110       120       130       140       150       160       
pF1KE0 TVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P
       :.::::   ::.::. :::::  : .:.. :  .::  ..:::::::.: : .   .  :
CCDS11 TLAEVLQQAGYVTGIIGKWHL--GHHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHP
     120       130       140         150       160        170      

         170                 180       190       200       210     
pF1KE0 PATPCDGG----------CDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQ
       :   :  :          :    : .::  ::..  ::  : .:  .:   : ...  :.
CCDS11 PCPACPQGDGPSRNLQRDCYTD-VALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS
        180       190        200       210       220       230     

         220       230       240       250       260       270     
pF1KE0 RQDRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEE
        . :::.:: :  : : :    :  :   ::. .: .: :.:. :: .   . :  . :.
CCDS11 TSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKEN
         240       250       260       270       280        290    

         280       290           300             310       320     
pF1KE0 TLVIFTADNGPETMRM----SRGGCSGLLRCGKG------TTYEGGVREPALAFWPGHIA
       :.. ::.:::: ...     : :  .:. .  .:      ::.::: : ::::.:::.. 
CCDS11 TFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVP
          300       310       320       330       340       350    

         330        340       350        360       370       380   
pF1KE0 PGVTHE-LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--
        .::   : : ::..::..::: : ::.   .:: :.: .:.: .. : . ..:.:.   
CCDS11 VNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGA
          360       370       380       390       400        410   

             390       400       410       420       430       440 
pF1KE0 PDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENY
         :  .. .::  .::: ..: :.   : .. :  .       :. ::...:  : .:  
CCDS11 AGEFGALQTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAV
           420       430       440              450       460      

                450       460       470       480       490        
pF1KE0 NLLGGVA---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPR
        :  : :   .. ::: ..: ..      :.  .. . :..   .::..  ::.    : 
CCDS11 PLERGGAEYQAVLPEVRKVLADV------LQDIANDNISSADYTQDPSVTPCCN----PY
        470       480             490       500       510          

      500         
pF1KE0 PACCHCPDPHA
          :.:     
CCDS11 QIACRCQAA  
        520       

>>CCDS43334.1 ARSB gene_id:411|Hs108|chr5                 (413 aa)
 initn: 533 init1: 197 opt: 517  Z-score: 538.9  bits: 109.0 E(32554): 1.1e-23
Smith-Waterman score: 551; 32.5% identity (55.7% similar) in 397 aa overlap (6-383:25-401)

                                  10           20        30        
pF1KE0                    MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL
                               :  ::: ::   .: ...:::..:...:::::..:.
CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
               10        20        30        40        50        60

       40        50        60        70        80        90        
pF1KE0 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS
       : .:     ::.:: :::::. . ..:.   ::::::. :::::  .: :.   .. : .
CCDS43 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ
                70        80         90       100       110        

      100       110       120       130       140             150  
pF1KE0 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS
        . .::.:  . ..:   :: : :.::::::.  .   :: ..::  ..:        ::
CCDS43 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY-RKECLPTRRGFDTYFGYLLGSEDYYS
      120       130       140       150        160       170       

            160       170       180       190       200       210  
pF1KE0 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA
       :..  :  .  .  .: :     .:        :.           .  : .:.  .   
CCDS43 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN---
       180          190       200       210             220        

            220       230             240       250       260      
pF1KE0 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA
         .  ..:.::: : . .: :       ..  .: . ..:  ..  .  .: :::.. .:
CCDS43 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA
           230       240       250       260       270       280   

        270       280       290       300       310       320      
pF1KE0 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP
       . . :: ..:. ::..::: .:.    :: .  ::  : . .:::::  ...  :     
CCDS43 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK
           290       300          310       320       330       340

        330        340        350       360       370         380  
pF1KE0 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFDLSPLLLGTGKSPRQSLFFY--PSYP
       :: . ::    : ::::. :: :    .  :::::.   .   . :::  :.    :.. 
CCDS43 GVKNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV
              350       360       370       380       390       400

            390       400       410       420       430       440  
pF1KE0 DEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENYN
       :                                                           
CCDS43 DSSPYWPECSLLL                                               
              410                                                  

>>CCDS4043.1 ARSB gene_id:411|Hs108|chr5                  (533 aa)
 initn: 533 init1: 197 opt: 517  Z-score: 537.4  bits: 109.1 E(32554): 1.3e-23
Smith-Waterman score: 569; 30.0% identity (53.8% similar) in 526 aa overlap (6-485:25-523)

                                  10           20        30        
pF1KE0                    MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL
                               :  ::: ::   .: ...:::..:...:::::..:.
CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
               10        20        30        40        50        60

       40        50        60        70        80        90        
pF1KE0 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS
       : .:     ::.:: :::::. . ..:.   ::::::. :::::  .: :.   .. : .
CCDS40 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ
                70        80         90       100       110        

      100       110       120       130       140             150  
pF1KE0 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS
        . .::.:  . ..:   :: : :.::::::.  .   :: ..::  ..:        ::
CCDS40 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY-RKECLPTRRGFDTYFGYLLGSEDYYS
      120       130       140       150        160       170       

            160       170       180       190       200       210  
pF1KE0 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA
       :..  :  .  .  .: :     .:        :.           .  : .:.  .   
CCDS40 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN---
       180          190       200       210             220        

            220       230             240       250       260      
pF1KE0 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA
         .  ..:.::: : . .: :       ..  .: . ..:  ..  .  .: :::.. .:
CCDS40 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA
           230       240       250       260       270       280   

        270       280       290       300       310       320      
pF1KE0 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP
       . . :: ..:. ::..::: .:.    :: .  ::  : . .:::::  ...  :     
CCDS40 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK
           290       300          310       320       330       340

        330        340        350       360       370         380  
pF1KE0 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFDLSPLLLGTGKSPRQSLFFY--PSYP
       :: . ::    : ::::. :: :    .  :::::.   .   . :::  :.    :.. 
CCDS40 GVKNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV
              350       360       370       380       390       400

               390            400            410                420
pF1KE0 DEV---RGVFA-----VRTGKYKAHFFTQGSA--HSD---TTADPAC---------HASS
       :     :. .:         .:.:   .  .:  :..    :. :.:         .  :
CCDS40 DSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVS
              410       420       430       440       450       460

                  430       440       450        460       470     
pF1KE0 SLTAHEPPL----LYDLSKDPGENYNLLGGVAGATPEVL-QALKQLQLLKAQLDAAVTFG
        . . .::     :.:...:: : ..:    .   :... . :..::. . . .. : : 
CCDS40 EIPSSDPPTKTLWLFDIDRDPEERHDL----SREYPHIVTKLLSRLQFYHKH-SVPVYF-
              470       480           490       500        510     

         480       490       500         
pF1KE0 PSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
       :.:  :  ::                        
CCDS40 PAQDPRC-DPKATGVWGPWM              
          520        530                 

>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX                 (589 aa)
 initn: 814 init1: 292 opt: 422  Z-score: 438.5  bits: 90.9 E(32554): 4.2e-18
Smith-Waterman score: 794; 33.0% identity (57.4% similar) in 528 aa overlap (8-462:20-542)

                           10            20        30        40    
pF1KE0             MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDLGYGDLGCYGHP
                          ..::.::    . ....:: ::.:..::::: ::.::::. 
CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDLGIGDIGCYGNN
               10        20        30         40        50         

           50        60        70        80        90              
pF1KE0 SSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLV-----PSSR
       .  :::.:.::  :...:.    .:::::::::.:::: ::: ::  ..        .. 
CCDS14 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS
      60        70        80        90       100       110         

     100       110       120       130           140       150     
pF1KE0 GGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFHRFLGIPYSHDQ
       :::: .:.: :..:  .:: ::. ::::::.. :.:      : :.:: .: :.:.:  .
CCDS14 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL-M
     120       130       140       150       160       170         

         160       170            180       190                    
pF1KE0 GPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG----------L
       : :         .  .   .      .:: . :.:.  ..  :  :.:           :
CCDS14 GDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLL
      180       190       200       210       220       230        

     200       210                                      220        
pF1KE0 EARYMAFAHDLMADA---------------QR----------------QDRPFFLYYASH
        . :.. :  . ::                ::                .  ::.:. .  
CCDS14 ASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFL
      240       250       260       270       280       290        

      230       240       250       260       270       280        
pF1KE0 HTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGP--
       :.: : .. ..:  .: .: .::.. :.:  :: .. ..   :: . ::. ::.:.:   
CCDS14 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSL
      300       310       320       330       340       350        

          290       300        310       320        330       340  
pF1KE0 --ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTL
         .    . :: .:. . :::   .:::.: :..  ::: .  : :  : .: .:..::.
CCDS14 ENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTV
      360       370       380       390       400       410        

            350        360        370        380       390         
pF1KE0 AALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGVFAVRTGKYKAH
       . :::. .: . ..:: :: ::::::.. : .. :. :   .   .:     :   .:.:
CCDS14 VRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVH
      420       430       440       450       460       470        

     400          410        420       430       440       450     
pF1KE0 FFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVL
       : :   :  . .   .  .:   . ... :.::::.:::.::.:.. :   . .. :   
CCDS14 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL---TPASEPVFY
      480       490       500       510       520          530     

         460       470       480       490       500         
pF1KE0 QALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
       :.....:                                               
CCDS14 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
         540       550       560       570       580         

>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX                 (614 aa)
 initn: 814 init1: 292 opt: 422  Z-score: 438.3  bits: 90.9 E(32554): 4.3e-18
Smith-Waterman score: 794; 33.0% identity (57.4% similar) in 528 aa overlap (8-462:45-567)

                                      10            20        30   
pF1KE0                        MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDL
                                     ..::.::    . ....:: ::.:..::::
CCDS75 LMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDL
           20        30        40        50        60         70   

            40        50        60        70        80        90   
pF1KE0 GYGDLGCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGV
       : ::.::::. .  :::.:.::  :...:.    .:::::::::.:::: ::: ::  ..
CCDS75 GIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSI
            80        90       100       110       120       130   

                100       110       120       130           140    
pF1KE0 LV-----PSSRGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFH
               .. :::: .:.: :..:  .:: ::. ::::::.. :.:      : :.:: 
CCDS75 GYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFD
           140       150       160       170       180       190   

          150       160       170            180       190         
pF1KE0 RFLGIPYSHDQGPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG
       .: :.:.:  .: :         .  .   .      .:: . :.:.  ..  :  :.: 
CCDS75 HFYGMPFSL-MGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPV
           200        210       220       230       240       250  

                200       210                                      
pF1KE0 ----------LEARYMAFAHDLMADA---------------QR----------------Q
                 : . :.. :  . ::                ::                .
CCDS75 IWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNK
            260       270       280       290       300       310  

       220       230       240       250       260       270       
pF1KE0 DRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETL
         ::.:. .  :.: : .. ..:  .: .: .::.. :.:  :: .. ..   :: . ::
CCDS75 HGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTL
            320       330       340       350       360       370  

       280           290       300        310       320        330 
pF1KE0 VIFTADNGP----ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHE
       . ::.:.:     .    . :: .:. . :::   .:::.: :..  ::: .  : :  :
CCDS75 IYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGE
            380       390       400       410       420       430  

             340       350        360        370        380        
pF1KE0 LASSLDLLPTLAALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGV
        .: .:..::.. :::. .: . ..:: :: ::::::.. : .. :. :   .   .:  
CCDS75 PTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWH
            440       450       460       470       480       490  

      390       400          410        420       430       440    
pF1KE0 FAVRTGKYKAHFFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLL
          :   .:.:: :   :  . .   .  .:   . ... :.::::.:::.::.:.. : 
CCDS75 QRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL-
            500       510       520       530       540       550  

          450       460       470       480       490       500    
pF1KE0 GGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHC
         . .. :   :.....:                                          
CCDS75 --TPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLR
               560       570       580       590       600         

>>CCDS14127.1 STS gene_id:412|Hs108|chrX                  (583 aa)
 initn: 905 init1: 293 opt: 421  Z-score: 437.5  bits: 90.7 E(32554): 4.7e-18
Smith-Waterman score: 861; 35.3% identity (58.0% similar) in 533 aa overlap (3-462:6-531)

                  10          20        30        40        50     
pF1KE0    MSMGAPRSLLLAL--AAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLA
            :  :  ::. :  : . :..:: ::.:..::::: :: ::::. .  :::.:.::
CCDS14 MPLRKMKIPFLLLFFLWEAESHAASRP-NIILVMADDLGIGDPGCYGNKTIRTPNIDRLA
               10        20         30        40        50         

          60        70        80            90        100       110
pF1KE0 AGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGM----YPGV-LVPSSRGGLPLEEVTVA
       .::...:.  .   ::::::::..::: ::: ::      :: :  .: :::: .:.: :
CCDS14 SGGVKLTQHLAASPLCTPSRAAFMTGRYPVRSGMASWSRTGVFLFTASSGGLPTDEITFA
      60        70        80        90       100       110         

              120       130           140       150         160    
pF1KE0 EVLAARGYLTGMAGKWHLGVG--PEGAFL--PPHQGFHRFLGIPYSH--DQGPCQN----
       ..:  .:: :.. ::::::..   .  :   : :.::. : ::  ..  :  : ..    
CCDS14 KLLKDQGYSTALIGKWHLGMSCHSKTDFCHHPLHHGFNYFYGISLTNLRDCKPGEGSVFT
     120       130       140       150       160       170         

                              170                               180
pF1KE0 -----LTCFP-----------PATPCDG------------------------GCDQGLVP
            :. .:            :  : :                        :  . . :
CCDS14 TGFKRLVFLPLQIVGVTLLTLAALNCLGLLHVPLGVFFSLLFLAALILTLFLGFLHYFRP
     180       190       200       210       220       230         

                190       200       210        220       230       
pF1KE0 IP--LLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQ-DRPFFLYYASHHTHYPQFSG
       .   .. :  .  ::    .:  :  . : ...   ::. . ::.:  .  :.:   ::.
CCDS14 LNCFMMRNYEIIQQPMSYDNLTQRLTVEAAQFI---QRNTETPFLLVLSYLHVHTALFSS
     240       250       260       270          280       290      

       240       250       260       270       280       290       
pF1KE0 QSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMS-----
       ..:: .: .: .::.. :.: .:: ... . .: : ..::. ::.:.: .. ..:     
CCDS14 KDFAGKSQHGVYGDAVEEMDWSVGQILNLLDELRLANDTLIYFTSDQGAHVEEVSSKGEI
        300       310       320       330       340       350      

            300       310       320        330       340       350 
pF1KE0 RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPGVT-HELASSLDLLPTLAALAGAPLP
       .:: .:. . ::....:::.: :..  ::  :  :    : .:..:..::.: :::::::
CCDS14 HGGSNGIYKGGKANNWEGGIRVPGILRWPRVIQAGQKIDEPTSNMDIFPTVAKLAGAPLP
        360       370       380       390       400       410      

              360        370        380       390       400        
pF1KE0 -NVTLDGFDLSPLLLG-TGKSPRQSLFFY-PSYPDEVRGVFAVRTGKYKAHFFTQGSAHS
        .  .:: :: ::: : . .: .. :: :  .: . ::      :. .:: ::: .    
CCDS14 EDRIIDGRDLMPLLEGKSQRSDHEFLFHYCNAYLNAVRWHPQNSTSIWKAFFFTPNFNPV
        420       430       440       450       460       470      

      410           420       430       440       450       460    
pF1KE0 DTTADPACHA----SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLL
        ...  : :.    .: .: :.::::.:.:::: :   :   . .. :.  . :: .:  
CCDS14 GSNGCFATHVCFCFGSYVTHHDPPLLFDISKDPRERNPL---TPASEPRFYEILKVMQEA
        480       490       500       510          520       530   

          470       480       490       500              
pF1KE0 KAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA     
                                                         
CCDS14 ADRHTQTLPEVPDQFSWNNFLWKPWLQLCCPSTGLSCQCDREKQDKRLSR
           540       550       560       570       580   

>>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX              (562 aa)
 initn: 791 init1: 295 opt: 401  Z-score: 417.1  bits: 86.9 E(32554): 6.6e-17
Smith-Waterman score: 777; 34.3% identity (57.3% similar) in 490 aa overlap (23-443:7-495)

               10        20        30        40        50        60
pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
                             :::::..::::: ::: :::. : .:::.:.::. :.:
CCDS35                 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVR
                               10        20        30        40    

               70        80        90             100       110    
pF1KE0 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS------RGGLPLEEVTVAEVLA
       .:.  . .:.:::::::.:::: :.: ::  .  .  .       :::: .:.: :..: 
CCDS35 LTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQ
           50        60        70        80        90       100    

          120       130           140       150            160     
pF1KE0 ARGYLTGMAGKWHLGVG----PEGAFLPPHQGFHRFLGIPYSHDQGPCQ-----NLTCFP
        ::: ::. ::::::..     .  . : ..::: : :.:..   . ::     .:  . 
CCDS35 HRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGL-LSDCQASKTPELHRWL
          110       120       130       140        150       160   

         170       180            190                      200     
pF1KE0 PATPCDGGCDQGLVP----IPLLAN-LSVEAQ-------------PPWLP--GLEARY--
             .    .:::    :: .:  .::  .               :    :.  :.  
CCDS35 RIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNC
           170       180       190       200       210       220   

            210                          220       230       240   
pF1KE0 -MAFAHDLMADAQRQDR-------------------PFFLYYASHHTHYPQFSGQSFAER
        .   :... . .....                   ::.:...  :.: : .: ..:. :
CCDS35 ILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGR
           230       240       250       260       270       280   

           250       260       270       280           290         
pF1KE0 SGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNG----PETMRMSRGGCSGL
       :  : .::.. :.:  :: .. :. .  : ..::: ::.:::    :    .. :: .:.
CCDS35 SKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGI
           290       300       310       320       330       340   

     300        310       320        330       340       350       
pF1KE0 LRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAGAPLP-NVTLD
        . :::   .:::.: :..  ::. .  : : .: .: .:. :::. ..:. :  . ..:
CCDS35 YKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVID
           350       360       370       380       390       400   

        360        370       380        390       400       410    
pF1KE0 GFDLSPLLLG-TGKSPRQSLFFYPS-YPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTA--
       : .: ::: : ...: .. :: : . :   ::      .  .:::. :       : :  
CCDS35 GQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACY
           410       420       430       440       450       460   

             420       430       440       450       460       470 
pF1KE0 -DPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAA
        .  :  :...: :.::::.:.:.::.:   :                            
CCDS35 GSGICSCSGDVTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTP
           470       480       490       500       510       520   

             480       490       500          
pF1KE0 VTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA 
                                              
CCDS35 VPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
           530       540       550       560  




509 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 15:20:22 2016 done: Thu Nov  3 15:20:23 2016
 Total Scan time:  3.540 Total Display time:  0.100

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com