Result of FASTA (ccds) for pF1KE2430
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE2430, 533 aa
  1>>>pF1KE2430 533 - 533 aa - 533 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.5349+/-0.000704; mu= 18.3882+/- 0.043
 mean_var=86.0476+/-17.018, 0's: 0 Z-trim(111.9): 27  B-trim: 0 in 0/52
 Lambda= 0.138263
 statistics sampled from 12733 (12760) to 12733 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.392), width:  16
 Scan time:  3.130

The best scores are:                                      opt bits E(32554)
CCDS4043.1 ARSB gene_id:411|Hs108|chr5             ( 533) 3754 758.5 4.3e-219
CCDS43334.1 ARSB gene_id:411|Hs108|chr5            ( 413) 2797 567.5  1e-161
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4          ( 599) 1750 358.8   1e-98
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5         ( 569) 1729 354.6 1.8e-97
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16         ( 522)  539 117.2 4.7e-26
CCDS14100.2 ARSA gene_id:410|Hs108|chr22           ( 509)  516 112.6 1.1e-24
CCDS14123.1 ARSF gene_id:416|Hs108|chrX            ( 590)  354 80.3 6.7e-15
CCDS14122.1 ARSE gene_id:415|Hs108|chrX            ( 589)  349 79.3 1.3e-14
CCDS75948.1 ARSE gene_id:415|Hs108|chrX            ( 614)  349 79.4 1.4e-14
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17         ( 525)  334 76.3 9.7e-14
CCDS35196.1 ARSD gene_id:414|Hs108|chrX            ( 593)  331 75.8 1.6e-13
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX         ( 562)  305 70.6 5.6e-12


>>CCDS4043.1 ARSB gene_id:411|Hs108|chr5                  (533 aa)
 initn: 3754 init1: 3754 opt: 3754  Z-score: 4046.9  bits: 758.5 E(32554): 4.3e-219
Smith-Waterman score: 3754; 99.8% identity (100.0% similar) in 533 aa overlap (1-533:1-533)

               10        20        30        40        50        60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE2 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE2 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE2 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE2 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE2 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKL
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS40 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKL
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE2 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLP
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE2 EYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDRD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 EYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDRD
              430       440       450       460       470       480

              490       500       510       520       530   
pF1KE2 PEERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATGVWGPWM
       :::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 PEERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATGVWGPWM
              490       500       510       520       530   

>>CCDS43334.1 ARSB gene_id:411|Hs108|chr5                 (413 aa)
 initn: 2796 init1: 2796 opt: 2797  Z-score: 3016.8  bits: 567.5 E(32554): 1e-161
Smith-Waterman score: 2797; 98.5% identity (99.3% similar) in 411 aa overlap (1-410:1-411)

               10        20        30        40        50        60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE2 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE2 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE2 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE2 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE2 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKL
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS43 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKL
              310       320       330       340       350       360

              370       380       390       400        410         
pF1KE2 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPC-PRNSMAPAKDDSSL
       ::::::::::::::::::::::::::::::::::::::::::::  :. :.         
CCDS43 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPYWPECSLLL       
              370       380       390       400       410          

     420       430       440       450       460       470         
pF1KE2 PEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDR

>>CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4               (599 aa)
 initn: 1869 init1: 774 opt: 1750  Z-score: 1885.9  bits: 358.8 E(32554): 1e-98
Smith-Waterman score: 1858; 53.7% identity (77.2% similar) in 501 aa overlap (41-532:72-554)

               20        30        40        50        60        70
pF1KE2 RGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSRIRTP
                                     ..  :::.:.:::: :. :::.:::.:.::
CCDS43 GYLSWGQALEEEEEGALLAQAGEKLEPSTTSTSQPHLIFILADDQGFRDVGYHGSEIKTP
              50        60        70        80        90       100 

               80        90       100       110       120       130
pF1KE2 HLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPLDEKLLP
        :: ::: :: :.:::.::.:::::::..::.:::.:::::.:: : ::.:.:::.  ::
CCDS43 TLDKLAAEGVKLENYYVQPICTPSRSQFITGKYQIHTGLQHSIIRPTQPNCLPLDNATLP
             110       120       130       140       150       160 

              140       150       160       170       180       190
pF1KE2 QLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHERCTLIDALNVT
       : :::.::.::::::::::.:::::.::::::::.:: :::: :::.: .:   :. .. 
CCDS43 QKLKEVGYSTHMVGKWHLGFYRKECMPTRRGFDTFFGSLLGSGDYYTHYKC---DSPGM-
             170       180       190       200       210           

              200        210       220       230       240         
pF1KE2 RCALDFRDGEEVATGYKN-MYSTNIFTKRAIALITNHPPEKPLFLYLALQSVHEPLQVPE
        :. :. .....:  : : .:::...:.:.  ....: : ::.:::.: :.:: :::.: 
CCDS43 -CGYDLYENDNAAWDYDNGIYSTQMYTQRVQQILASHNPTKPIFLYIAYQAVHSPLQAPG
        220       230       240       250       260       270      

     250       260       270       280       290       300         
pF1KE2 EYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTDNGGQTLAGG
       .:.. :  : . ::..::.:.: .:::..::: :::. :..::...:.:.:::::  :::
CCDS43 RYFEHYRSIININRRRYAAMLSCLDEAINNVTLALKTYGFYNNSIIIYSSDNGGQPTAGG
        280       290       300       310       320       330      

     310       320       330       340       350       360         
pF1KE2 NNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGTK
       .:::::: : . ::::.:.:::: :::::.::.  .::.::.:: :::..::.:. .   
CCDS43 SNWPLRGSKGTYWEGGIRAVGFVHSPLLKNKGTVCKELVHITDWYPTLISLAEGQIDEDI
        340       350       360       370       380       390      

     370       380       390       400       410       420         
pF1KE2 PLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTSV
        :::.:.:.:::::  :::...:::::: ..            ::. :    :. .::..
CCDS43 QLDGYDIWETISEGLRSPRVDILHNIDPIYTK-----------AKNGSWAAGYGIWNTAI
        400       410       420                  430       440     

     430       440       450              460       470       480  
pF1KE2 HAAIRHGNWKLLTGYPGCGYWFPP-------PSQYNVSEIPSSDPPTKTLWLFDIDRDPE
       ..:::  .:::::: :: . : ::       :....  .:  :    :..:::.:  :: 
CCDS43 QSAIRVQHWKLLTGNPGYSDWVPPQSFSNLGPNRWHNERITLSTG--KSVWLFNITADPY
         450       460       470       480       490         500   

            490       500       510       520        530           
pF1KE2 ERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATG-VWGPWM        
       :: ::: .:: :: ::: ::. ..: .::: .: .::: .:. .: :::::         
CCDS43 ERVDLSNRYPGIVKKLLRRLSQFNKTAVPVRYPPKDPRSNPRLNGGVWGPWYKEETKKKK
           510       520       530       540       550       560   

CCDS43 PSKNQAEKKQKKSKKKKKKQQKAVSGSTCHSGVTCG
           570       580       590         

>>CCDS34275.1 ARSI gene_id:340075|Hs108|chr5              (569 aa)
 initn: 1890 init1: 832 opt: 1729  Z-score: 1863.5  bits: 354.6 E(32554): 1.8e-97
Smith-Waterman score: 1855; 54.6% identity (76.7% similar) in 502 aa overlap (39-532:41-523)

       10        20        30        40        50        60        
pF1KE2 LPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSRIR
                                     :.  .:::..:.:.:: :..:::.::: :.
CCDS34 SLLSFGYLSWDWAKPSFVADGPGEAGEQPSAAPPQPPHIIFILTDDQGYHDVGYHGSDIE
               20        30        40        50        60        70

       70        80        90       100       110       120        
pF1KE2 TPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPLDEKL
       :: :: ::: :: :.::: ::.:::::::::::::::.:::::.:: : ::.:.:::.  
CCDS34 TPTLDRLAAKGVKLENYYIQPICTPSRSQLLTGRYQIHTGLQHSIIRPQQPNCLPLDQVT
               80        90       100       110       120       130

      130       140       150       160       170       180        
pF1KE2 LPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHERCTLIDALN
       ::: :.::::.::::::::::.::::::::::::::..: : :. :::... :   :. .
CCDS34 LPQKLQEAGYSTHMVGKWHLGFYRKECLPTRRGFDTFLGSLTGNVDYYTYDNC---DGPG
              140       150       160       170       180          

      190       200       210       220       230       240        
pF1KE2 VTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQSVHEPLQVP
       :  :..:...::.:: : ...::: ....::  ....: :..:::::.:.:.:: ::: :
CCDS34 V--CGFDLHEGENVAWGLSGQYSTMLYAQRASHILASHSPQRPLFLYVAFQAVHTPLQSP
         190       200       210       220       230       240     

      250       260       270       280       290       300        
pF1KE2 EEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTDNGGQTLAG
       .:::  :  . .  :..::.::. ::::: :.: :::  :..::.:.:::.::::::..:
CCDS34 REYLYRYRTMGNVARRKYAAMVTCMDEAVRNITWALKRYGFYNNSVIIFSSDNGGQTFSG
         250       260       270       280       290       300     

      310       320       330       340       350       360        
pF1KE2 GNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGT
       :.:::::::: . :::::::.::: :::::.:   .: :.::.:: :::. :: : :...
CCDS34 GSNWPLRGRKGTYWEGGVRGLGFVHSPLLKRKQRTSRALMHITDWYPTLVGLAGGTTSAA
         310       320       330       340       350       360     

      370       380       390       400       410       420        
pF1KE2 KPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTS
         :::.::: .::::  ::: :.:::::: .             :.  :    .. .::.
CCDS34 DGLDGYDVWPAISEGRASPRTEILHNIDPLY-----------NHAQHGSLEGGFGIWNTA
         370       380       390                  400       410    

      430       440       450              460       470       480 
pF1KE2 VHAAIRHGNWKLLTGYPGCGYWFPP------P-SQYNVSEIPSSDPPTKTLWLFDIDRDP
       :.:::: :.:::::: :: : :.::      : : .:. .. :     ...:::.:. ::
CCDS34 VQAAIRVGEWKLLTGDPGYGDWIPPQTLATFPGSWWNLERMASV---RQAVWLFNISADP
          420       430       440       450          460       470 

             490       500       510       520        530          
pF1KE2 EERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATG-VWGPWM       
        ::.::. . : .:  ::.::  :.. ..:: .::..::  :  .: .::::        
CCDS34 YEREDLAGQRPDVVRTLLARLAEYNRTAIPVRYPAENPRAHPDFNGGAWGPWASDEEEEE
             480       490       500       510       520       530 

CCDS34 EEGRARSFSRGRRKKKCKICKLRSFFRKLNTRLMSQRI
             540       550       560         

>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16              (522 aa)
 initn: 554 init1: 139 opt: 539  Z-score: 581.2  bits: 117.2 E(32554): 4.7e-26
Smith-Waterman score: 677; 31.2% identity (57.0% similar) in 528 aa overlap (28-531:13-498)

               10        20        30         40        50         
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND
                                  :::.:.  : :: :: .::....:: ::.::.:
CCDS10                MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD
                              10        20        30        40     

      60         70        80         90       100       110       
pF1KE2 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H--
       .: .:   : ::.:: .:: :.:. :.:. .:::.:::. :::::  ::.:.     :  
CCDS10 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR
          50        60        70        80        90       100     

              120       130       140       150       160          
pF1KE2 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY--
       .   : .  . .: .:.:::.:::.:::....::::::: .: .  : ..::: .::   
CCDS10 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN
         110       120       130       140        150       160    

       170       180        190       200       210       220      
pF1KE2 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH
         .:  :  ..    .  :   : :   .:    .. ::  :.  :.:. ..:. .:  .
CCDS10 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ
          170       180       190         200         210       220

        230       240       250       260       270       280      
pF1KE2 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS
         ..:.::: :....: :. .     ::  :.  ..: .:.  :  .:...:..   :..
CCDS10 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD
              230       240             250       260       270    

        290       300           310       320       330       340  
pF1KE2 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV
         . .::  .:..:::.  ..    ::.: :.   : . .:::.:  ...  :     : 
CCDS10 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ
          280       290       300       310       320       330    

            350       360       370       380       390       400  
pF1KE2 KNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS
        ...:  : : . : . ::     . . .::...  :. .:    :        : :   
CCDS10 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDR--------PIFYYR
          340       350       360       370       380              

            410       420       430        440       450       460 
pF1KE2 SPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWK-LLTGYPGCGYWFPPPSQYNVSE
       .    ...  :    .: ...:     :     ..:. .  :   :      :.: ::: 
CCDS10 G----DTLMAA----TLGQHKA-----HFWTWTNSWENFRQGIDFC------PGQ-NVSG
            390           400            410             420       

               470       480          490       500       510      
pF1KE2 IPSSD--PPTKTLWLFDIDRDPEERHDLS---REYPHIVTKLLSRLQFYHKHSVPVYFPA
       . . .    ::   .: . ::: ::  ::    :: . .... : .: ...  ::.  : 
CCDS10 VTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQ-P-
        430       440       450       460       470       480      

        520       530                         
pF1KE2 QDPRCDPKATGVWGPWM                      
       :   :.  :.  :.:                        
CCDS10 QLNVCN-WAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
          490        500       510       520  

>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22                (509 aa)
 initn: 532 init1: 197 opt: 516  Z-score: 556.6  bits: 112.6 E(32554): 1.1e-24
Smith-Waterman score: 568; 29.5% identity (52.8% similar) in 528 aa overlap (25-523:6-485)

               10        20        30        40        50        60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
                               :  ::: ::   .: ...:::..:...:::::..:.
CCDS14                    MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL
                                  10           20        30        

                70        80         90       100       110        
pF1KE2 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ
       : .:     ::.:: :::::. . ..:.   ::::::. :::::  .: :.   .. : .
CCDS14 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS
       40        50        60        70        80        90        

      120       130       140       150        160       170       
pF1KE2 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRK-ECLPTRRGFDTYFGYLLGSEDYYS
        . .::.:  . ..:   :: : :.::::::.  .   :: ..::  ..:        ::
CCDS14 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS
      100       110       120       130       140             150  

       180          190       200       210             220        
pF1KE2 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN---
       :..  :  .  .  .: :     .:        :.           .  : .:.  .   
CCDS14 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA
            160       170       180       190       200       210  

           230       240       250       260       270       280   
pF1KE2 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA
         .  ..:.::: : . .: :       ..  .: . ..:  ..  .  .: :::.. .:
CCDS14 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA
            220       230             240       250       260      

           290       300          310       320       330       340
pF1KE2 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK
       . . :: ..:. ::..::: .:.    :: .  ::  : . .:::::  ...  :     
CCDS14 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP
        270       280       290       300       310       320      

              350       360       370       380       390       400
pF1KE2 GVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV
       :: . ::    : ::::  :: :    .  :::::                   ..: ..
CCDS14 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFD-------------------LSPLLL
        330        340        350                          360     

              410       420       430       440         450        
pF1KE2 DSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGY--WFPPPSQYN
        ..  ::.:.         : :     .: : .: :..:      : ..      :. . 
CCDS14 GTGKSPRQSLF------FYPSYPDEVRGVFA-VRTGKYKAHFFTQGSAHSDTTADPACHA
         370             380       390        400       410        

      460       470       480           490       500        510   
pF1KE2 VSEIPSSDPPTKTLWLFDIDRDPEERHDL----SREYPHIVTKLLSRLQFYHKH-SVPVY
        : . . .::     :.:...:: : ..:    .   :... . :..::. . . .. : 
CCDS14 SSSLTAHEPPL----LYDLSKDPGENYNLLGGVAGATPEVL-QALKQLQLLKAQLDAAVT
      420           430       440       450        460       470   

            520        530                 
pF1KE2 F-PAQDPRC-DPKATGVWGPWM              
       : :.:  :  ::                        
CCDS14 FGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
           480       490       500         

>>CCDS14123.1 ARSF gene_id:416|Hs108|chrX                 (590 aa)
 initn: 520 init1: 125 opt: 354  Z-score: 381.0  bits: 80.3 E(32554): 6.7e-15
Smith-Waterman score: 506; 27.2% identity (48.1% similar) in 580 aa overlap (15-514:3-550)

               10        20        30        40        50        60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
                     :::   :.:.  :.  ::    .    .  :..:....:::: .:.
CCDS14             MRPRR---PLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDL
                              10        20        30        40     

                70        80         90       100           110    
pF1KE2 GFHGS-RIRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQIRTGL----QHQII
       : .:.  .::::.: ::  :: : .. .   ::.:::: .::::: ::.:.    ....:
CCDS14 GCYGNDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVI
          50        60        70        80        90       100     

           120       130       140       150            160        
pF1KE2 WPCQ-PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGM----YRKECL-PTRRGFDTYFG-
            :. .::.:  :  :::. ::.: ..:::: :.       .:  :   ::: :.: 
CCDS14 QNLAVPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGM
         110       120       130       140       150       160     

        170       180                   190                        
pF1KE2 -YLLGSEDYYSHER------------CTLIDALNVTR-----------------------
        . : .  . .  :            :. . :. .                         
CCDS14 PFTLVDSCWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILF
         170       180       190       200       210       220     

                                200       210       220       230  
pF1KE2 -------------------CALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPL
                          : : .:  : .   .:   . .:..:.::...  :  :  .
CCDS14 IFLLGYAWFSSHTSPLYWDCLL-MRGHEITEQPMKAERAGSIMVKEAISFLERHSKET-F
         230       240        250       260       270       280    

            240       250       260       270       280       290  
pF1KE2 FLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNN
       .:....  :: :: . .      ::   ...  :.  :  ::  ::..  :. . :: ::
CCDS14 LLFFSFLHVHTPLPTTD------DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNN
           290       300             310       320       330       

            300              310        320       330       340    
pF1KE2 TVFIFSTDNGGQTLA-------GGNNWPLRGRK-WSLWEGGVRGVGFVASPLLKQKGVKN
       :.  :..:.::.  :       :: :   .: :  . ::::.:  :.:  :     :   
CCDS14 TLVYFTSDHGGHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLI
       340       350       360       370       380       390       

          350       360       370       380       390       400    
pF1KE2 RELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSP
       .:   . : :::. ... :     . .:: :.   .. .    . :.: .   ... .  
CCDS14 KEPTSLMDILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAV-
       400       410       420       430       440       450       

          410       420       430       440       450       460    
pF1KE2 CPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPS
              : ::::.    . . : :      :.   .:.   :   :     :.      
CCDS14 ----RWIP-KDDSGSVWKAHYVTPVFQPPASGG-CYVTSLCRC---FGEQVTYH------
            460        470       480        490          500       

          470       480         490         500       510       520
pF1KE2 SDPPTKTLWLFDIDRDPEERHDLS--REYPH--IVTKLLSRLQFYHKHSVPVYFPAQDPR
        .::     :::..::: :   :.   :  :  .. :. . :. ...  ::: .      
CCDS14 -NPPL----LFDLSRDPSESTPLTPATEPLHDFVIKKVANALKEHQETIVPVTYQLSELN
                  510       520       530       540       550      

              530                        
pF1KE2 CDPKATGVWGPWM                     
                                         
CCDS14 QGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
        560       570       580       590

>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX                 (589 aa)
 initn: 561 init1: 110 opt: 349  Z-score: 375.7  bits: 79.3 E(32554): 1.3e-14
Smith-Waterman score: 515; 28.3% identity (51.0% similar) in 573 aa overlap (17-517:12-558)

               10        20        30        40        50        60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
                       :  ::..: .::   ::: .:.  ..  :....:.::::: .:.
CCDS14      MLHLHHSCLCFRSWLPAMLAVLLS--LAPSASSDISASRPNILLLMADDLGIGDI
                    10        20          30        40        50   

                70        80         90       100       110        
pF1KE2 GFHGSR-IRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQIRTGLQHQI-----
       : .:.  .:::..: ::  :: : .. .   ::::::. .::::: .:.:.  .:     
CCDS14 GCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVL
            60        70        80        90       100       110   

           120       130       140       150            160        
pF1KE2 IWPCQPSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY----RKECL-PTRRGFDTYFGY
        :    . .: .:  . ..::: ::.: ..::::::.       .:  : ..::: ..:.
CCDS14 QWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGM
           120       130       140       150       160       170   

         170         180            190       200                  
pF1KE2 ---LLGSEDYY--SHERCTLIDALN-----VTRCALDFRDGEEV-------------ATG
          :.:.   .  :..: .: . ::     ..  :: .  :. .             : .
CCDS14 PFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALS
           180       190       200       210       220       230   

         210       220             230           240               
pF1KE2 YKNMYSTNIFTKRAIA-----LITNHP-PEKPLFLY----LALQSV--------HEPLQV
          . ... :.   :.     :. ::   :.:. .     : :: :        : :. .
CCDS14 AVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLL
           240       250       260       270       280       290   

       250          260           270       280       290       300
pF1KE2 PEEYLK---PYDFIQD---KNRHH-YAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
          .:.   :   ...   :. :  :.  :  ::  :: .  .:   :: :.:.. :..:
CCDS14 FVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSD
           300       310       320       330       340       350   

                     310        320       330       340       350  
pF1KE2 NGGQ-------TLAGGNNWPLRGRK-WSLWEGGVRGVGFVASPLLKQKGVKNRELIHISD
       .::.       :  :: :   .: :  . ::::.:  :.   : .   :    :   . :
CCDS14 HGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMD
           360       370       380       390       400       410   

            360       370       380       390       400       410  
pF1KE2 WLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAP
        .::...:: :..   . .:: :.   .   .     :.: .    :. ..   :  .  
CCDS14 VFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAA---RWHQ--
           420       430       440       450       460             

            420       430       440       450       460       470  
pF1KE2 AKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTL
        .: ... .   : : :      :      :   :    :  ..    ..   :::    
CCDS14 -RDRGTMWKVH-FVTPVFQPEGAGA---CYGRKVC----PCFGE----KVVHHDPPL---
       470        480       490              500           510     

            480       490       500          510        520        
pF1KE2 WLFDIDRDPEERHDLSREYPHIVTKLLSRLQ---FYHKHSV-PVYFPAQDPRCDPKATGV
        :::..::: : : :.     .  ... :.:   . :.... ::  : :           
CCDS14 -LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPV--PLQLDRLGNIWRPW
             520       530       540       550         560         

      530                  
pF1KE2 WGPWM               
                           
CCDS14 LQPCCGPFPLCWCLREDDPQ
     570       580         

>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX                 (614 aa)
 initn: 561 init1: 110 opt: 349  Z-score: 375.4  bits: 79.4 E(32554): 1.4e-14
Smith-Waterman score: 515; 28.3% identity (51.0% similar) in 573 aa overlap (17-517:37-583)

                             10        20        30        40      
pF1KE2               MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPH
                                     :  ::..: .::   ::: .:.  ..  :.
CCDS75 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLS--LAPSASSDISASRPN
         10        20        30        40          50        60    

         50        60         70        80         90       100    
pF1KE2 LVFLLADDLGWNDVGFHGSR-IRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQ
       ...:.::::: .:.: .:.  .:::..: ::  :: : .. .   ::::::. .::::: 
CCDS75 ILLLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYP
           70        80        90       100       110       120    

          110            120       130       140       150         
pF1KE2 IRTGLQHQI-----IWPCQPSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY----RKEC
       .:.:.  .:      :    . .: .:  . ..::: ::.: ..::::::.       .:
CCDS75 VRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHC
          130       140       150       160       170       180    

          160          170         180            190       200    
pF1KE2 L-PTRRGFDTYFGY---LLGSEDYY--SHERCTLIDALN-----VTRCALDFRDGEEV--
         : ..::: ..:.   :.:.   .  :..: .: . ::     ..  :: .  :. .  
CCDS75 HHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHL
          190       200       210       220       230       240    

                       210       220             230           240 
pF1KE2 -----------ATGYKNMYSTNIFTKRAIA-----LITNHP-PEKPLFLY----LALQSV
                  : .   . ... :.   :.     :. ::   :.:. .     : :: :
CCDS75 IPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEV
          250       260       270       280       290       300    

                     250          260           270       280      
pF1KE2 --------HEPLQVPEEYLK---PYDFIQD---KNRHH-YAGMVSLMDEAVGNVTAALKS
               : :. .   .:.   :   ...   :. :  :.  :  ::  :: .  .:  
CCDS75 ASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDV
          310       320       330       340       350       360    

        290       300              310        320       330        
pF1KE2 SGLWNNTVFIFSTDNGGQ-------TLAGGNNWPLRGRK-WSLWEGGVRGVGFVASPLLK
        :: :.:.. :..:.::.       :  :: :   .: :  . ::::.:  :.   : . 
CCDS75 EGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVL
          370       380       390       400       410       420    

      340       350       360       370       380       390        
pF1KE2 QKGVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPN
         :    :   . : .::...:: :..   . .:: :.   .   .     :.: .    
CCDS75 PAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCER
          430       440       450       460       470       480    

      400       410       420       430       440       450        
pF1KE2 FVDSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYN
       :. ..   :  .   .: ... .   : : :      :      :   :    :  ..  
CCDS75 FLHAA---RWHQ---RDRGTMWKVH-FVTPVFQPEGAGA---CYGRKVC----PCFGE--
             490          500        510          520              

      460       470       480       490       500          510     
pF1KE2 VSEIPSSDPPTKTLWLFDIDRDPEERHDLSREYPHIVTKLLSRLQ---FYHKHSV-PVYF
         ..   :::     :::..::: : : :.     .  ... :.:   . :.... ::  
CCDS75 --KVVHHDPPL----LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPV--
        530           540       550       560       570       580  

          520       530                  
pF1KE2 PAQDPRCDPKATGVWGPWM               
       : :                               
CCDS75 PLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
              590       600       610    

>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17              (525 aa)
 initn: 372 init1: 120 opt: 334  Z-score: 360.2  bits: 76.3 E(32554): 9.7e-14
Smith-Waterman score: 481; 29.8% identity (57.3% similar) in 396 aa overlap (37-398:28-410)

         10        20        30        40        50        60      
pF1KE2 ASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSR
                                     ::   .. :..:..::::.::.:.: . ..
CCDS11    MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAE
                  10        20        30        40        50       

          70        80         90       100       110       120    
pF1KE2 IR-TPHLDALAAGGV-LLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPL
        . : .:: .:. :. ..: . .   :.:::..:::::  .:.:. ...      . .::
CCDS11 TKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGG-LPL
        60        70        80        90       100       110       

          130       140       150       160           170          
pF1KE2 DEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFG----YLLGSEDY--YSH
       .:  : ..:..:::.: ..:::::: ..    :. :::: :::    . .:  :   :.:
CCDS11 NETTLAEVLQQAGYVTGIIGKWHLG-HHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNH
        120       130       140        150       160       170     

      180            190            200       210        220       
pF1KE2 ERCTLID-----ALNVTR-C----ALDFRDGEEVATGYKNMYS-TNIFTKRAIALITNHP
         :         . :. : :    :: . .. ...    :. : .. ....:  .:    
CCDS11 PPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS
         180       190       200       210       220       230     

        230       240       250       260       270       280      
pF1KE2 PE-KPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS
          .:..::.::  .: :: : .    :      ..:  :.. .  ::  ::..   .  
CCDS11 TSGRPFLLYVALAHMHVPLPVTQLPAAP------RGRSLYGAGLWEMDSLVGQIKDKVDH
         240       250       260             270       280         

        290       300           310                320       330   
pF1KE2 SGLWNNTVFIFSTDNGGQT----LAGGNN-----WPLR--GR--KWSLWEGGVRGVGFVA
       . . .:: . :. :::  .    :::. .     :  :  :   : . :::: :  ... 
CCDS11 T-VKENTFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAY
     290        300       310       320       330       340        

           340       350       360       370       380        390  
pF1KE2 SPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTI-SEGSPSPRIELL
        :     .: .  :. . : .::.. ::..     . .:: :: ... ....:. :. :.
CCDS11 WPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRV-LF
      350       360       370       380       390       400        

            400       410       420       430       440       450  
pF1KE2 HNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFP
       :   ::                                                      
CCDS11 H---PNSGAAGEFGALQTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAE
          410       420       430       440       450       460    




533 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 19:58:17 2016 done: Mon Nov  7 19:58:18 2016
 Total Scan time:  3.130 Total Display time:  0.080

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com