Result of FASTA (ccds) for pF1KSDA1247
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KSDA1247, 870 aa
  1>>>pF1KSDA1247 870 - 870 aa - 870 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.1657+/-0.000963; mu= 16.6915+/- 0.058
 mean_var=81.0745+/-15.554, 0's: 0 Z-trim(106.0): 25  B-trim: 0 in 0/52
 Lambda= 0.142440
 statistics sampled from 8709 (8732) to 8709 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.634), E-opt: 0.2 (0.268), width:  16
 Scan time:  3.650

The best scores are:                                      opt bits E(32554)
CCDS13408.1 SULF2 gene_id:55959|Hs108|chr20        ( 870) 6069 1257.4       0
CCDS13409.2 SULF2 gene_id:55959|Hs108|chr20        ( 867) 6034 1250.2       0
CCDS6204.1 SULF1 gene_id:23213|Hs108|chr8          ( 871) 2774 580.3  5e-165
CCDS8970.1 GNS gene_id:2799|Hs108|chr12            ( 552) 1044 224.7 3.5e-58
CCDS4073.1 ARSK gene_id:153642|Hs108|chr5          ( 536)  329 77.8 5.9e-14


>>CCDS13408.1 SULF2 gene_id:55959|Hs108|chr20             (870 aa)
 initn: 6069 init1: 6069 opt: 6069  Z-score: 6735.6  bits: 1257.4 E(32554):    0
Smith-Waterman score: 6069; 99.9% identity (100.0% similar) in 870 aa overlap (1-870:1-870)

               10        20        30        40        50        60
pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD MQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
       :::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MQVMNKTRRIMEQGGAHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KSD EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KSD NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KSD LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KSD LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KSD HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KSD AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KSD HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KSD DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KSD SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KSD YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE
              790       800       810       820       830       840

              850       860       870
pF1KSD QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
       ::::::::::::::::::::::::::::::
CCDS13 QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
              850       860       870

>>CCDS13409.2 SULF2 gene_id:55959|Hs108|chr20             (867 aa)
 initn: 5802 init1: 5802 opt: 6034  Z-score: 6696.8  bits: 1250.2 E(32554):    0
Smith-Waterman score: 6034; 99.5% identity (99.7% similar) in 870 aa overlap (1-870:1-867)

               10        20        30        40        50        60
pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD MQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
       :::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MQVMNKTRRIMEQGGAHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KSD EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KSD NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KSD LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KSD LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KSD HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KSD AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KSD HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KSD DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KSD SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KSD YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE
       :::::::::::::::::::::::::::::::::::::::::::::::::::   ::::::
CCDS13 YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDL---DGGSYE
              790       800       810       820       830          

              850       860       870
pF1KSD QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
       ::::::::::::::::::::::::::::::
CCDS13 QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
       840       850       860       

>>CCDS6204.1 SULF1 gene_id:23213|Hs108|chr8               (871 aa)
 initn: 3955 init1: 2651 opt: 2774  Z-score: 3076.2  bits: 580.3 E(32554): 5e-165
Smith-Waterman score: 4065; 65.1% identity (84.7% similar) in 887 aa overlap (5-870:7-871)

                 10        20        30        40        50        
pF1KSD   MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVEL
             .::: .:..    :::.  . .   :..::.:..:.::::::::::::::::::
CCDS62 MKYSCCALVLAVLGTE---LLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL
               10           20        30        40        50       

       60        70        80        90       100       110        
pF1KSD GSMQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSW
       ::.:::::::.:::.::. :::::::::::::::::.::::::::::.::::::::::::
CCDS62 GSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSW
        60        70        80        90       100       110       

      120       130       140       150       160       170        
pF1KSD QAQHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNG
       ::.:: ::::::::.:::::::::::::::::::.::::.::.::.:::::::::.::::
CCDS62 QAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNG
       120       130       140       150       160       170       

      180       190       200       210       220       230        
pF1KSD VKEKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRL
       .::::: ::.:::.::::::.:...:. ::.:::::::.:::::::::::::::::.:.:
CCDS62 IKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKL
       180       190       200       210       220       230       

      240       250       260       270       280       290        
pF1KSD FPNASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIY
       .:::::::::::::::: ::::::.::::: ::::::::.:::::::::::::::.: .:
CCDS62 YPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLY
       240       250       260       270       280       290       

      300       310       320       330       340       350        
pF1KSD NMLVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPH
       :::::::::.::::.::::::::::::::::::::::.:::::::..:::.:: : . :.
CCDS62 NMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQ
       300       310       320       330       340       350       

      360       370       380       390       400       410        
pF1KSD IVLNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGK
       :::::::::::::::::: : :.::::.::::: :.: :::. .:: ..:::.:::::::
CCDS62 IVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGK
       360       370       380       390       400       410       

      420       430       440       450       460       470        
pF1KSD LLHKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCK
       .:.:..... . :. : ::::.:::.:::.:.::::::: ::::::.::..:::..::::
CCDS62 FLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCK
       420       430       440       450       460       470       

      480        490       500       510        520            530 
pF1KSD GPMRLGGSR-ALSNLVPKYYGQGSEACTCDSGDYKLSLAGRR-KKLFKK-----KYKASY
       ::  :   : .  ::  . . . .. :.:  . :. : . :. .. : .     :::  .
CCDS62 GPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRF
       480       490       500       510       520       530       

             540       550            560         570       580    
pF1KSD VRSRSIRSVAIEVDGRVYHVGLGDAA-----QPRNLTKRHWPG--APEDQDDKDGGDFSG
       :..:. ::...: .:..: ..: .       ::::..:::  :  .:.: . ..::.  :
CCDS62 VHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGN-RG
       540       550       560       570       580       590       

          590          600       610       620       630       640 
pF1KSD TGGLPDYSAANP---IKVTHRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNK
            . .:..:   ..:::.:.:: ::...:. .::.: .:::::: .::.:::.::.:
CCDS62 RMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDK
        600       610       620       630       640       650      

             650       660       670         680       690         
pF1KSD IKNLREVRGHLKKKRPEECDCHKISYHTQHKGRLKHRG--SSLHPFRKGLQEKD-KVWLL
       ::::::::::::...::::.: : ::....::  :..   : ::::... :: : :. :.
CCDS62 IKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLF
        660       670       680       690       700       710      

      700        710       720       730       740       750       
pF1KSD REQ-KRKKKLRKLLKRLQNNDTCSMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTY
       .:. .:.:: ::  .: .... ::.::::::::::.::::::::.:: ::::::.:::::
CCDS62 KENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTY
        720       730       740       750       760       770      

       760       770       780       790       800       810       
pF1KSD WCMRTINETHNFLFCEFATGFLEYFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCK
       ::.::.::::::::::::::::::::.::::::: :.:.:..: .::::::::::::::.
CCDS62 WCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQ
        780       790       800       810       820       830      

       820       830       840       850       860       870
pF1KSD GYKQCNPRTRNMDLGLKDGGSYEQYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
       :::::::: .:.:.: ::::::. .:                  ::::.::::
CCDS62 GYKQCNPRPKNLDVGNKDGGSYDLHR------------------GQLWDGWEG
        840       850       860                         870 

>>CCDS8970.1 GNS gene_id:2799|Hs108|chr12                 (552 aa)
 initn: 1122 init1: 436 opt: 1044  Z-score: 1158.0  bits: 224.7 E(32554): 3.5e-58
Smith-Waterman score: 1049; 41.3% identity (65.6% similar) in 448 aa overlap (43-478:46-468)

             20        30        40        50        60        70  
pF1KSD ATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGSMQVMNKTRRIME
                                     :::..:.::::::  ::.:  ..::. .. 
CCDS89 PRHLPSCSPALLLLVLGGCLGVFGVAAGTRRPNVVLLLTDDQDEVLGGMTPLKKTKALIG
          20        30        40        50        60        70     

             80        90       100       110         120       130
pF1KSD QGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNE--NCSSPSWQAQHESRTFAVY
       . :  : .:.: . .:::::.::::::: :::.. .:.   :::: :::  .:  :: . 
CCDS89 EMGMTFSSAYVPSALCCPSRASILTGKYPHNHHVVNNTLEGNCSSKSWQKIQEPNTFPAI
          80        90       100       110       120       130     

               140       150             160       170       180   
pF1KSD LNST-GYRTAFFGKYLNEYNGS------YVPPGWKEWVGLLKNSRFYNYTLCRNGVKEKH
       : :  ::.: : :::::::..       .:: ::. : .: :::..:::::  ::  .::
CCDS89 LRSMCGYQTFFAGKYLNEYGAPDAGGLEHVPLGWSYWYALEKNSKYYNYTLSINGKARKH
         140       150       160       170       180       190     

           190       200       210       220       230       240   
pF1KSD GSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFPNAS
       : .:: :::::...: :..:.  ....   .: .:.:.  :::.:  .::::.. : :. 
CCDS89 GENYSVDYLTDVLANVSLDFLDYKSNF---EPFFMMIATPAPHSPWTAAPQYQKAFQNVF
         200       210       220          230       240       250  

           250       260        270       280       290       300  
pF1KSD QHITPSYNYAPNPDKHWIMRYTG-PMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNMLV
          . ..:   . .:::..: .  ::    ..: .   ::: :::.:::: .: . . : 
CCDS89 APRNKNFNIH-GTNKHWLIRQAKTPMTNSSIQFLDNAFRKRWQTLLSVDDLVEKLVKRLE
            260        270       280       290       300       310 

            310       320       330       340       350       360  
pF1KSD ETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIVLN
        ::::.:::: ::.:.::: :::.:   : . :::::.::. ::::... .  .  .: :
CCDS89 FTGELNNTYIFYTSDNGYHTGQFSLPIDKRQLYEFDIKVPLLVRGPGIKPNQTSKMLVAN
             320       330       340       350       360       370 

            370        380       390       400       410       420 
pF1KSD IDLAPTILDIAGLDI-PADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLLH
       :::.:::::::: :.  ..::: :.: .:   : .. .       .::.. :::     .
CCDS89 IDLGPTILDIAGYDLNKTQMDGMSLLPIL---RGASNL-------TWRSDVLVEY----Q
             380       390       400                 410           

             430       440       450        460       470       480
pF1KSD KRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQ-LGQKWQCVEDATGKLKLHKCKGP
        .  . .:    .. :  ..    :       .::.  .. . ::.  ..  .:. :.  
CCDS89 GEGRNVTDPTCPSLSPGVSQCFPDC-------VCEDAYNNTYACVRTMSALWNLQYCEFD
       420       430       440              450       460       470

              490       500       510       520       530       540
pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
                                                                   
CCDS89 DQEVFVEVYNLTADPDQITNIAKTIDPELLGKMNYRLMMLQSCSGPTCRTPGVFDPGYRF
              480       490       500       510       520       530

>>CCDS4073.1 ARSK gene_id:153642|Hs108|chr5               (536 aa)
 initn: 425 init1: 154 opt: 329  Z-score: 364.1  bits: 77.8 E(32554): 5.9e-14
Smith-Waterman score: 379; 26.6% identity (56.4% similar) in 399 aa overlap (36-408:24-402)

          10        20        30        40        50            60 
pF1KSD LVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVEL----GSM
                                     :: :    ::..::..:. : .:    ::.
CCDS40        MLLLWVSVVAALALAVLAPGAGEQRRRAAKAPNVVLVVSDSFDGRLTFHPGSQ
                      10        20        30        40        50   

              70        80        90       100       110       120 
pF1KSD QVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQAQ
        :      .:.  :: :.::....:.:::::... .: ..:  ... :: .  .:..   
CCDS40 VVKLPFINFMKTRGTSFLNAYTNSPICCPSRAAMWSGLFTHLTESW-NNFKGLDPNYT--
            60        70        80        90        100       110  

             130       140       150           160        170      
pF1KSD HESRTFAVYLNSTGYRTAFFGKYLNEYNG----SYVPPGWKEWVG-LLKNSRFYNYTLCR
           :.   ..  ::::  ::: :.  .:    :    .: . :. ::..      .: :
CCDS40 ----TWMDVMERHGYRTQKFGK-LDYTSGHHSISNRVEAWTRDVAFLLRQEGRPMVNLIR
                  120        130       140       150       160     

        180       190       200       210       220       230      
pF1KSD NGVKEKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYS
       : .: .    . .:. .   :. .:...:     : . : .. ..   :: :  : :. .
CCDS40 NRTKVR---VMERDWQN---TDKAVNWLRKEAINYTE-PFVIYLGLNLPH-PYPS-PSSG
         170             180       190        200        210       

        240       250       260       270                280       
pF1KSD RLFPNASQHITPSYNYAPNPDKHWIMRYTGPMKPIH-MEF--------TNMLQRKRLQTL
       . : ... : .  .    . :   : ... :.. .: ...        :. . .:.....
CCDS40 ENFGSSTFHTSLYWLEKVSHDAIKIPKWS-PLSEMHPVDYYSSYTKNCTGRFTKKEIKNI
        220       230       240        250       260       270     

       290            300          310       320       330         
pF1KSD MSVDDSM--ET---IYNMLVETGELD---NTYIVYTADHGYHIGQFGLVKGKSMPYEFDI
        .   .:  ::   . ....   .::   .: ..:..:::    .       :: :: . 
CCDS40 RAFYYAMCAETDAMLGEIILALHQLDLLQKTIVIYSSDHGELAMEHRQFYKMSM-YEASA
         280       290       300       310       320        330    

     340       350       360       370       380       390         
pF1KSD RVPFYVRGPNVEAGCLNPHIVLNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRF
       .::. . ::...::    ..:  .:. ::.:::::. .: ...: :.: : ..:   :. 
CCDS40 HVPLLMMGPGIKAGLQVSNVVSLVDIYPTMLDIAGIPLPQNLSGYSLLPL-SSETFKNEH
          340       350       360       370       380        390   

     400       410       420       430       440       450         
pF1KSD HLKKKMRVWRDSFLVERGKLLHKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLG
       ..:.    :                                                   
CCDS40 KVKNLHPPWILSEFHGCNVNASTYMLRTNHWKYIAYSDGASILPQLFDLSSDPDELTNVA
           400       410       420       430       440       450   




870 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 05:33:05 2016 done: Thu Nov  3 05:33:06 2016
 Total Scan time:  3.650 Total Display time:  0.140

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com