Result of FASTA (ccds) for pFN21AE1967
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE1967, 530 aa
  1>>>pF1KE1967 530 - 530 aa - 530 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 7.8658+/-0.000836; mu= 9.1037+/- 0.051
 mean_var=190.6086+/-38.313, 0's: 0 Z-trim(114.5): 16  B-trim: 0 in 0/53
 Lambda= 0.092897
 statistics sampled from 15051 (15061) to 15051 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.463), width:  16
 Scan time:  3.360

The best scores are:                                      opt bits E(32554)
CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3           ( 530) 3624 497.9 1.2e-140
CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16         ( 395)  577 89.4 8.2e-18
CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16        ( 411)  576 89.3 9.2e-18
CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX         ( 486)  558 87.0 5.6e-17
CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10          ( 479)  416 67.9 2.9e-11


>>CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3                (530 aa)
 initn: 3624 init1: 3624 opt: 3624  Z-score: 2638.6  bits: 497.9 E(32554): 1.2e-140
Smith-Waterman score: 3624; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530)

               10        20        30        40        50        60
pF1KE1 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE1 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE1 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE1 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE1 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE1 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA
              430       440       450       460       470       480

              490       500       510       520       530
pF1KE1 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
       ::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
              490       500       510       520       530

>>CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16              (395 aa)
 initn: 822 init1: 299 opt: 577  Z-score: 433.3  bits: 89.4 E(32554): 8.2e-18
Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378)

            130       140       150       160       170       180  
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
                                     :  . .: :. :  : :...::::::: :.
CCDS10  MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ
                10        20        30         40        50        

            190       200       210       220       230       240  
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
       ::::.:.::.:.::.::::  :  :.:..:. :.::.. ... ::..::. : :     :
CCDS10 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR
       60        70        80        90       100       110        

            250       260       270       280        290       300 
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
       ::. :  :  :.....:: : : :. . ...  .. :::  :  : ..  .: ::.:  .
CCDS10 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV
         120         130       140         150       160       170 

             310       320       330       340       350       360 
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
       :.: :: :.. :: ::: ::::.:...:::::::::  :: .. ..: :..         
CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN---------
             180       190       200       210       220           

             370       380       390       400        410       420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
                  :  ::..  :.   ::  .: ... .: : ..  ..: :.:: .:.:.:
CCDS10 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY
                         230        240       250       260        

              430       440       450       460         470        
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ
        .::.:::. .:.  .: .: :.:: ..:..: .  :.: ::: ...   : .:.::: .
CCDS10 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN
      270       280       290       300       310       320        

      480       490       500       510       520       530        
pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL        
       ...::: :: : .:..:.:.:   . .:::. : : .: ..:.  :.  ::         
CCDS10 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS
      330       340       350       360       370        380       

CCDS10 STASHPRN
       390     

>>CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16             (411 aa)
 initn: 821 init1: 293 opt: 576  Z-score: 432.3  bits: 89.3 E(32554): 9.2e-18
Smith-Waterman score: 865; 40.1% identity (67.0% similar) in 382 aa overlap (153-529:52-400)

            130       140       150       160       170       180  
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
                                     :  . .: :. :  : :...:::::::.:.
CCDS10 MWLPRFSSKTVTVLLLAQTTCLLLFIISRPGPSSPAG-GEDRVHVLVLSSWRSGSSFLGQ
              30        40        50         60        70        80

            190       200       210       220       230       240  
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
       ::.:.:.::.:.::.::::  :  :.:..:. :.::.. ... ::..::. : : .   :
CCDS10 LFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLMRSIFLCDMDVFDAYMPQS---R
               90       100       110       120       130          

            250       260       270       280        290       300 
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
       ::...  :. ::....:: : : :. . ...  :  :::  :  : ..  .: ::.:  .
CCDS10 NLSAF--FNWATSRALCSPPACSAFPRGTISKQD--VCKTLCTRQPFSLAREACRSYSHV
       140         150       160         170       180       190   

             310       320       330       340       350       360 
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
       :.: :: :.. :: ::: ::::.:...:::::::::    .:::     :.   . .:: 
CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAV----LRSR-----EAAGPILARD-
           200       210       220           230            240    

             370       380       390       400        410       420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
                  :  ::.. . :   :: : :  .. .: : ..  ..: :.:: .:.:.:
CCDS10 ----------NGIVLGTNGKWV--EADPH-LRLIREVCRSHVRIAEAATLKPPPFLRGRY
                     250         260        270       280       290

              430       440       450       460          470       
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKP---FVVSARNAT
        .::.:::. .:.  .: .: :.:: ..:..: .  :.: ::: . ::   : .:.::: 
CCDS10 RLVRFEDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIG-KPIEAFHTSSRNAR
              300       310       320       330        340         

       480       490       500       510       520       530       
pF1KE1 QAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL       
       ....::: :: : .: .:.: :   . .:::. : : .. .::.  :.  ::        
CCDS10 NVSQAWRHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVL-PRGPDHFSWA
     350       360       370       380       390        400        

CCDS10 SPD
      410 

>>CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX              (486 aa)
 initn: 1093 init1: 408 opt: 558  Z-score: 418.3  bits: 87.0 E(32554): 5.6e-17
Smith-Waterman score: 1211; 45.4% identity (68.2% similar) in 491 aa overlap (48-516:1-465)

        20        30        40        50        60        70       
pF1KE1 LQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCAGYALLLVLTMLNLLDYK
                                     ::  ::.    :  .::::::  : ::   
CCDS14                               MKGRRRRRREYCK-FALLLVLYTLVLL---
                                             10         20         

        80        90       100       110       120       130       
pF1KE1 WHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARLDLRTPYRPPAAAVG---
            :     ::      :  : . ..  :   :  :. .  .:.      :::.:   
CCDS14 -----LVPSVLDG------GRDGDKGAEHCP---GLQRSLGVWSLE------AAAAGERE
              30              40           50              60      

           140       150       160           170       180         
pF1KE1 -AAPAAAAGMAGVAAPPGNGTRGTGGVGD----KRQLVYVFTTWRSGSSFFGELFNQNPE
        .: : ::  .:.   :   .  .:.::.    ..: .:: .:::.::::.::::::.:.
CCDS14 QGAEARAAEEGGANQSPRFPSNLSGAVGEAVSREKQHIYVHATWRTGSSFLGELFNQHPD
         70        80        90       100       110       120      

     190       200       210       220       230        240        
pF1KE1 VFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGS-GGR-----N
       ::.::::.::.:: :::::: ::::: :::: .:.:::.::..::.: :. ..:     :
CCDS14 VFYLYEPMWHLWQALYPGDAESLQGALRDMLRSLFRCDFSVLRLYAPPGDPAARAPDTAN
        130       140       150       160       170       180      

           250       260        270        280        290       300
pF1KE1 LTTLGIFGAATNKVVCSSPLCP-AYRKEV-VGLVDDRVCKK-CPPQRLARFEEECRKYRT
       ::: ..:   ::::.:: :::: : : .. ::::.: .:.. :::  .  .: ::::: .
CCDS14 LTTAALFRWRTNKVICSPPLCPGAPRARAEVGLVEDTACERSCPPVAIRALEAECRKYPV
        190       200       210       220       230       240      

              310       320       330       340       350       360
pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
       .::: ::..:..::.::::::.:.:::..: :::::: .::..::.::.:::.::.:.:.
CCDS14 VVIKDVRLLDLGVLVPLLRDPGLNLKVVQLFRDPRAVHNSRLKSRQGLLRESIQVLRTRQ
        250       260       270       280       290       300      

                370       380         390       400       410      
pF1KE1 --PRAHRMPFLEAAGHKLGAKKEGV-GGP-ADYHALGAMEVICNSMAKTLQTALQPPDWL
          : ::. . ...: . :...... ..: ::.   ::.::::..  . :  :   : ::
CCDS14 RGDRFHRVLLAHGVGARPGGQSRALPAAPRADFFLTGALEVICEAWLRDLLFARGAPAWL
        310       320       330       340       350       360      

        420       430       440       450       460        470     
pF1KE1 QGHYLVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSG-SSSKPFVVSARN
       . .:: .:::::: .:   :::.  : :: .   .. :::::: :.. ....:: .:::.
CCDS14 RRRYLRLRYEDLVRQPRAQLRRLLRFSGLRALAALDAFALNMTRGAAYGADRPFHLSARD
        370       380       390       400       410       420      

         480       490       500       510       520       530     
pF1KE1 ATQAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL     
       : .:..:::  :. .:..:::  :   : .:.: :  : ::                   
CCDS14 AREAVHAWRERLSREQVRQVEAACAPAMRLLAYPR--SGEEGDAEQPREGETPLEMDADG
        430       440       450       460         470       480    

CCDS14 AT
         

>>CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10               (479 aa)
 initn: 483 init1: 178 opt: 416  Z-score: 315.6  bits: 67.9 E(32554): 2.9e-11
Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472)

              140       150       160       170       180       190
pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV
                                     : .:... . :: :.:::: ::.:::. ..
CCDS73 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI
     100       110       120       130       140        150        

              200         210          220       230        240    
pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL
       :.:.::.::. .  .. :: : .  :.:   ::.:. :. ::: :.. . .:      .:
CCDS73 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL
      160       170        180       190       200       210       

          250       260       270       280         290       300  
pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV
       : . .:  .... .: .:.:  . :.:    .   ::  .: :  ..   : ::. . ..
CCDS73 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA
          220       230       240          250       260       270 

            310       320       330       340       350       360  
pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR
       .:.::. ..  : :: .:: :::.::.:::::::: .::. .  :  .   .        
CCDS73 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK--------
             280       290       300       310       320           

            370       380       390       400       410       420  
pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV
            .:.  :.  : ..: :           ..  :.:.  . . .:. : ::.:.:..
CCDS73 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML
                330                 340       350       360        

            430       440       450       460       470       480  
pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA
       :::::..  :..  :..: :.:. ..:..:..  . :... ..:  .  . .:...  . 
CCDS73 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK
      370       380       390       400       410        420       

            490       500       510       520       530    
pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL    
       :: .. :.  . :.  :   : ..::. . .   . . : .::..       
CCDS73 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT
       430       440       450       460       470         




530 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 17:41:15 2016 done: Sun Nov  6 17:41:16 2016
 Total Scan time:  3.360 Total Display time:  0.020

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com