Result of FASTA (ccds) for pFN21AE4350
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE4350, 365 aa
  1>>>pF1KE4350 365 - 365 aa - 365 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.6805+/-0.000837; mu= 2.2830+/- 0.051
 mean_var=199.2008+/-39.643, 0's: 0 Z-trim(114.2): 24  B-trim: 7 in 1/55
 Lambda= 0.090872
 statistics sampled from 14773 (14795) to 14773 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.454), width:  16
 Scan time:  3.160

The best scores are:                                      opt bits E(32554)
CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19       ( 365) 2562 347.9 8.3e-96
CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19       ( 350) 2394 325.8 3.4e-89
CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19       ( 285)  994 142.2 5.2e-34
CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16     ( 295)  739 108.8 6.2e-24
CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16       ( 295)  739 108.8 6.2e-24
CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16       ( 295)  726 107.1   2e-23
CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2      ( 304)  716 105.8 5.1e-23
CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16       ( 295)  710 105.0 8.7e-23
CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2         ( 296)  708 104.7   1e-22
CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4        ( 296)  701 103.8   2e-22
CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2        ( 302)  700 103.7 2.2e-22
CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4         ( 294)  688 102.1 6.4e-22
CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2         ( 307)  550 84.0 1.8e-16
CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16       ( 217)  514 79.2 3.7e-15
CCDS33182.1 SULT6B1 gene_id:391365|Hs108|chr2      ( 265)  472 73.8   2e-13
CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22      ( 284)  436 69.1 5.5e-12


>>CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19            (365 aa)
 initn: 2562 init1: 2562 opt: 2562  Z-score: 1833.5  bits: 347.9 E(32554): 8.3e-96
Smith-Waterman score: 2562; 100.0% identity (100.0% similar) in 365 aa overlap (1-365:1-365)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE4 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE4 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
              310       320       330       340       350       360

            
pF1KE4 HPRPS
       :::::
CCDS12 HPRPS
            

>>CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19            (350 aa)
 initn: 2394 init1: 2394 opt: 2394  Z-score: 1714.7  bits: 325.8 E(32554): 3.4e-89
Smith-Waterman score: 2394; 100.0% identity (100.0% similar) in 342 aa overlap (24-365:9-350)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                              :::::::::::::::::::::::::::::::::::::
CCDS12                MASPPPFHSQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                              10        20        30        40     

               70        80        90       100       110       120
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
          50        60        70        80        90       100     

              130       140       150       160       170       180
pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
         110       120       130       140       150       160     

              190       200       210       220       230       240
pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
         170       180       190       200       210       220     

              250       260       270       280       290       300
pF1KE4 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
         230       240       250       260       270       280     

              310       320       330       340       350       360
pF1KE4 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
         290       300       310       320       330       340     

            
pF1KE4 HPRPS
       :::::
CCDS12 HPRPS
         350

>>CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19            (285 aa)
 initn: 998 init1: 830 opt: 994  Z-score: 724.0  bits: 142.2 E(32554): 5.2e-34
Smith-Waterman score: 994; 48.1% identity (76.3% similar) in 287 aa overlap (27-310:1-285)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                                 .  ... ..:. ::.  .  :..  ...   .::
CCDS12                           MSDDFLWFEGIAFPTMGFRSETLRKVRDEFVIRD
                                         10        20        30    

               70        80        90       100       110       120
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
       .:..:.:::::::.:. ::.::. ..:: .::.:::::::.:: :. .:  .: .  :::
CCDS12 EDVIILTYPKSGTNWLAEILCLMHSKGDAKWIQSVPIWERSPWVESEIGYTALSETESPR
           40        50        60        70        80        90    

              130       140       150       160       170       180
pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
       :.:::::::.: :.::::::::::. ::::::.:: : . :    .: : . ..... : 
CCDS12 LFSSHLPIQLFPKSFFSSKAKVIYLMRNPRDVLVSGYFFWKNMKFIKKPKSWEEYFEWFC
          100       110       120       130       140       150    

              190       200       210       220       230       240
pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
       .: : .:::::::.::. :. . :::...::::.::   ..:.:: :::. :  : :. .
CCDS12 QGTVLYGSWFDHIHGWMPMREEKNFLLLSYEELKQDTGRTIEKICQFLGKTLEPEELNLI
          160       170       180       190       200       210    

              250       260        270       280       290         
pF1KE4 VAHSTFSAMKANTMSNYTLLPPS-LLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRK
       . .:.:..:: : ::::.::  . ..:  .. .::::: :::::::::::.: ::. ...
CCDS12 LKNSSFQSMKENKMSNYSLLSVDYVVD--KAQLLRKGVSGDWKNHFTVAQAEDFDKLFQE
          220       230       240         250       260       270  

     300         310       320       330       340       350       
pF1KE4 QMRGMPT--FPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQAS
       .:  .:   :::.                                               
CCDS12 KMADLPRELFPWE                                               
            280                                                    

>>CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16          (295 aa)
 initn: 767 init1: 591 opt: 739  Z-score: 543.2  bits: 108.8 E(32554): 6.2e-24
Smith-Waterman score: 739; 39.3% identity (69.1% similar) in 285 aa overlap (24-303:7-286)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                              ... : ::   ::::.    :  :...  .. : .: 
CCDS32                  MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
                                10          20          30         

               70        80        90       100            110     
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETI-----VGAFSLPD
       ::..: :::::::::. .:. .: . ::      .::. :.:. :.       :  .: :
CCDS32 DDLLINTYPKSGTTWVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKD
       40        50        60        70        80        90        

         120       130       140       150       160       170     
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
          :::..::::. .. ......:.::.:..:::.::.:: ::. ..     .::: :.:
CCDS32 TPPPRLIKSHLPLALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSF
      100       110       120       130       140       150        

         180       190       200       210       220       230     
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
       :. :. :::..:::..:.. : ...     :.. ::..... .  ...:  :.:: : .:
CCDS32 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
      160       170       180       190       200       210        

         240       250       260       270       280       290     
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
       ..  .: :..:. :: : :.::: .:  :.::  . :.:::. ::::. :::::.: :: 
CCDS32 TMDFMVQHTSFKEMKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
      220       230       240       250       260       270        

         300       310       320       330       340       350     
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
        : ..: :                                                    
CCDS32 DYAEKMAGCSLSFRSEL                                           
      280       290                                                

>>CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16            (295 aa)
 initn: 767 init1: 591 opt: 739  Z-score: 543.2  bits: 108.8 E(32554): 6.2e-24
Smith-Waterman score: 739; 39.3% identity (69.1% similar) in 285 aa overlap (24-303:7-286)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                              ... : ::   ::::.    :  :...  .. : .: 
CCDS10                  MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
                                10          20          30         

               70        80        90       100            110     
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETI-----VGAFSLPD
       ::..: :::::::::. .:. .: . ::      .::. :.:. :.       :  .: :
CCDS10 DDLLINTYPKSGTTWVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKD
       40        50        60        70        80        90        

         120       130       140       150       160       170     
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
          :::..::::. .. ......:.::.:..:::.::.:: ::. ..     .::: :.:
CCDS10 TPPPRLIKSHLPLALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSF
      100       110       120       130       140       150        

         180       190       200       210       220       230     
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
       :. :. :::..:::..:.. : ...     :.. ::..... .  ...:  :.:: : .:
CCDS10 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
      160       170       180       190       200       210        

         240       250       260       270       280       290     
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
       ..  .: :..:. :: : :.::: .:  :.::  . :.:::. ::::. :::::.: :: 
CCDS10 TMDFMVQHTSFKEMKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
      220       230       240       250       260       270        

         300       310       320       330       340       350     
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
        : ..: :                                                    
CCDS10 DYAEKMAGCSLSFRSEL                                           
      280       290                                                

>>CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16            (295 aa)
 initn: 727 init1: 574 opt: 726  Z-score: 533.9  bits: 107.1 E(32554): 2e-23
Smith-Waterman score: 726; 38.9% identity (69.8% similar) in 285 aa overlap (24-303:7-286)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                              ... : ::   ::::.    :  :...  .. : .: 
CCDS32                  MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
                                10          20          30         

               70        80        90       100            110     
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIV-----GAFSLPD
       ::..: :::::::::. .:. .: . ::    . .::. :.:. :  .     :  .: :
CCDS32 DDLLISTYPKSGTTWVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKAPGIPSGMETLKD
       40        50        60        70        80        90        

         120       130       140       150       160       170     
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
         .:::...:::. .. ......:.::.:..:: .::.:: ::. ..:    .::: :.:
CCDS32 TPAPRLLKTHLPLALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVHPEPGTWDSF
      100       110       120       130       140       150        

         180       190       200       210       220       230     
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
       :. :. :::..:::..:.. : ...     :.. ::..... .  ...:  :.:: : .:
CCDS32 LEKFMVGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
      160       170       180       190       200       210        

         240       250       260       270       280       290     
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
       ..  :: :..:. :: : :.::: .:  ..::  . :.:::. ::::. :::::.: :: 
CCDS32 TVDFVVQHTSFKEMKKNPMTNYTTVPQEFMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
      220       230       240       250       260       270        

         300       310       320       330       340       350     
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
        : ..: :                                                    
CCDS32 DYAEKMAGCSLSFRSEL                                           
      280       290                                                

>>CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2           (304 aa)
 initn: 726 init1: 607 opt: 716  Z-score: 526.7  bits: 105.8 E(32554): 5.1e-23
Smith-Waterman score: 716; 38.9% identity (68.9% similar) in 270 aa overlap (40-303:27-295)

      10        20        30        40        50        60         
pF1KE4 PGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYP
                                     :. . : :    . : : .. ::... :::
CCDS33     MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQ-AKPDDLILATYP
                   10        20        30        40         50     

      70        80        90       100       110             120   
pF1KE4 KSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPD------QYSPRLMS
       ::::::: ::. .::..::    . .   .:  . :        ::      . ::.:..
CCDS33 KSGTTWMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIK
          60        70        80        90       100       110     

           130       140       150       160       170       180   
pF1KE4 SHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGE
       .::: ...  .... . :..:..:::.: .:: ::. ..:. . :: . ..: . :..:.
CCDS33 THLPSHLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGK
         120       130       140       150       160       170     

           190       200       210       220       230       240   
pF1KE4 VQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAH
       :  ::::::.:::   :    .:.. ::....: .  .:.:  :: . ...: :.... :
CCDS33 VVGGSWFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYH
         180       190       200       210       220       230     

           250       260       270       280       290       300   
pF1KE4 STFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRG
       ..:..:: : :.::: :: :..::  . :.:::. :::::.:::::.: ::. :.:.: :
CCDS33 TSFDVMKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAG
         240       250       260       270       280       290     

           310       320       330       340       350       360   
pF1KE4 MPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPR
                                                                   
CCDS33 STLTFRTEI                                                   
         300                                                       

>>CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16            (295 aa)
 initn: 708 init1: 555 opt: 710  Z-score: 522.6  bits: 105.0 E(32554): 8.7e-23
Smith-Waterman score: 710; 38.8% identity (69.2% similar) in 289 aa overlap (20-303:4-286)

               10        20        30        40        50        60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
                          :..::.  : ::   ::::.    :  :...  .. : .: 
CCDS10                 MELIQDISRP-PLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
                               10           20          30         

               70        80        90       100            110     
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIV-----GAFSLPD
       ::..: :::::::::. .:. .: . ::    . .::. :.:. :  :     :  .: .
CCDS10 DDLLISTYPKSGTTWVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKVPGIPSGMETLKN
       40        50        60        70        80        90        

         120       130       140       150       160       170     
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
         .:::...:::. .. ......:.::.:..:: .::.:: ::. ..:     ::: ..:
CCDS10 TPAPRLLKTHLPLALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVYPHPGTWESF
      100       110       120       130       140       150        

         180       190       200       210       220       230     
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
       :. :. :::..:::..:.. : ...     :.. ::..... .  ...:  :.:: : .:
CCDS10 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
      160       170       180       190       200       210        

         240       250       260       270       280       290     
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
       ..  .: :..:. :: : :.::: .   ..::  . :.:::. ::::. :::::.: :: 
CCDS10 TVDLMVEHTSFKEMKKNPMTNYTTVRREFMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
      220       230       240       250       260       270        

         300       310       320       330       340       350     
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
        : :.: :                                                    
CCDS10 DYAKKMAGCSLSFRSEL                                           
      280       290                                                

>>CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2              (296 aa)
 initn: 742 init1: 599 opt: 708  Z-score: 521.2  bits: 104.7 E(32554): 1e-22
Smith-Waterman score: 708; 38.0% identity (71.0% similar) in 255 aa overlap (57-303:36-287)

         30        40        50        60        70        80      
pF1KE4 LPGEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYPKSGTTWMIEIICLILKE
                                     ... ::..: ::::.::::. ::. .: ..
CCDS20 DLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTTWIQEIVDMIEQN
          10        20        30        40        50        60     

         90               100       110       120       130        
pF1KE4 GDPSWIRSVPI--------WERAPWCETIVGAFSLPDQYSPRLMSSHLPIQIFTKAFFSS
       ::    . . :        : : :    .  : ..:   :::....::  :..  .:. .
CCDS20 GDVEKCQRAIIQHRHPFIEWARPPQPSGVEKAKAMP---SPRILKTHLSTQLLPPSFWEN
          70        80        90       100          110       120  

      140       150       160       170       180       190        
pF1KE4 KAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGEVQFGSWFDHIKGWLR
       . : .:..:: .: .:: ::....  .: :::: ..... :..:.: .::::::.::: .
CCDS20 NCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFETFINGKVVWGSWFDHVKGWWE
            130       140       150       160       170       180  

      200       210       220       230       240       250        
pF1KE4 MKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAHSTFSAMKANTMSNYT
       :: . ..::. ::....: .  ....  :.:. . . .: ..: ...:  :: : :.: .
CCDS20 MKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLDKIVQETSFEKMKENPMTNRS
            190       200       210       220       230       240  

      260       270       280       290       300       310        
pF1KE4 LLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRGMPTFPWDEDPEEDGS
        .  :.::.  ..:.:::. :::::::::::.: ::. ::..:.:               
CCDS20 TVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYRRKMEGTSINFCMEL      
            250       260       270       280       290            

      320       330       340       350       360     
pF1KE4 PDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPRPS

>>CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4             (296 aa)
 initn: 722 init1: 578 opt: 701  Z-score: 516.2  bits: 103.8 E(32554): 2e-22
Smith-Waterman score: 701; 41.4% identity (69.1% similar) in 249 aa overlap (59-301:37-285)

       30        40        50        60        70        80        
pF1KE4 GEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYPKSGTTWMIEIICLILKEGD
                                     : ::: : :::::::::. ::: .::..::
CCDS35 ILRKDLKLVHGYPMTCAFASNWEKIEQFHSRPDDIVIATYPKSGTTWVSEIIDMILNDGD
         10        20        30        40        50        60      

       90       100             110       120       130       140  
pF1KE4 PSWIRSVPIWERAPWCETIV------GAFSLPDQYSPRLMSSHLPIQIFTKAFFSSKAKV
           .   : :..:  :  .      :  .:  . :::....::: ... :.:. .. :.
CCDS35 IEKCKRGFITEKVPMLEMTLPGLRTSGIEQLEKNPSPRIVKTHLPTDLLPKSFWENNCKM
         70        80        90       100       110       120      

            150       160       170       180       190       200  
pF1KE4 IYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGEVQFGSWFDHIKGWLRMKGK
       ::..:: .:: :: ::.. . .    ::: ...:. :: :.: .:::: :.:.: . : .
CCDS35 IYLARNAKDVSVSYYHFDLMNNLQPFPGTWEEYLEKFLTGKVAYGSWFTHVKNWWKKKEE
        130       140       150       160       170       180      

            210       220       230       240       250       260  
pF1KE4 DNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAHSTFSAMKANTMSNYTLLPP
         .::. ::..... .  ...:  :: . :. : :  .. :..: .:: : . ::: :: 
CCDS35 HPILFLYYEDMKENPKEEIKKIIRFLEKNLNDEILDRIIHHTSFEVMKDNPLVNYTHLPT
        190       200       210       220       230       240      

            270       280       290       300       310       320  
pF1KE4 SLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRGMPTFPWDEDPEEDGSPDPE
       ...:: .. :.:::. :::::.:::::.: ::  :. .:                     
CCDS35 TVMDHSKSPFMRKGTAGDWKNYFTVAQNEKFDAIYETEMSKTALQFRTEI          
        250       260       270       280       290                

            330       340       350       360     
pF1KE4 PSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPRPS




365 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 02:08:26 2016 done: Sun Nov  6 02:08:26 2016
 Total Scan time:  3.160 Total Display time:  0.030

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com