Result of FASTA (ccds) for pF1KE2728
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE2728, 643 aa
  1>>>pF1KE2728     643 - 643 aa - 643 aa
Library: human.CCDS.faa
  18921897 residues in 33420 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.8943+/-0.000892; mu= 16.3493+/- 0.053
 mean_var=76.6212+/-15.843, 0's: 0 Z-trim(106.4): 29  B-trim: 0 in 0/49
 Lambda= 0.146521
 statistics sampled from 9074 (9096) to 9074 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.627), E-opt: 0.2 (0.272), width:  16
 Scan time:  1.800

The best scores are:                                      opt bits E(33420)
CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19        ( 643) 4233 904.6       0
CCDS9080.1 SLC5A8 gene_id:160728|Hs109|chr12       ( 610) 1953 422.7 7.6e-118
CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11      ( 618) 1692 367.5 3.1e-101
CCDS1740.1 SLC5A6 gene_id:8884|Hs109|chr2          ( 635) 1423 310.7 4.2e-84
CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16     ( 675)  305 74.3 6.1e-13
CCDS2074.1 SLC5A7 gene_id:60482|Hs109|chr2         ( 580)  302 73.7 8.3e-13
CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22        ( 659)  300 73.3 1.2e-12
CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16        ( 672)  297 72.6   2e-12
CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22        ( 664)  286 70.3 9.7e-12


>>CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19             (643 aa)
 initn: 4233 init1: 4233 opt: 4233  Z-score: 4833.8  bits: 904.6 E(33420):    0
Smith-Waterman score: 4233; 100.0% identity (100.0% similar) in 643 aa overlap (1-643:1-643)

               10        20        30        40        50        60
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
              550       560       570       580       590       600

              610       620       630       640   
pF1KE2 PPGFLPTNEDRLFFLGQKELEGAGSWTPCVGHDGGRDQQETNL
       :::::::::::::::::::::::::::::::::::::::::::
CCDS12 PPGFLPTNEDRLFFLGQKELEGAGSWTPCVGHDGGRDQQETNL
              610       620       630       640   

>>CCDS9080.1 SLC5A8 gene_id:160728|Hs109|chr12            (610 aa)
 initn: 1712 init1: 1633 opt: 1953  Z-score: 2229.4  bits: 422.7 E(33420): 7.6e-118
Smith-Waterman score: 1953; 51.8% identity (81.1% similar) in 550 aa overlap (11-560:9-552)

               10        20        30        40        50        60
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
                 :: .::: ::: ::..:..::.. ..: :::....::. ::::..:.::.
CCDS90   MDTPRGIGTFVVWDYVVFAGMLVISAAIGIYYAFAGGGQQTSKDFLMGGRRMTAVPVA
                 10        20        30        40        50        

               70        80        90       100       110       120
pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
       :::.::::::: :::.:::.::.:  :  . .  ..  :..: .:.::::.::.::::::
CCDS90 LSLTASFMSAVTVLGTPSEVYRFGAIFSIFAFTYFFVVVISAEVFLPVFYKLGITSTYEY
       60        70        80        90       100       110        

              130       140       150       160       170       180
pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
       ::.::.. ::::::. .:: :.:::::::::::: ::::::.:.:.....::..:::: .
CCDS90 LELRFNKCVRLCGTVLFIVQTILYTGIVIYAPALALNQVTGFDLWGAVVATGVVCTFYCT
      120       130       140       150       160       170        

              190       200       210       220       230       240
pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
       .::.:::.::::::: .:..::  :. ..:.. ::   .:. : . .:.:. .:::.: .
CCDS90 LGGLKAVIWTDVFQVGIMVAGFASVIIQAVVMQGGISTILNDAYDGGRLNFWNFNPNPLQ
      180       190       200       210       220       230        

              250       260       270       280       290       300
pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
       :.::::...:::..: :.:::::.:::::..:... ::::.: :: :::. :.. .. ::
CCDS90 RHTFWTIIIGGTFTWTSIYGVNQSQVQRYISCKSRFQAKLSLYINLVGLWAILTCSVFCG
      240       250       260       270       280       290        

              310       320       330       340       350       360
pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
       ....  : ::::    ..::::: :: :::::..: ::.::::.::::::::::.:.:::
CCDS90 LALYSRYHDCDPWTAKKVSAPDQLMPYLVLDILQDYPGLPGLFVACAYSGTLSTVSSSIN
      300       310       320       330       340       350        

              370       380       390       400       410       420
pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
       :.::::::::::: .:::. :.:  ::.:.:..::. :. .:::.::.:. .::....:.
CCDS90 ALAAVTVEDLIKPYFRSLSERSLSWISQGMSVVYGALCIGMAALASLMGA-LLQAALSVF
      360       370       380       390       400        410       

              430       440       450       460       470       480
pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
       :...:::.: : ::...:  :. :.:.:: ::.:.::::..:: .:::  .    :  . 
CCDS90 GMVGGPLMGLFALGILVPFANSIGALVGLMAGFAISLWVGIGAQIYPPLPERTLPLHLDI
       420       430       440       450       460       470       

              490       500       510       520       530       540
pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
         : . . : ..:.  . .: . :       ....:  : :..:..::::....:::.:.
CCDS90 QGCNS-TYNETNLMTTTEMPFTTSVFQI---YNVQRTPLMDNWYSLSYLYFSTVGTLVTL
       480        490       500          510       520       530   

              550       560       570       580       590       600
pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
       : : :.:  ::  :.. : :                                        
CCDS90 LVGILVSLSTGGRKQN-LDPRYILTKEDFLSNFDIFKKKKHVLSYKSHPVEDGGTDNPAF
           540        550       560       570       580       590  

>>CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11           (618 aa)
 initn: 1620 init1: 1463 opt: 1692  Z-score: 1931.2  bits: 367.5 E(33420): 3.1e-101
Smith-Waterman score: 1802; 48.4% identity (77.2% similar) in 556 aa overlap (8-563:2-539)

               10        20        30        40        50        60
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
              :  .:..::: ::: ....:.:::.. .. .  . ....:..:::...  :::
CCDS78       MEVKNFAVWDYVVFAALFFISSGIGVFFAIKERKKATSREFLVGGRQMSFGPVG
                     10        20        30        40        50    

               70        80        90       100       110       120
pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
       :::.::::::: :::.:::.::.: .:: . .. :.  .::. ::.::::: :.::::::
CCDS78 LSLTASFMSAVTVLGTPSEVYRFGASFLVFFIAYLFVILLTSELFLPVFYRSGITSTYEY
           60        70        80        90       100       110    

              130       140       150       160       170       180
pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
       :..::.. ::  .:. ::: :.::::.:.::::: ::::::.:.:.:...:::.:::: .
CCDS78 LQLRFNKPVRYAATVIYIVQTILYTGVVVYAPALALNQVTGFDLWGSVFATGIVCTFYCT
          120       130       140       150       160       170    

              190       200       210       220       230       240
pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
       .::.:::::::.::.:::. :: .:: .:   .:: ..::  . : ::....::. ::  
CCDS78 LGGLKAVVWTDAFQMVVMIVGFLTVLIQGSTHAGGFHNVLEQSTNGSRLHIFDFDVDPLR
          180       190       200       210       220       230    

              250       260       270       280       290       300
pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
       :.::::..::::..::..:::::. .:: ..:.:::.::::: .: .::..:.  :.  :
CCDS78 RHTFWTITVGGTFTWLGIYGVNQSTIQRCISCKTEKHAKLALYFNLLGLWIILVCAVFSG
          240       250       260       270       280       290    

              310       320       330       340       350       360
pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
       ..:.  . ::::   : :::::: :: .:..::  .::.::::.:::.::::::...:::
CCDS78 LIMYSHFKDCDPWTSGIISAPDQLMPYFVMEIFATMPGLPGLFVACAFSGTLSTVASSIN
          300       310       320       330       340       350    

              370       380       390       400       410       420
pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
       :.:.:: ::..:  .  :. .  . ::::: :..:  : ..:. .:..:: :.:.:... 
CCDS78 ALATVTFEDFVKSCFPHLSDKLSTWISKGLCLLFGVMCTSMAVAASVMGG-VVQASLSIH
          360       370       380       390       400        410   

              430       440       450       460       470       480
pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
       :. .::.:: : ::. .:  :  :.:.:: .:..::.:::.:: .::   .    :: :.
CCDS78 GMCGGPMLGLFSLGIVFPFVNWKGALGGLLTGITLSFWVAIGAFIYPAPASKTWPLPLST
           420       430       440       450       460       470   

              490       500       510       520       530       540
pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
        .:.  .:.:.:   : .:              .:::..::..:.::::::.:.: :  .
CCDS78 DQCIKSNVTATG---PPVL--------------SSRPGIADTWYSISYLYYSAVGCLGCI
           480                        490       500       510      

              550       560       570       580       590       600
pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
       . :..:: .::  .   . : :.                                     
CCDS78 VAGVIISLITGRQRGEDIQPLLIRPVCNLFCFWSKKYKTLCWCGVQHDSGTEQENLENGS
        520       530       540       550       560       570      

>>CCDS1740.1 SLC5A6 gene_id:8884|Hs109|chr2               (635 aa)
 initn: 1494 init1: 1209 opt: 1423  Z-score: 1623.7  bits: 310.7 E(33420): 4.2e-84
Smith-Waterman score: 1499; 40.6% identity (70.2% similar) in 630 aa overlap (11-630:23-629)

                           10        20        30         40       
pF1KE2             MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARG-GQRSAEDF
                             ::.  :: ::.:.:..: .:::. .  :: :.... ..
CCDS17 MSVGVSTSAPLSPTSGTSVGMSTFSIMDYVVFVLLLVLSLAIGLYHA-CRGWGRHTVGEL
               10        20        30        40         50         

        50        60        70        80        90       100       
pF1KE2 FTGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMP
       . . :... :::.::: :.:.::: .:::::: ::.: .. ..    .:. .. : .:.:
CCDS17 LMADRKMGCLPVALSLLATFQSAVAILGVPSEIYRFGTQYWFLGCCYFLGLLIPAHIFIP
      60        70        80        90       100       110         

       110       120       130       140       150       160       
pF1KE2 VFYRLGLTSTYEYLEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWAS
       ::::: :::.:::::.::...::.:::. .:   ..: :.:.:::.: :: :::.:.: :
CCDS17 VFYRLHLTSAYEYLELRFNKTVRVCGTVTFIFQMVIYMGVVLYAPSLALNAVTGFDLWLS
     120       130       140       150       160       170         

       170       180       190       200       210       220       
pF1KE2 LLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHS
       .:. ::.:: :::.::.:::.::::::..::. :  .:.  :   :::  .: ..:..:.
CCDS17 VLALGIVCTVYTALGGLKAVIWTDVFQTLVMFLGQLAVIIVGSAKVGGLGRVWAVASQHG
     180       190       200       210       220       230         

       230       240       250       260       270       280       
pF1KE2 RINLMDFNPDPRSRYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQV
       ::. ....:::  :.::::.. ::... ::.:::::::::::.. :::: : :.     :
CCDS17 RISGFELDPDPFVRHTFWTLAFGGVFMMLSLYGVNQAQVQRYLSSRTEKAAVLSCY--AV
     240       250       260       270       280       290         

       290         300       310        320       330       340    
pF1KE2 GLFLIVSSAACC--GIVMFVFYTDCDPLLLGRI-SAPDQYMPLLVLDIFEDLPGVPGLFL
         :  ::  . :  :.:::..: .  :. . .  .::::..  .:.:... :::.::::.
CCDS17 FPFQQVSLCVGCLIGLVMFAYYQEY-PMSIQQAQAAPDQFVLYFVMDLLKGLPGLPGLFI
       300       310       320        330       340       350      

          350       360       370       380       390       400    
pF1KE2 ACAYSGTLSTASTSINAMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAAL
       :: .::.::: :...:..:.::.::::.: .  ..  . ...:.::.. ::  :: .: .
CCDS17 ACLFSGSLSTISSAFNSLATVTMEDLIRPWFPEFSEARAIMLSRGLAFGYGLLCLGMAYI
        360       370       380       390       400       410      

          410       420       430       440       450       460    
pF1KE2 SSLLGGGVLQGSFTVMGVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGAT
       :: .:  :::......:...::::: : ::::.:  : ::...:: :::....:...:. 
CCDS17 SSQMGP-VLQAAISIFGMVGGPLLGLFCLGMFFPCANPPGAVVGLLAGLVMAFWIGIGSI
        420        430       440       450       460       470     

          470       480       490       500       510       520    
pF1KE2 LYPPSEQTMRVLPSSAARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFY
       .   . .    .: : .   ..:      :   :  :. ..  : . .  :.:.  . ::
CCDS17 VTSMGSS----MPPSPSNGSSFS------LPTNLTVATVTTLMPLTTF--SKPTGLQRFY
         480           490             500       510         520   

          530       540       550       560       570       580    
pF1KE2 AISYLYYGALGTLTTVLCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILD
       ..:::.:.: .. :... : ..: :::  .  .: :. ..  : .   :. :      : 
CCDS17 SLSYLWYSAHNSTTVIVVGLIVSLLTGRMRGRSLNPATIYPVLPKLL-SLLPLSCQKRLH
           530       540       550       560       570        580  

          590         600        610       620          630        
pF1KE2 DNLVKGPEELPTG--NKKP-PGFLPTNEDRLFFLGQKELEGA---GSWTPCVGHDGGRDQ
            : ..: ::   .::  : :  ..:.        :.:.   :: . :.        
CCDS17 CRSY-GQDHLDTGLFPEKPRNGVLGDSRDK----EAMALDGTAYQGSSSTCILQETSL  
             590       600       610           620       630       

      640   
pF1KE2 QETNL

>>CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16          (675 aa)
 initn: 424 init1: 145 opt: 305  Z-score: 346.0  bits: 74.3 E(33420): 6.1e-13
Smith-Waterman score: 460; 25.4% identity (58.8% similar) in 476 aa overlap (16-457:28-492)

                           10        20        30        40        
pF1KE2             MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFF
                                  : .:..:..:   ..::: . ..  . ... .:
CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLW-STVKTKRDTVKGYF
               10        20        30        40         50         

       50        60        70        80        90       100        
pF1KE2 TGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPV
        .:  ..  ::: :: :: ... . .:. . .   :..   . :. :.. .. : .:.:.
CCDS10 LAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPI
      60        70        80        90       100       110         

      110       120         130       140       150       160      
pF1KE2 FYRLGLTSTYEYLEMRFS--RAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWA
       .    .:.  :::. ::.  :   . ..:  ..  .   .. .:: :....:   ::.. 
CCDS10 YIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYL
     120       130       140       150       160       170         

        170       180       190       200       210            220 
pF1KE2 SLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGG-----PRQVLT
       ....   : . ::..::. ::..::..:...:: :  .... .   :::      .  :.
CCDS10 AIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLA
     180       190       200       210       220       230         

                     230       240        250       260       270  
pF1KE2 LAQNHS--------RINLMDFNPDPRSRYTFWTFVV-GGTLVWLSMYGVNQAQVQRYVAC
       ::.:.:        : . . .  :: .    :  :. : ..  : .. ..:. ::: .: 
CCDS10 LASNRSENSSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVIVQRTLAA
     240       250       260       270       280       290         

                280       290       300          310         320   
pF1KE2 RTEKQAK----LALLINQVGLFLIVSSAACCGIVMFVFYTD---C-DPLLLGRI-SAP--
       .. ..::    .:  .. . ::..:      :.:  ... :   : :: .  .: : :  
CCDS10 KNLSHAKGGALMAAYLKVLPLFIMVFP----GMVSRILFPDQVACADPEICQKICSNPSG
     300       310       320           330       340       350     

               330        340       350       360       370        
pF1KE2 --DQYMPLLVLDIFEDLP-GVPGLFLACAYSGTLSTASTSINAMAAVTVEDL---IKPRL
         :  .: :::..   :: :. ::..:   .. .:. .. .:. ... . ::   ..:: 
CCDS10 CSDIAYPKLVLEL---LPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRA
         360          370       380       390       400       410  

         380       390        400       410       420       430    
pF1KE2 RSLAPRKLVIISKGLSLIYG-SACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILG
          . ..:.:... . :.    . : . ....  :: ..    .. . .. :.  .::.:
CCDS10 ---SEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMG
               420       430       440       450       460         

          440       450       460       470       480       490    
pF1KE2 MFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLL
        :    :  :.. :: .:: :.:                                     
CCDS10 CFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILS
     470       480       490       500       510       520         

>>CCDS2074.1 SLC5A7 gene_id:60482|Hs109|chr2              (580 aa)
 initn: 122 init1:  93 opt: 302  Z-score: 343.6  bits: 73.7 E(33420): 8.3e-13
Smith-Waterman score: 307; 22.0% identity (54.7% similar) in 464 aa overlap (19-457:13-447)

               10        20        30        40            50      
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAED----FFTGGRRLAA
                         :: :..:.   .:.:..    .. :::.    ...::: .. 
CCDS20       MAFHVEGLIAIIVFYLLILL---VGIWAAWRTKNSGSAEERSEAIIVGGRDIGL
                     10        20           30        40        50 

         60        70        80          90       100       110    
pF1KE2 LPVGLSLSASFMSAVQVLGVPSEAYR--YGLKFLWMCLGQLLNSVLTALLFMPVFYRLGL
       :  :....:.....  . :.   .:   ::: .    .:  :. .: .:.:   .   : 
CCDS20 LVGGFTMTATWVGGGYINGTAEAVYVPGYGLAWAQAPIGYSLSLILGGLFFAKPMRSKGY
              60        70        80        90       100       110 

          120       130         140       150       160       170  
pF1KE2 TSTYEYLEMRFSRAVRLCGTL--QYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTG
       ..  . ... ...  :. : :    ... :.... .. : .  .. .  .:.  :.. ..
CCDS20 VTMLDPFQQIYGK--RMGGLLFIPALMGEMFWAAAIFSALGATISVIIDVDMHISVIISA
             120         130       140       150       160         

            180       190       200       210       220       230  
pF1KE2 IICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLM
       .: :.:: :::. .:..::: :.  .. :.:. .         :     .: .:  .  .
CCDS20 LIATLYTLVGGLYSVAYTDVVQLFCIFVGLWISV---------P-----FALSHPAVADI
     170       180       190       200                     210     

            240       250               260        270       280   
pF1KE2 DFNPDPRSRYTFWTFVVGGTLV--WLSMY------GVN-QAQVQRYVACRTEKQAKLALL
        :.    .    :  .: .. :  ::. .      :.  ::  :: ..  .   :..  .
CCDS20 GFTAVHAKYQKPWLGTVDSSEVYSWLDSFLLLMLGGIPWQAYFQRVLSSSSATYAQVLSF
         220       230       240       250       260       270     

           290       300       310       320             330       
pF1KE2 INQVGLFLIVSSAACCGIVMFVFYTDCDPLLLGRISAP------DQYMPLLVLDIFEDLP
       .   : ....  :   : .     :: .    : .  :      :. .:. ::. .   :
CCDS20 LAAFGCLVMAIPAILIGAIGAS--TDWNQTAYG-LPDPKTTEEADMILPI-VLQYL--CP
         280       290         300        310       320            

       340        350       360       370       380        390     
pF1KE2 GVPGLF-LACAYSGTLSTASTSINAMAAVTVEDLIKPRLRSLAPRKLVI-ISKGLSLIYG
          ..: :. . ....:.:..:: . ... .... .  .:. :  : .. . .   ...:
CCDS20 VYISFFGLGAVSAAVMSSADSSILSASSMFARNIYQLSFRQNASDKEIVWVMRITVFVFG
     330       340       350       360       370       380         

         400       410       420       430       440       450     
pF1KE2 SACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILGMFLPACNTPGVLAGLGAGLAL
       ..  ..: :.. . :    .:  :. ::   :: .    .:. . :: :..::  .:: :
CCDS20 ASATAMALLTKTVYGLWYLSSDLVYIVIFPQLLCV----LFVKGTNTYGAVAGYVSGLFL
     390       400       410       420           430       440     

         460       470       480       490       500       510     
pF1KE2 SLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLLDPALLPANDSSRAPSSGMDAS
        .                                                          
CCDS20 RITGGEPYLYLQPLIFYPGYYPDDNGIYNQKFPFKTLAMVTSFLTNICISYLAKYLFESG
         450       460       470       480       490       500     

>>CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22             (659 aa)
 initn: 345 init1: 143 opt: 300  Z-score: 340.5  bits: 73.3 E(33420): 1.2e-12
Smith-Waterman score: 421; 22.7% identity (56.0% similar) in 498 aa overlap (5-457:12-497)

                      10             20        30        40        
pF1KE2        MEAVETGERPTFG-----AWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFF
                  :: : : ..     : : .:.....::  ..:::. : . .. .   ::
CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAML-KTNRGTIGGFF
               10        20        30        40         50         

       50        60        70        80           90       100     
pF1KE2 TGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLK---FLWMCLGQLLNSVLTALLF
        .:: .:  :.: :: :: ... . .:. . .   :.    : :    .::   . . .:
CCDS13 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLL---ILGWIF
      60        70        80        90       100       110         

         110       120         130       140       150       160   
pF1KE2 MPVFYRLGLTSTYEYLEMRFS--RAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLD
       .:.. . :. .  :::. ::.  :     . :. .. ..:  .  :.: :.... . :::
CCDS13 VPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLD
        120       130       140       150       160       170      

           170       180       190       200       210       220   
pF1KE2 IWASLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLA
       .. ...    . . ::..::. .:..::..:...:: : ..... .   ::: ..     
CCDS13 LYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKY
        180       190       200       210       220       230      

                    230       240                250          260  
pF1KE2 QNHS---------RINLMDFNPDPRSRYTF---------WTFVVGG---TLVWLSMYGVN
        : .          :.   ..:   : . :         :  .. :   : .:  .. .:
CCDS13 VNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALW--YWCTN
        240       250       260       270       280         290    

            270       280           290       300                  
pF1KE2 QAQVQRYVACRTEKQAKLALLI----NQVGLFLIVSSAACCGIVMFVFYTD---------
       :. ::: .  .  ...: : ..    . . .::.:      :..  ..:::         
CCDS13 QVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMP----GMISRILYTDMVACVVPSE
          300       310       320       330           340       350

     310       320       330       340       350       360         
pF1KE2 CDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVED
       :       ..  .  .: .::... .  :. ::.:.   .. .:. .. .:. ... . :
CCDS13 CVKHCGVDVGCTNYAYPTMVLELMPQ--GLRGLMLSVMLASLMSSLTSIFNSASTLFTID
              360       370         380       390       400        

     370       380       390       400        410       420        
pF1KE2 LIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSL-LGGGVLQGSFTVMGVISGPLL
       :     .. . ..:.: .. . :.   . .. . : ..  .: ... . .. . .. :. 
CCDS13 LYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIA
      410       420       430       440       450       460        

      430       440       450       460       470       480        
pF1KE2 GAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSV
       ..:.:..:    :  :.. :: .:::..:                               
CCDS13 AVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLY
      470       480       490       500       510       520        

>>CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16             (672 aa)
 initn: 275 init1: 135 opt: 297  Z-score: 336.9  bits: 72.6 E(33420): 2e-12
Smith-Waterman score: 441; 25.1% identity (56.8% similar) in 505 aa overlap (2-457:3-497)

                10                20        30        40        50 
pF1KE2  MEAVETGERPTFGAW--------DYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGG
         : .:.:  : .::         :  :.: ..:.  :.::: .. : .. ..  .: .:
CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLW-SMCRTNRGTVGGYFLAG
               10        20        30        40         50         

              60        70        80        90       100       110 
pF1KE2 RRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYR
       : ..  ::: :: :: ... . .:. . .   ::    .  . :.  .: . :: ::.  
CCDS10 RSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLT
      60        70        80        90       100       110         

             120        130        140       150       160         
pF1KE2 LGLTSTYEYLEMRFS-RAVRL-CGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLL
        :. .  .::. ::. : .::  ..:. ..  .   .. ... :....:. : .:.::..
CCDS10 AGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVI
     120       130       140       150       160       170         

     170       180       190       200       210                   
pF1KE2 STGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQV----------
       .   :  .::..::. :...::. :. :.:.:  .... .   :::   .          
CCDS10 ALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATS
     180       190       200       210       220       230         

     220       230        240       250        260                 
pF1KE2 LTLAQNHSRINLMDFNPDPR-SRYTFWTFVVGGTLVWLSMY-GV----------NQAQVQ
       ::.... .  :. .:   :: . : .    : : : : ..  :.          .:. ::
CCDS10 LTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQ
     240       250       260       270       280       290         

       270           280       290       300                310    
pF1KE2 RYVACRTEKQAK----LALLINQVGLFLIVSSAACCGIVMFVFYTD---------CDPLL
       : .: ..  . :    :   .. . .::.:      :..  ..: :         :  . 
CCDS10 RCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP----GMISRILYPDEVACVVPEVCRRVC
     300       310       320       330           340       350     

          320       330       340       350       360       370    
pF1KE2 LGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVEDLIKPR
         ...  .  .: ::. .. .  :. ::.::   .. .:. .. .:. ... . : :  :
CCDS10 GTEVGCSNIAYPRLVVKLMPN--GLRGLMLAVMLAALMSSLASIFNSSSTLFTMD-IYTR
         360       370         380       390       400        410  

           380       390       400          410       420       430
pF1KE2 LRSLA-PRKLVIISKGLSLIYGSACLTVAAL---SSLLGGGVLQGSFTVMGVISGPLLGA
       ::  :  :.:..... : ...  . ..:: :   ..  :: ...   .: . .. :. ..
CCDS10 LRPRAGDRELLLVGR-LWVVF-IVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAV
            420        430        440       450       460       470

              440       450       460       470       480       490
pF1KE2 FILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNA
       :.:..:.:  :  :.. :: .:: ..:                                 
CCDS10 FVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFA
              480       490       500       510       520       530

>>CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22             (664 aa)
 initn: 292 init1: 144 opt: 286  Z-score: 324.4  bits: 70.3 E(33420): 9.7e-12
Smith-Waterman score: 414; 22.2% identity (58.9% similar) in 487 aa overlap (4-457:17-497)

                            10        20        30        40       
pF1KE2              MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDF
                       ::: :    .: : ........:  ..:::. .. . . ..  :
CCDS13 MDSSTWSPKTTAVTRPVETHEL-IRNAADISIIVIYFVVVMAVGLWAMFSTN-RGTVGGF
               10        20         30        40        50         

        50        60        70        80        90       100       
pF1KE2 FTGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMP
       : .:: ..  :.: :: :: ... . .:. . .   :. .  .  . :.  :. . ::.:
CCDS13 FLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVP
       60        70        80        90       100       110        

       110       120        130       140         150       160    
pF1KE2 VFYRLGLTSTYEYLEMRFS-RAVRLCGTLQYIVATMLYTGIV--IYAPALILNQVTGLDI
       .. . :...  :::. ::. . ...  .:  ..  ...: :   :.. :...: . ::..
CCDS13 IYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLL-LYIFTKISADIFSGAIFINLALGLNL
      120       130       140       150        160       170       

          170       180       190       200       210              
pF1KE2 WASLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGP--------
       . ...    : ..:: .::. ::..::..:.:.:: :  .. . .   :::         
CCDS13 YLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYM
       180       190       200       210       220       230       

        220        230       240                 250       260     
pF1KE2 RQVLTLAQN-HSRINLMDFNPDPRSRYTF---------WT-FVVGGTLVWLSMYGVNQAQ
       . . :.... .. ..   ..:   : . :         :  :. : ... : .. ..:. 
CCDS13 KAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVI
       240       250       260       270       280       290       

         270           280       290       300            310      
pF1KE2 VQRYVACRTEKQAK----LALLINQVGLFLIVSSAACCGI-----VMFVFYTDCDPLLLG
       ::: .. .. ...:    :   .. . .:..:  .    :     .  :  ..:.     
CCDS13 VQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGT
       300       310       320       330       340       350       

        320       330       340       350       360       370      
pF1KE2 RISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVEDLIKPRLR
       ...  .  .: ::.... .  :. ::.:.   .. .:. .. .:. ... . : :  ..:
CCDS13 KVGCTNIAYPTLVVELMPN--GLRGLMLSVMLASLMSSLTSIFNSASTLFTMD-IYAKVR
       360       370         380       390       400        410    

        380       390         400       410       420       430    
pF1KE2 SLAPRKLVIISKGLSLIY--GSACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILG
       . : .: ..:.  : ..   : .   :  ..:  .: ...   .. . .. :. ..:.:.
CCDS13 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA
          420       430       440       450       460       470    

          440       450       460       470       480       490    
pF1KE2 MFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLL
       .:    : ::.. ::  :: ...                                     
CCDS13 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF
          480       490       500       510       520       530    




643 residues in 1 query   sequences
18921897 residues in 33420 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Tue Jul  3 15:00:17 2018 done: Tue Jul  3 15:00:18 2018
 Total Scan time:  1.800 Total Display time:  0.150

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com