Result of FASTA (ccds) for pFN21AE0360
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE0360, 659 aa
  1>>>pF1KE0360 659 - 659 aa - 659 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 4.9732+/-0.0009; mu= 21.0885+/- 0.055
 mean_var=65.5911+/-13.410, 0's: 0 Z-trim(105.3): 30  B-trim: 453 in 1/50
 Lambda= 0.158362
 statistics sampled from 8311 (8336) to 8311 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.614), E-opt: 0.2 (0.256), width:  16
 Scan time:  2.830

The best scores are:                                      opt bits E(32554)
CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22        ( 659) 4343 1001.6       0
CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22        ( 664) 3222 745.5 5.6e-215
CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22        ( 537) 2617 607.2 1.9e-173
CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16        ( 672) 2483 576.6 3.8e-164
CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1       ( 681) 2183 508.1 1.6e-143
CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16     ( 675) 2131 496.2 6.1e-140
CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17     ( 596) 2019 470.6 2.8e-132
CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16     ( 611) 1957 456.4 5.3e-128
CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21        ( 718) 1933 451.0 2.7e-126
CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1       ( 706) 1826 426.5  6e-119
CCDS58438.1 SLC5A11 gene_id:115584|Hs108|chr16     ( 605) 1596 373.9 3.5e-103
CCDS58437.1 SLC5A11 gene_id:115584|Hs108|chr16     ( 640) 1576 369.4 8.7e-102
CCDS59278.1 SLC5A10 gene_id:125206|Hs108|chr17     ( 569) 1276 300.8 3.4e-81
CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17     ( 560) 1208 285.3 1.6e-76
CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17     ( 612) 1207 285.1   2e-76
CCDS58440.1 SLC5A11 gene_id:115584|Hs108|chr16     ( 519)  656 159.1 1.4e-38
CCDS74008.1 SLC5A10 gene_id:125206|Hs108|chr17     ( 566)  511 126.0 1.4e-28
CCDS7860.2 SLC5A12 gene_id:159963|Hs108|chr11      ( 618)  307 79.5 1.6e-14
CCDS12368.1 SLC5A5 gene_id:6528|Hs108|chr19        ( 643)  300 77.9   5e-14
CCDS1740.1 SLC5A6 gene_id:8884|Hs108|chr2          ( 635)  277 72.6 1.9e-12
CCDS2074.1 SLC5A7 gene_id:60482|Hs108|chr2         ( 580)  258 68.2 3.6e-11


>>CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22             (659 aa)
 initn: 4343 init1: 4343 opt: 4343  Z-score: 5357.2  bits: 1001.6 E(32554):    0
Smith-Waterman score: 4343; 100.0% identity (100.0% similar) in 659 aa overlap (1-659:1-659)

               10        20        30        40        50        60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE0 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE0 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE0 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE0 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KE0 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KE0 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK
              550       560       570       580       590       600

              610       620       630       640       650         
pF1KE0 KAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
              610       620       630       640       650         

>>CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22             (664 aa)
 initn: 3266 init1: 2919 opt: 3222  Z-score: 3973.0  bits: 745.5 E(32554): 5.6e-215
Smith-Waterman score: 3222; 70.4% identity (89.9% similar) in 663 aa overlap (2-659:3-664)

                10        20        30        40        50         
pF1KE0  MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFF
         .:: ::.: : : .:    . ::::::::.:::::.::::::::::..:::::.::::
CCDS13 MDSSTWSPKTTAVT-RPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF
               10         20        30        40        50         

      60        70        80        90       100       110         
pF1KE0 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPI
       ::::.:.:::.:::::::::::.:.:::::::::::.:   :::.. :....:::.::::
CCDS13 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI
      60        70        80        90       100       110         

     120       130       140       150       160       170         
pF1KE0 YIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYL
       :::.::.::::::.:::::.:.:::::.:::.. .   ::::::.:::::.:::::.:::
CCDS13 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL
     120       130       140       150       160       170         

     180       190       200       210       220       230         
pF1KE0 AIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNA
       :::.:::.::.:: :::::.:::::::::.:::.::.:: ::::.:::::..: :::..:
CCDS13 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA
     180       190       200       210       220       230         

     240       250       260       270       280       290         
pF1KE0 TPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQ
        :..:   : :.. .:::::::::::::: .:::.::::.:::: : .::::::.:::::
CCDS13 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ
     240       250       260       270       280       290         

     300       310       320       330       340       350         
pF1KE0 RCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDV
       ::: .:.:::::..::.:.::::.:::.:::::::::::::. .:::::::: :.::. :
CCDS13 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV
     300       310       320       330       340       350         

     360       370       380       390       400       410         
pF1KE0 GCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASE
       :::: ::::.:.::::.::::::::::::::::::::::::::::::.:.:.:.::.:::
CCDS13 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE
     360       370       380       390       400       410         

     420       430       440       450       460       470         
pF1KE0 KELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKR
       :::.::::.:.:.:  .::.:::.:: .:.:::. : .::.:::::::::::.:::: ::
CCDS13 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR
     420       430       440       450       460       470         

     480       490       500       510       520       530         
pF1KE0 VNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSML
       ::: ::::::..:: .:. :::::::::::::. ::::: ::::::::::.:.::  :..
CCDS13 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI
     480       490       500       510       520       530         

     540       550       560       570       580          590      
pF1KE0 VTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDG---VEEDYPEKSR
       . . :::::::::::::::::: :::: :::::.::::.. .:       .: . :::..
CCDS13 TIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKK
     540       550       560       570       580       590         

        600        610        620       630       640       650    
pF1KE0 GCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFI
       : ...:::::::: :.: ::.:.:::.:.. :.:::::.: :::..:.:.:.:..:.:: 
CCDS13 GIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFC
     600       610       620       630       640       650         

            
pF1KE0 HGYYA
       :.:.:
CCDS13 HAYFA
     660    

>>CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22             (537 aa)
 initn: 2686 init1: 2339 opt: 2617  Z-score: 3227.3  bits: 607.2 E(32554): 1.9e-173
Smith-Waterman score: 2617; 70.4% identity (89.9% similar) in 537 aa overlap (128-659:1-537)

       100       110       120       130       140       150       
pF1KE0 TVTFEWTSSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLL
                                     :::::.:::::.:.:::::.:::.. .   
CCDS58                               MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK
                                             10        20        30

       160       170       180       190       200       210       
pF1KE0 ISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFI
       ::::::.:::::.:::::.::::::.:::.::.:: :::::.:::::::::.:::.::.:
CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI
               40        50        60        70        80        90

       220       230       240       250       260       270       
pF1KE0 LMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWP
       : ::::.:::::..: :::..: :..:   : :.. .:::::::::::::: .:::.:::
CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP
              100       110       120       130       140       150

       280       290       300       310       320       330       
pF1KE0 GIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRI
       :.:::: : .::::::.:::::::: .:.:::::..::.:.::::.:::.::::::::::
CCDS58 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI
              160       170       180       190       200       210

       340       350       360       370       380       390       
pF1KE0 LYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSI
       :::. .:::::::: :.::. ::::: ::::.:.::::.:::::::::::::::::::::
CCDS58 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI
              220       230       240       250       260       270

       400       410       420       430       440       450       
pF1KE0 FNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTE
       :::::::::.:.:.:.::.::::::.::::.:.:.:  .::.:::.:: .:.:::. : .
CCDS58 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ
              280       290       300       310       320       330

       460       470       480       490       500       510       
pF1KE0 SISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNC
       ::.:::::::::::.:::: ::::: ::::::..:: .:. :::::::::::::. ::::
CCDS58 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC
              340       350       360       370       380       390

       520       530       540       550       560       570       
pF1KE0 PKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEE
       : ::::::::::.:.::  :... . :::::::::::::::::: :::: :::::.::::
CCDS58 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE
              400       410       420       430       440       450

       580          590       600        610        620       630  
pF1KE0 KSQEETDDG---VEEDYPEKSRGCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSE
       .. .:       .: . :::..: ...:::::::: :.: ::.:.:::.:.. :.:::::
CCDS58 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE
              460       470       480       490       500       510

            640       650         
pF1KE0 RPSWRTIVNINAILLLAVVVFIHGYYA
       .: :::..:.:.:.:..:.:: :.:.:
CCDS58 KPLWRTVLNVNGIILVTVAVFCHAYFA
              520       530       

>>CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16             (672 aa)
 initn: 2666 init1: 1531 opt: 2483  Z-score: 3060.5  bits: 576.6 E(32554): 3.8e-164
Smith-Waterman score: 2641; 56.5% identity (83.4% similar) in 662 aa overlap (14-659:11-672)

               10        20        30        40        50        60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
                    ::    .  : : ::: ::. :::.:..::::.: .:::::.::.::
CCDS10    MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL
                  10        20        30        40        50       

               70        80        90       100       110       120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
       :::.:.:::.:::::::::::.:.:::::::::::.:.. :::..  ..:.:::.:.:.:
CCDS10 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY
        60        70        80        90       100       110       

              130       140       150       160       170       180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
       . .::.:::.::.:::::.:...:::.::::. .   ::.:.:.::.::. ::: ..: .
CCDS10 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS
       120       130       140       150       160       170       

              190       200       210       220       230       240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
       .. ::..: .::.:::::...::::.::...: :. ::::.::.::::: .. .::..:.
CCDS10 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA
       180       190       200       210       220       230       

              250          260       270       280       290       
pF1KE0 PSVVEGDNLT---ISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVI
        :.. ... .   ::. :: :: ::.:..:  ::::.:::....:. :.. ::::..:::
CCDS10 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI
       240       250       260       270       280       290       

       300       310       320       330       340       350       
pF1KE0 VQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGV
       ::::: ::...:.::.::.:.:::: :::::::::::::::: : ::::::  : . ::.
CCDS10 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT
       300       310       320       330       340       350       

       360       370       380       390       400       410       
pF1KE0 DVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQA
       .:::.: ::: .:..:::.:::::::.::::.:::::.:::::.:::::.:.::..: .:
CCDS10 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA
       360       370       380       390       400       410       

       420       430       440       450       460       470       
pF1KE0 SEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFC
       ...:::..::..:....:::..:.:.::..:.:::. : ...::::.::..::::::.: 
CCDS10 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV
       420       430       440       450       460       470       

       480       490       500       510       520       530       
pF1KE0 KRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGS
        :::::::::::. :: ::: :.: ::..:.:::. :: :: ..::::::::.::::: :
CCDS10 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS
       480       490       500       510       520       530       

       540       550       560       570         580            590
pF1KE0 MLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEK--SQEETDDG-----VEED
        :.:: .:: : :::  ::.:: . ::.: ::: :.::.:.  :.  ...:     .: .
CCDS10 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMN
       540       550       560       570       580       590       

               600       610            620       630       640    
pF1KE0 YPEKSRGCL-KKAYDLFCGLQKG-----PKLTKEEEEALSKKLTDTSERPSWRTIVNINA
        :.     : ..    :::...:     : ::.::  : ...: : :: :::  .::.::
CCDS10 EPQAPAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNA
       600       610       620       630       640       650       

          650         
pF1KE0 ILLLAVVVFIHGYYA
       .:..::.::. :.::
CCDS10 LLMMAVAVFLWGFYA
       660       670  

>>CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1            (681 aa)
 initn: 2336 init1: 1279 opt: 2183  Z-score: 2690.0  bits: 508.1 E(32554): 1.6e-143
Smith-Waterman score: 2337; 51.8% identity (79.7% similar) in 654 aa overlap (25-659:34-681)

                     10        20        30        40        50    
pF1KE0       MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGT
                                     .: ::::.::::. :.:::.:. ....:::
CCDS30 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT
            10        20        30        40        50        60   

           60        70        80        90       100       110    
pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGW
       :::.:::::.:.:::.::::..::.::. ..::::::::.:.:.  :::... .:: :::
CCDS30 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLALGW
            70        80        90       100       110       120   

          120       130       140       150       160       170    
pF1KE0 IFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALG
       .:::.:: .::.:::.::::::::.:.:::.:.:::.. .   ::.:::.::.::..:::
CCDS30 VFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQMALG
           130       140       150       160       170       180   

          180       190       200       210       220       230    
pF1KE0 LDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTE
        .:::.  :::..::::: .::: .:::::.:::.::. :...:: ..:..:: : .. .
CCDS30 WNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPGLEQ
           190       200       210       220       230       240   

          240       250        260       270       280       290   
pF1KE0 KYVNATPSVVEGDNLTI-SASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCT
       .: .: :      :.:. ...:. :: :.:::.:: :.:::::::.:::. . : : :::
CCDS30 RYRQAIP------NVTVPNTTCHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLATWCWCT
           250             260       270       280       290       

           300       310       320       330       340       350   
pF1KE0 NQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVK
       .:::::: : .:..::.:.. .. .:::.::::..:::::::: :. : :.:: :. : .
CCDS30 DQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDPDVCQR
       300       310       320       330       340       350       

           360       370       380       390       400       410   
pF1KE0 HCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKM
        ::. :::.: ::: .:. ::: ::::::..:..:.:::::::::::.:::::::.. ..
CCDS30 ICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTIDVWQRF
       360       370       380       390       400       410       

           420       430       440       450       460       470   
pF1KE0 RKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVL
       :....:.::...::.::..:.:.::.:.:..: :..:::. : ....:::.:::.:.:.:
CCDS30 RRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPITALFLL
       420       430       440       450       460       470       

           480       490       500       510       520       530   
pF1KE0 AIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVL
       :::::::.: ::::::. ::..::.::: ::.: . .:   .  : ..   :::::.:.:
CCDS30 AIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLYFAILL
       480       490       500       510       520       530       

           540       550       560       570       580             
pF1KE0 FFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETD---------
          . .: . .:: : :::. .: :: :  ::    ... .:.:.. : ..         
CCDS30 CGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAGECPAG
       540       550       560       570       580       590       

          590              600       610         620       630     
pF1KE0 DGVEED------YPEK-SRGCLKKAYDLFCGLQKGPK--LTKEEEEALSKKLTDTSERPS
        :. :.       ::  ::.  :  .. ::::.  :.  :.  :. :: .:::.  :.: 
CCDS30 GGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLSGTPEQALSPAEKAALEQKLTSIEEEPL
       600       610       620       630       640       650       

         640       650         
pF1KE0 WRTIVNINAILLLAVVVFIHGYYA
       :: . ::::.::::. .:. ::.:
CCDS30 WRHVCNINAVLLLAINIFLWGYFA
       660       670       680 

>>CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16          (675 aa)
 initn: 2089 init1: 1229 opt: 2131  Z-score: 2625.8  bits: 496.2 E(32554): 6.1e-140
Smith-Waterman score: 2185; 49.2% identity (75.6% similar) in 677 aa overlap (13-659:7-675)

               10           20           30        40        50    
pF1KE0 MASTVSPSTIAETPEPP---PLSDHIRNA---ADISVIVIYFLVVMAVGLWAMLKTNRGT
                   .:.::   ::.   ...   .::.:.:.::: :.:::::. .::.: :
CCDS10       MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDT
                     10        20        30        40        50    

           60        70        80        90       100       110    
pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGW
       . :.:::: ::.:::.::::::::.::.:..::::.:::.:... ..: ..   .:.:.:
CCDS10 VKGYFLAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAW
           60        70        80        90       100       110    

          120       130       140       150       160       170    
pF1KE0 IFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALG
       ::.:::: . : ::::::.::::: :. . :..: ::: .   ::.:..::::::. .: 
CCDS10 IFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLH
          120       130       140       150       160       170    

          180       190       200       210       220       230    
pF1KE0 LDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTE
       :::::::  :::.:::::..::::.:::::.:::.:::::.. :::..:  :::.:.. :
CCDS10 LDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKE
          180       190       200       210       220       230    

          240       250       260       270       280       290    
pF1KE0 KYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTN
       ::  :  :     : . ..::  :: :.:::::: .:.:.::::..::: : .::::::.
CCDS10 KYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTD
          240            250       260       270       280         

          300       310       320       330       340       350    
pF1KE0 QVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKH
       :::::: : .:..::.:.. .: ::::.::.:.::.:::.::::. :.:::. :  : : 
CCDS10 QVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKI
     290       300       310       320       330       340         

          360       370       380       390       400       410    
pF1KE0 CGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMR
       :.   ::.. ::: .::::.: ::::::..::.:.::::::::::::::.::.::....:
CCDS10 CSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLR
     350       360       370       380       390       400         

          420       430       440       450       460       470    
pF1KE0 KQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLA
        .::::::.:.::.:::::..:::.:.:.::.::.:::. : .:::::: ::.:.::...
CCDS10 PRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMG
     410       420       430       440       450       460         

          480       490       500       510       520       530    
pF1KE0 IFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLF
        : ::.::.::::::. :: .::.:.. .: :    :  :.. : .. ..::::::..: 
CCDS10 CFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILS
     470       480       490       500       510       520         

          540       550       560         570       580            
pF1KE0 FGSMLVTLGISLLTKPIPDVHLYRLCWVLRNS--TEERIDIDAEEKSQEETDDGVEE---
         .....  .: .:.:     . .: :  :..  ....    :   :   ...:. :   
CCDS10 TVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQAPPAAPLSLTLSQNGMPEASS
     530       540       550       560       570       580         

               590               600       610        620       630
pF1KE0 ----------DYPEKSRGC--------LKKAYDLFCGLQ-KGPKLTKEEEEALSKKLTDT
                 .   :...:        . ::   .::.: :: .    . ::.   ... 
CCDS10 SSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQEKGKEELPARAEAI---IVSL
     590       600       610       620       630       640         

              640       650         
pF1KE0 SERPSWRTIVNINAILLLAVVVFIHGYYA
        : :  .:....: :. .. ..:: ::.:
CCDS10 EENPLVKTLLDVNLIFCVSCAIFIWGYFA
        650       660       670     

>>CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17          (596 aa)
 initn: 2012 init1: 1198 opt: 2019  Z-score: 2488.3  bits: 470.6 E(32554): 2.8e-132
Smith-Waterman score: 2019; 51.8% identity (82.5% similar) in 537 aa overlap (25-561:17-548)

               10        20        30        40        50        60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
                               ..::: ::..:: . .:::.:.  ...:.:..:.::
CCDS42         MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFL
                       10        20        30        40        50  

               70        80        90       100       110       120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
       :::::.:::.:::::::. ::. ..::::.:::.:.:.. :::... .:: :.:.:::::
CCDS42 AGRDMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIY
             60        70        80        90       100       110  

              130       140       150       160       170       180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
       :.: ..:.:::..::.::.:...:::.:::.. :   :: :..:::.:... :: ..::.
CCDS42 ISSEIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLS
            120       130       140       150       160       170  

              190       200       210       220       230       240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
        .. :..::.:: .::::.:::::.:::.::..:. ::   ::...::: ..   :..: 
CCDS42 TILTLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAI
            180       190       200       210       220       230  

              250       260       270       280       290       300
pF1KE0 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR
       ::         ...:. ::.:..:.:::  :::.:: :. ::. : : :::::.::::::
CCDS42 PS-----RTIANTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR
                 240       250       260       270       280       

              310       320       330       340       350       360
pF1KE0 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG
        : ..:..:.::. :. .:::.::: :..::::::: :. : :.:::::::.. ::..::
CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG
       290       300       310       320       330       340       

              370       380       390       400       410       420
pF1KE0 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK
       :.: ::: .:.:::: ::::::..::::.:::::::::::.:::::.:.. ..: ...:.
CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER
       350       360       370       380       390       400       

              430       440       450       460       470       480
pF1KE0 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV
       :::..::. .. :  ::..:.:..: :..:::. : .:..: :.::..:::::..: .:.
CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA
       410       420       430       440       450       460       

              490       500       510       520       530       540
pF1KE0 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV
       :::::::::..::..:  :.. ::   .  :  :.. : .. ..:::.:...::  :  :
CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV
       470       480       490       500       510       520       

              550       560       570       580       590       600
pF1KE0 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK
       ... :::: :  .:..  : :                                       
CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV
       530       540       550       560       570       580       

>>CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16          (611 aa)
 initn: 1927 init1: 1229 opt: 1957  Z-score: 2411.6  bits: 456.4 E(32554): 5.3e-128
Smith-Waterman score: 2011; 49.3% identity (75.6% similar) in 619 aa overlap (65-659:1-611)

           40        50        60        70        80        90    
pF1KE0 YFLVVMAVGLWAMLKTNRGTIGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAAS
                                     :.:::.::::::::.::.:..::::.:::.
CCDS58                               MVWWPVGASLFASNVGSGHFIGLAGSGAAT
                                             10        20        30

          100       110       120       130       140       150    
pF1KE0 GVATVTFEWTSSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICV
       :... ..: ..   .:.:.:::.:::: . : ::::::.::::: :. . :..: ::: .
CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI
               40        50        60        70        80        90

          160       170       180       190       200       210    
pF1KE0 VLLISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIG
          ::.:..::::::. .: :::::::  :::.:::::..::::.:::::.:::.:::::
CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG
              100       110       120       130       140       150

          220       230       240       250       260       270    
pF1KE0 SFILMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDI
       .. :::..:  :::.:.. :::  :  :     : . ..::  :: :.:::::: .:.:.
CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDL
              160       170            180       190       200     

          280       290       300       310       320       330    
pF1KE0 PWPGIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMI
       ::::..::: : .::::::.:::::: : .:..::.:.. .: ::::.::.:.::.:::.
CCDS58 PWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMV
         210       220       230       240       250       260     

          340       350       360       370       380       390    
pF1KE0 SRILYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSL
       ::::. :.:::. :  : : :.   ::.. ::: .::::.: ::::::..::.:.:::::
CCDS58 SRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSL
         270       280       290       300       310       320     

          400       410       420       430       440       450    
pF1KE0 TSIFNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIH
       :::::::::.::.::....: .::::::.:.::.:::::..:::.:.:.::.::.:::. 
CCDS58 TSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFI
         330       340       350       360       370       380     

          460       470       480       490       500       510    
pF1KE0 YTESISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAP
       : .:::::: ::.:.::... : ::.::.::::::. :: .::.:.. .: :    :  :
CCDS58 YIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQP
         390       400       410       420       430       440     

          520       530       540       550       560         570  
pF1KE0 SNCPKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNS--TEERID
       .. : .. ..::::::..:   .....  .: .:.:     . .: :  :..  ....  
CCDS58 DERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQA
         450       460       470       480       490       500     

            580                    590               600       610 
pF1KE0 IDAEEKSQEETDDGVEE-------------DYPEKSRGC--------LKKAYDLFCGLQ-
         :   :   ...:. :             .   :...:        . ::   .::.: 
CCDS58 PPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQE
         510       520       530       540       550       560     

              620       630       640       650         
pF1KE0 KGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
       :: .    . ::.   ...  : :  .:....: :. .. ..:: ::.:
CCDS58 KGKEELPARAEAI---IVSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA
         570          580       590       600       610 

>>CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21             (718 aa)
 initn: 1924 init1: 1073 opt: 1933  Z-score: 2381.0  bits: 451.0 E(32554): 2.7e-126
Smith-Waterman score: 1933; 48.5% identity (80.7% similar) in 569 aa overlap (23-583:4-571)

               10        20        30        40        50        60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
                             . ..:::.....::..:: .:..:: :.::.:..:.::
CCDS33                    MRAVLDTADIAIVALYFILVMCIGFFAMWKSNRSTVSGYFL
                                  10        20        30        40 

               70        80        90       100       110       120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
       :::.:.:  .:::::.:::::.:..::::.::::: :. ..:... ..: .:::.:.:::
CCDS33 AGRSMTWVAIGASLFVSNIGSEHFIGLAGSGAASGFAVGAWEFNALLLLQLLGWVFIPIY
              50        60        70        80        90       100 

              130       140       150       160       170       180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
       :.:::.::::::.:::::.:.:::.. :::.. .   .:.:...::.::. .:: .::..
CCDS33 IRSGVYTMPEYLSKRFGGHRIQVYFAALSLILYIFTKLSVDLYSGALFIQESLGWNLYVS
             110       120       130       140       150       160 

              190       200       210       220       230       240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
       ...:..:::. :.::::..::::::::...:.::.. :: ... :.::.:   ..:. :.
CCDS33 VILLIGMTALLTVTGGLVAVIYTDTLQALLMIIGALTLMIISIMEIGGFEEVKRRYMLAS
             170       180       190       200       210       220 

                 250        260       270       280       290      
pF1KE0 P---SVVEGDNLTISASC-YTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQV
       :   :..   ::. . ::  .:. ......:. .  :.::::.:.:.  ...::::..::
CCDS33 PDVTSILLTYNLSNTNSCNVSPKKEALKMLRNPTDEDVPWPGFILGQTPASVWYWCADQV
             230       240       250       260       270       280 

        300       310       320       330       340       350      
pF1KE0 IVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCG
       :::: : .:...:.:.. .: ..:::::::..:.::::::::.:: .::. : .:.  ::
CCDS33 IVQRVLAAKNIAHAKGSTLMAGFLKLLPMFIIVVPGMISRILFTDDIACINPEHCMLVCG
             290       300       310       320       330       340 

        360       370       380       390       400       410      
pF1KE0 VDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQ
         .::.: ::: .:..:.: ::::::..::.:.:::.: ::::::::.::.:.:  .::.
CCDS33 SRAGCSNIAYPRLVMKLVPVGLRGLMMAVMIAALMSDLDSIFNSASTIFTLDVYKLIRKS
             350       360       370       380       390       400 

        420       430       440       450       460       470      
pF1KE0 ASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIF
       :: .::.:.::::: ...:.::.:::..   :.::.  : . ...:: ::.::.:.::::
CCDS33 ASSRELMIVGRIFVAFMVVISIAWVPIIVEMQGGQMYLYIQEVADYLTPPVAALFLLAIF
             410       420       430       440       450       460 

        480       490       500       510       520       530      
pF1KE0 CKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFG
        :: ::::::.: :.:...: .:.:  ::: .  :  :.: : .:  .::.: .  ::. 
CCDS33 WKRCNEQGAFYGGMAGFVLGAVRLILAFAYRAPECDQPDNRPGFIKDIHYMYVATGLFWV
             470       480       490       500       510       520 

        540       550       560         570         580       590  
pF1KE0 SMLVTLGISLLTKPIPDVHLYRLC--WVLRNSTEERIDIDAEE--KSQEETDDGVEEDYP
       . :.:. .:::: : :  .  :    :  .: . ..     ::  : ::..         
CCDS33 TGLITVIVSLLTPP-PTKEQIRTTTFWSKKNLVVKENCSPKEEPYKMQEKSILRCSENNE
             530        540       550       560       570       580

            600       610       620       630       640       650  
pF1KE0 EKSRGCLKKAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVV
                                                                   
CCDS33 TINHIIPNGKSEDSIKGLQPEDVNLLVTCREEGNPVASLGHSEAETPVDAYSNGQAALMG
              590       600       610       620       630       640

>>CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1            (706 aa)
 initn: 2323 init1: 1279 opt: 1826  Z-score: 2248.9  bits: 426.5 E(32554): 6e-119
Smith-Waterman score: 2277; 49.9% identity (76.7% similar) in 679 aa overlap (25-659:34-706)

                     10        20        30        40        50    
pF1KE0       MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGT
                                     .: ::::.::::. :.:::.:. ....:::
CCDS44 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT
            10        20        30        40        50        60   

           60        70        80        90       100              
pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWT----------
       :::.:::::.:.:::.::::..::.::. ..::::::::.:.:.  :::.          
CCDS44 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSGGDR
            70        80        90       100       110       120   

                         110       120       130       140         
pF1KE0 ---------------SSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILS
                      .. .:: :::.:::.:: .::.:::.::::::::.:.:::.:.::
CCDS44 GIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLS
           130       140       150       160       170       180   

     150       160       170       180       190       200         
pF1KE0 LFICVVLLISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTI
       :.. .   ::.:::.::.::..::: .:::.  :::..::::: .::: .:::::.:::.
CCDS44 LILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTV
           190       200       210       220       230       240   

     210       220       230       240       250        260        
pF1KE0 IMLIGSFILMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTI-SASCYTPRADSFHIFRD
       ::. :...:: ..:..:: : .. ..: .: :      :.:. ...:. :: :.:::.::
CCDS44 IMVGGALVLMFLGFQDVGWYPGLEQRYRQAIP------NVTVPNTTCHLPRPDAFHILRD
           250       260       270             280       290       

      270       280       290       300       310       320        
pF1KE0 AVTGDIPWPGIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLM
        :.:::::::.:::. . : : :::.:::::: : .:..::.:.. .. .:::.::::..
CCDS44 PVSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFI
       300       310       320       330       340       350       

      330       340       350       360       370       380        
pF1KE0 VMPGMISRILYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLA
       :::::::: :. : :.:: :. : . ::. :::.: ::: .:. ::: ::::::..:..:
CCDS44 VMPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMA
       360       370       380       390       400       410       

      390       400       410       420       430       440        
pF1KE0 SLMSSLTSIFNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQ
       .:::::::::::.:::::::.. ..:....:.::...::.::..:.:.::.:.:..: :.
CCDS44 ALMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSN
       420       430       440       450       460       470       

      450       460       470       480       490       500        
pF1KE0 NGQLIHYTESISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGT
       .:::. : ....:::.:::.:.:.::::::::.: ::::::. ::..::.::: ::.: .
CCDS44 SGQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPA
       480       490       500       510       520       530       

      510       520       530       540       550       560        
pF1KE0 GSCLAPSNCPKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTE
        .:   .  : ..   :::::.:.:   . .: . .:: : :::. .: :: :  ::   
CCDS44 PACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPL
       540       550       560       570       580       590       

      570       580                590              600       610  
pF1KE0 ERIDIDAEEKSQEETD---------DGVEED------YPEK-SRGCLKKAYDLFCGLQKG
        ... .:.:.. : ..          :. :.       ::  ::.  :  .. ::::.  
CCDS44 SELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLSGT
       600       610       620       630       640       650       

              620       630       640       650         
pF1KE0 PK--LTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
       :.  :.  :. :: .:::.  :.: :: . ::::.::::. .:. ::.:
CCDS44 PEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA
       660       670       680       690       700      




659 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 14:13:19 2016 done: Thu Nov  3 14:13:20 2016
 Total Scan time:  2.830 Total Display time:  0.160

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com