Result of FASTA (ccds) for pFN21AB3831
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB3831, 701 aa
  1>>>pF1KB3831 701 - 701 aa - 701 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 4.9761+/-0.000862; mu= 21.8202+/- 0.051
 mean_var=67.3875+/-13.598, 0's: 0 Z-trim(107.0): 29  B-trim: 312 in 1/49
 Lambda= 0.156237
 statistics sampled from 9285 (9312) to 9285 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.286), width:  16
 Scan time:  4.150

The best scores are:                                      opt bits E(32554)
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4       ( 701) 4598 1045.7       0
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5         ( 739) 2140 491.7 1.7e-138
CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4       ( 224) 1298 301.5   9e-82
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7         ( 780) 1293 300.8 5.2e-81
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7         ( 764) 1180 275.3 2.4e-73
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 685)  993 233.1 1.1e-60
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7       ( 744)  993 233.1 1.1e-60
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 738)  990 232.4 1.8e-60
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 740)  990 232.4 1.8e-60
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 758)  990 232.5 1.8e-60
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 759)  990 232.5 1.8e-60
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 516)  849 200.5   5e-51
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 712)  802 190.1   1e-47
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1      ( 791)  783 185.8 2.1e-46
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1      ( 887)  783 185.8 2.3e-46
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 651)  778 184.6   4e-46
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 723)  766 181.9 2.8e-45
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6       ( 970)  764 181.6 4.8e-45
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8       ( 656)  741 176.3 1.3e-43
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8       ( 663)  741 176.3 1.3e-43
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12      ( 563)  646 154.8 3.2e-37
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6       ( 865)  464 113.9   1e-24
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8      ( 355)  439 108.0 2.5e-23
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7       ( 335)  390 96.9   5e-20


>>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4            (701 aa)
 initn: 4598 init1: 4598 opt: 4598  Z-score: 5594.6  bits: 1045.7 E(32554):    0
Smith-Waterman score: 4598; 100.0% identity (100.0% similar) in 701 aa overlap (1-701:1-701)

               10        20        30        40        50        60
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB3 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB3 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB3 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB3 GPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB3 VATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB3 EMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSA
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB3 TVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAAT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAAT
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB3 CMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVF
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB3 RFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKEGGSETGVGEGGPAQGEDLGPVSTRA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKEGGSETGVGEGGPAQGEDLGPVSTRA
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB3 ALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRG
              610       620       630       640       650       660

              670       680       690       700 
pF1KB3 GFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL
       :::::::::::::::::::::::::::::::::::::::::
CCDS33 GFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL
              670       680       690       700 

>>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5              (739 aa)
 initn: 2183 init1: 1450 opt: 2140  Z-score: 2600.0  bits: 491.7 E(32554): 1.7e-138
Smith-Waterman score: 2160; 48.4% identity (78.5% similar) in 678 aa overlap (17-687:56-719)

                             10        20        30        40      
pF1KB3               MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCV
                                     ..::. .  ...:..  .:  .:.::   .
CCDS43 GIHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKA
          30        40        50        60        70        80     

         50        60        70        80        90       100      
pF1KB3 RALVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSF
       . ..  .::. .:: .:  .. . :::::::..::.::::.:::::::: .:.:.:::::
CCDS43 KNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSF
          90       100       110       120       130       140     

        110       120       130       140       150         160    
pF1KB3 FANLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPG--ANSSTLNG
       ::..::::.:::::.:::::..::::.:..:::::: ::.: .... . :  .:.::: .
CCDS43 FASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLN
         150       160       170       180       190       200     

          170       180       190       200       210       220    
pF1KB3 SAAMLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTIL
        ..   : ..:::: :....:...:.::: :: ...::::.:::. ::.::. ::: :::
CCDS43 HTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTIL
         210       220       230       240       250       260     

          230       240       250       260       270       280    
pF1KB3 TSQLKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRY
       ::: :.:::. .:: .: : .. ::. ..:.  ..:.::..:: .:: ::: .:::....
CCDS43 TSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHF
         270       280       290       300       310       320     

          290       300       310       320       330       340    
pF1KB3 RHRLRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALD
       . .:..:.: ::.:.:.:::.::::.::. ..::.:: ::::::::.:::  :.  ::.:
CCDS43 KSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVD
         330       340       350       360       370       380     

          350       360       370       380       390       400    
pF1KB3 AVALALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLV
       :.:..... :...::.::::..:::.:.::::. :.: ::..:.:.:::.:::::::.::
CCDS43 AIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLV
         390       400       410       420       430       440     

          410       420       430       440       450       460    
pF1KB3 KTATGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLW
       : .:::.::::.::.: :.:::::..::::..::.:::. . .:.:::::::  :::..:
CCDS43 KESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMW
         450       460       470       480       490       500     

          470       480       490       500       510       520    
pF1KB3 RMSPADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYED
        .:  :...:  :  .  :.::: :::.:: .:.. .  :::.:...::. . ..  .:.
CCDS43 SISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFES
         510       520       530       540       550       560     

          530       540       550       560            570         
pF1KB3 ATEFEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-----AGCMAARRKEGGSE
       .. ...:  .::...::: .:::: ::. : ..::. :        :   ::.::   .:
CCDS43 VSAYKNLQIKPGIKIFRFVAPLYYINKECFKSALYKQTVNPILIKVAWKKAAKRK--IKE
         570       580       590       600       610       620     

     580       590       600       610       620       630         
pF1KB3 TGVGEGGPAQGEDLGPVSTRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGA
         :  ::  : :    .:.. .  :    .::.::::. . :::.::. ::...:::: :
CCDS43 KVVTLGG-IQDE----MSVQLSHDPLE--LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEA
           630            640         650       660       670      

     640       650       660       670       680       690         
pF1KB3 LGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDA
       .::..::: :.: ::: :. : .  .      ::. :: ::..:.  :            
CCDS43 IGIQVLLAQCNPTVRDSLTNGEYCKK-----EEENLLFYSVYEAMAFAEVSKNQKGVCVP
        680       690       700            710       720       730 

     700       
pF1KB3 HL      
               
CCDS43 NGLSLSSD
               

>>CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4            (224 aa)
 initn: 1320 init1: 1298 opt: 1298  Z-score: 1581.6  bits: 301.5 E(32554): 9e-82
Smith-Waterman score: 1298; 98.5% identity (99.0% similar) in 196 aa overlap (1-196:1-196)

               10        20        30        40        50        60
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB3 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB3 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB3 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ
       ::::::::::::.  :                                            
CCDS33 ATALTLMTGLYQTSWGRNSFQQHPWQLTQRSDSQELLEEEERSC                
              190       200       210       220                    

>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7              (780 aa)
 initn: 1371 init1: 976 opt: 1293  Z-score: 1567.9  bits: 300.8 E(32554): 5.2e-81
Smith-Waterman score: 1355; 32.6% identity (68.9% similar) in 700 aa overlap (28-684:43-726)

                  10        20        30        40        50       
pF1KB3    MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPAT
                                     :. :.  :   ::::   . .... :.:  
CCDS57 LPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPIL
             20        30        40        50        60        70  

        60        70        80        90       100       110       
pF1KB3 RWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGT
       .:: .:: .:.: .::.::.  :.. . :..::.:::..   :.::..::  : ::..::
CCDS57 EWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGT
             80        90       100       110       120       130  

       120       130       140       150       160       170       
pF1KB3 SRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCG-RDCY
       :::.::: : .. ::::.::   :..:   :..  :  ..:...:: .  :.: . ::  
CCDS57 SRHISVGPFPVVSLMVGSVV---LSMA---PDEHFLVSSSNGTVLNTT--MIDTAARDTA
            140       150             160       170         180    

        180       190       200       210       220       230      
pF1KB3 AIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRI
        . .:.::::..:. :...: :..::.  ::..::. ::. .:.  .:.:::: .:.:  
CCDS57 RVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVST
          190       200       210       220       230       240    

        240       250       260       270       280       290      
pF1KB3 PRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTEL
         ..:   .. : . .... :..:. : ... . ..: .:.:::.::.::.. ::.: :.
CCDS57 KNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEV
          250       260       270       280       290       300    

        300       310       320       330       340       350      
pF1KB3 LVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFS
       .: ..:: .:. ..:.: ...... .:: ::.::..:   :....   . ..:.:: :..
CCDS57 IVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIA
          310       320       330       340       350       360    

        360       370       380       390       400       410      
pF1KB3 ISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSS
       .:.....: .. :.. .:::..: :  :.. .:. ::....::... :. .:: .::...
CCDS57 VSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAG
          370       380       390       400       410       420    

        420       430       440       450       460       470      
pF1KB3 VVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAG
       ..::..:....:::. :.. ::.:::: :....:.: . .. :.:::::..  ::..:. 
CCDS57 IISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVF
          430       440       450       460       470       480    

        480       490       500       510       520       530      
pF1KB3 TAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPG
       :  . .... . :::::.:..::... :.: :    :. : .: .:... .....    :
CCDS57 TCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQG
          490       500       510       520       530       540    

        540       550       560       570                     580  
pF1KB3 VRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARR-----------KEG---GSETGV
       :...::..:..:.: : : . . : .:.::  .  .:           : :   ....:.
CCDS57 VKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRATKNGI
          550       560       570       580       590       600    

                    590                           600       610    
pF1KB3 GEGG--------PAQG-EDLG-------------------PVSTRAALVPAAAGFHTVVI
          .        : .  :::                    ::.. .  ::    .:..:.
CCDS57 ISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVP----IHSLVL
          610       620       630       640       650           660

          620       630       640       650       660       670    
pF1KB3 DCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEE
       ::. . :::..:: .:. . ...  . ... .:  .  : . : . ::.     :. ...
CCDS57 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFD----DNIRKD
              670       680       690       700       710          

          680       690       700                                  
pF1KB3 QLFLSVHDAVQTARARHRELEATDAHL                                 
        .::.::::.                                                  
CCDS57 TFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMR
        720       730       740       750       760       770      

>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7              (764 aa)
 initn: 1209 init1: 817 opt: 1180  Z-score: 1430.4  bits: 275.3 E(32554): 2.4e-73
Smith-Waterman score: 1186; 32.0% identity (64.0% similar) in 691 aa overlap (37-684:42-717)

         10        20        30        40        50        60      
pF1KB3 PLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWLRQYRPR
                                     : ::::   .. .: .:.: . ::  :: .
CCDS57 ARPVYSTNAFEENHKKTGRHHKTFLDHLKVC-CSCSPQKAKRIVLSLFPIASWLPAYRLK
              20        30        40         50        60        70

         70        80        90       100       110       120      
pF1KB3 EYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRHVSVGIF
       :.: .:..::.  ::. : :..:..::. . :.:.::.:::  .::...:::::.::: :
CCDS57 EWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFGTSRHISVGPF
               80        90       100       110       120       130

        130       140       150       160       170       180      
pF1KB3 SLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRVATA--L
        .: .::: .:.  .. :   :....   :  ... :.:  .::  :    .:::.:  .
CCDS57 PILSMMVGLAVSGAVSKAV--PDRNATTLGLPNNSNNSS--LLDDER----VRVAAAASV
              140         150       160         170           180  

          190       200       210       220       230       240    
pF1KB3 TLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQGPGM
       :...:. :. .:.::.:::  :::. :..::. .:.: .:.:::: .. . .: :  :  
CCDS57 TVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDPVS
            190       200       210       220       230       240  

          250       260       270       280       290       300    
pF1KB3 VVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIVVATL
       .  .  :..    ..:. :.::. . : :.  .::...:.. .: ::.: :... :.:. 
CCDS57 IFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIAAG
            250       260       270       280       290       300  

          310       320       330       340       350       360    
pF1KB3 VSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLAEMFA
       ::.  ....::  .:.::.  ::.:: .:. . .: .. :  ..:.:: : ..:.: ...
CCDS57 VSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASVYS
            310       320       330       340       350       360  

          370       380       390       400       410       420    
pF1KB3 RSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSATVVL
        .. : . .::::.:.:  :.. . .. :: :.::..: :. .:: .::......: .::
CCDS57 LKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAIIVL
            370       380       390       400       410       420  

          430       440       450       460       470       480    
pF1KB3 LVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAATCMLV
       .:.::.. :.  ::.:::: . . .:.: : .  .. :::: .  : :.:  :    ...
CCDS57 IVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTIVL
            430       440       450       460       470       480  

          490       500       510       520       530       540    
pF1KB3 STEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVFRFGG
       .   :: :.: ..::... ::: :. . :: :: : .:..  ..  .    ::..::  .
CCDS57 GLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRCPS
            490       500       510       520       530       540  

          550       560             570       580                  
pF1KB3 PLYYANKDFFLQSLYSLTG------LDAGCMAARRKEGGSETGVGEGGPA----------
       :.:.::  :: ..: . .:      :     : :. .  .. :. .  :           
CCDS57 PIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDTIK
            550       560       570       580       590       600  

       590                              600       610       620    
pF1KB3 -QGEDLG---------PVSTR--------------AALVPAAAGFHTVVIDCAPLLFLDA
        . :.:          :..:                  ::  . .:....: . . :::.
CCDS57 DSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS-LHSLILDFSAVSFLDV
            610       620       630       640        650       660 

          630       640       650       660        670       680   
pF1KB3 AGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFL-GEGPGDTAEEEQLFLSVHDA
       ..:  :... ...  . ... ..  .    . :.:  :. ::     ..   .::..:::
CCDS57 SSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGE-----VKSSIFFLTIHDA
             670       680       690       700            710      

           690       700                               
pF1KB3 VQTARARHRELEATDAHL                              
       :                                               
CCDS57 VLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
        720       730       740       750       760    

>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7           (685 aa)
 initn: 1374 init1: 969 opt: 993  Z-score: 1203.2  bits: 233.1 E(32554): 1.1e-60
Smith-Waterman score: 1366; 33.4% identity (69.3% similar) in 668 aa overlap (16-650:26-680)

                         10        20         30        40         
pF1KB3           MDESPEPLQQGRGPVPVRRQRPAPRG-LREMLKARLWCSCSCSVLCVRAL
                                :: ..:   .  . . .  .:  . .:.   .: .
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB3 VQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFAN
       .  .:: :.::  :. .::. ::..::.  :.. .::..:...::.. ::..::.::.  
CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
               70        80        90       100       110       120

     110       120       130       140       150       160         
pF1KB3 LIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAML
       ..: ..:::::.:.: :... ::.: :. : .      :. : . ::. ..: ::. :  
CCDS43 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLV------PD-DIVIPGGVNAT-NGTEA--
              130       140       150              160        170  

     170       180       190       200       210       220         
pF1KB3 DCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLK
          ::   ..:: ..::..:. :  .:: :.:::. ::..::. ::. .:.: ..::.::
CCDS43 ---RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK
                 180       190       200       210       220       

     230       240       250       260       270       280         
pF1KB3 HLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLR
       .:.::.  :..:   :: . ...:... . :::.. .. . ...::..::...:....: 
CCDS43 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP
       230       240       250       260       270       280       

     290       300       310       320       330       340         
pF1KB3 VPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALA
       .:.: :....:..: .:   .:.. .. .:.: .: :..::  :.  :.. : .::.:.:
CCDS43 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA
       290       300       310       320       330       340       

     350       360       370       380       390       400         
pF1KB3 LVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATG
       .:. . .::.:. .: .:::.: .::::.:.: :: . .... :. : .:..:::. .::
CCDS43 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG
       350       360       370       380       390       400       

     410       420       430       440       450       460         
pF1KB3 CRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPA
        .:::.. ... ..:::.:: . ::..: ..::. ...:.:.: . .  ::: .:: :  
CCDS43 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI
       410       420       430       440       450       460       

     470       480       490       500       510       520         
pF1KB3 DALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFE
       .  .:  : .. .... . ::...::..::..  ::: :   .:... .:  : :   .:
CCDS43 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE
       470       480       490       500       510       520       

     530       540       550       560        570          580     
pF1KB3 GLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-AGCMAARRK---EGGSETG----
        .   ::...:....:.::::.:.. ..:   ::.. :  :.::::   . ..:.:    
CCDS43 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM
       530       540       550       560       570       580       

                  590                   600              610       
pF1KB3 -----VGEGGPAQGED------------LGPVSTRAAL-------VPAAAGFHTVVIDCA
            :   . ..:::              :.  ....       .: . . :::..: .
CCDS43 ANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFMPPGDNVHTVILDFT
       590       600       610       620       630       640       

       620       630       640       650       660       670       
pF1KB3 PLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLF
        . :.:..::.::  . ..:: .:: . :: ::                           
CCDS43 QVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR                      
       650       660       670       680                           

       680       690       700 
pF1KB3 LSVHDAVQTARARHRELEATDAHL

>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7            (744 aa)
 initn: 1405 init1: 969 opt: 993  Z-score: 1202.7  bits: 233.1 E(32554): 1.1e-60
Smith-Waterman score: 1426; 33.8% identity (68.6% similar) in 717 aa overlap (16-697:26-725)

                         10        20         30        40         
pF1KB3           MDESPEPLQQGRGPVPVRRQRPAPRG-LREMLKARLWCSCSCSVLCVRAL
                                :: ..:   .  . . .  .:  . .:.   .: .
CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB3 VQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFAN
       .  .:: :.::  :. .::. ::..::.  :.. .::..:...::.. ::..::.::.  
CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
               70        80        90       100       110       120

     110       120       130       140       150       160         
pF1KB3 LIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAML
       ..: ..:::::.:.: :... ::.: :. : .      :. : . ::. ..: ::. :  
CCDS57 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLV------PD-DIVIPGGVNAT-NGTEA--
              130       140       150              160        170  

     170       180       190       200       210       220         
pF1KB3 DCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLK
          ::   ..:: ..::..:. :  .:: :.:::. ::..::. ::. .:.: ..::.::
CCDS57 ---RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK
                 180       190       200       210       220       

     230       240       250       260       270       280         
pF1KB3 HLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLR
       .:.::.  :..:   :: . ...:... . :::.. .. . ...::..::...:....: 
CCDS57 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP
       230       240       250       260       270       280       

     290       300       310       320       330       340         
pF1KB3 VPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALA
       .:.: :....:..: .:   .:.. .. .:.: .: :..::  :.  :.. : .::.:.:
CCDS57 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA
       290       300       310       320       330       340       

     350       360       370       380       390       400         
pF1KB3 LVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATG
       .:. . .::.:. .: .:::.: .::::.:.: :: . .... :. : .:..:::. .::
CCDS57 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG
       350       360       370       380       390       400       

     410       420       430       440       450       460         
pF1KB3 CRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPA
        .:::.. ... ..:::.:: . ::..: ..::. ...:.:.: . .  ::: .:: :  
CCDS57 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI
       410       420       430       440       450       460       

     470       480       490       500       510       520         
pF1KB3 DALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFE
       .  .:  : .. .... . ::...::..::..  ::: :   .:... .:  : :   .:
CCDS57 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE
       470       480       490       500       510       520       

     530       540       550       560        570          580     
pF1KB3 GLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-AGCMAARRK---EGGSETG----
        .   ::...:....:.::::.:.. ..:   ::.. :  :.::::   . ..:.:    
CCDS57 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM
       530       540       550       560       570       580       

                  590                   600              610       
pF1KB3 -----VGEGGPAQGED------------LGPVSTRAAL-------VPAAAGFHTVVIDCA
            :   . ..:::              :.  ....       .: . . :::..: .
CCDS57 ANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFMPPGDNVHTVILDFT
       590       600       610       620       630       640       

       620       630       640       650       660       670       
pF1KB3 PLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLF
        . :.:..::.::  . ..:: .:: . :: ::  : . :.:. :. :.:   :  : ::
CCDS57 QVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFF-ENP---ALWELLF
       650       660       670       680       690           700   

       680       690         700                
pF1KB3 LSVHDAVQTARARHR--ELEATDAHL               
        :.::::  .. :.   : ::.                   
CCDS57 HSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA
           710       720       730       740    

>>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3            (738 aa)
 initn: 1377 init1: 959 opt: 990  Z-score: 1199.1  bits: 232.4 E(32554): 1.8e-60
Smith-Waterman score: 1316; 33.3% identity (65.7% similar) in 720 aa overlap (19-681:25-715)

                     10        20        30        40        50    
pF1KB3       MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLL
                               :   :::      . : : .:: .   . ::. . :
CCDS46 MDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYALLLQHL
               10        20        30            40          50    

           60        70        80        90       100       110    
pF1KB3 PATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFL
       :.  :: .:  :..: ::..::: ..:. .::..::.::::: :...::.::.  .::::
CCDS46 PVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFL
           60        70        80        90       100       110    

          120       130       140       150        160       170   
pF1KB3 MGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAAMLDCGR
       .:::::.::: :... .:::.:..             .: : : :.: .: .:      :
CCDS46 FGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA------R
          120       130                    140       150           

           180       190       200       210       220       230   
pF1KB3 DCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLG
       :   ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::::...:
CCDS46 DAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFG
         160       170       180       190       200       210     

           240       250       260       270       280       290   
pF1KB3 VRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLP
       ...  :.::  .. : : .     :..:  :::..:  .::...: :.:. ...: .:.:
CCDS46 LHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIP
         220       230       240       250       260       270     

           300       310       320       330       340       350   
pF1KB3 TELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAA
        :::... :: .:.   :..::  .:.:.::.:..:: .:. .:..... .: ..:.:. 
CCDS46 GELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGF
         280       290       300       310       320       330     

           360       370       380       390       400       410   
pF1KB3 AFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQ
       :..:::...::  ::: : .::::.:.:  :.. ....:: .: ....:::. .::  .:
CCDS46 AIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQ
         340       350       360       370       380       390     

           420       430       440       450       460       470   
pF1KB3 LSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALV
       .....:.  .::... :. ::::: ..::: .:.:.:.: ::.. :.  ::. . :: :.
CCDS46 VAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLI
         400       410       420       430       440       450     

           480       490       500       510       520       530   
pF1KB3 WAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVP
       :  : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:.     
CCDS46 WLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKE
         460       470       480       490       500       510     

           540       550       560       570                       
pF1KB3 EPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAAR---------------------
         ::.::: .. .:.:: .:. ..: .  :.:.  . ..                     
CCDS46 VRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEK
         520       530       540       550       560       570     

             580                                      590          
pF1KB3 -RKEGGSETGVG-------------------------------EGGPAQGEDLGPV---S
        ::...:  :..                               : . :.:.. . .   :
CCDS46 LRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGS
         580       590       600       610       620       630     

       600       610       620       630       640       650       
pF1KB3 TRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDIL
       :  ::      ::....: . : :.:.. ...:... .:.  . . . .: :  :: . :
CCDS46 TLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQL
         640       650       660       670       680       690     

       660       670       680       690       700    
pF1KB3 SRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL   
         : :.      .  ...:: :::                       
CCDS46 EAGHFFDA----SITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
         700           710       720       730        

>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3            (740 aa)
 initn: 1400 init1: 982 opt: 990  Z-score: 1199.1  bits: 232.4 E(32554): 1.8e-60
Smith-Waterman score: 1371; 34.3% identity (67.0% similar) in 712 aa overlap (19-692:46-728)

                           10        20        30        40        
pF1KB3             MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRA
                                     :   :::      . : : .:: .   . :
CCDS46 LSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYA
          20        30        40        50            60           

       50        60        70        80        90       100        
pF1KB3 LVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFA
       :. . ::.  :: .:  :..: ::..::: ..:. .::..::.::::: :...::.::. 
CCDS46 LLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYP
      70        80        90       100       110       120         

      110       120       130       140       150        160       
pF1KB3 NLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAA
        .::::.:::::.::: :... .:::.:..             .: : : :.: .: .: 
CCDS46 VFIYFLFGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA-
     130       140       150                    160       170      

       170       180       190       200       210       220       
pF1KB3 MLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQ
            ::   ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::
CCDS46 -----RDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQ
              180       190       200       210       220       230

       230       240       250       260       270       280       
pF1KB3 LKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHR
       ::...:...  :.::  .. : : .     :..:  :::..:  .::...: :.:. ...
CCDS46 LKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQ
              240       250       260       270       280       290

       290       300       310       320       330       340       
pF1KB3 LRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVA
       : .:.: :::... :: .:.   :..::  .:.:.::.:..:: .:. .:..... .: .
CCDS46 LPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFT
              300       310       320       330       340       350

       350       360       370       380       390       400       
pF1KB3 LALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTA
       .:.:. :..:::...::  ::: : .::::.:.:  :.. ....:: .: ....:::. .
CCDS46 IAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQES
              360       370       380       390       400       410

       410       420       430       440       450       460       
pF1KB3 TGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMS
       ::  .:.....:.  .::... :. ::::: ..::: .:.:.:.: ::.. :.  ::. .
CCDS46 TGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKAN
              420       430       440       450       460       470

       470       480       490       500       510       520       
pF1KB3 PADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATE
        :: :.:  : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:
CCDS46 RADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAE
              480       490       500       510       520       530

       530       540       550       560       570                 
pF1KB3 FEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKE------------
       .       ::.::: .. .:.:: .:. ..: .  :.:.  . ...:.            
CCDS46 YSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQ
              540       550       560       570       580       590

          580       590         600                             610
pF1KB3 -GGSETGVGEGGPAQGEDLGP--VSTRAALVPAAAG----------------------FH
           :    ..::  .  :.:  ::.   .  :.:.                      ::
CCDS46 LQKEEKLRKQAGPLLSACLAPQQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFH
              600       610       620       630       640       650

              620       630       640       650       660       670
pF1KB3 TVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDT
       ....: . : :.:.. ...:... .:.  . . . .: :  :: . :  : :.      .
CCDS46 SLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDA----S
              660       670       680       690       700          

              680       690       700    
pF1KB3 AEEEQLFLSVHDAVQTARARHRELEATDAHL   
         ...:: ::::::  :  . :            
CCDS46 ITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
        710       720       730       740

>>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3            (758 aa)
 initn: 1377 init1: 959 opt: 990  Z-score: 1199.0  bits: 232.5 E(32554): 1.8e-60
Smith-Waterman score: 1326; 33.5% identity (65.8% similar) in 720 aa overlap (19-682:46-736)

                           10        20        30        40        
pF1KB3             MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRA
                                     :   :::      . : : .:: .   . :
CCDS46 LSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYA
          20        30        40        50            60           

       50        60        70        80        90       100        
pF1KB3 LVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFA
       :. . ::.  :: .:  :..: ::..::: ..:. .::..::.::::: :...::.::. 
CCDS46 LLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYP
      70        80        90       100       110       120         

      110       120       130       140       150        160       
pF1KB3 NLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAA
        .::::.:::::.::: :... .:::.:..             .: : : :.: .: .: 
CCDS46 VFIYFLFGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA-
     130       140       150                    160       170      

       170       180       190       200       210       220       
pF1KB3 MLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQ
            ::   ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::
CCDS46 -----RDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQ
              180       190       200       210       220       230

       230       240       250       260       270       280       
pF1KB3 LKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHR
       ::...:...  :.::  .. : : .     :..:  :::..:  .::...: :.:. ...
CCDS46 LKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQ
              240       250       260       270       280       290

       290       300       310       320       330       340       
pF1KB3 LRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVA
       : .:.: :::... :: .:.   :..::  .:.:.::.:..:: .:. .:..... .: .
CCDS46 LPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFT
              300       310       320       330       340       350

       350       360       370       380       390       400       
pF1KB3 LALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTA
       .:.:. :..:::...::  ::: : .::::.:.:  :.. ....:: .: ....:::. .
CCDS46 IAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQES
              360       370       380       390       400       410

       410       420       430       440       450       460       
pF1KB3 TGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMS
       ::  .:.....:.  .::... :. ::::: ..::: .:.:.:.: ::.. :.  ::. .
CCDS46 TGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKAN
              420       430       440       450       460       470

       470       480       490       500       510       520       
pF1KB3 PADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATE
        :: :.:  : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:
CCDS46 RADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAE
              480       490       500       510       520       530

       530       540       550       560       570                 
pF1KB3 FEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAAR---------------
       .       ::.::: .. .:.:: .:. ..: .  :.:.  . ..               
CCDS46 YSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQ
              540       550       560       570       580       590

                   580                                     590     
pF1KB3 -------RKEGGSETGVG------------------------------EGGPAQGEDLGP
              ::...:  :..                              : . :.:.. . 
CCDS46 LQKEEKLRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSK
              600       610       620       630       640       650

            600       610       620       630       640       650  
pF1KB3 V---STRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPP
       .   ::  ::      ::....: . : :.:.. ...:... .:.  . . . .: :  :
CCDS46 APDGSTLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSP
              660       670       680       690       700       710

            660       670       680       690       700    
pF1KB3 VRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL   
       : . :  : :.      .  ...:: ::::                      
CCDS46 VVSQLEAGHFFDA----SITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
              720           730       740       750        




701 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 14:02:30 2016 done: Thu Nov  3 14:02:31 2016
 Total Scan time:  4.150 Total Display time:  0.220

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com