Result of FASTA (ccds) for pF1KE0374
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE0374, 780 aa
  1>>>pF1KE0374 780 - 780 aa - 780 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 4.8809+/-0.000938; mu= 22.6133+/- 0.057
 mean_var=62.3300+/-12.616, 0's: 0 Z-trim(103.8): 28  B-trim: 7 in 1/51
 Lambda= 0.162452
 statistics sampled from 7565 (7592) to 7565 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.591), E-opt: 0.2 (0.233), width:  16
 Scan time:  3.970

The best scores are:                                      opt bits E(32554)
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7         ( 780) 4972 1174.5       0
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7         ( 764) 2288 545.5 1.2e-154
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7       ( 744) 1830 438.1 2.5e-122
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 685) 1773 424.7 2.4e-118
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 516) 1463 352.0 1.4e-96
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 740) 1462 351.9 2.3e-96
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1      ( 791) 1436 345.8 1.6e-94
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1      ( 887) 1436 345.8 1.8e-94
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4       ( 701) 1293 312.2 1.8e-84
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 738) 1261 304.8 3.4e-82
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 758) 1261 304.8 3.5e-82
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 759) 1261 304.8 3.5e-82
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 712) 1224 296.1 1.4e-79
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5         ( 739) 1088 264.2 5.5e-70
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8       ( 656) 1062 258.1 3.4e-68
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8       ( 663) 1062 258.1 3.4e-68
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6       ( 970) 1007 245.3 3.5e-64
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 723)  968 236.1 1.6e-61
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 651)  965 235.3 2.4e-61
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7       ( 335)  900 219.9 5.4e-57
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12      ( 563)  723 178.6 2.5e-44
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6       ( 865)  559 140.3 1.3e-32
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8      ( 355)  474 120.1 6.4e-27
CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17    ( 606)  435 111.1 5.5e-24
CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4       ( 224)  383 98.6 1.2e-20


>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7              (780 aa)
 initn: 4972 init1: 4972 opt: 4972  Z-score: 6289.2  bits: 1174.5 E(32554):    0
Smith-Waterman score: 4972; 100.0% identity (100.0% similar) in 780 aa overlap (1-780:1-780)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KE0 KNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 KNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVL
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KE0 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFL
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KE0 TVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 TVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
              730       740       750       760       770       780

>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7              (764 aa)
 initn: 2292 init1: 1395 opt: 2288  Z-score: 2889.7  bits: 545.5 E(32554): 1.2e-154
Smith-Waterman score: 2288; 48.5% identity (80.1% similar) in 720 aa overlap (16-729:5-720)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
                      .. .:.:.:::::  ::...:..  ...::. . :  ::::: ..
CCDS57            MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQK
                          10        20        30        40         

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
       :  .. .: ::  ::: ::.:::::::..::.:::.::.:::.:.:::. .:  ::::..
CCDS57 AKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYAS
      50        60        70        80        90       100         

              130       140       150           160       170      
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVV---LSMA-PDEHFLVSSSNGTVLNTTMI
       ::: . :..:::::::::::::..:.::: .:   .: : ::..  . .  ..  :....
CCDS57 FFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLL
     110       120       130       140       150       160         

        180       190       200       210       220       230      
pF1KE0 DTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQL
       :    . .::  :...:.: ::::: :: :.:::.: ::.. :..::::::: .::::::
CCDS57 DD---ERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQL
     170          180       190       200       210       220      

        240       250       260       270       280       290      
pF1KE0 KIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKI
       :....... ...  .::. .:  .:..:  ::.::....:....:   :::.:.::. :.
CCDS57 KFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKL
        230       240       250       260       270       280      

        300       310       320       330       340       350      
pF1KE0 PVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSI
       ::::::: :.:.::...::: .... .....: ..  :: ::  : :  :.. ..  :.:
CCDS57 PVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGI
        290       300       310       320       330       340      

        360       370       380       390       400       410      
pF1KE0 AVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQEST
       :.::.:.: ::..::. :::: .:::::.::.:..::  : :  :...:::::.::::::
CCDS57 AMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQEST
        350       360       370       380       390       400      

        420       430       440       450       460       470      
pF1KE0 GGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNK
       :::::.::.:.: ::.:..::.: :: :::::::::....:::::.::. .: ::::..:
CCDS57 GGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDK
        410       420       430       440       450       460      

        480       490       500       510       520       530      
pF1KE0 IDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNY
        : .::..: : .:.::: ::: :.. : :::.:.:.:::. . :..:  :.:::. :.:
CCDS57 YDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDY
        470       480       490       500       510       520      

        540       550       560       570       580       590      
pF1KE0 KNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQ
        .. ::.::::.:  :::...:.  :.. . ..:::. .:.  :: ::::::.:: :.: 
CCDS57 YDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGL
        530       540       550       560       570       580      

        600       610       620       630         640       650    
pF1KE0 LRATKNGIISDAVSTNNAFEPDEDIEDLEELDIP--TKEIEIQVDWNSELPVKVNVPKVP
       :..: .:.:  .:.: .  . . : ...: :: :  : .. ...:::..::....:::. 
CCDS57 LQVTPKGFIC-TVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS
        590        600       610       620       630       640     

          660       670       680       690       700       710    
pF1KE0 IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIR
       .:::.:: .:.::::: .::.:. :..:: :: :.::... .:  ::::..  ::: ...
CCDS57 LHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVK
         650       660       670       680       690       700     

          720       730       740       750       760       770    
pF1KE0 KDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEA
       .. ::::.:::.:..                                             
CCDS57 SSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF 
         710       720       730       740       750       760     

>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7            (744 aa)
 initn: 1775 init1: 1231 opt: 1830  Z-score: 2309.8  bits: 438.1 E(32554): 2.5e-122
Smith-Waterman score: 1830; 38.4% identity (74.5% similar) in 721 aa overlap (20-737:16-723)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
                          :.: ::..:. ..:.. . . .   .. ..: .  .:. :.
CCDS57     MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK
                   10        20        30        40        50      

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
         ...  ..:: .::: :. ::..:.:..::.:::..   ::.:.:.:::::  .::::.
CCDS57 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS
         60        70        80        90       100       110      

              130       140       150       160       170       180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
       :.:.. : ..:::::::.::: :.:::.:.:.. ..::.  . .. :.:        : :
CCDS57 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNAT------NGTEA
        120       130       140       150       160             170

              190       200       210       220       230       240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
       ::. :: .: ..::: ::::. .:  ..::.. ::..::: ::::::: .:..:.:: ..
CCDS57 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF
              180       190       200       210       220       230

              250       260       270       280       290       300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
       .:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.::
CCDS57 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              310       320       330       340       350       360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
       :.: ......:.:: : ::...::. .: ..: :.:::  : .:::  . . ...::.:.
CCDS57 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              370       380       390       400       410       420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
       .....:..:. :.:. : .:::::.::.:. : ....:. :  . .:::. :::.:::::
CCDS57 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              430       440       450       460       470       480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
       :.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. .
CCDS57 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
              420       430       440       450       460       470

              490       500       510       520       530       540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
       ::. : . :..:::: ::....:..::::. :.: ::.. ::..: ::.: .   :....
CCDS57 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
              480       490       500       510       520       530

              550       560       570       580       590       600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
       :  :.::.....::.:.: : ... .:  .: .   ... : ::.::  : . .... :.
CCDS57 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM-AN
              540       550       560       570       580          

               610       620       630       640       650         
pF1KE0 KNGIISDA-VSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLV
        . . .:: :. ..: .:.:     :. ..    : :.  .  :.  .   :   .:...
CCDS57 ATVVKADAEVDGEDATKPEE-----EDGEVKYPPIVIKSTFPEEMQ-RFMPPGDNVHTVI
     590       600            610       620       630        640   

     660       670       680       690       700       710         
pF1KE0 LDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFF
       ::   ..:.: :::..:  ::::.  . . ::.:. .  :.. : .  ::..    . .:
CCDS57 LDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELLF
           650       660       670       680       690       700   

     720         730       740       750       760       770       
pF1KE0 LTVHDAIL--YLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRT
        ..:::.:   :.. .  ::                                        
CCDS57 HSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA                   
           710       720       730       740                       

>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7           (685 aa)
 initn: 1736 init1: 1216 opt: 1773  Z-score: 2238.1  bits: 424.7 E(32554): 2.4e-118
Smith-Waterman score: 1773; 39.1% identity (75.6% similar) in 681 aa overlap (20-699:16-683)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
                          :.: ::..:. ..:.. . . .   .. ..: .  .:. :.
CCDS43     MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK
                   10        20        30        40        50      

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
         ...  ..:: .::: :. ::..:.:..::.:::..   ::.:.:.:::::  .::::.
CCDS43 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS
         60        70        80        90       100       110      

              130       140       150       160       170       180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
       :.:.. : ..:::::::.::: :.:::.:.:.. ..::.  . .. :.:  :     : :
CCDS43 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNAT--N----GTEA
        120       130       140       150       160             170

              190       200       210       220       230       240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
       ::. :: .: ..::: ::::. .:  ..::.. ::..::: ::::::: .:..:.:: ..
CCDS43 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF
              180       190       200       210       220       230

              250       260       270       280       290       300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
       .:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.::
CCDS43 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              310       320       330       340       350       360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
       :.: ......:.:: : ::...::. .: ..: :.:::  : .:::  . . ...::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              370       380       390       400       410       420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
       .....:..:. :.:. : .:::::.::.:. : ....:. :  . .:::. :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              430       440       450       460       470       480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
       :.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. .
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
              420       430       440       450       460       470

              490       500       510       520       530       540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
       ::. : . :..:::: ::....:..::::. :.: ::.. ::..: ::.: .   :....
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
              480       490       500       510       520       530

              550       560       570       580       590       600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
       :  :.::.....::.:.: : ... .:  .: .   ... : ::.::  : . .... :.
CCDS43 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM-AN
              540       550       560       570       580          

               610       620       630       640       650         
pF1KE0 KNGIISDA-VSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLV
        . . .:: :. ..: .:.:     :. ..    : :.  .  :.  .   :   .:...
CCDS43 ATVVKADAEVDGEDATKPEE-----EDGEVKYPPIVIKSTFPEEMQ-RFMPPGDNVHTVI
     590       600            610       620       630        640   

     660       670       680       690       700       710         
pF1KE0 LDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFF
       ::   ..:.: :::..:  ::::.  . . ::.:. . ..                    
CCDS43 LDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR                  
           650       660       670       680                       

     720       730       740       750       760       770         
pF1KE0 LTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLA

>>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7           (516 aa)
 initn: 1459 init1: 1030 opt: 1463  Z-score: 1847.2  bits: 352.0 E(32554): 1.4e-96
Smith-Waterman score: 1463; 42.6% identity (79.6% similar) in 495 aa overlap (20-514:16-504)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
                          :.: ::..:. ..:.. . . .   .. ..: .  .:. :.
CCDS43     MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK
                   10        20        30        40        50      

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
         ...  ..:: .::: :. ::..:.:..::.:::..   ::.:.:.:::::  .::::.
CCDS43 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS
         60        70        80        90       100       110      

              130       140       150       160       170       180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
       :.:.. : ..:::::::.::: :.:::.:.:.. ..::.  . .. :.:        : :
CCDS43 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATN------GTEA
        120       130       140       150       160             170

              190       200       210       220       230       240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
       ::. :: .: ..::: ::::. .:  ..::.. ::..::: ::::::: .:..:.:: ..
CCDS43 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF
              180       190       200       210       220       230

              250       260       270       280       290       300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
       .:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.::
CCDS43 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              310       320       330       340       350       360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
       :.: ......:.:: : ::...::. .: ..: :.:::  : .:::  . . ...::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              370       380       390       400       410       420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
       .....:..:. :.:. : .:::::.::.:. : ....:. :  . .:::. :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              430       440       450       460       470       480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
       :.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. .
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
              420       430       440       450       460       470

              490       500       510       520       530       540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
       ::. : . :..:::: ::....:..::::. :.:                          
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP              
              480       490       500       510                    

              550       560       570       580       590       600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT

>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3            (740 aa)
 initn: 1858 init1: 1247 opt: 1462  Z-score: 1843.7  bits: 351.9 E(32554): 2.3e-96
Smith-Waterman score: 1841; 41.8% identity (77.4% similar) in 682 aa overlap (56-731:62-726)

          30        40        50        60        70        80     
pF1KE0 VYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPILEWLPKYRVKEWLL
                                     ::: ::...:   .:.: :::.: :..:::
CCDS46 ERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLL
              40        50        60        70        80        90 

          90       100       110       120       130       140     
pF1KE0 SDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGTSRHISVGPFPVVS
       .:..::.:....   ::.::::::..:  .::::.:.:.. ::.:::::::::: : :.:
CCDS46 GDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMS
             100       110       120       130       140       150 

         150       160       170       180       190       200     
pF1KE0 LMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGG
       .:::::. :.::.           .:: .::. .:::.::: .::.:..:::..:. .: 
CCDS46 VMVGSVTESLAPQ-----------ALNDSMINETARDAARVQVASTLSVLVGLFQVGLGL
             160                  170       180       190       200

         210       220       230       240       250       260     
pF1KE0 LQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIG
       ...::.: ::..::: :.::::: ::.::::: :...  ....: ::.:::..:.  .. 
CCDS46 IHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLP
              210       220       230       240       250       260

         270       280       290       300       310       320     
pF1KE0 DTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNA
       .....  ... .. :: ..:: :::......:.::: :... : ::.:::: .:.. ...
CCDS46 QSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEV
              270       280       290       300       310       320

         330       340       350       360       370       380     
pF1KE0 GIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEF
        .: .:: :..::  : ..:::......:.::::..:::.:.::..: .. : .:.:::.
CCDS46 DVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQEL
              330       340       350       360       370       380

         390       400       410       420       430       440     
pF1KE0 IAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPL
       .:.:.::...:.:.:: .. ..::. :::::::..:::: ::. .... :. ::.:.. :
CCDS46 VALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDL
              390       400       410       420       430       440

         450       460       470       480       490       500     
pF1KE0 QKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFG
        :.::::..:.:::::. :: :.  ::. :. : .::. :  ..:.:.:::::....::.
CCDS46 PKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFS
              450       460       470       480       490       500

         510       520       530       540       550       560     
pF1KE0 LLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKC
       :: ::.:.:.: .. ::..:.::::... .:.. .: .:::..: :. ....:.. ..  
CCDS46 LLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDA
              510       520       530       540       550       560

         570       580            590       600       610       620
pF1KE0 IKSTVGFDAIRVYNKRLKALRK-----IQKLIKSGQLRATKNGIISDAVSTNNAFEPDED
       .:.  : :.  . ... : :.:     ...: :  .::   . ..:  .. ...   :. 
CCDS46 LKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAGPLLSACLAPQQVSSGDK-
              570       580       590       600       610          

              630       640       650       660       670       680
pF1KE0 IEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVLDCGAISFLDVVGVRSLRVIV
          .:.     .:     : .: : . ...:.  .:::.:: ::.::.:.: ..::. : 
CCDS46 ---MEDATANGQEDSKAPD-GSTLKA-LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIF
        620       630        640        650       660       670    

              690       700       710       720        730         
pF1KE0 KEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFLTVHDAILY-LQNQVKSQEGQ
       ..:..:.:.::.:. .. :. .::   ::: .: :  .: .::::. . ::.        
CCDS46 HDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSP
          680       690       700       710       720       730    

     740       750       760       770       780
pF1KE0 GSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
                                                
CCDS46 VSVTRL                                   
          740                                   

>>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1           (791 aa)
 initn: 1403 init1: 1064 opt: 1436  Z-score: 1810.3  bits: 345.8 E(32554): 1.6e-94
Smith-Waterman score: 1556; 35.3% identity (70.2% similar) in 739 aa overlap (20-734:8-742)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
                          :.:.: .::   :... :.. ..   . :.: .   ::  .
CCDS30             MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK
                           10        20         30        40       

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
         .:.  :.:.: :::::..:.... :...:.: : . . ::::.:::: .:.  ::::.
CCDS30 IKAVVFGLLPVLSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS
        50        60        70        80        90       100       

              130       140       150       160       170       180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
       :::.::::..:  ...  : : :.:..::.. :..::. .: : . :.:  : ...::::
CCDS30 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA
       110       120       130       140       150          160    

              190       200       210       220       230       240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
        .. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: ..
CCDS30 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF
          170       180       190       200       210       220    

              250       260       270       280       290       300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
       ...  .:.:  ::..:...: .:.  ::.:..  .:.. .  . ::::: :. :::  ::
CCDS30 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI
          230       240       250       260       270       280    

              310       320       330       340       350       360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
       : :.::...::::: : .. :.:.  ::  : :::  :  : :: ...:....::.:.:.
CCDS30 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS
          290       300       310       320       330       340    

              370       380       390       400       410       420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
       :.: ...:.. :.:. : .:.:::.::.: ::.:..::.  :   ::: : . ...:::.
CCDS30 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS
          350       360       370       380       390       400    

              430       440       450       460       470       480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
       :::..  . .:::..:.::  : :: ::::.:.. .:::. . :: :   :::..:.:  
CCDS30 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC
          410       420       430       440       450       460    

              490       500       510       520       530       540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
       ::: . . :..:.:  :. .:. :..:.::...:: .  .:... .:::: . :.:.  .
CCDS30 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ
          470       480       490       500       510       520    

              550       560       570       580       590          
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA
       . ::.::. . ::....: . :.. . . .:.:  .:   . : :.: .:  ..  : : 
CCDS30 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR
          530       540       550       560       570       580    

     600           610         620       630       640             
pF1KE0 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN
       .   :.  .: . .. .  ::   : . ..       .. : .. : .:    : :....
CCDS30 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE
          590       600       610       620       630       640    

     650                   660       670       680       690       
pF1KE0 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD
       .:  :            .:.:.:: ...::.:..:...:  . . . .: :.:...... 
CCDS30 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA
          650       660       670       680       690       700    

       700       710        720       730       740       750      
pF1KE0 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL
        : . . . : :.: ...    : ..:::.:. : ...                      
CCDS30 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS
          710       720       730       740       750       760    

        760       770       780   
pF1KE0 ELIETELTEEELDVQDEAMRTLAS   
                                  
CCDS30 EEDIRSYWDLEQEMFGSMFHAETLTAL
          770       780       790 

>>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1           (887 aa)
 initn: 1403 init1: 1064 opt: 1436  Z-score: 1809.6  bits: 345.8 E(32554): 1.8e-94
Smith-Waterman score: 1556; 35.3% identity (70.2% similar) in 739 aa overlap (20-734:8-742)

               10        20        30        40        50        60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
                          :.:.: .::   :... :.. ..   . :.: .   ::  .
CCDS30             MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK
                           10        20         30        40       

               70        80        90       100       110       120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
         .:.  :.:.: :::::..:.... :...:.: : . . ::::.:::: .:.  ::::.
CCDS30 IKAVVFGLLPVLSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS
        50        60        70        80        90       100       

              130       140       150       160       170       180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
       :::.::::..:  ...  : : :.:..::.. :..::. .: : . :.:  : ...::::
CCDS30 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA
       110       120       130       140       150          160    

              190       200       210       220       230       240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
        .. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: ..
CCDS30 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF
          170       180       190       200       210       220    

              250       260       270       280       290       300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
       ...  .:.:  ::..:...: .:.  ::.:..  .:.. .  . ::::: :. :::  ::
CCDS30 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI
          230       240       250       260       270       280    

              310       320       330       340       350       360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
       : :.::...::::: : .. :.:.  ::  : :::  :  : :: ...:....::.:.:.
CCDS30 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS
          290       300       310       320       330       340    

              370       380       390       400       410       420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
       :.: ...:.. :.:. : .:.:::.::.: ::.:..::.  :   ::: : . ...:::.
CCDS30 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS
          350       360       370       380       390       400    

              430       440       450       460       470       480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
       :::..  . .:::..:.::  : :: ::::.:.. .:::. . :: :   :::..:.:  
CCDS30 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC
          410       420       430       440       450       460    

              490       500       510       520       530       540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
       ::: . . :..:.:  :. .:. :..:.::...:: .  .:... .:::: . :.:.  .
CCDS30 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ
          470       480       490       500       510       520    

              550       560       570       580       590          
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA
       . ::.::. . ::....: . :.. . . .:.:  .:   . : :.: .:  ..  : : 
CCDS30 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR
          530       540       550       560       570       580    

     600           610         620       630       640             
pF1KE0 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN
       .   :.  .: . .. .  ::   : . ..       .. : .. : .:    : :....
CCDS30 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE
          590       600       610       620       630       640    

     650                   660       670       680       690       
pF1KE0 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD
       .:  :            .:.:.:: ...::.:..:...:  . . . .: :.:...... 
CCDS30 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA
          650       660       670       680       690       700    

       700       710        720       730       740       750      
pF1KE0 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL
        : . . . : :.: ...    : ..:::.:. : ...                      
CCDS30 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS
          710       720       730       740       750       760    

        760       770       780                                    
pF1KE0 ELIETELTEEELDVQDEAMRTLAS                                    
                                                                   
CCDS30 EEDIRSYWDLEQEMFGSMFHAETLTALESLSAAGGCYPYRSESLVSPLFTRQALAAMDKP
          770       780       790       800       810       820    

>>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4            (701 aa)
 initn: 1371 init1: 976 opt: 1293  Z-score: 1630.0  bits: 312.2 E(32554): 1.8e-84
Smith-Waterman score: 1355; 32.6% identity (68.9% similar) in 700 aa overlap (43-726:28-684)

             20        30        40        50        60        70  
pF1KE0 LPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPIL
                                     :. :.  :   ::::   . .... :.:  
CCDS33    MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPAT
                  10        20        30        40        50       

             80        90       100       110       120       130  
pF1KE0 EWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGT
       .:: .:: .:.: .::.::.  :.. . :..::.:::..   :.::..::  : ::..::
CCDS33 RWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGT
        60        70        80        90       100       110       

            140       150             160       170         180    
pF1KE0 SRHISVGPFPVVSLMVGSVV---LSMA---PDEHFLVSSSNGTVLNTT--MIDTAARDTA
       :::.::: : .. ::::.::   :..:   :..  :  ..:...:: .  :.: . ::  
CCDS33 SRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCG-RDCY
       120       130       140       150       160       170       

          190       200       210       220       230       240    
pF1KE0 RVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVST
        . .:.::::..:. :...: :..::.  ::..::. ::. .:.  .:.:::: .:.:  
CCDS33 AIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRI
        180       190       200       210       220       230      

          250       260       270       280       290       300    
pF1KE0 KNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEV
         ..:   .. : . .... :..:. : ... . ..: .:.:::.::.::.. ::.: :.
CCDS33 PRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTEL
        240       250       260       270       280       290      

          310       320       330       340       350       360    
pF1KE0 IVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIA
       .: ..:: .:. ..:.: ...... .:: ::.::..:   :....   . ..:.:: :..
CCDS33 LVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFS
        300       310       320       330       340       350      

          370       380       390       400       410       420    
pF1KE0 VSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAG
       .:.....: .. :.. .:::..: :  :.. .:. ::....::... :. .:: .::...
CCDS33 ISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSS
        360       370       380       390       400       410      

          430       440       450       460       470       480    
pF1KE0 IISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVF
       ..::..:....:::. :.. ::.:::: :....:.: . .. :.:::::..  ::..:. 
CCDS33 VVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAG
        420       430       440       450       460       470      

          490       500       510       520       530       540    
pF1KE0 TCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQG
       :  . .... . :::::.:..::... :.: :    :. : .: .:... .....    :
CCDS33 TAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPG
        480       490       500       510       520       530      

          550       560       570       580       590       600    
pF1KE0 VKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRATKNGI
       :...::..:..:.: : : . . : .:.::  .  .:           : :   ....:.
CCDS33 VRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARR-----------KEG---GSETGV
        540       550       560       570                     580  

          610       620       630       640       650           660
pF1KE0 ISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVP----IHSLVL
          .        : .  :::                    ::.. .  ::    .:..:.
CCDS33 GEGG--------PAQG-EDLG-------------------PVSTRAALVPAAAGFHTVVI
                    590                           600       610    

              670       680       690       700       710          
pF1KE0 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFD----DNIRKD
       ::. . :::..:: .:. . ...  . ... .:  .  : . : . ::.     :. ...
CCDS33 DCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEE
          620       630       640       650       660       670    

        720       730       740       750       760       770      
pF1KE0 TFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMR
        .::.::::.                                                  
CCDS33 QLFLSVHDAVQTARARHRELEATDAHL                                 
          680       690       700                                  

>>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3            (738 aa)
 initn: 1858 init1: 1247 opt: 1261  Z-score: 1589.1  bits: 304.8 E(32554): 3.4e-82
Smith-Waterman score: 1848; 41.2% identity (77.4% similar) in 696 aa overlap (56-731:41-724)

          30        40        50        60        70        80     
pF1KE0 VYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPILEWLPKYRVKEWLL
                                     ::: ::...:   .:.: :::.: :..:::
CCDS46 ERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLL
               20        30        40        50        60        70

          90       100       110       120       130       140     
pF1KE0 SDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGTSRHISVGPFPVVS
       .:..::.:....   ::.::::::..:  .::::.:.:.. ::.:::::::::: : :.:
CCDS46 GDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMS
               80        90       100       110       120       130

         150       160       170       180       190       200     
pF1KE0 LMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGG
       .:::::. :.::.           .:: .::. .:::.::: .::.:..:::..:. .: 
CCDS46 VMVGSVTESLAPQ-----------ALNDSMINETARDAARVQVASTLSVLVGLFQVGLGL
              140                  150       160       170         

         210       220       230       240       250       260     
pF1KE0 LQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIG
       ...::.: ::..::: :.::::: ::.::::: :...  ....: ::.:::..:.  .. 
CCDS46 IHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLP
     180       190       200       210       220       230         

         270       280       290       300       310       320     
pF1KE0 DTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNA
       .....  ... .. :: ..:: :::......:.::: :... : ::.:::: .:.. ...
CCDS46 QSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEV
     240       250       260       270       280       290         

         330       340       350       360       370       380     
pF1KE0 GIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEF
        .: .:: :..::  : ..:::......:.::::..:::.:.::..: .. : .:.:::.
CCDS46 DVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQEL
     300       310       320       330       340       350         

         390       400       410       420       430       440     
pF1KE0 IAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPL
       .:.:.::...:.:.:: .. ..::. :::::::..:::: ::. .... :. ::.:.. :
CCDS46 VALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDL
     360       370       380       390       400       410         

         450       460       470       480       490       500     
pF1KE0 QKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFG
        :.::::..:.:::::. :: :.  ::. :. : .::. :  ..:.:.:::::....::.
CCDS46 PKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFS
     420       430       440       450       460       470         

         510       520       530       540       550       560     
pF1KE0 LLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKC
       :: ::.:.:.: .. ::..:.::::... .:.. .: .:::..: :. ....:.. ..  
CCDS46 LLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDA
     480       490       500       510       520       530         

         570       580            590          600       610       
pF1KE0 IKSTVGFDAIRVYNKRLKALRK-----IQKLIKSGQLR---ATKNGIISDAVSTNNAFEP
       .:.  : :.  . ... : :.:     ...: :  .::   :. .:  : ....:...: 
CCDS46 LKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGA-SVSINVNTSLED
     540       550       560       570       580        590        

         620       630       640                650       660      
pF1KE0 --DEDIEDLEELDIPTKEIEIQVDWNSELPVK---------VNVPKVPIHSLVLDCGAIS
         ....:: . ... . .   ..  :..   :         ...:.  .:::.:: ::.:
CCDS46 MRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHSLILDLGALS
      600       610       620       630       640       650        

        670       680       690       700       710       720      
pF1KE0 FLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFLTVHDAI
       :.:.: ..::. : ..:..:.:.::.:. .. :. .::   ::: .: :  .: .::::.
CCDS46 FVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAV
      660       670       680       690       700       710        

         730       740       750       760       770       780
pF1KE0 LY-LQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
        . ::.                                                 
CCDS46 TFALQHPRPVPDSPVSVTRL                                   
      720       730                                           




780 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 13:33:47 2016 done: Thu Nov  3 13:33:48 2016
 Total Scan time:  3.970 Total Display time:  0.260

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com