Result of FASTA (ccds) for pFN21AB6259
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB6259, 764 aa
  1>>>pF1KB6259 764 - 764 aa - 764 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.2011+/-0.00115; mu= 20.5807+/- 0.068
 mean_var=65.2369+/-13.157, 0's: 0 Z-trim(101.4): 32  B-trim: 2 in 1/49
 Lambda= 0.158792
 statistics sampled from 6498 (6524) to 6498 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.543), E-opt: 0.2 (0.2), width:  16
 Scan time:  3.830

The best scores are:                                      opt bits E(32554)
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7         ( 764) 4939 1141.1       0
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7         ( 780) 2288 533.8 3.9e-151
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7       ( 744) 1763 413.6 5.9e-115
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 685) 1690 396.8  6e-110
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 516) 1459 343.8   4e-94
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1      ( 791) 1393 328.8 2.1e-89
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1      ( 887) 1393 328.8 2.3e-89
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 740) 1344 317.6 4.6e-86
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5         ( 739) 1293 305.9 1.5e-82
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7      ( 712) 1251 296.3 1.2e-79
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 758) 1212 287.3   6e-77
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 738) 1209 286.6 9.5e-77
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 759) 1209 286.6 9.7e-77
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4       ( 701) 1180 280.0 9.1e-75
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6       ( 970) 1111 264.3 6.8e-70
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8       ( 656) 1073 255.5 2.1e-67
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8       ( 663) 1073 255.5 2.1e-67
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 723)  961 229.8 1.2e-59
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3       ( 651)  953 228.0 3.9e-59
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7       ( 335)  921 220.5 3.6e-57
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12      ( 563)  679 165.2 2.7e-40
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6       ( 865)  554 136.6 1.6e-31
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8      ( 355)  438 109.8 7.7e-24
CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17    ( 606)  385 97.8 5.4e-20
CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4       ( 224)  361 92.1 1.1e-18


>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7              (764 aa)
 initn: 4939 init1: 4939 opt: 4939  Z-score: 6109.2  bits: 1141.1 E(32554):    0
Smith-Waterman score: 4939; 100.0% identity (100.0% similar) in 764 aa overlap (1-764:1-764)

               10        20        30        40        50        60
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDERVRVAAAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDERVRVAAAA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB6 SVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 SVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB6 VSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIA
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB6 AGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 AGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASV
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB6 YSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAII
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 YSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAII
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB6 VLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTI
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB6 VLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRC
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB6 PSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 PSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDT
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB6 IKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSLILDFSAVSFLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 IKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSLILDFSAVSFLD
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB6 VSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIFFLTIHDAVLHI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIFFLTIHDAVLHI
              670       680       690       700       710       720

              730       740       750       760    
pF1KB6 LMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
       ::::::::::::::::::::::::::::::::::::::::::::
CCDS57 LMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
              730       740       750       760    

>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7              (780 aa)
 initn: 2292 init1: 1395 opt: 2288  Z-score: 2826.9  bits: 533.8 E(32554): 3.9e-151
Smith-Waterman score: 2288; 48.2% identity (80.1% similar) in 720 aa overlap (5-720:16-729)

                          10        20        30        40         
pF1KB6            MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQK
                      .. .:.:.:::::  ::...:..  ...::. . :  ::::: ..
CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB6 AKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYAS
       :  .. .: ::  ::: ::.:::::::..::.:::.::.:::.:.:::. .:  ::::..
CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
               70        80        90       100       110       120

     110       120       130       140       150       160         
pF1KB6 FFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLL
       ::: . :..:::::::::::::..:.:::    ..: . .::..  . .  ..  :....
CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVG----SVVLSMAPDEHFLVSSSNGTVLNTTMI
              130       140           150       160       170      

     170          180       190       200       210       220      
pF1KB6 DD---ERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQL
       :    . .::  :...:.: ::::: :: :.:::.: ::.. :..::::::: .::::::
CCDS57 DTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQL
        180       190       200       210       220       230      

        230       240       250       260       270       280      
pF1KB6 KFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKL
       :....... ...  .::. .:  .:..:  ::.::....:....:   :::.:.::. :.
CCDS57 KIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKI
        240       250       260       270       280       290      

        290       300       310       320       330       340      
pF1KB6 PVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGI
       ::::::: :.:.::...::: .... .....: ..  :: ::  : :  :.. ..  :.:
CCDS57 PVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSI
        300       310       320       330       340       350      

        350       360       370       380       390       400      
pF1KB6 AMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQEST
       :.::.:.: ::..::. :::: .:::::.::.:..::  : :  :...:::::.::::::
CCDS57 AVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQEST
        360       370       380       390       400       410      

        410       420       430       440       450       460      
pF1KB6 GGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDK
       :::::.::.:.: ::.:..::.: :: :::::::::....:::::.::. .: ::::..:
CCDS57 GGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNK
        420       430       440       450       460       470      

        470       480       490       500       510       520      
pF1KB6 YDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDY
        : .::..: : .:.::: ::: :.. : :::.:.:.:::. . :..:  :.:::. :.:
CCDS57 IDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNY
        480       490       500       510       520       530      

        530       540       550       560       570       580      
pF1KB6 YDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGL
        .. ::.::::.:  :::...:.  :.. . ..:::. .:.  :: ::::::.:: :.: 
CCDS57 KNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQ
        540       550       560       570       580       590      

        590        600       610       620       630       640     
pF1KB6 LQVTPKGFIC-TVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS
       :..: .:.:  .:.: .  . . : ...: :: :  : .. ...:::..::....:::. 
CCDS57 LRATKNGIISDAVSTNNAFEPDEDIEDLEELDIP--TKEIEIQVDWNSELPVKVNVPKVP
        600       610       620       630         640       650    

         650       660       670       680       690       700     
pF1KB6 LHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVK
       .:::.:: .:.::::: .::.:. :..:: :: :.::... .:  ::::..  ::: ...
CCDS57 IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIR
          660       670       680       690       700       710    

         710       720       730       740       750       760     
pF1KB6 SSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF 
       .. ::::.:::.:..                                             
CCDS57 KDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEA
          720       730       740       750       760       770    

>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7            (744 aa)
 initn: 1746 init1: 1117 opt: 1763  Z-score: 2177.2  bits: 413.6 E(32554): 5.9e-115
Smith-Waterman score: 1763; 39.2% identity (71.6% similar) in 735 aa overlap (8-736:15-731)

                      10        20        30        40        50   
pF1KB6        MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
                     .: : ::..:  ...:  .   .   .. :.::   .:.:.: . :
CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
               10        20        30        40        50        60

            60        70        80        90       100       110   
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
       .  ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
               70        80        90       100       110       120

           120       130       140       150       160       170   
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
       :.: :.:::::::.::: ..:.:.:    :.. . :::  .   :. : .:..   :  :
CCDS57 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
              130       140           150       160        170     

           180       190       200       210       220       230   
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
       :.::   :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . 
CCDS57 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
         180         190       200       210       220       230   

           240          250       260       270       280       290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
       .  ..   .::.:.::   :...... :. .: ..:.:. ..   ::.:.:::.:::.::
CCDS57 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              300       310       320       330       340       350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
       :.::. .:...:.: : ..:. ..: ::: .  :. :: .::.  :. .  : ..::.:.
CCDS57 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              360       370       380       390       400       410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
       :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS57 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              420       430       440       450       460       470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
       :.:: ......:.:.:: :::.  : ..::.:... :::::.:::...  .:: .: .  
CCDS57 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
              420       430       440       450       460       470

              480       490       500       510       520       530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
       ::. ::. .. :::  :: ..: . :::...::: :. ..:... .:..: .   : .. 
CCDS57 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
              480       490       500       510       520       530

              540       550       560       570       580          
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV
       :  :.:::.  .:::.::  ..   :   .: .:  :.  : ::.::  : . . .. ..
CCDS57 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA
              540       550       560       570       580       590

     590       600       610       620       630       640         
pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL
       :       ::    .  : ......     :..:   :  . .  .:     :  ..:..
CCDS57 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV
              600       610       620          630            640  

     650       660       670       680       690       700         
pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF
       ::::. :.:.:  .:. : .:..:.  . . ::..: . . .. :.: .::.. .   ..
CCDS57 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELL
            650       660       670       680       690       700  

     710       720       730         740       750       760    
pF1KB6 FLTIHDAVLHILMKKDYSTSKFN--PSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
       : .::::::   ...  . .. .  ::::                            
CCDS57 FHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA               
            710       720       730       740                   

>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7           (685 aa)
 initn: 1584 init1: 1117 opt: 1690  Z-score: 2087.4  bits: 396.8 E(32554): 6e-110
Smith-Waterman score: 1690; 39.9% identity (72.0% similar) in 690 aa overlap (8-693:15-685)

                      10        20        30        40        50   
pF1KB6        MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
                     .: : ::..:  ...:  .   .   .. :.::   .:.:.: . :
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
               10        20        30        40        50        60

            60        70        80        90       100       110   
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
       .  ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
               70        80        90       100       110       120

           120       130       140       150       160       170   
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
       :.: :.:::::::.::: ..:.:.:    :.. . :::  .   :. : .:..   :  :
CCDS43 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
              130       140           150       160        170     

           180       190       200       210       220       230   
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
       :.::   :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . 
CCDS43 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
         180         190       200       210       220       230   

           240          250       260       270       280       290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
       .  ..   .::.:.::   :...... :. .: ..:.:. ..   ::.:.:::.:::.::
CCDS43 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              300       310       320       330       340       350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
       :.::. .:...:.: : ..:. ..: ::: .  :. :: .::.  :. .  : ..::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              360       370       380       390       400       410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
       :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              420       430       440       450       460       470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
       :.:: ......:.:.:: :::.  : ..::.:... :::::.:::...  .:: .: .  
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
              420       430       440       450       460       470

              480       490       500       510       520       530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
       ::. ::. .. :::  :: ..: . :::...::: :. ..:... .:..: .   : .. 
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
              480       490       500       510       520       530

              540       550       560       570       580          
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV
       :  :.:::.  .:::.::  ..   :   .: .:  :.  : ::.::  : . . .. ..
CCDS43 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA
              540       550       560       570       580       590

     590       600       610       620       630       640         
pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL
       :       ::    .  : ......     :..:   :  . .  .:     :  ..:..
CCDS43 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV
              600       610       620          630            640  

     650       660       670       680       690       700         
pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF
       ::::. :.:.:  .:. : .:..:.  . . ::..: .  ::..                
CCDS43 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSA-FIQR                
            650       660       670       680                      

     710       720       730       740       750       760    
pF1KB6 FLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF

>>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7           (516 aa)
 initn: 1437 init1: 970 opt: 1459  Z-score: 1803.2  bits: 343.8 E(32554): 4e-94
Smith-Waterman score: 1459; 44.8% identity (77.2% similar) in 500 aa overlap (8-504:15-504)

                      10        20        30        40        50   
pF1KB6        MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
                     .: : ::..:  ...:  .   .   .. :.::   .:.:.: . :
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
               10        20        30        40        50        60

            60        70        80        90       100       110   
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
       .  ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
               70        80        90       100       110       120

           120       130       140       150       160       170   
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
       :.: :.:::::::.::: ..:.:.:    :.. . :::  .   :. : .:..   :  :
CCDS43 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
              130       140           150       160        170     

           180       190       200       210       220       230   
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
       :.::   :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . 
CCDS43 VKVA--MSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
           180       190       200       210       220       230   

           240          250       260       270       280       290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
       .  ..   .::.:.::   :...... :. .: ..:.:. ..   ::.:.:::.:::.::
CCDS43 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              300       310       320       330       340       350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
       :.::. .:...:.: : ..:. ..: ::: .  :. :: .::.  :. .  : ..::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              360       370       380       390       400       410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
       :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              420       430       440       450       460       470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
       :.:: ......:.:.:: :::.  : ..::.:... :::::.:::...  .:: .: .  
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
              420       430       440       450       460       470

              480       490       500       510       520       530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
       ::. ::. .. :::  :: ..: . :::...:::                          
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP              
              480       490       500       510                    

              540       550       560       570       580       590
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVT

>>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1           (791 aa)
 initn: 1450 init1: 1020 opt: 1393  Z-score: 1718.7  bits: 328.8 E(32554): 2.1e-89
Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (8-718:7-735)

               10        20        30        40        50        60
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
              .:.: : .:: . :... .:  : . .  ..:.    ::  : : .:..:.:.
CCDS30  MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV
                10        20        30         40        50        

               70        80        90       100       110       120
pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
        :::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.:
CCDS30 LSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG
       60        70        80        90       100       110        

              130       140       150       160       170          
pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA
         ...  : : ..:..::    .   . .:.   . . . ::..: : .:    :  :. 
CCDS30 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH
      120       130           140          150       160       170 

       180       190       200       210       220       230       
pF1KB6 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH
       ..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::.
CCDS30 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY
             180       190       200       210       220       230 

       240       250       260       270       280       290       
pF1KB6 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT
       : : ::  .. .. ... .::::.:. :::    . .:::.: :.  :.  ::: :.:..
CCDS30 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV
             240       250       260       270       280       290 

       300       310       320       330       340       350       
pF1KB6 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV
       :.:...: :: . ..... .::... ::  :..: :  ... .:  :..:.:.... ...
CCDS30 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM
             300       310       320       330       340       350 

       360       370       380       390       400       410       
pF1KB6 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG
       . . . :. : .:.:::.:::: .:.  . :.  .   ::: . . ...:::.:.:.:  
CCDS30 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV
             360       370       380       390       400       410 

       420       430       440       450       460       470       
pF1KB6 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI
       ...:.:..:..:. : :: ::::.::   :::. : :...   ::::.: :: ::...:.
CCDS30 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL
             420       430       440       450       460       470 

       480       490       500       510       520       530       
pF1KB6 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI
        .. :.:  :.:..:::..:..::.::: .  .::..  :.:: : : :    . .:.::
CCDS30 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI
             480       490       500       510       520       530 

       540       550       560       570       580             590 
pF1KB6 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP
       .   ::.::::  .::.:.:  .:..: ..:  ..: :.: .:       :...:.. : 
CCDS30 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK
             540       550       560       570       580       590 

             600       610       620       630           640       
pF1KB6 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK----
          .  ..   ..    : :. ..  .  ... . :  : ..    . : . :.:     
CCDS30 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD
             600       610       620       630       640       650 

                   650       660       670       680       690     
pF1KB6 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN
               ...:.::::.:.:::.:. ....: .. . . .: : :..:.   .  . ..
CCDS30 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS
             660       670       680       690       700       710 

         700        710       720       730       740       750    
pF1KB6 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR
       .   : :: .. .  : .::::::                                    
CCDS30 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY
             720       730       740       750       760       770 

>>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1           (887 aa)
 initn: 1450 init1: 1020 opt: 1393  Z-score: 1718.0  bits: 328.8 E(32554): 2.3e-89
Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (8-718:7-735)

               10        20        30        40        50        60
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
              .:.: : .:: . :... .:  : . .  ..:.    ::  : : .:..:.:.
CCDS30  MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV
                10        20        30         40        50        

               70        80        90       100       110       120
pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
        :::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.:
CCDS30 LSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG
       60        70        80        90       100       110        

              130       140       150       160       170          
pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA
         ...  : : ..:..::    .   . .:.   . . . ::..: : .:    :  :. 
CCDS30 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH
      120       130           140          150       160       170 

       180       190       200       210       220       230       
pF1KB6 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH
       ..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::.
CCDS30 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY
             180       190       200       210       220       230 

       240       250       260       270       280       290       
pF1KB6 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT
       : : ::  .. .. ... .::::.:. :::    . .:::.: :.  :.  ::: :.:..
CCDS30 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV
             240       250       260       270       280       290 

       300       310       320       330       340       350       
pF1KB6 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV
       :.:...: :: . ..... .::... ::  :..: :  ... .:  :..:.:.... ...
CCDS30 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM
             300       310       320       330       340       350 

       360       370       380       390       400       410       
pF1KB6 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG
       . . . :. : .:.:::.:::: .:.  . :.  .   ::: . . ...:::.:.:.:  
CCDS30 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV
             360       370       380       390       400       410 

       420       430       440       450       460       470       
pF1KB6 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI
       ...:.:..:..:. : :: ::::.::   :::. : :...   ::::.: :: ::...:.
CCDS30 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL
             420       430       440       450       460       470 

       480       490       500       510       520       530       
pF1KB6 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI
        .. :.:  :.:..:::..:..::.::: .  .::..  :.:: : : :    . .:.::
CCDS30 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI
             480       490       500       510       520       530 

       540       550       560       570       580             590 
pF1KB6 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP
       .   ::.::::  .::.:.:  .:..: ..:  ..: :.: .:       :...:.. : 
CCDS30 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK
             540       550       560       570       580       590 

             600       610       620       630           640       
pF1KB6 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK----
          .  ..   ..    : :. ..  .  ... . :  : ..    . : . :.:     
CCDS30 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD
             600       610       620       630       640       650 

                   650       660       670       680       690     
pF1KB6 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN
               ...:.::::.:.:::.:. ....: .. . . .: : :..:.   .  . ..
CCDS30 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS
             660       670       680       690       700       710 

         700        710       720       730       740       750    
pF1KB6 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR
       .   : :: .. .  : .::::::                                    
CCDS30 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY
             720       730       740       750       760       770 

>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3            (740 aa)
 initn: 1667 init1: 1134 opt: 1344  Z-score: 1658.5  bits: 317.6 E(32554): 4.6e-86
Smith-Waterman score: 1678; 37.9% identity (71.4% similar) in 721 aa overlap (9-721:29-724)

                                   10        20        30          
pF1KB6                     MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHL-
                                   : . ::. . . .::     ::  ..   :  
CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE----LGRWGSAPRTHQW
               10        20        30        40            50      

      40        50        60        70        80        90         
pF1KB6 KVCCSCSPQKAKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVD
       ..  .::  .:  ..:. .:.  ::: : ...:::.:..::.:..:. . ::::.:::. 
CCDS46 RTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG
         60        70        80        90       100       110      

     100       110       120       130       140       150         
pF1KB6 IPPVYGLYASFFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGL
       .:::.:::.::.:..::..:::::::::: : ..:.::: .. . . .:. :        
CCDS46 LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALND--------
        120       130       140       150       160                

     160       170       180       190       200       210         
pF1KB6 PNNSNNSSLLDDERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAV
         .  : .  :  ::.::.  ...:: :..:...:....:::: :::: :. :.::::::
CCDS46 --SMINETARDAARVQVAS--TLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAV
        170       180         190       200       210       220    

     220       230       240       250       260       270         
pF1KB6 HVLVSQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEIN
       .:.:::::..: : . ::. :.:.. ..  :  .. ..... .::: .. .:. .:: .:
CCDS46 QVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLN
          230       240       250       260       270       280    

     280       290       300       310       320       330         
pF1KB6 QRFKDKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNT
       ......::.::: :..  . :.:.:::  .:.::.: :::..  :. ::..:... :.. 
CCDS46 DKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKL
          290       300       310       320       330       340    

     340       350       360       370       380       390         
pF1KB6 VGDCFGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSR
       ::. : ::.:.::.:.:......:.. : .:.::::.::::.:.. :.:. :  : ..::
CCDS46 VGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSR
          350       360       370       380       390       400    

     400       410       420       430       440       450         
pF1KB6 SAVQESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIG
       : :::::::..:.:: :.....:.... .: :.  : :.::::. . :::::: :.... 
CCDS46 SLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMR
          410       420       430       440       450       460    

     460       470       480       490       500       510         
pF1KB6 RLWRKDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNI
        ::. .. : :::..::  ::.:.: :::...: :.:: .: :::.:. :.:...  :.:
CCDS46 SLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDI
          470       480       490       500       510       520    

     520       530       540       550       560       570         
pF1KB6 YKNKKDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRK--
       :..  .: .  : .:::.::  . .::::  :.   : .  : .   .. ...: :.:  
CCDS46 YRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQE
          530       540       550       560       570       580    

          580         590       600       610       620       630  
pF1KB6 ---IRKLQKQGLL--QVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWN
          ...:::.  :  :. :    : .    .: ....       :   :  .     : .
CCDS46 QLKLKQLQKEEKLRKQAGPLLSACLAPQQVSSGDKME-------DATANGQEDSKAPDGS
          590       600       610       620              630       

            640       650       660       670       680       690  
pF1KB6 DDLPLNIEVPKISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIE
           :..  :. ..::::::..:.::.:.  ...::.:...: .:.:.::...  .  . 
CCDS46 TLKALGL--PQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVS
       640         650       660       670       680       690     

            700       710       720       730       740       750  
pF1KB6 KLNRYEFFDGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLR
       .:.  .:::. . .. .: ..::::   :                               
CCDS46 QLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL               
         700       710       720       730       740               

>>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5              (739 aa)
 initn: 968 init1: 895 opt: 1293  Z-score: 1595.4  bits: 305.9 E(32554): 1.5e-82
Smith-Waterman score: 1335; 32.2% identity (68.8% similar) in 712 aa overlap (23-725:57-724)

                       10        20        30         40        50 
pF1KB6         MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTF-LDHLKVCCSCSPQKAK
                                     : ..:.  . : : . .:.  :.::: :::
CCDS43 IHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAK
         30        40        50        60        70        80      

              60        70        80        90       100       110 
pF1KB6 RIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFF
        ..:...:. .::: : ::. .:.:..::. .::. : :..:..::.   ::::::.:::
CCDS43 NMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFF
         90       100       110       120       130       140      

             120       130       140       150       160       170 
pF1KB6 PAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLD-
        .:::...::::::::: : .: .:.: .:.  ..::  :   .. .:   ::.:.::. 
CCDS43 ASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNH
        150       160       170       180       190       200      

                     180       190       200       210       220   
pF1KB6 -DERV------RVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLV
        ..:.       . ....:: ..:. :.:.:....::: .:::..:.:::.:.:.  .:.
CCDS43 TSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILT
        210       220       230       240       250       260      

           230       240       250       260       270       280   
pF1KB6 SQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFK
       :: :... :..:  .   :.. .   :: .:.:::. ::.:.:. :::.  .::.:..::
CCDS43 SQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFK
        270       280       290       300       310       320      

           290       300       310       320       330       340   
pF1KB6 DKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDC
       .:: .:::::....: :. .:.   ... .. ...: .  ::.:: .:. . . ... : 
CCDS43 SKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDA
        330       340       350       360       370       380      

           350       360       370       380       390       400   
pF1KB6 FGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQ
       ..:....::.. :.. ... :. : . .:::. :.:. ::. . :. :. :.::... :.
CCDS43 IAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVK
        390       400       410       420       430       440      

           410       420       430       440       450       460   
pF1KB6 ESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWR
       :::: .::..:.. :...:.:.:.:. :.  ::::::..... ::.: : .: .. ..: 
CCDS43 ESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWS
        450       460       470       480       490       500      

           470       480       490       500       510       520   
pF1KB6 KDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNK
        ...: .::..:.. . .:.  .:: ..: :... ...::: :: : :. . ....... 
CCDS43 ISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESV
        510       520       530       540       550       560      

           530       540       550       560       570       580   
pF1KB6 KDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQK
       . : ..    :.::::  .:.:. :   :.  :   .  .:. :    .:: .  ::...
CCDS43 SAYKNLQIKPGIKIFRFVAPLYYINKECFKSALYKQT-VNPILIKVAWKKAAK--RKIKE
        570       580       590       600        610         620   

           590       600       610       620       630       640   
pF1KB6 QGLLQVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPK
       .          . :.  :.:   :..                   .. . : ::.     
CCDS43 K----------VVTLGGIQD---EMS-------------------VQLSHD-PLE-----
                     630                             640           

           650       660       670       680       690       700   
pF1KB6 ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGE
         ::....: ::..:::..... :: . ...  : ..: ..  .    ..:.  :.   :
CCDS43 --LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKE
           650       660       670       680       690       700   

           710       720       730       740       750       760   
pF1KB6 VKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETK
        . ...: ....:.    ..:.                                      
CCDS43 -EENLLFYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD                       
            710       720       730                                

>>CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7           (712 aa)
 initn: 1639 init1: 760 opt: 1251  Z-score: 1543.6  bits: 296.3 E(32554): 1.2e-79
Smith-Waterman score: 1592; 37.3% identity (68.2% similar) in 735 aa overlap (8-736:15-699)

                      10        20        30        40        50   
pF1KB6        MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
                     .: : ::..:  ...:  .   .   .. :.::   .:.:.: . :
CCDS55 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
               10        20        30        40        50        60

            60        70        80        90       100       110   
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
       .  ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS55 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
               70        80        90       100       110       120

           120       130       140       150       160       170   
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
       :.: :.:::::::.::: ..:.:.:    :.. . :::  .   :. : .:..   :  :
CCDS55 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
              130       140           150       160        170     

           180       190       200       210       220       230   
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
       :.::   :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . 
CCDS55 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
         180         190       200       210       220       230   

           240          250       260       270       280       290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
       .  ..   .::.:.::   :...... :. .: ..:.:. ..   ::.:.:::.:::.::
CCDS55 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
              240       250       260       270       280       290

              300       310       320       330       340       350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
       :.::. .:...:.: : ..:. ..: ::: .  :. :: .::.  :. .  : ..::.:.
CCDS55 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
              300       310       320       330       340       350

              360       370       380       390       400       410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
       :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS55 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
              360       370       380       390       400       410

              420       430       440       450       460       470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
       :.:: ......:.:.:: :::.  : ..                                
CCDS55 QLAGCLASLMILLVILATGFLFESLPQT--------------------------------
              420       430                                        

              480       490       500       510       520       530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
       ::. ::. .. :::  :: ..: . :::...::: :. ..:... .:..: .   : .. 
CCDS55 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
      440       450       460       470       480       490        

              540       550       560       570       580          
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV
       :  :.:::.  .:::.::  ..   :   .: .:  :.  : ::.::  : . . .. ..
CCDS55 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA
      500       510       520       530       540       550        

     590       600       610       620       630       640         
pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL
       :       ::    .  : ......     :..:   :  . .  .:     :  ..:..
CCDS55 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV
      560       570       580       590          600            610

     650       660       670       680       690       700         
pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF
       ::::. :.:.:  .:. : .:..:.  . . ::..: . . .. :.: .::.. .   ..
CCDS55 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELL
              620       630       640       650       660       670

     710       720       730         740       750       760    
pF1KB6 FLTIHDAVLHILMKKDYSTSKFN--PSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
       : .::::::   ...  . .. .  ::::                            
CCDS55 FHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA               
              680       690       700       710                 




764 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 08:20:17 2016 done: Sat Nov  5 08:20:18 2016
 Total Scan time:  3.830 Total Display time:  0.270

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com