Result of FASTA (ccds) for pFN21AE6765
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE6765, 1019 aa
  1>>>pF1KE6765 1019 - 1019 aa - 1019 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 7.8131+/-0.00123; mu= 12.1399+/- 0.074
 mean_var=248.0807+/-50.745, 0's: 0 Z-trim(109.4): 76  B-trim: 10 in 1/51
 Lambda= 0.081429
 statistics sampled from 10820 (10883) to 10820 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.334), width:  16
 Scan time:  3.210

The best scores are:                                      opt bits E(32554)
CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2         (1121) 4565 550.9 5.2e-156
CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2         (1137) 4565 551.0 5.3e-156
CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4          (1035) 2334 288.8 3.9e-77
CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4         (1079) 2334 288.8   4e-77
CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4         (1094) 2308 285.8 3.4e-76
CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3         (1090) 2286 283.2   2e-75
CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3         (1095) 2286 283.2   2e-75
CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3         (1131) 2280 282.5 3.4e-75
CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12        (1040) 1878 235.2 5.3e-61
CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12        (1093) 1878 235.3 5.4e-61
CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2       (1088) 1860 233.2 2.3e-60
CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2       (1099) 1860 233.2 2.4e-60
CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3         (1206) 1858 233.0 2.9e-60
CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3         (1210) 1858 233.0   3e-60
CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3         (1214) 1858 233.0   3e-60
CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2       (1118) 1852 232.2 4.6e-60
CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3         (1246) 1852 232.3 4.9e-60
CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3         (1259) 1852 232.3 4.9e-60
CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5        ( 959) 1513 192.3   4e-48
CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5        ( 983) 1513 192.3 4.1e-48
CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2          (1232) 1339 172.0 6.7e-42
CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2          (1259) 1339 172.0 6.8e-42
CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5        ( 945) 1201 155.7 4.3e-37
CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5        ( 896) 1200 155.5 4.5e-37
CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12        ( 638) 1084 141.7 4.6e-33
CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12        ( 747) 1084 141.8 5.1e-33
CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7         (1227)  802 108.9 6.6e-23
CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7         (1232)  802 108.9 6.6e-23
CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7          (1241)  802 108.9 6.6e-23
CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17        ( 911)  757 103.5 2.1e-21


>>CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2              (1121 aa)
 initn: 4736 init1: 4565 opt: 4565  Z-score: 2914.3  bits: 550.9 E(32554): 5.2e-156
Smith-Waterman score: 6549; 96.3% identity (96.3% similar) in 1024 aa overlap (28-1013:92-1115)

                  10        20        30        40        50       
pF1KE6    MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
                                     ::::::::::::::::::::::::::::::
CCDS19 RPDQPQQELTGPGSGASSQDSSMDLISRTRSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
              70        80        90       100       110       120 

        60        70        80        90       100       110       
pF1KE6 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
             130       140       150       160       170       180 

       120       130       140       150       160       170       
pF1KE6 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
             190       200       210       220       230       240 

       180       190       200       210       220       230       
pF1KE6 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
             250       260       270       280       290       300 

       240       250       260       270       280       290       
pF1KE6 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
             310       320       330       340       350       360 

       300       310       320       330       340       350       
pF1KE6 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
             370       380       390       400       410       420 

       360       370       380       390       400       410       
pF1KE6 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
             430       440       450       460       470       480 

       420       430       440       450       460       470       
pF1KE6 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
             490       500       510       520       530       540 

       480       490       500       510       520       530       
pF1KE6 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
             550       560       570       580       590       600 

       540       550       560       570       580       590       
pF1KE6 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
             610       620       630       640       650       660 

       600       610       620       630       640       650       
pF1KE6 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
             670       680       690       700       710       720 

       660       670       680       690       700                 
pF1KE6 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK--------
       ::::::::::::::::::::::::::::::::::::::::::::::::::::        
CCDS19 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTKVRALVADF
             730       740       750       760       770       780 

                                   710       720       730         
pF1KE6 ------------------------------PTRPDRGWFVAPFGKNPWWVYPASILPALL
                                     ::::::::::::::::::::::::::::::
CCDS19 SIVFSILMFCGIDACFGLETPKLHVPSVIKPTRPDRGWFVAPFGKNPWWVYPASILPALL
             790       800       810       820       830       840 

     740       750       760       770       780       790         
pF1KE6 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
             850       860       870       880       890       900 

     800       810       820       830       840       850         
pF1KE6 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
             910       920       930       940       950       960 

     860       870       880       890       900       910         
pF1KE6 YMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKST
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKST
             970       980       990      1000      1010      1020 

     920       930       940       950       960       970         
pF1KE6 VAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDE
            1030      1040      1050      1060      1070      1080 

     980       990      1000      1010         
pF1KE6 EPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
       ::::::::::::::::::::::::::::::::::      
CCDS19 EPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
            1090      1100      1110      1120 

>>CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2              (1137 aa)
 initn: 5752 init1: 4565 opt: 4565  Z-score: 2914.2  bits: 551.0 E(32554): 5.3e-156
Smith-Waterman score: 6394; 94.7% identity (94.7% similar) in 1024 aa overlap (28-997:92-1115)

                  10        20        30        40        50       
pF1KE6    MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
                                     ::::::::::::::::::::::::::::::
CCDS19 RPDQPQQELTGPGSGASSQDSSMDLISRTRSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
              70        80        90       100       110       120 

        60        70        80        90       100       110       
pF1KE6 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
             130       140       150       160       170       180 

       120       130       140       150       160       170       
pF1KE6 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
             190       200       210       220       230       240 

       180       190       200       210       220       230       
pF1KE6 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
             250       260       270       280       290       300 

       240       250       260       270       280       290       
pF1KE6 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
             310       320       330       340       350       360 

       300       310       320       330       340       350       
pF1KE6 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
             370       380       390       400       410       420 

       360       370       380       390       400       410       
pF1KE6 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
             430       440       450       460       470       480 

       420       430       440       450       460       470       
pF1KE6 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
             490       500       510       520       530       540 

       480       490       500       510       520       530       
pF1KE6 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
             550       560       570       580       590       600 

       540       550       560       570       580       590       
pF1KE6 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
             610       620       630       640       650       660 

       600       610       620       630       640       650       
pF1KE6 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
             670       680       690       700       710       720 

       660       670       680       690       700                 
pF1KE6 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK--------
       ::::::::::::::::::::::::::::::::::::::::::::::::::::        
CCDS19 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTKVRALVADF
             730       740       750       760       770       780 

                                   710       720       730         
pF1KE6 ------------------------------PTRPDRGWFVAPFGKNPWWVYPASILPALL
                                     ::::::::::::::::::::::::::::::
CCDS19 SIVFSILMFCGIDACFGLETPKLHVPSVIKPTRPDRGWFVAPFGKNPWWVYPASILPALL
             790       800       810       820       830       840 

     740       750       760       770       780       790         
pF1KE6 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
             850       860       870       880       890       900 

     800       810       820       830       840       850         
pF1KE6 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
             910       920       930       940       950       960 

     860       870                       880       890       900   
pF1KE6 YMGVASLNGIQ----------------FWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFT
       :::::::::::                :::::::::::::::::::::::::::::::::
CCDS19 YMGVASLNGIQMGTGGSEFKIQKKLTPFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFT
             970       980       990      1000      1010      1020 

           910       920       930       940       950       960   
pF1KE6 LVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKET
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKET
            1030      1040      1050      1060      1070      1080 

           970       980       990      1000      1010         
pF1KE6 DKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
       ::::::::::::::::::::::::::::::::::                      
CCDS19 DKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
            1090      1100      1110      1120      1130       

>>CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4               (1035 aa)
 initn: 4149 init1: 1438 opt: 2334  Z-score: 1498.2  bits: 288.8 E(32554): 3.9e-77
Smith-Waterman score: 4146; 62.7% identity (80.7% similar) in 1021 aa overlap (28-1000:42-1012)

                  10        20        30        40         50      
pF1KE6    MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL
                                     :::::... ::::::..: :  ::::.: :
CCDS35 NLGERGRARSSTFLRVVQPMFNHSIFTSAVSPAAERIRFILGEEDDSPAPPQLFTELDEL
              20        30        40        50        60        70 

          60        70        80        90       100       110     
pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD
          ::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: .
CCDS35 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE
              80        90       100       110       120       130 

         120       130       140       150       160       170     
pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN
       ..::::... ....::: :::.:::...:.:.:::.:::::::   ::::::::.::...
CCDS35 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS
             140       150       160       170       180       190 

         180       190       200       210       220       230     
pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP
       :  .   ...:.. :                 .  : :.::::  :. :: :::::::.:
CCDS35 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP
             200                       210       220       230     

         240       250       260       270       280       290     
pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE
       .:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.:
CCDS35 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE
         240       250       260       270       280       290     

         300       310       320       330       340       350     
pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS
       ::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..::
CCDS35 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS
         300       310       320       330       340       350     

         360       370       380       390       400       410     
pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP
       .::::...: .:  ::::..      :   .:: :::: :                    
CCDS35 SDKRKNMYSGGENVQMNGDT------PH--DGGHGGGGHGDC------------------
         360       370               380                           

         420       430       440       450       460       470     
pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF
             :::  :::: :::  ::::: :.: :::::...::..::::::::. .::::::
CCDS35 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF
           390       400       410       420       430       440   

         480       490       500       510       520       530     
pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG
       ::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :.
CCDS35 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN
           450       460       470       480       490       500   

         540       550       560       570       580       590     
pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA
       .::.:::::::: ::  :::::::::::...:.:::::::::.::::::::::.::::  
CCDS35 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL
           510       520       530       540       550       560   

         600       610       620       630         640       650   
pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW
         ::::: .:: .. : ..: :: :: .: .. : .. :::.   . :  .. . :..::
CCDS35 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW
           570       580       590       600        610       620  

           660       670       680       690       700             
pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT-----
       ..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : ::::     
CCDS35 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL
            630       640       650       660       670       680  

                                       710       720       730     
pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL
                                        ::: :.::::: :::.:::::  :. .
CCDS35 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI
            690       700       710       720       730       740  

         740       750       760       770       780       790     
pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV
       ::::::::::::::::::::::::.::::.::::::::::.:::..::.:.:::::::::
CCDS35 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV
            750       760       770       780       790       800  

         800       810       820       830       840       850     
pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY
       ::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.::::
CCDS35 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY
            810       820       830       840       850       860  

         860       870       880       890       900       910     
pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI
       :::::::::::::.:: .: ::.::: :::::  .::::::::.::::..:.::::.:::
CCDS35 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI
            870       880       890       900       910       920  

         920       930       940       950       960         970   
pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA
       :::::::::::::::.:. ::. .:..::::::...:...:::.::  : .::.:.:::.
CCDS35 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS
            930       940       950       960       970       980  

           980           990      1000      1010             
pF1KE6 HEDCDEEPQFPP----PSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL    
        .. ... . :     :: :::::. ....:                       
CCDS35 LDSDNDDSDCPYSEKVPS-IKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC
            990      1000       1010      1020      1030     

>>CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4              (1079 aa)
 initn: 4149 init1: 1438 opt: 2334  Z-score: 1498.0  bits: 288.8 E(32554): 4e-77
Smith-Waterman score: 4146; 62.7% identity (80.7% similar) in 1021 aa overlap (28-1000:86-1056)

                  10        20        30        40         50      
pF1KE6    MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL
                                     :::::... ::::::..: :  ::::.: :
CCDS43 EKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDEL
          60        70        80        90       100       110     

          60        70        80        90       100       110     
pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD
          ::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: .
CCDS43 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE
         120       130       140       150       160       170     

         120       130       140       150       160       170     
pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN
       ..::::... ....::: :::.:::...:.:.:::.:::::::   ::::::::.::...
CCDS43 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS
         180       190       200       210       220       230     

         180       190       200       210       220       230     
pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP
       :  .   ...:.. :                 .  : :.::::  :. :: :::::::.:
CCDS43 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP
         240       250                       260       270         

         240       250       260       270       280       290     
pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE
       .:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.:
CCDS43 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE
     280       290       300       310       320       330         

         300       310       320       330       340       350     
pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS
       ::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..::
CCDS43 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS
     340       350       360       370       380       390         

         360       370       380       390       400       410     
pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP
       .::::...: .:  ::::..      :   .:: :::: :                    
CCDS43 SDKRKNMYSGGENVQMNGDT------PH--DGGHGGGGHGDC------------------
     400       410             420         430                     

         420       430       440       450       460       470     
pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF
             :::  :::: :::  ::::: :.: :::::...::..::::::::. .::::::
CCDS43 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF
                 440       450       460       470       480       

         480       490       500       510       520       530     
pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG
       ::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :.
CCDS43 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN
       490       500       510       520       530       540       

         540       550       560       570       580       590     
pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA
       .::.:::::::: ::  :::::::::::...:.:::::::::.::::::::::.::::  
CCDS43 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL
       550       560       570       580       590       600       

         600       610       620       630         640       650   
pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW
         ::::: .:: .. : ..: :: :: .: .. : .. :::.   . :  .. . :..::
CCDS43 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW
       610       620       630       640        650       660      

           660       670       680       690       700             
pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT-----
       ..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : ::::     
CCDS43 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL
        670       680       690       700       710       720      

                                       710       720       730     
pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL
                                        ::: :.::::: :::.:::::  :. .
CCDS43 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI
        730       740       750       760       770       780      

         740       750       760       770       780       790     
pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV
       ::::::::::::::::::::::::.::::.::::::::::.:::..::.:.:::::::::
CCDS43 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV
        790       800       810       820       830       840      

         800       810       820       830       840       850     
pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY
       ::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.::::
CCDS43 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY
        850       860       870       880       890       900      

         860       870       880       890       900       910     
pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI
       :::::::::::::.:: .: ::.::: :::::  .::::::::.::::..:.::::.:::
CCDS43 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI
        910       920       930       940       950       960      

         920       930       940       950       960         970   
pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA
       :::::::::::::::.:. ::. .:..::::::...:...:::.::  : .::.:.:::.
CCDS43 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS
        970       980       990      1000      1010      1020      

           980           990      1000      1010             
pF1KE6 HEDCDEEPQFPP----PSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL    
        .. ... . :     :: :::::. ....:                       
CCDS43 LDSDNDDSDCPYSEKVPS-IKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC
       1030      1040       1050      1060      1070         

>>CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4              (1094 aa)
 initn: 4149 init1: 1438 opt: 2308  Z-score: 1481.5  bits: 285.8 E(32554): 3.4e-76
Smith-Waterman score: 4120; 63.5% identity (81.1% similar) in 998 aa overlap (28-980:86-1034)

                  10        20        30        40         50      
pF1KE6    MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL
                                     :::::... ::::::..: :  ::::.: :
CCDS47 EKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDEL
          60        70        80        90       100       110     

          60        70        80        90       100       110     
pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD
          ::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: .
CCDS47 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE
         120       130       140       150       160       170     

         120       130       140       150       160       170     
pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN
       ..::::... ....::: :::.:::...:.:.:::.:::::::   ::::::::.::...
CCDS47 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS
         180       190       200       210       220       230     

         180       190       200       210       220       230     
pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP
       :  .   ...:.. :                 .  : :.::::  :. :: :::::::.:
CCDS47 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP
         240       250                       260       270         

         240       250       260       270       280       290     
pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE
       .:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.:
CCDS47 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE
     280       290       300       310       320       330         

         300       310       320       330       340       350     
pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS
       ::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..::
CCDS47 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS
     340       350       360       370       380       390         

         360       370       380       390       400       410     
pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP
       .::::...: .:  ::::..      :   .:: :::: :                    
CCDS47 SDKRKNMYSGGENVQMNGDT------P--HDGGHGGGGHGDC------------------
     400       410             420         430                     

         420       430       440       450       460       470     
pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF
             :::  :::: :::  ::::: :.: :::::...::..::::::::. .::::::
CCDS47 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF
                 440       450       460       470       480       

         480       490       500       510       520       530     
pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG
       ::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :.
CCDS47 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN
       490       500       510       520       530       540       

         540       550       560       570       580       590     
pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA
       .::.:::::::: ::  :::::::::::...:.:::::::::.::::::::::.::::  
CCDS47 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL
       550       560       570       580       590       600       

         600       610       620       630         640       650   
pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW
         ::::: .:: .. : ..: :: :: .: .. : .. :::.   . :  .. . :..::
CCDS47 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW
       610       620       630       640        650       660      

           660       670       680       690       700             
pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT-----
       ..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : ::::     
CCDS47 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL
        670       680       690       700       710       720      

                                       710       720       730     
pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL
                                        ::: :.::::: :::.:::::  :. .
CCDS47 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI
        730       740       750       760       770       780      

         740       750       760       770       780       790     
pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV
       ::::::::::::::::::::::::.::::.::::::::::.:::..::.:.:::::::::
CCDS47 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV
        790       800       810       820       830       840      

         800       810       820       830       840       850     
pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY
       ::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.::::
CCDS47 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY
        850       860       870       880       890       900      

         860       870       880       890       900       910     
pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI
       :::::::::::::.:: .: ::.::: :::::  .::::::::.::::..:.::::.:::
CCDS47 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI
        910       920       930       940       950       960      

         920       930       940       950       960         970   
pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA
       :::::::::::::::.:. ::. .:..::::::...:...:::.::  : .::.:.:::.
CCDS47 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS
        970       980       990      1000      1010      1020      

            980       990      1000      1010                      
pF1KE6 HE-DCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL             
        . : :.:                                                    
CCDS47 LDSDNDDEKDHQHSLNATHHADKIPFLQSLGMPSPPRTPVKVVPQIRIELEPEDNDYFWR
       1030      1040      1050      1060      1070      1080      

>>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3              (1090 aa)
 initn: 3031 init1: 1247 opt: 2286  Z-score: 1467.5  bits: 283.2 E(32554): 2e-75
Smith-Waterman score: 3093; 47.1% identity (72.7% similar) in 1064 aa overlap (15-1004:64-1069)

                               10        20               30       
pF1KE6                 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ
                                     : .:.::  :...       ::.    ...
CCDS58 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR
            40        50        60        70        80        90   

            40           50         60        70        80         
pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH
       .: ::: ::  :   :  :::::: : . ::...::::.:::.:::: ::.::.:::::.
CCDS58 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY
           100       110       120       130       140       150   

      90       100       110       120       130       140         
pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL
       :.:::::::::::.:. .:::.::. ...: .: : :....: .: :   .:: :  .::
CCDS58 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL
           160       170       180       190       200       210   

     150             160       170           180       190         
pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ
       .::.::..:      :. ::.:::::. :  .   :.    :: ..:.   .... ... 
CCDS58 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG
           220       230       240       250       260       270   

     200       210       220       230       240       250         
pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV
       ... :      ::  . .... ..:.   .::.:::  .:::::::::::::..:.::::
CCDS58 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV
                 280        290          300       310       320   

     260       270       280       290       300       310         
pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR
       ::  ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..:
CCDS58 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR
           330       340       350       360       370       380   

     320       330       340       350       360        370        
pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG
       .::..:::::::.: :::::::::.:::::::.::: .:::  ::        :::.   
CCDS58 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL
           390       400       410       420              430      

      380       390       400       410       420       430        
pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI
       : .:                                 : :. : ::  :::.:::: :::
CCDS58 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI
        440                                      450       460     

      440       450       460       470       480       490        
pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM
       ::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::..  ...::..:...
CCDS58 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL
         470       480       490       500       510       520     

      500       510       520       530       540       550        
pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA
       .:  . ::.:::: ::.::::.:.:::.:. : .   :.:. .:  ::: ..  :..:::
CCDS58 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA
         530       540       550       560       570       580     

      560       570       580       590       600       610        
pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV
       :::: .. ::::::::.:..:: .::::.:..:..   . : .::  . . .:.:.: :.
CCDS58 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT
         590       600       610       620       630       640     

      620       630       640       650       660       670        
pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K
        : . .. ..   :    : : . .:.      .:  :. .:: .  : .::..:     
CCDS58 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP
         650          660              670       680       690     

          680       690       700                                  
pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------------------------
       .:::. .   :::: :. ..  ::.:: .::::::                         
CCDS58 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG
         700       710       720       730       740       750     

                  710       720       730       740       750      
pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN
                    ::.:.:::...:.: ::::.   . .:::: ::::::::::::::.:
CCDS58 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN
         760       770       780       790       800       810     

        760       770       780       790       800       810      
pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ
       :::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: ::::::
CCDS58 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ
         820       830       840       850       860       870     

        820       830       840       850       860       870      
pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK
       :.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: :
CCDS58 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK
         880       890       900       910       920       930     

        880       890       900       910       920       930      
pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR
       :: ::::::::  .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..::
CCDS58 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR
         940       950       960       970       980       990     

        940       950        960       970          980         990
pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK
       .:.:. :....:.:.:...:: :.::: :::.:.:. :.   .: :.  ..:    :...
CCDS58 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ
        1000      1010      1020      1030      1040      1050     

             1000      1010               
pF1KE6 IPMESVQSDPQNGIHCIARKRSSSWSYSL      
       ::..... .:.. .                     
CCDS58 IPVKALKYSPDKPVSVKISFEDEPRKKYVDAETSL
        1060      1070      1080      1090

>>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3              (1095 aa)
 initn: 3031 init1: 1247 opt: 2286  Z-score: 1467.5  bits: 283.2 E(32554): 2e-75
Smith-Waterman score: 3093; 47.1% identity (72.7% similar) in 1064 aa overlap (15-1004:69-1074)

                               10        20               30       
pF1KE6                 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ
                                     : .:.::  :...       ::.    ...
CCDS82 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR
       40        50        60        70        80        90        

            40           50         60        70        80         
pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH
       .: ::: ::  :   :  :::::: : . ::...::::.:::.:::: ::.::.:::::.
CCDS82 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY
      100       110       120       130       140       150        

      90       100       110       120       130       140         
pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL
       :.:::::::::::.:. .:::.::. ...: .: : :....: .: :   .:: :  .::
CCDS82 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL
      160       170       180       190       200       210        

     150             160       170           180       190         
pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ
       .::.::..:      :. ::.:::::. :  .   :.    :: ..:.   .... ... 
CCDS82 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG
      220       230       240       250       260       270        

     200       210       220       230       240       250         
pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV
       ... :      ::  . .... ..:.   .::.:::  .:::::::::::::..:.::::
CCDS82 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV
      280             290           300       310       320        

     260       270       280       290       300       310         
pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR
       ::  ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..:
CCDS82 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR
      330       340       350       360       370       380        

     320       330       340       350       360        370        
pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG
       .::..:::::::.: :::::::::.:::::::.::: .:::  ::        :::.   
CCDS82 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL
      390       400       410       420       430              440 

      380       390       400       410       420       430        
pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI
       : .:                                 : :. : ::  :::.:::: :::
CCDS82 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI
                                            450       460       470

      440       450       460       470       480       490        
pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM
       ::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::..  ...::..:...
CCDS82 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL
              480       490       500       510       520       530

      500       510       520       530       540       550        
pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA
       .:  . ::.:::: ::.::::.:.:::.:. : .   :.:. .:  ::: ..  :..:::
CCDS82 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA
              540       550       560       570       580       590

      560       570       580       590       600       610        
pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV
       :::: .. ::::::::.:..:: .::::.:..:..   . : .::  . . .:.:.: :.
CCDS82 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT
              600       610       620       630       640       650

      620       630       640       650       660       670        
pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K
        : . .. ..   :    : : . .:.      .:  :. .:: .  : .::..:     
CCDS82 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP
              660           670             680       690       700

          680       690       700                                  
pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------------------------
       .:::. .   :::: :. ..  ::.:: .::::::                         
CCDS82 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG
              710       720       730       740       750       760

                  710       720       730       740       750      
pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN
                    ::.:.:::...:.: ::::.   . .:::: ::::::::::::::.:
CCDS82 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN
              770       780       790       800       810       820

        760       770       780       790       800       810      
pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ
       :::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: ::::::
CCDS82 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ
              830       840       850       860       870       880

        820       830       840       850       860       870      
pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK
       :.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: :
CCDS82 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK
              890       900       910       920       930       940

        880       890       900       910       920       930      
pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR
       :: ::::::::  .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..::
CCDS82 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR
              950       960       970       980       990      1000

        940       950        960       970          980         990
pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK
       .:.:. :....:.:.:...:: :.::: :::.:.:. :.   .: :.  ..:    :...
CCDS82 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ
             1010      1020      1030      1040      1050      1060

             1000      1010               
pF1KE6 IPMESVQSDPQNGIHCIARKRSSSWSYSL      
       ::..... .:.. .                     
CCDS82 IPVKALKYSPDKPVSVKISFEDEPRKKYVDAETSL
             1070      1080      1090     

>>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3              (1131 aa)
 initn: 3031 init1: 1247 opt: 2280  Z-score: 1463.5  bits: 282.5 E(32554): 3.4e-75
Smith-Waterman score: 3087; 46.7% identity (72.5% similar) in 1077 aa overlap (15-1015:69-1087)

                               10        20               30       
pF1KE6                 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ
                                     : .:.::  :...       ::.    ...
CCDS58 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR
       40        50        60        70        80        90        

            40           50         60        70        80         
pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH
       .: ::: ::  :   :  :::::: : . ::...::::.:::.:::: ::.::.:::::.
CCDS58 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY
      100       110       120       130       140       150        

      90       100       110       120       130       140         
pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL
       :.:::::::::::.:. .:::.::. ...: .: : :....: .: :   .:: :  .::
CCDS58 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL
      160       170       180       190       200       210        

     150             160       170           180       190         
pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ
       .::.::..:      :. ::.:::::. :  .   :.    :: ..:.   .... ... 
CCDS58 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG
      220       230       240       250       260       270        

     200       210       220       230       240       250         
pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV
       ... :      ::  . .... ..:.   .::.:::  .:::::::::::::..:.::::
CCDS58 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV
      280             290           300       310       320        

     260       270       280       290       300       310         
pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR
       ::  ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..:
CCDS58 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR
      330       340       350       360       370       380        

     320       330       340       350       360        370        
pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG
       .::..:::::::.: :::::::::.:::::::.::: .:::  ::        :::.   
CCDS58 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL
      390       400       410       420       430              440 

      380       390       400       410       420       430        
pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI
       : .:                                 : :. : ::  :::.:::: :::
CCDS58 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI
                                            450       460       470

      440       450       460       470       480       490        
pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM
       ::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::..  ...::..:...
CCDS58 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL
              480       490       500       510       520       530

      500       510       520       530       540       550        
pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA
       .:  . ::.:::: ::.::::.:.:::.:. : .   :.:. .:  ::: ..  :..:::
CCDS58 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA
              540       550       560       570       580       590

      560       570       580       590       600       610        
pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV
       :::: .. ::::::::.:..:: .::::.:..:..   . : .::  . . .:.:.: :.
CCDS58 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT
              600       610       620       630       640       650

      620       630       640       650       660       670        
pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K
        : . .. ..   :    : : . .:.      .:  :. .:: .  : .::..:     
CCDS58 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP
              660           670             680       690       700

          680       690       700                                  
pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------------------------
       .:::. .   :::: :. ..  ::.:: .::::::                         
CCDS58 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG
              710       720       730       740       750       760

                  710       720       730       740       750      
pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN
                    ::.:.:::...:.: ::::.   . .:::: ::::::::::::::.:
CCDS58 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN
              770       780       790       800       810       820

        760       770       780       790       800       810      
pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ
       :::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: ::::::
CCDS58 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ
              830       840       850       860       870       880

        820       830       840       850       860       870      
pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK
       :.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: :
CCDS58 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK
              890       900       910       920       930       940

        880       890       900       910       920       930      
pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR
       :: ::::::::  .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..::
CCDS58 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR
              950       960       970       980       990      1000

        940       950        960       970          980         990
pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK
       .:.:. :....:.:.:...:: :.::: :::.:.:. :.   .: :.  ..:    :...
CCDS58 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ
             1010      1020      1030      1040      1050      1060

             1000      1010                                        
pF1KE6 IPMESVQSDPQNGIHCIARK--RSSSWSYSL                             
       ::..... . . .:  :. .  ....:                                 
CCDS58 IPVKALKYSVDPSIVNISDEMAKTAQWKALSMNTENAKVTRSNMSPDKPVSVKISFEDEP
             1070      1080      1090      1100      1110      1120

>>CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12             (1040 aa)
 initn: 3137 init1: 1277 opt: 1878  Z-score: 1208.7  bits: 235.2 E(32554): 5.3e-61
Smith-Waterman score: 3094; 47.3% identity (72.1% similar) in 1056 aa overlap (4-1006:17-1004)

                            10        20        30         40      
pF1KE6              MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILG-EEDEAPN
                       :... : ::    ...      . .:. ...: ::: ::::   
CCDS73 MPLGRQSHRHHRTHGQKHRRRGRGKGASQGEEGLEALAHDTPS-QRVQFILGTEEDEEHV
               10        20        30        40         50         

          50         60        70        80        90       100    
pF1KE6 P-TLFTEMDTL-QHDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTC
       :  ::::.: . ...:.. ::::.:::.:::: ::.::::::::.:.:::::::::::.:
CCDS73 PHELFTELDEICMKEGEDAEWKETARWLKFEEDVEDGGERWSKPYVATLSLHSLFELRSC
      60        70        80        90       100       110         

          110       120       130       140       150              
pF1KE6 LQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKK------
       : .::::::. ..:. .: : ....:  .. :   .: .:  .::..:.::..:      
CCDS73 LINGTVLLDMHANSIEEISDLILDQQELSSDLNDSMRVKVREALLKKHHHQNEKKRNNLI
     120       130       140       150       160       170         

      160       170       180       190       200       210        
pF1KE6 PIHRSLADIGKSVSTTNRSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDIS
       :: ::.:..::. :  .    ..  ..:.    : .:......:    :. .  ... ..
CCDS73 PIVRSFAEVGKKQSDPHLMDKHGQTVSPQ-SVPTTNLEVKNGVN----CEHSPVDLSKVD
     180       190       200        210       220           230    

      220       230       240       250       260       270        
pF1KE6 LTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTR
       :         .::::::  .:::::::::::.::.:..:::::  ...:.:.::::.:::
CCDS73 L---------HFMKKIPTGAEASNVLVGEVDILDRPIVAFVRLSPAVLLSGLTEVPIPTR
                   240       250       260       270       280     

      280       290       300       310       320       330        
pF1KE6 FLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPP
       :::::::: :....:.::::..::.:.:..: ::::::..:.::.::::::::.: ::::
CCDS73 FLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYKAKERDDLLAGIDEFLDQVTVLPP
         290       300       310       320       330       340     

      340       350       360       370       380       390        
pF1KE6 GEWDPNIRIEPPKKVPSADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGA
       :::::.:::::::.::: .:::        :  ::.:      : ::..:          
CCDS73 GEWDPSIRIEPPKNVPSQEKRKMP------GVPNGNVCHIEQEPHGGHSG----------
         350       360             370       380                   

      400       410       420       430       440       450        
pF1KE6 GSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSI
                       :       ::  :::.:::: :::::: ::. ::. :.. .: .
CCDS73 ----------------P-------ELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQCL
                     390              400       410       420      

      460       470       480       490       500       510        
pF1KE6 SAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTG
       ...::.: .:.. .::::::::.::..  ...::..:..:.:  . ::.:: : ::.:::
CCDS73 ASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGSTG
        430       440       450       460       470       480      

      520       530       540       550       560       570        
pF1KE6 PILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFST
       :.:.:::.:: : :  .:.:. .:  ::: .:  :..::::::: .. ::::::::.:..
CCDS73 PVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAFAS
        490       500       510       520       530       540      

      580       590       600       610       620       630        
pF1KE6 LISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDT
       :: .::::.::.:.:   . :::.:  . . .. : :.:. :.. :    : .     : 
CCDS73 LICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPN----NHTLQYWKDH
        550       560       570       580       590           600  

      640       650       660       670           680       690    
pF1KE6 NASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----KFIPDLALMSFILFFGTYSMT
       :      .  . . :. :. .::  . :...:..:     . ::. . : :::: :. ..
CCDS73 N------IVTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILS
                  610       620       630       640       650      

          700                                             710      
pF1KE6 LTLKKFKFSRYFPT--------------------------------------KPTRPDRG
        ::: :: ::::::                                      :::: :::
CCDS73 STLKTFKTSRYFPTRVRSMVSDFAVFLTIFTMVIIDFLIGVPSPKLQVPSVFKPTRDDRG
        660       670       680       690       700       710      

        720       730       740       750       760       770      
pF1KE6 WFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVG
       :.. :.: ::::.  :.:.:::: ::::::::::::::.::::.::::. ::::::. :.
CCDS73 WIINPIGPNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVA
        720       730       740       750       760       770      

        780       790       800       810       820       830      
pF1KE6 ILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILT
       :....::.:::::.:::::.::.:..:::.:.: :::::::.:::.:::::::...:.: 
CCDS73 IMLGVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLM
        780       790       800       810       820       830      

        840       850       860       870       880       890      
pF1KE6 GISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPL
       : :::.. ::: ::.::::::::::::.::.::::..: ::: ::::::::  .::::::
CCDS73 GCSVFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPL
        840       850       860       870       880       890      

        900       910       920       930       940       950      
pF1KE6 RRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILP
       :..:::::.:. ::..::..:.. :::.::.:.:.:..::...:. ::...:.:.:...:
CCDS73 RKVHLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKVMDLCFSKRELSWLDDLMP
        900       910       920       930       940       950      

        960       970       980       990        1000      1010    
pF1KE6 EKEKKETDKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQ--SDPQNGIHCIARKRSSS
       :..::. :  .:. :   :. . : ..   .  :.:.:: .  :.: ..: :        
CCDS73 ESKKKKLDDAKKKAK---EEEEAEKMLEIGGD-KFPLESRKLLSSPGKNISCRCDPSEIN
        960       970          980        990      1000      1010  

                                   
pF1KE6 WSYSL                       
                                   
CCDS73 ISDEMPKTTVWKALSMNSGNAKEKSLFN
           1020      1030      1040

>>CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12             (1093 aa)
 initn: 3137 init1: 1277 opt: 1878  Z-score: 1208.5  bits: 235.3 E(32554): 5.4e-61
Smith-Waterman score: 3094; 47.3% identity (72.1% similar) in 1056 aa overlap (4-1006:70-1057)

                                          10        20        30   
pF1KE6                            MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQ
                                     :... : ::    ...      . .:. ..
CCDS44 EELEGHRTLYVGVRMPLGRQSHRHHRTHGQKHRRRGRGKGASQGEEGLEALAHDTPS-QR
      40        50        60        70        80        90         

             40         50         60        70        80        90
pF1KE6 LQDILG-EEDEAPNP-TLFTEMDTL-QHDGDQMEWKESARWIKFEEKVEEGGERWSKPHV
       .: ::: ::::   :  ::::.: . ...:.. ::::.:::.:::: ::.::::::::.:
CCDS44 VQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDVEDGGERWSKPYV
      100       110       120       130       140       150        

              100       110       120       130       140       150
pF1KE6 STLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLR
       .:::::::::::.:: .::::::. ..:. .: : ....:  .. :   .: .:  .::.
CCDS44 ATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLNDSMRVKVREALLK
      160       170       180       190       200       210        

                    160       170       180       190       200    
pF1KE6 RHRHQTKK------PIHRSLADIGKSVSTTNRSPARSPGAGPSLHHSTEDLRMRQSANYG
       .:.::..:      :: ::.:..::. :  .    ..  ..:.    : .:......:  
CCDS44 KHHHQNEKKRNNLIPIVRSFAEVGKKQSDPHLMDKHGQTVSPQ-SVPTTNLEVKNGVN--
      220       230       240       250       260        270       

          210       220       230       240       250       260    
pF1KE6 RLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFVRLIQS
         :. .  ... ..:         .::::::  .:::::::::::.::.:..:::::  .
CCDS44 --CEHSPVDLSKVDL---------HFMKKIPTGAEASNVLVGEVDILDRPIVAFVRLSPA
           280                290       300       310       320    

          270       280       290       300       310       320    
pF1KE6 AMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNREDLIA
       ..:.:.::::.::::::::::: :....:.::::..::.:.:..: ::::::..:.::.:
CCDS44 VLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYKAKERDDLLA
          330       340       350       360       370       380    

          330       340       350       360       370       380    
pF1KE6 GIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRKSVFSLAELGQMNGSVGGGGGAPGG
       :::::::.: :::::::::.:::::::.::: .:::        :  ::.:      : :
CCDS44 GIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQEKRKMP------GVPNGNVCHIEQEPHG
          390       400       410       420             430        

          390       400       410       420       430       440    
pF1KE6 GNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDIKRKLPW
       :..:                          :       ::  :::.:::: :::::: ::
CCDS44 GHSG--------------------------P-------ELQRTGRLFGGLVLDIKRKAPW
      440                                        450       460     

          450       460       470       480       490       500    
pF1KE6 FPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAMAGSLFC
       . ::. :.. .: ....::.: .:.. .::::::::.::..  ...::..:..:.:  . 
CCDS44 YWSDYRDALSLQCLASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYS
         470       480       490       500       510       520     

          510       520       530       540       550       560    
pF1KE6 LFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVATDASFI
       ::.:: : ::.::::.:.:::.:: : :  .:.:. .:  ::: .:  :..::::::: .
CCDS44 LFAGQALTILGSTGPVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSL
         530       540       550       560       570       580     

          570       580       590       600       610       620    
pF1KE6 IKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECVAPDTVN
       . ::::::::.:..:: .::::.::.:.:   . :::.:  . . .. : :.:. :.. :
CCDS44 VCYITRFTEEAFASLICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPN
         590       600       610       620       630       640     

          630       640       650       660       670           680
pF1KE6 TTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----KFIPDLA
           : .     : :      .  . . :. :. .::  . :...:..:     . ::. 
CCDS44 ----NHTLQYWKDHN------IVTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVL
             650             660       670       680       690     

              690       700                                        
pF1KE6 LMSFILFFGTYSMTLTLKKFKFSRYFPT--------------------------------
       . : :::: :. .. ::: :: ::::::                                
CCDS44 FWSCILFFTTFILSSTLKTFKTSRYFPTRVRSMVSDFAVFLTIFTMVIIDFLIGVPSPKL
         700       710       720       730       740       750     

            710       720       730       740       750       760  
pF1KE6 ------KPTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVNRKENKL
             :::: ::::.. :.: ::::.  :.:.:::: ::::::::::::::.::::.::
CCDS44 QVPSVFKPTRDDRGWIINPIGPNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKL
         760       770       780       790       800       810     

            770       780       790       800       810       820  
pF1KE6 KKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQPQFLGV
       ::. ::::::. :.:....::.:::::.:::::.::.:..:::.:.: :::::::.:::.
CCDS44 KKGCGYHLDLLMVAIMLGVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGI
         820       830       840       850       860       870     

            830       840       850       860       870       880  
pF1KE6 REQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCKLFLMPA
       :::::::...:.: : :::.. ::: ::.::::::::::::.::.::::..: ::: :::
CCDS44 REQRVTGLMIFVLMGCSVFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPA
         880       890       900       910       920       930     

            890       900       910       920       930       940  
pF1KE6 KHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFI
       :::::  .:::::::..:::::.:. ::..::..:.. :::.::.:.:.:..::...:. 
CCDS44 KHQPDFIYLRHVPLRKVHLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKVMDLC
         940       950       960       970       980       990     

            950       960       970       980       990        1000
pF1KE6 FSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQ--SDP
       ::...:.:.:...::..::. :  .:. :   :. . : ..   .  :.:.:: .  :.:
CCDS44 FSKRELSWLDDLMPESKKKKLDDAKKKAK---EEEEAEKMLEIGGD-KFPLESRKLLSSP
        1000      1010      1020         1030       1040      1050 

             1010                                
pF1KE6 QNGIHCIARKRSSSWSYSL                       
        ..: :                                    
CCDS44 GKNISCRCDPSEINISDEMPKTTVWKALSMNSGNAKEKSLFN
            1060      1070      1080      1090   




1019 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Tue Nov  8 16:10:00 2016 done: Tue Nov  8 16:10:00 2016
 Total Scan time:  3.210 Total Display time:  0.360

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com