FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6765, 1019 aa
1>>>pF1KE6765 1019 - 1019 aa - 1019 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8131+/-0.00123; mu= 12.1399+/- 0.074
mean_var=248.0807+/-50.745, 0's: 0 Z-trim(109.4): 76 B-trim: 10 in 1/51
Lambda= 0.081429
statistics sampled from 10820 (10883) to 10820 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.334), width: 16
Scan time: 3.210
The best scores are: opt bits E(32554)
CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121) 4565 550.9 5.2e-156
CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137) 4565 551.0 5.3e-156
CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035) 2334 288.8 3.9e-77
CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079) 2334 288.8 4e-77
CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094) 2308 285.8 3.4e-76
CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090) 2286 283.2 2e-75
CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095) 2286 283.2 2e-75
CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131) 2280 282.5 3.4e-75
CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040) 1878 235.2 5.3e-61
CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093) 1878 235.3 5.4e-61
CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2 (1088) 1860 233.2 2.3e-60
CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2 (1099) 1860 233.2 2.4e-60
CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3 (1206) 1858 233.0 2.9e-60
CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3 (1210) 1858 233.0 3e-60
CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3 (1214) 1858 233.0 3e-60
CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2 (1118) 1852 232.2 4.6e-60
CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3 (1246) 1852 232.3 4.9e-60
CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3 (1259) 1852 232.3 4.9e-60
CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 959) 1513 192.3 4e-48
CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 983) 1513 192.3 4.1e-48
CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232) 1339 172.0 6.7e-42
CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259) 1339 172.0 6.8e-42
CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 945) 1201 155.7 4.3e-37
CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 896) 1200 155.5 4.5e-37
CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 638) 1084 141.7 4.6e-33
CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 747) 1084 141.8 5.1e-33
CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227) 802 108.9 6.6e-23
CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232) 802 108.9 6.6e-23
CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241) 802 108.9 6.6e-23
CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 ( 911) 757 103.5 2.1e-21
>>CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121 aa)
initn: 4736 init1: 4565 opt: 4565 Z-score: 2914.3 bits: 550.9 E(32554): 5.2e-156
Smith-Waterman score: 6549; 96.3% identity (96.3% similar) in 1024 aa overlap (28-1013:92-1115)
10 20 30 40 50
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
::::::::::::::::::::::::::::::
CCDS19 RPDQPQQELTGPGSGASSQDSSMDLISRTRSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
70 80 90 100 110 120
60 70 80 90 100 110
pF1KE6 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
130 140 150 160 170 180
120 130 140 150 160 170
pF1KE6 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
190 200 210 220 230 240
180 190 200 210 220 230
pF1KE6 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
250 260 270 280 290 300
240 250 260 270 280 290
pF1KE6 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
310 320 330 340 350 360
300 310 320 330 340 350
pF1KE6 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
370 380 390 400 410 420
360 370 380 390 400 410
pF1KE6 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
430 440 450 460 470 480
420 430 440 450 460 470
pF1KE6 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
490 500 510 520 530 540
480 490 500 510 520 530
pF1KE6 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
550 560 570 580 590 600
540 550 560 570 580 590
pF1KE6 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
610 620 630 640 650 660
600 610 620 630 640 650
pF1KE6 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
670 680 690 700 710 720
660 670 680 690 700
pF1KE6 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK--------
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTKVRALVADF
730 740 750 760 770 780
710 720 730
pF1KE6 ------------------------------PTRPDRGWFVAPFGKNPWWVYPASILPALL
::::::::::::::::::::::::::::::
CCDS19 SIVFSILMFCGIDACFGLETPKLHVPSVIKPTRPDRGWFVAPFGKNPWWVYPASILPALL
790 800 810 820 830 840
740 750 760 770 780 790
pF1KE6 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
850 860 870 880 890 900
800 810 820 830 840 850
pF1KE6 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
910 920 930 940 950 960
860 870 880 890 900 910
pF1KE6 YMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKST
970 980 990 1000 1010 1020
920 930 940 950 960 970
pF1KE6 VAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDE
1030 1040 1050 1060 1070 1080
980 990 1000 1010
pF1KE6 EPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
::::::::::::::::::::::::::::::::::
CCDS19 EPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
1090 1100 1110 1120
>>CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137 aa)
initn: 5752 init1: 4565 opt: 4565 Z-score: 2914.2 bits: 551.0 E(32554): 5.3e-156
Smith-Waterman score: 6394; 94.7% identity (94.7% similar) in 1024 aa overlap (28-997:92-1115)
10 20 30 40 50
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
::::::::::::::::::::::::::::::
CCDS19 RPDQPQQELTGPGSGASSQDSSMDLISRTRSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ
70 80 90 100 110 120
60 70 80 90 100 110
pF1KE6 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG
130 140 150 160 170 180
120 130 140 150 160 170
pF1KE6 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS
190 200 210 220 230 240
180 190 200 210 220 230
pF1KE6 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD
250 260 270 280 290 300
240 250 260 270 280 290
pF1KE6 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG
310 320 330 340 350 360
300 310 320 330 340 350
pF1KE6 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD
370 380 390 400 410 420
360 370 380 390 400 410
pF1KE6 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM
430 440 450 460 470 480
420 430 440 450 460 470
pF1KE6 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG
490 500 510 520 530 540
480 490 500 510 520 530
pF1KE6 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD
550 560 570 580 590 600
540 550 560 570 580 590
pF1KE6 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK
610 620 630 640 650 660
600 610 620 630 640 650
pF1KE6 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS
670 680 690 700 710 720
660 670 680 690 700
pF1KE6 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK--------
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTKVRALVADF
730 740 750 760 770 780
710 720 730
pF1KE6 ------------------------------PTRPDRGWFVAPFGKNPWWVYPASILPALL
::::::::::::::::::::::::::::::
CCDS19 SIVFSILMFCGIDACFGLETPKLHVPSVIKPTRPDRGWFVAPFGKNPWWVYPASILPALL
790 800 810 820 830 840
740 750 760 770 780 790
pF1KE6 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA
850 860 870 880 890 900
800 810 820 830 840 850
pF1KE6 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL
910 920 930 940 950 960
860 870 880 890 900
pF1KE6 YMGVASLNGIQ----------------FWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFT
::::::::::: :::::::::::::::::::::::::::::::::
CCDS19 YMGVASLNGIQMGTGGSEFKIQKKLTPFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFT
970 980 990 1000 1010 1020
910 920 930 940 950 960
pF1KE6 LVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKET
1030 1040 1050 1060 1070 1080
970 980 990 1000 1010
pF1KE6 DKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
::::::::::::::::::::::::::::::::::
CCDS19 DKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
1090 1100 1110 1120 1130
>>CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035 aa)
initn: 4149 init1: 1438 opt: 2334 Z-score: 1498.2 bits: 288.8 E(32554): 3.9e-77
Smith-Waterman score: 4146; 62.7% identity (80.7% similar) in 1021 aa overlap (28-1000:42-1012)
10 20 30 40 50
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL
:::::... ::::::..: : ::::.: :
CCDS35 NLGERGRARSSTFLRVVQPMFNHSIFTSAVSPAAERIRFILGEEDDSPAPPQLFTELDEL
20 30 40 50 60 70
60 70 80 90 100 110
pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD
::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: .
CCDS35 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE
80 90 100 110 120 130
120 130 140 150 160 170
pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN
..::::... ....::: :::.:::...:.:.:::.::::::: ::::::::.::...
CCDS35 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS
140 150 160 170 180 190
180 190 200 210 220 230
pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP
: . ...:.. : . : :.:::: :. :: :::::::.:
CCDS35 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP
200 210 220 230
240 250 260 270 280 290
pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE
.:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.:
CCDS35 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS
::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..::
CCDS35 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP
.::::...: .: ::::.. : .:: :::: :
CCDS35 SDKRKNMYSGGENVQMNGDT------PH--DGGHGGGGHGDC------------------
360 370 380
420 430 440 450 460 470
pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF
::: :::: ::: ::::: :.: :::::...::..::::::::. .::::::
CCDS35 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF
390 400 410 420 430 440
480 490 500 510 520 530
pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG
::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :.
CCDS35 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN
450 460 470 480 490 500
540 550 560 570 580 590
pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA
.::.:::::::: :: :::::::::::...:.:::::::::.::::::::::.::::
CCDS35 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL
510 520 530 540 550 560
600 610 620 630 640 650
pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW
::::: .:: .. : ..: :: :: .: .. : .. :::. . : .. . :..::
CCDS35 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW
570 580 590 600 610 620
660 670 680 690 700
pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT-----
..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : ::::
CCDS35 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL
630 640 650 660 670 680
710 720 730
pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL
::: :.::::: :::.::::: :. .
CCDS35 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI
690 700 710 720 730 740
740 750 760 770 780 790
pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV
::::::::::::::::::::::::.::::.::::::::::.:::..::.:.:::::::::
CCDS35 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV
750 760 770 780 790 800
800 810 820 830 840 850
pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY
::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.::::
CCDS35 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY
810 820 830 840 850 860
860 870 880 890 900 910
pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI
:::::::::::::.:: .: ::.::: ::::: .::::::::.::::..:.::::.:::
CCDS35 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI
870 880 890 900 910 920
920 930 940 950 960 970
pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA
:::::::::::::::.:. ::. .:..::::::...:...:::.:: : .::.:.:::.
CCDS35 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS
930 940 950 960 970 980
980 990 1000 1010
pF1KE6 HEDCDEEPQFPP----PSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
.. ... . : :: :::::. ....:
CCDS35 LDSDNDDSDCPYSEKVPS-IKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC
990 1000 1010 1020 1030
>>CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079 aa)
initn: 4149 init1: 1438 opt: 2334 Z-score: 1498.0 bits: 288.8 E(32554): 4e-77
Smith-Waterman score: 4146; 62.7% identity (80.7% similar) in 1021 aa overlap (28-1000:86-1056)
10 20 30 40 50
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL
:::::... ::::::..: : ::::.: :
CCDS43 EKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDEL
60 70 80 90 100 110
60 70 80 90 100 110
pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD
::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: .
CCDS43 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE
120 130 140 150 160 170
120 130 140 150 160 170
pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN
..::::... ....::: :::.:::...:.:.:::.::::::: ::::::::.::...
CCDS43 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS
180 190 200 210 220 230
180 190 200 210 220 230
pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP
: . ...:.. : . : :.:::: :. :: :::::::.:
CCDS43 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP
240 250 260 270
240 250 260 270 280 290
pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE
.:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.:
CCDS43 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE
280 290 300 310 320 330
300 310 320 330 340 350
pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS
::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..::
CCDS43 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS
340 350 360 370 380 390
360 370 380 390 400 410
pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP
.::::...: .: ::::.. : .:: :::: :
CCDS43 SDKRKNMYSGGENVQMNGDT------PH--DGGHGGGGHGDC------------------
400 410 420 430
420 430 440 450 460 470
pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF
::: :::: ::: ::::: :.: :::::...::..::::::::. .::::::
CCDS43 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF
440 450 460 470 480
480 490 500 510 520 530
pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG
::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :.
CCDS43 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA
.::.:::::::: :: :::::::::::...:.:::::::::.::::::::::.::::
CCDS43 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL
550 560 570 580 590 600
600 610 620 630 640 650
pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW
::::: .:: .. : ..: :: :: .: .. : .. :::. . : .. . :..::
CCDS43 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW
610 620 630 640 650 660
660 670 680 690 700
pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT-----
..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : ::::
CCDS43 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL
670 680 690 700 710 720
710 720 730
pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL
::: :.::::: :::.::::: :. .
CCDS43 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI
730 740 750 760 770 780
740 750 760 770 780 790
pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV
::::::::::::::::::::::::.::::.::::::::::.:::..::.:.:::::::::
CCDS43 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV
790 800 810 820 830 840
800 810 820 830 840 850
pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY
::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.::::
CCDS43 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY
850 860 870 880 890 900
860 870 880 890 900 910
pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI
:::::::::::::.:: .: ::.::: ::::: .::::::::.::::..:.::::.:::
CCDS43 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI
910 920 930 940 950 960
920 930 940 950 960 970
pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA
:::::::::::::::.:. ::. .:..::::::...:...:::.:: : .::.:.:::.
CCDS43 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS
970 980 990 1000 1010 1020
980 990 1000 1010
pF1KE6 HEDCDEEPQFPP----PSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
.. ... . : :: :::::. ....:
CCDS43 LDSDNDDSDCPYSEKVPS-IKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC
1030 1040 1050 1060 1070
>>CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094 aa)
initn: 4149 init1: 1438 opt: 2308 Z-score: 1481.5 bits: 285.8 E(32554): 3.4e-76
Smith-Waterman score: 4120; 63.5% identity (81.1% similar) in 998 aa overlap (28-980:86-1034)
10 20 30 40 50
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL
:::::... ::::::..: : ::::.: :
CCDS47 EKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDEL
60 70 80 90 100 110
60 70 80 90 100 110
pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD
::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: .
CCDS47 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE
120 130 140 150 160 170
120 130 140 150 160 170
pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN
..::::... ....::: :::.:::...:.:.:::.::::::: ::::::::.::...
CCDS47 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS
180 190 200 210 220 230
180 190 200 210 220 230
pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP
: . ...:.. : . : :.:::: :. :: :::::::.:
CCDS47 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP
240 250 260 270
240 250 260 270 280 290
pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE
.:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.:
CCDS47 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE
280 290 300 310 320 330
300 310 320 330 340 350
pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS
::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..::
CCDS47 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS
340 350 360 370 380 390
360 370 380 390 400 410
pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP
.::::...: .: ::::.. : .:: :::: :
CCDS47 SDKRKNMYSGGENVQMNGDT------P--HDGGHGGGGHGDC------------------
400 410 420 430
420 430 440 450 460 470
pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF
::: :::: ::: ::::: :.: :::::...::..::::::::. .::::::
CCDS47 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF
440 450 460 470 480
480 490 500 510 520 530
pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG
::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :.
CCDS47 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA
.::.:::::::: :: :::::::::::...:.:::::::::.::::::::::.::::
CCDS47 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL
550 560 570 580 590 600
600 610 620 630 640 650
pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW
::::: .:: .. : ..: :: :: .: .. : .. :::. . : .. . :..::
CCDS47 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW
610 620 630 640 650 660
660 670 680 690 700
pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT-----
..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : ::::
CCDS47 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL
670 680 690 700 710 720
710 720 730
pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL
::: :.::::: :::.::::: :. .
CCDS47 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI
730 740 750 760 770 780
740 750 760 770 780 790
pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV
::::::::::::::::::::::::.::::.::::::::::.:::..::.:.:::::::::
CCDS47 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV
790 800 810 820 830 840
800 810 820 830 840 850
pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY
::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.::::
CCDS47 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY
850 860 870 880 890 900
860 870 880 890 900 910
pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI
:::::::::::::.:: .: ::.::: ::::: .::::::::.::::..:.::::.:::
CCDS47 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI
910 920 930 940 950 960
920 930 940 950 960 970
pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA
:::::::::::::::.:. ::. .:..::::::...:...:::.:: : .::.:.:::.
CCDS47 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS
970 980 990 1000 1010 1020
980 990 1000 1010
pF1KE6 HE-DCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL
. : :.:
CCDS47 LDSDNDDEKDHQHSLNATHHADKIPFLQSLGMPSPPRTPVKVVPQIRIELEPEDNDYFWR
1030 1040 1050 1060 1070 1080
>>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090 aa)
initn: 3031 init1: 1247 opt: 2286 Z-score: 1467.5 bits: 283.2 E(32554): 2e-75
Smith-Waterman score: 3093; 47.1% identity (72.7% similar) in 1064 aa overlap (15-1004:64-1069)
10 20 30
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ
: .:.:: :... ::. ...
CCDS58 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR
40 50 60 70 80 90
40 50 60 70 80
pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH
.: ::: :: : : :::::: : . ::...::::.:::.:::: ::.::.:::::.
CCDS58 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY
100 110 120 130 140 150
90 100 110 120 130 140
pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL
:.:::::::::::.:. .:::.::. ...: .: : :....: .: : .:: : .::
CCDS58 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL
160 170 180 190 200 210
150 160 170 180 190
pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ
.::.::..: :. ::.:::::. : . :. :: ..:. .... ...
CCDS58 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG
220 230 240 250 260 270
200 210 220 230 240 250
pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV
... : :: . .... ..:. .::.::: .:::::::::::::..:.::::
CCDS58 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV
280 290 300 310 320
260 270 280 290 300 310
pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR
:: ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..:
CCDS58 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR
330 340 350 360 370 380
320 330 340 350 360 370
pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG
.::..:::::::.: :::::::::.:::::::.::: .::: :: :::.
CCDS58 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL
390 400 410 420 430
380 390 400 410 420 430
pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI
: .: : :. : :: :::.:::: :::
CCDS58 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI
440 450 460
440 450 460 470 480 490
pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM
::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::.. ...::..:...
CCDS58 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL
470 480 490 500 510 520
500 510 520 530 540 550
pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA
.: . ::.:::: ::.::::.:.:::.:. : . :.:. .: ::: .. :..:::
CCDS58 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA
530 540 550 560 570 580
560 570 580 590 600 610
pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV
:::: .. ::::::::.:..:: .::::.:..:.. . : .:: . . .:.:.: :.
CCDS58 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT
590 600 610 620 630 640
620 630 640 650 660 670
pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K
: . .. .. : : : . .:. .: :. .:: . : .::..:
CCDS58 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP
650 660 670 680 690
680 690 700
pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------------------------
.:::. . :::: :. .. ::.:: .::::::
CCDS58 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG
700 710 720 730 740 750
710 720 730 740 750
pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN
::.:.:::...:.: ::::. . .:::: ::::::::::::::.:
CCDS58 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN
760 770 780 790 800 810
760 770 780 790 800 810
pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ
:::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: ::::::
CCDS58 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ
820 830 840 850 860 870
820 830 840 850 860 870
pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK
:.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: :
CCDS58 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK
880 890 900 910 920 930
880 890 900 910 920 930
pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR
:: :::::::: .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..::
CCDS58 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR
940 950 960 970 980 990
940 950 960 970 980 990
pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK
.:.:. :....:.:.:...:: :.::: :::.:.:. :. .: :. ..: :...
CCDS58 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ
1000 1010 1020 1030 1040 1050
1000 1010
pF1KE6 IPMESVQSDPQNGIHCIARKRSSSWSYSL
::..... .:.. .
CCDS58 IPVKALKYSPDKPVSVKISFEDEPRKKYVDAETSL
1060 1070 1080 1090
>>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095 aa)
initn: 3031 init1: 1247 opt: 2286 Z-score: 1467.5 bits: 283.2 E(32554): 2e-75
Smith-Waterman score: 3093; 47.1% identity (72.7% similar) in 1064 aa overlap (15-1004:69-1074)
10 20 30
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ
: .:.:: :... ::. ...
CCDS82 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR
40 50 60 70 80 90
40 50 60 70 80
pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH
.: ::: :: : : :::::: : . ::...::::.:::.:::: ::.::.:::::.
CCDS82 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY
100 110 120 130 140 150
90 100 110 120 130 140
pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL
:.:::::::::::.:. .:::.::. ...: .: : :....: .: : .:: : .::
CCDS82 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL
160 170 180 190 200 210
150 160 170 180 190
pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ
.::.::..: :. ::.:::::. : . :. :: ..:. .... ...
CCDS82 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG
220 230 240 250 260 270
200 210 220 230 240 250
pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV
... : :: . .... ..:. .::.::: .:::::::::::::..:.::::
CCDS82 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV
280 290 300 310 320
260 270 280 290 300 310
pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR
:: ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..:
CCDS82 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR
330 340 350 360 370 380
320 330 340 350 360 370
pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG
.::..:::::::.: :::::::::.:::::::.::: .::: :: :::.
CCDS82 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL
390 400 410 420 430 440
380 390 400 410 420 430
pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI
: .: : :. : :: :::.:::: :::
CCDS82 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI
450 460 470
440 450 460 470 480 490
pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM
::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::.. ...::..:...
CCDS82 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL
480 490 500 510 520 530
500 510 520 530 540 550
pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA
.: . ::.:::: ::.::::.:.:::.:. : . :.:. .: ::: .. :..:::
CCDS82 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA
540 550 560 570 580 590
560 570 580 590 600 610
pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV
:::: .. ::::::::.:..:: .::::.:..:.. . : .:: . . .:.:.: :.
CCDS82 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT
600 610 620 630 640 650
620 630 640 650 660 670
pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K
: . .. .. : : : . .:. .: :. .:: . : .::..:
CCDS82 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP
660 670 680 690 700
680 690 700
pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------------------------
.:::. . :::: :. .. ::.:: .::::::
CCDS82 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG
710 720 730 740 750 760
710 720 730 740 750
pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN
::.:.:::...:.: ::::. . .:::: ::::::::::::::.:
CCDS82 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN
770 780 790 800 810 820
760 770 780 790 800 810
pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ
:::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: ::::::
CCDS82 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ
830 840 850 860 870 880
820 830 840 850 860 870
pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK
:.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: :
CCDS82 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK
890 900 910 920 930 940
880 890 900 910 920 930
pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR
:: :::::::: .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..::
CCDS82 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR
950 960 970 980 990 1000
940 950 960 970 980 990
pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK
.:.:. :....:.:.:...:: :.::: :::.:.:. :. .: :. ..: :...
CCDS82 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ
1010 1020 1030 1040 1050 1060
1000 1010
pF1KE6 IPMESVQSDPQNGIHCIARKRSSSWSYSL
::..... .:.. .
CCDS82 IPVKALKYSPDKPVSVKISFEDEPRKKYVDAETSL
1070 1080 1090
>>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131 aa)
initn: 3031 init1: 1247 opt: 2280 Z-score: 1463.5 bits: 282.5 E(32554): 3.4e-75
Smith-Waterman score: 3087; 46.7% identity (72.5% similar) in 1077 aa overlap (15-1015:69-1087)
10 20 30
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ
: .:.:: :... ::. ...
CCDS58 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR
40 50 60 70 80 90
40 50 60 70 80
pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH
.: ::: :: : : :::::: : . ::...::::.:::.:::: ::.::.:::::.
CCDS58 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY
100 110 120 130 140 150
90 100 110 120 130 140
pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL
:.:::::::::::.:. .:::.::. ...: .: : :....: .: : .:: : .::
CCDS58 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL
160 170 180 190 200 210
150 160 170 180 190
pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ
.::.::..: :. ::.:::::. : . :. :: ..:. .... ...
CCDS58 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG
220 230 240 250 260 270
200 210 220 230 240 250
pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV
... : :: . .... ..:. .::.::: .:::::::::::::..:.::::
CCDS58 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV
280 290 300 310 320
260 270 280 290 300 310
pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR
:: ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..:
CCDS58 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR
330 340 350 360 370 380
320 330 340 350 360 370
pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG
.::..:::::::.: :::::::::.:::::::.::: .::: :: :::.
CCDS58 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL
390 400 410 420 430 440
380 390 400 410 420 430
pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI
: .: : :. : :: :::.:::: :::
CCDS58 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI
450 460 470
440 450 460 470 480 490
pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM
::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::.. ...::..:...
CCDS58 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL
480 490 500 510 520 530
500 510 520 530 540 550
pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA
.: . ::.:::: ::.::::.:.:::.:. : . :.:. .: ::: .. :..:::
CCDS58 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA
540 550 560 570 580 590
560 570 580 590 600 610
pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV
:::: .. ::::::::.:..:: .::::.:..:.. . : .:: . . .:.:.: :.
CCDS58 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT
600 610 620 630 640 650
620 630 640 650 660 670
pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K
: . .. .. : : : . .:. .: :. .:: . : .::..:
CCDS58 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP
660 670 680 690 700
680 690 700
pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------------------------
.:::. . :::: :. .. ::.:: .::::::
CCDS58 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG
710 720 730 740 750 760
710 720 730 740 750
pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN
::.:.:::...:.: ::::. . .:::: ::::::::::::::.:
CCDS58 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN
770 780 790 800 810 820
760 770 780 790 800 810
pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ
:::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: ::::::
CCDS58 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ
830 840 850 860 870 880
820 830 840 850 860 870
pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK
:.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: :
CCDS58 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK
890 900 910 920 930 940
880 890 900 910 920 930
pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR
:: :::::::: .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..::
CCDS58 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR
950 960 970 980 990 1000
940 950 960 970 980 990
pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK
.:.:. :....:.:.:...:: :.::: :::.:.:. :. .: :. ..: :...
CCDS58 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ
1010 1020 1030 1040 1050 1060
1000 1010
pF1KE6 IPMESVQSDPQNGIHCIARK--RSSSWSYSL
::..... . . .: :. . ....:
CCDS58 IPVKALKYSVDPSIVNISDEMAKTAQWKALSMNTENAKVTRSNMSPDKPVSVKISFEDEP
1070 1080 1090 1100 1110 1120
>>CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040 aa)
initn: 3137 init1: 1277 opt: 1878 Z-score: 1208.7 bits: 235.2 E(32554): 5.3e-61
Smith-Waterman score: 3094; 47.3% identity (72.1% similar) in 1056 aa overlap (4-1006:17-1004)
10 20 30 40
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILG-EEDEAPN
:... : :: ... . .:. ...: ::: ::::
CCDS73 MPLGRQSHRHHRTHGQKHRRRGRGKGASQGEEGLEALAHDTPS-QRVQFILGTEEDEEHV
10 20 30 40 50
50 60 70 80 90 100
pF1KE6 P-TLFTEMDTL-QHDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTC
: ::::.: . ...:.. ::::.:::.:::: ::.::::::::.:.:::::::::::.:
CCDS73 PHELFTELDEICMKEGEDAEWKETARWLKFEEDVEDGGERWSKPYVATLSLHSLFELRSC
60 70 80 90 100 110
110 120 130 140 150
pF1KE6 LQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKK------
: .::::::. ..:. .: : ....: .. : .: .: .::..:.::..:
CCDS73 LINGTVLLDMHANSIEEISDLILDQQELSSDLNDSMRVKVREALLKKHHHQNEKKRNNLI
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE6 PIHRSLADIGKSVSTTNRSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDIS
:: ::.:..::. : . .. ..:. : .:......: :. . ... ..
CCDS73 PIVRSFAEVGKKQSDPHLMDKHGQTVSPQ-SVPTTNLEVKNGVN----CEHSPVDLSKVD
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE6 LTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTR
: .:::::: .:::::::::::.::.:..::::: ...:.:.::::.:::
CCDS73 L---------HFMKKIPTGAEASNVLVGEVDILDRPIVAFVRLSPAVLLSGLTEVPIPTR
240 250 260 270 280
280 290 300 310 320 330
pF1KE6 FLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPP
:::::::: :....:.::::..::.:.:..: ::::::..:.::.::::::::.: ::::
CCDS73 FLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYKAKERDDLLAGIDEFLDQVTVLPP
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE6 GEWDPNIRIEPPKKVPSADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGA
:::::.:::::::.::: .::: : ::.: : ::..:
CCDS73 GEWDPSIRIEPPKNVPSQEKRKMP------GVPNGNVCHIEQEPHGGHSG----------
350 360 370 380
400 410 420 430 440 450
pF1KE6 GSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSI
: :: :::.:::: :::::: ::. ::. :.. .: .
CCDS73 ----------------P-------ELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQCL
390 400 410 420
460 470 480 490 500 510
pF1KE6 SAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTG
...::.: .:.. .::::::::.::.. ...::..:..:.: . ::.:: : ::.:::
CCDS73 ASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGSTG
430 440 450 460 470 480
520 530 540 550 560 570
pF1KE6 PILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFST
:.:.:::.:: : : .:.:. .: ::: .: :..::::::: .. ::::::::.:..
CCDS73 PVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAFAS
490 500 510 520 530 540
580 590 600 610 620 630
pF1KE6 LISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDT
:: .::::.::.:.: . :::.: . . .. : :.:. :.. : : . :
CCDS73 LICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPN----NHTLQYWKDH
550 560 570 580 590 600
640 650 660 670 680 690
pF1KE6 NASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----KFIPDLALMSFILFFGTYSMT
: . . . :. :. .:: . :...:..: . ::. . : :::: :. ..
CCDS73 N------IVTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILS
610 620 630 640 650
700 710
pF1KE6 LTLKKFKFSRYFPT--------------------------------------KPTRPDRG
::: :: :::::: :::: :::
CCDS73 STLKTFKTSRYFPTRVRSMVSDFAVFLTIFTMVIIDFLIGVPSPKLQVPSVFKPTRDDRG
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE6 WFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVG
:.. :.: ::::. :.:.:::: ::::::::::::::.::::.::::. ::::::. :.
CCDS73 WIINPIGPNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVA
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE6 ILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILT
:....::.:::::.:::::.::.:..:::.:.: :::::::.:::.:::::::...:.:
CCDS73 IMLGVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLM
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE6 GISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPL
: :::.. ::: ::.::::::::::::.::.::::..: ::: :::::::: .::::::
CCDS73 GCSVFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPL
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE6 RRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILP
:..:::::.:. ::..::..:.. :::.::.:.:.:..::...:. ::...:.:.:...:
CCDS73 RKVHLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKVMDLCFSKRELSWLDDLMP
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KE6 EKEKKETDKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQ--SDPQNGIHCIARKRSSS
:..::. : .:. : :. . : .. . :.:.:: . :.: ..: :
CCDS73 ESKKKKLDDAKKKAK---EEEEAEKMLEIGGD-KFPLESRKLLSSPGKNISCRCDPSEIN
960 970 980 990 1000 1010
pF1KE6 WSYSL
CCDS73 ISDEMPKTTVWKALSMNSGNAKEKSLFN
1020 1030 1040
>>CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093 aa)
initn: 3137 init1: 1277 opt: 1878 Z-score: 1208.5 bits: 235.3 E(32554): 5.4e-61
Smith-Waterman score: 3094; 47.3% identity (72.1% similar) in 1056 aa overlap (4-1006:70-1057)
10 20 30
pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQ
:... : :: ... . .:. ..
CCDS44 EELEGHRTLYVGVRMPLGRQSHRHHRTHGQKHRRRGRGKGASQGEEGLEALAHDTPS-QR
40 50 60 70 80 90
40 50 60 70 80 90
pF1KE6 LQDILG-EEDEAPNP-TLFTEMDTL-QHDGDQMEWKESARWIKFEEKVEEGGERWSKPHV
.: ::: :::: : ::::.: . ...:.. ::::.:::.:::: ::.::::::::.:
CCDS44 VQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDVEDGGERWSKPYV
100 110 120 130 140 150
100 110 120 130 140 150
pF1KE6 STLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLR
.:::::::::::.:: .::::::. ..:. .: : ....: .. : .: .: .::.
CCDS44 ATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLNDSMRVKVREALLK
160 170 180 190 200 210
160 170 180 190 200
pF1KE6 RHRHQTKK------PIHRSLADIGKSVSTTNRSPARSPGAGPSLHHSTEDLRMRQSANYG
.:.::..: :: ::.:..::. : . .. ..:. : .:......:
CCDS44 KHHHQNEKKRNNLIPIVRSFAEVGKKQSDPHLMDKHGQTVSPQ-SVPTTNLEVKNGVN--
220 230 240 250 260 270
210 220 230 240 250 260
pF1KE6 RLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFVRLIQS
:. . ... ..: .:::::: .:::::::::::.::.:..::::: .
CCDS44 --CEHSPVDLSKVDL---------HFMKKIPTGAEASNVLVGEVDILDRPIVAFVRLSPA
280 290 300 310 320
270 280 290 300 310 320
pF1KE6 AMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNREDLIA
..:.:.::::.::::::::::: :....:.::::..::.:.:..: ::::::..:.::.:
CCDS44 VLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYKAKERDDLLA
330 340 350 360 370 380
330 340 350 360 370 380
pF1KE6 GIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRKSVFSLAELGQMNGSVGGGGGAPGG
:::::::.: :::::::::.:::::::.::: .::: : ::.: : :
CCDS44 GIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQEKRKMP------GVPNGNVCHIEQEPHG
390 400 410 420 430
390 400 410 420 430 440
pF1KE6 GNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDIKRKLPW
:..: : :: :::.:::: :::::: ::
CCDS44 GHSG--------------------------P-------ELQRTGRLFGGLVLDIKRKAPW
440 450 460
450 460 470 480 490 500
pF1KE6 FPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAMAGSLFC
. ::. :.. .: ....::.: .:.. .::::::::.::.. ...::..:..:.: .
CCDS44 YWSDYRDALSLQCLASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYS
470 480 490 500 510 520
510 520 530 540 550 560
pF1KE6 LFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVATDASFI
::.:: : ::.::::.:.:::.:: : : .:.:. .: ::: .: :..::::::: .
CCDS44 LFAGQALTILGSTGPVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSL
530 540 550 560 570 580
570 580 590 600 610 620
pF1KE6 IKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECVAPDTVN
. ::::::::.:..:: .::::.::.:.: . :::.: . . .. : :.:. :.. :
CCDS44 VCYITRFTEEAFASLICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPN
590 600 610 620 630 640
630 640 650 660 670 680
pF1KE6 TTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----KFIPDLA
: . : : . . . :. :. .:: . :...:..: . ::.
CCDS44 ----NHTLQYWKDHN------IVTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVL
650 660 670 680 690
690 700
pF1KE6 LMSFILFFGTYSMTLTLKKFKFSRYFPT--------------------------------
. : :::: :. .. ::: :: ::::::
CCDS44 FWSCILFFTTFILSSTLKTFKTSRYFPTRVRSMVSDFAVFLTIFTMVIIDFLIGVPSPKL
700 710 720 730 740 750
710 720 730 740 750 760
pF1KE6 ------KPTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVNRKENKL
:::: ::::.. :.: ::::. :.:.:::: ::::::::::::::.::::.::
CCDS44 QVPSVFKPTRDDRGWIINPIGPNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKL
760 770 780 790 800 810
770 780 790 800 810 820
pF1KE6 KKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQPQFLGV
::. ::::::. :.:....::.:::::.:::::.::.:..:::.:.: :::::::.:::.
CCDS44 KKGCGYHLDLLMVAIMLGVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGI
820 830 840 850 860 870
830 840 850 860 870 880
pF1KE6 REQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCKLFLMPA
:::::::...:.: : :::.. ::: ::.::::::::::::.::.::::..: ::: :::
CCDS44 REQRVTGLMIFVLMGCSVFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPA
880 890 900 910 920 930
890 900 910 920 930 940
pF1KE6 KHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFI
::::: .:::::::..:::::.:. ::..::..:.. :::.::.:.:.:..::...:.
CCDS44 KHQPDFIYLRHVPLRKVHLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKVMDLC
940 950 960 970 980 990
950 960 970 980 990 1000
pF1KE6 FSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQ--SDP
::...:.:.:...::..::. : .:. : :. . : .. . :.:.:: . :.:
CCDS44 FSKRELSWLDDLMPESKKKKLDDAKKKAK---EEEEAEKMLEIGGD-KFPLESRKLLSSP
1000 1010 1020 1030 1040 1050
1010
pF1KE6 QNGIHCIARKRSSSWSYSL
..: :
CCDS44 GKNISCRCDPSEINISDEMPKTTVWKALSMNSGNAKEKSLFN
1060 1070 1080 1090
1019 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 16:10:00 2016 done: Tue Nov 8 16:10:00 2016
Total Scan time: 3.210 Total Display time: 0.360
Function used was FASTA [36.3.4 Apr, 2011]