FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6765, 1019 aa 1>>>pF1KE6765 1019 - 1019 aa - 1019 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8131+/-0.00123; mu= 12.1399+/- 0.074 mean_var=248.0807+/-50.745, 0's: 0 Z-trim(109.4): 76 B-trim: 10 in 1/51 Lambda= 0.081429 statistics sampled from 10820 (10883) to 10820 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.334), width: 16 Scan time: 3.210 The best scores are: opt bits E(32554) CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121) 4565 550.9 5.2e-156 CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137) 4565 551.0 5.3e-156 CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035) 2334 288.8 3.9e-77 CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079) 2334 288.8 4e-77 CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094) 2308 285.8 3.4e-76 CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090) 2286 283.2 2e-75 CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095) 2286 283.2 2e-75 CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131) 2280 282.5 3.4e-75 CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040) 1878 235.2 5.3e-61 CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093) 1878 235.3 5.4e-61 CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2 (1088) 1860 233.2 2.3e-60 CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2 (1099) 1860 233.2 2.4e-60 CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3 (1206) 1858 233.0 2.9e-60 CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3 (1210) 1858 233.0 3e-60 CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3 (1214) 1858 233.0 3e-60 CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2 (1118) 1852 232.2 4.6e-60 CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3 (1246) 1852 232.3 4.9e-60 CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3 (1259) 1852 232.3 4.9e-60 CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 959) 1513 192.3 4e-48 CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 983) 1513 192.3 4.1e-48 CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232) 1339 172.0 6.7e-42 CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259) 1339 172.0 6.8e-42 CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 945) 1201 155.7 4.3e-37 CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 896) 1200 155.5 4.5e-37 CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 638) 1084 141.7 4.6e-33 CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 747) 1084 141.8 5.1e-33 CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227) 802 108.9 6.6e-23 CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232) 802 108.9 6.6e-23 CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241) 802 108.9 6.6e-23 CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 ( 911) 757 103.5 2.1e-21 >>CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121 aa) initn: 4736 init1: 4565 opt: 4565 Z-score: 2914.3 bits: 550.9 E(32554): 5.2e-156 Smith-Waterman score: 6549; 96.3% identity (96.3% similar) in 1024 aa overlap (28-1013:92-1115) 10 20 30 40 50 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ :::::::::::::::::::::::::::::: CCDS19 RPDQPQQELTGPGSGASSQDSSMDLISRTRSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ 70 80 90 100 110 120 60 70 80 90 100 110 pF1KE6 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG 130 140 150 160 170 180 120 130 140 150 160 170 pF1KE6 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS 190 200 210 220 230 240 180 190 200 210 220 230 pF1KE6 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE6 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG 310 320 330 340 350 360 300 310 320 330 340 350 pF1KE6 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD 370 380 390 400 410 420 360 370 380 390 400 410 pF1KE6 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM 430 440 450 460 470 480 420 430 440 450 460 470 pF1KE6 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG 490 500 510 520 530 540 480 490 500 510 520 530 pF1KE6 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD 550 560 570 580 590 600 540 550 560 570 580 590 pF1KE6 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK 610 620 630 640 650 660 600 610 620 630 640 650 pF1KE6 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS 670 680 690 700 710 720 660 670 680 690 700 pF1KE6 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------- :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTKVRALVADF 730 740 750 760 770 780 710 720 730 pF1KE6 ------------------------------PTRPDRGWFVAPFGKNPWWVYPASILPALL :::::::::::::::::::::::::::::: CCDS19 SIVFSILMFCGIDACFGLETPKLHVPSVIKPTRPDRGWFVAPFGKNPWWVYPASILPALL 790 800 810 820 830 840 740 750 760 770 780 790 pF1KE6 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA 850 860 870 880 890 900 800 810 820 830 840 850 pF1KE6 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL 910 920 930 940 950 960 860 870 880 890 900 910 pF1KE6 YMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 YMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKST 970 980 990 1000 1010 1020 920 930 940 950 960 970 pF1KE6 VAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 VAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDE 1030 1040 1050 1060 1070 1080 980 990 1000 1010 pF1KE6 EPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL :::::::::::::::::::::::::::::::::: CCDS19 EPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL 1090 1100 1110 1120 >>CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137 aa) initn: 5752 init1: 4565 opt: 4565 Z-score: 2914.2 bits: 551.0 E(32554): 5.3e-156 Smith-Waterman score: 6394; 94.7% identity (94.7% similar) in 1024 aa overlap (28-997:92-1115) 10 20 30 40 50 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ :::::::::::::::::::::::::::::: CCDS19 RPDQPQQELTGPGSGASSQDSSMDLISRTRSPAAEQLQDILGEEDEAPNPTLFTEMDTLQ 70 80 90 100 110 120 60 70 80 90 100 110 pF1KE6 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 HDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLDSG 130 140 150 160 170 180 120 130 140 150 160 170 pF1KE6 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 SLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTNRS 190 200 210 220 230 240 180 190 200 210 220 230 pF1KE6 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 PARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKD 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE6 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 SEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIG 310 320 330 340 350 360 300 310 320 330 340 350 pF1KE6 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 RAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSAD 370 380 390 400 410 420 360 370 380 390 400 410 pF1KE6 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAM 430 440 450 460 470 480 420 430 440 450 460 470 pF1KE6 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 HEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGG 490 500 510 520 530 540 480 490 500 510 520 530 pF1KE6 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 LLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLD 550 560 570 580 590 600 540 550 560 570 580 590 pF1KE6 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 YMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFK 610 620 630 640 650 660 600 610 620 630 640 650 pF1KE6 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 YYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLS 670 680 690 700 710 720 660 670 680 690 700 pF1KE6 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK-------- :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTKVRALVADF 730 740 750 760 770 780 710 720 730 pF1KE6 ------------------------------PTRPDRGWFVAPFGKNPWWVYPASILPALL :::::::::::::::::::::::::::::: CCDS19 SIVFSILMFCGIDACFGLETPKLHVPSVIKPTRPDRGWFVAPFGKNPWWVYPASILPALL 790 800 810 820 830 840 740 750 760 770 780 790 pF1KE6 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 VTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIA 850 860 870 880 890 900 800 810 820 830 840 850 pF1KE6 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 HIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFL 910 920 930 940 950 960 860 870 880 890 900 pF1KE6 YMGVASLNGIQ----------------FWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFT ::::::::::: ::::::::::::::::::::::::::::::::: CCDS19 YMGVASLNGIQMGTGGSEFKIQKKLTPFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFT 970 980 990 1000 1010 1020 910 920 930 940 950 960 pF1KE6 LVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 LVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKKET 1030 1040 1050 1060 1070 1080 970 980 990 1000 1010 pF1KE6 DKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL :::::::::::::::::::::::::::::::::: CCDS19 DKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL 1090 1100 1110 1120 1130 >>CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035 aa) initn: 4149 init1: 1438 opt: 2334 Z-score: 1498.2 bits: 288.8 E(32554): 3.9e-77 Smith-Waterman score: 4146; 62.7% identity (80.7% similar) in 1021 aa overlap (28-1000:42-1012) 10 20 30 40 50 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL :::::... ::::::..: : ::::.: : CCDS35 NLGERGRARSSTFLRVVQPMFNHSIFTSAVSPAAERIRFILGEEDDSPAPPQLFTELDEL 20 30 40 50 60 70 60 70 80 90 100 110 pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD ::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: . CCDS35 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE 80 90 100 110 120 130 120 130 140 150 160 170 pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN ..::::... ....::: :::.:::...:.:.:::.::::::: ::::::::.::... CCDS35 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS 140 150 160 170 180 190 180 190 200 210 220 230 pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP : . ...:.. : . : :.:::: :. :: :::::::.: CCDS35 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP 200 210 220 230 240 250 260 270 280 290 pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE .:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.: CCDS35 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS ::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..:: CCDS35 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP .::::...: .: ::::.. : .:: :::: : CCDS35 SDKRKNMYSGGENVQMNGDT------PH--DGGHGGGGHGDC------------------ 360 370 380 420 430 440 450 460 470 pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF ::: :::: ::: ::::: :.: :::::...::..::::::::. .:::::: CCDS35 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG ::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :. CCDS35 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN 450 460 470 480 490 500 540 550 560 570 580 590 pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA .::.:::::::: :: :::::::::::...:.:::::::::.::::::::::.:::: CCDS35 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL 510 520 530 540 550 560 600 610 620 630 640 650 pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW ::::: .:: .. : ..: :: :: .: .. : .. :::. . : .. . :..:: CCDS35 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW 570 580 590 600 610 620 660 670 680 690 700 pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT----- ..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : :::: CCDS35 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL 630 640 650 660 670 680 710 720 730 pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL ::: :.::::: :::.::::: :. . CCDS35 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI 690 700 710 720 730 740 740 750 760 770 780 790 pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV ::::::::::::::::::::::::.::::.::::::::::.:::..::.:.::::::::: CCDS35 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV 750 760 770 780 790 800 800 810 820 830 840 850 pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY ::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.:::: CCDS35 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY 810 820 830 840 850 860 860 870 880 890 900 910 pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI :::::::::::::.:: .: ::.::: ::::: .::::::::.::::..:.::::.::: CCDS35 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI 870 880 890 900 910 920 920 930 940 950 960 970 pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA :::::::::::::::.:. ::. .:..::::::...:...:::.:: : .::.:.:::. CCDS35 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS 930 940 950 960 970 980 980 990 1000 1010 pF1KE6 HEDCDEEPQFPP----PSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL .. ... . : :: :::::. ....: CCDS35 LDSDNDDSDCPYSEKVPS-IKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC 990 1000 1010 1020 1030 >>CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079 aa) initn: 4149 init1: 1438 opt: 2334 Z-score: 1498.0 bits: 288.8 E(32554): 4e-77 Smith-Waterman score: 4146; 62.7% identity (80.7% similar) in 1021 aa overlap (28-1000:86-1056) 10 20 30 40 50 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL :::::... ::::::..: : ::::.: : CCDS43 EKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDEL 60 70 80 90 100 110 60 70 80 90 100 110 pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD ::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: . CCDS43 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE 120 130 140 150 160 170 120 130 140 150 160 170 pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN ..::::... ....::: :::.:::...:.:.:::.::::::: ::::::::.::... CCDS43 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS 180 190 200 210 220 230 180 190 200 210 220 230 pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP : . ...:.. : . : :.:::: :. :: :::::::.: CCDS43 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP 240 250 260 270 240 250 260 270 280 290 pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE .:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.: CCDS43 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS ::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..:: CCDS43 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS 340 350 360 370 380 390 360 370 380 390 400 410 pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP .::::...: .: ::::.. : .:: :::: : CCDS43 SDKRKNMYSGGENVQMNGDT------PH--DGGHGGGGHGDC------------------ 400 410 420 430 420 430 440 450 460 470 pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF ::: :::: ::: ::::: :.: :::::...::..::::::::. .:::::: CCDS43 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF 440 450 460 470 480 480 490 500 510 520 530 pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG ::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :. CCDS43 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA .::.:::::::: :: :::::::::::...:.:::::::::.::::::::::.:::: CCDS43 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL 550 560 570 580 590 600 600 610 620 630 640 650 pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW ::::: .:: .. : ..: :: :: .: .. : .. :::. . : .. . :..:: CCDS43 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW 610 620 630 640 650 660 660 670 680 690 700 pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT----- ..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : :::: CCDS43 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL 670 680 690 700 710 720 710 720 730 pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL ::: :.::::: :::.::::: :. . CCDS43 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI 730 740 750 760 770 780 740 750 760 770 780 790 pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV ::::::::::::::::::::::::.::::.::::::::::.:::..::.:.::::::::: CCDS43 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV 790 800 810 820 830 840 800 810 820 830 840 850 pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY ::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.:::: CCDS43 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY 850 860 870 880 890 900 860 870 880 890 900 910 pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI :::::::::::::.:: .: ::.::: ::::: .::::::::.::::..:.::::.::: CCDS43 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI 910 920 930 940 950 960 920 930 940 950 960 970 pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA :::::::::::::::.:. ::. .:..::::::...:...:::.:: : .::.:.:::. CCDS43 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS 970 980 990 1000 1010 1020 980 990 1000 1010 pF1KE6 HEDCDEEPQFPP----PSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL .. ... . : :: :::::. ....: CCDS43 LDSDNDDSDCPYSEKVPS-IKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC 1030 1040 1050 1060 1070 >>CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094 aa) initn: 4149 init1: 1438 opt: 2308 Z-score: 1481.5 bits: 285.8 E(32554): 3.4e-76 Smith-Waterman score: 4120; 63.5% identity (81.1% similar) in 998 aa overlap (28-980:86-1034) 10 20 30 40 50 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILGEEDEAPNPT-LFTEMDTL :::::... ::::::..: : ::::.: : CCDS47 EKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDEL 60 70 80 90 100 110 60 70 80 90 100 110 pF1KE6 QH-DGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTCLQTGTVLLDLD ::..:::::.:::::::::::.::::::::::.:::::::::::::.. :...:: . CCDS47 LAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDRE 120 130 140 150 160 170 120 130 140 150 160 170 pF1KE6 SGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKKPIHRSLADIGKSVSTTN ..::::... ....::: :::.:::...:.:.:::.::::::: ::::::::.::... CCDS47 ASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSAS 180 190 200 210 220 230 180 190 200 210 220 230 pF1KE6 RSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIP : . ...:.. : . : :.:::: :. :: :::::::.: CCDS47 RMFTNPDNGSPAMTHR----------------NLTSSSLNDISDKPEKDQLKNKFMKKLP 240 250 260 270 240 250 260 270 280 290 pF1KE6 KDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNE .:.:::::::::::::: :::::::: :..:::..::::::::::::::::.:.::::.: CCDS47 RDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHE 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE6 IGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPS ::::::::: :..: :.::::..:.::::::::::::::::::::::: :::::::..:: CCDS47 IGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPS 340 350 360 370 380 390 360 370 380 390 400 410 pF1KE6 ADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMP .::::...: .: ::::.. : .:: :::: : CCDS47 SDKRKNMYSGGENVQMNGDT------P--HDGGHGGGGHGDC------------------ 400 410 420 430 420 430 440 450 460 470 pF1KE6 AMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITF ::: :::: ::: ::::: :.: :::::...::..::::::::. .:::::: CCDS47 ------EELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITF 440 450 460 470 480 480 490 500 510 520 530 pF1KE6 GGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNG ::::::::::.:::.:::::::..:..::::.:::: :::::::.:.::.:::.::: :. CCDS47 GGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNN 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE6 LDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGA .::.:::::::: :: :::::::::::...:.:::::::::.::::::::::.:::: CCDS47 FDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKL 550 560 570 580 590 600 600 610 620 630 640 650 pF1KE6 FKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPD--TNASLYNLLNLTALDW ::::: .:: .. : ..: :: :: .: .. : .. :::. . : .. . :..:: CCDS47 ADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTT-LAPEYLPTMSSTDMYHNTTFDW 610 620 630 640 650 660 660 670 680 690 700 pF1KE6 SLLSKKECLSYGGRLLGNSCKFIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPT----- ..:::::: .::: :.::.:.:.::..:::::::.:::. ...::::: : :::: CCDS47 AFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKL 670 680 690 700 710 720 710 720 730 pF1KE6 ---------------------------------KPTRPDRGWFVAPFGKNPWWVYPASIL ::: :.::::: :::.::::: :. . CCDS47 ISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAI 730 740 750 760 770 780 740 750 760 770 780 790 pF1KE6 PALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATV ::::::::::::::::::::::::.::::.::::::::::.:::..::.:.::::::::: CCDS47 PALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATV 790 800 810 820 830 840 800 810 820 830 840 850 pF1KE6 ISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLY ::::::::::::::::::::::.::::::::::: .::::::.:::.::::: ::.:::: CCDS47 ISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLY 850 860 870 880 890 900 860 870 880 890 900 910 pF1KE6 GVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWI :::::::::::::.:: .: ::.::: ::::: .::::::::.::::..:.::::.::: CCDS47 GVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWI 910 920 930 940 950 960 920 930 940 950 960 970 pF1KE6 LKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILPEKEKK--ETDKKRKRKKGA :::::::::::::::.:. ::. .:..::::::...:...:::.:: : .::.:.:::. CCDS47 LKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGS 970 980 990 1000 1010 1020 980 990 1000 1010 pF1KE6 HE-DCDEEPQFPPPSVIKIPMESVQSDPQNGIHCIARKRSSSWSYSL . : :.: CCDS47 LDSDNDDEKDHQHSLNATHHADKIPFLQSLGMPSPPRTPVKVVPQIRIELEPEDNDYFWR 1030 1040 1050 1060 1070 1080 >>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090 aa) initn: 3031 init1: 1247 opt: 2286 Z-score: 1467.5 bits: 283.2 E(32554): 2e-75 Smith-Waterman score: 3093; 47.1% identity (72.7% similar) in 1064 aa overlap (15-1004:64-1069) 10 20 30 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ : .:.:: :... ::. ... CCDS58 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR 40 50 60 70 80 90 40 50 60 70 80 pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH .: ::: :: : : :::::: : . ::...::::.:::.:::: ::.::.:::::. CCDS58 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY 100 110 120 130 140 150 90 100 110 120 130 140 pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL :.:::::::::::.:. .:::.::. ...: .: : :....: .: : .:: : .:: CCDS58 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL 160 170 180 190 200 210 150 160 170 180 190 pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ .::.::..: :. ::.:::::. : . :. :: ..:. .... ... CCDS58 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG 220 230 240 250 260 270 200 210 220 230 240 250 pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV ... : :: . .... ..:. .::.::: .:::::::::::::..:.:::: CCDS58 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV 280 290 300 310 320 260 270 280 290 300 310 pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR :: ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..: CCDS58 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR 330 340 350 360 370 380 320 330 340 350 360 370 pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG .::..:::::::.: :::::::::.:::::::.::: .::: :: :::. CCDS58 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL 390 400 410 420 430 380 390 400 410 420 430 pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI : .: : :. : :: :::.:::: ::: CCDS58 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI 440 450 460 440 450 460 470 480 490 pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM ::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::.. ...::..:... CCDS58 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL 470 480 490 500 510 520 500 510 520 530 540 550 pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA .: . ::.:::: ::.::::.:.:::.:. : . :.:. .: ::: .. :..::: CCDS58 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV :::: .. ::::::::.:..:: .::::.:..:.. . : .:: . . .:.:.: :. CCDS58 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT 590 600 610 620 630 640 620 630 640 650 660 670 pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K : . .. .. : : : . .:. .: :. .:: . : .::..: CCDS58 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP 650 660 670 680 690 680 690 700 pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK------------------------- .:::. . :::: :. .. ::.:: .:::::: CCDS58 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG 700 710 720 730 740 750 710 720 730 740 750 pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN ::.:.:::...:.: ::::. . .:::: ::::::::::::::.: CCDS58 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN 760 770 780 790 800 810 760 770 780 790 800 810 pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ :::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: :::::: CCDS58 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ 820 830 840 850 860 870 820 830 840 850 860 870 pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK :.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: : CCDS58 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK 880 890 900 910 920 930 880 890 900 910 920 930 pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR :: :::::::: .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..:: CCDS58 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR 940 950 960 970 980 990 940 950 960 970 980 990 pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK .:.:. :....:.:.:...:: :.::: :::.:.:. :. .: :. ..: :... CCDS58 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ 1000 1010 1020 1030 1040 1050 1000 1010 pF1KE6 IPMESVQSDPQNGIHCIARKRSSSWSYSL ::..... .:.. . CCDS58 IPVKALKYSPDKPVSVKISFEDEPRKKYVDAETSL 1060 1070 1080 1090 >>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095 aa) initn: 3031 init1: 1247 opt: 2286 Z-score: 1467.5 bits: 283.2 E(32554): 2e-75 Smith-Waterman score: 3093; 47.1% identity (72.7% similar) in 1064 aa overlap (15-1004:69-1074) 10 20 30 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ : .:.:: :... ::. ... CCDS82 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR 40 50 60 70 80 90 40 50 60 70 80 pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH .: ::: :: : : :::::: : . ::...::::.:::.:::: ::.::.:::::. CCDS82 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY 100 110 120 130 140 150 90 100 110 120 130 140 pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL :.:::::::::::.:. .:::.::. ...: .: : :....: .: : .:: : .:: CCDS82 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL 160 170 180 190 200 210 150 160 170 180 190 pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ .::.::..: :. ::.:::::. : . :. :: ..:. .... ... CCDS82 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG 220 230 240 250 260 270 200 210 220 230 240 250 pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV ... : :: . .... ..:. .::.::: .:::::::::::::..:.:::: CCDS82 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV 280 290 300 310 320 260 270 280 290 300 310 pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR :: ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..: CCDS82 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR 330 340 350 360 370 380 320 330 340 350 360 370 pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG .::..:::::::.: :::::::::.:::::::.::: .::: :: :::. CCDS82 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL 390 400 410 420 430 440 380 390 400 410 420 430 pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI : .: : :. : :: :::.:::: ::: CCDS82 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI 450 460 470 440 450 460 470 480 490 pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM ::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::.. ...::..:... CCDS82 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL 480 490 500 510 520 530 500 510 520 530 540 550 pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA .: . ::.:::: ::.::::.:.:::.:. : . :.:. .: ::: .. :..::: CCDS82 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA 540 550 560 570 580 590 560 570 580 590 600 610 pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV :::: .. ::::::::.:..:: .::::.:..:.. . : .:: . . .:.:.: :. CCDS82 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT 600 610 620 630 640 650 620 630 640 650 660 670 pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K : . .. .. : : : . .:. .: :. .:: . : .::..: CCDS82 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP 660 670 680 690 700 680 690 700 pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK------------------------- .:::. . :::: :. .. ::.:: .:::::: CCDS82 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG 710 720 730 740 750 760 710 720 730 740 750 pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN ::.:.:::...:.: ::::. . .:::: ::::::::::::::.: CCDS82 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN 770 780 790 800 810 820 760 770 780 790 800 810 pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ :::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: :::::: CCDS82 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ 830 840 850 860 870 880 820 830 840 850 860 870 pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK :.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: : CCDS82 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK 890 900 910 920 930 940 880 890 900 910 920 930 pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR :: :::::::: .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..:: CCDS82 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR 950 960 970 980 990 1000 940 950 960 970 980 990 pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK .:.:. :....:.:.:...:: :.::: :::.:.:. :. .: :. ..: :... CCDS82 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ 1010 1020 1030 1040 1050 1060 1000 1010 pF1KE6 IPMESVQSDPQNGIHCIARKRSSSWSYSL ::..... .:.. . CCDS82 IPVKALKYSPDKPVSVKISFEDEPRKKYVDAETSL 1070 1080 1090 >>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131 aa) initn: 3031 init1: 1247 opt: 2280 Z-score: 1463.5 bits: 282.5 E(32554): 3.4e-75 Smith-Waterman score: 3087; 46.7% identity (72.5% similar) in 1077 aa overlap (15-1015:69-1087) 10 20 30 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKG-------SPA----AEQ : .:.:: :... ::. ... CCDS58 KEELESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQR 40 50 60 70 80 90 40 50 60 70 80 pF1KE6 LQDILGEED--EAPNP-TLFTEMDTLQH-DGDQMEWKESARWIKFEEKVEEGGERWSKPH .: ::: :: : : :::::: : . ::...::::.:::.:::: ::.::.:::::. CCDS58 VQFILGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPY 100 110 120 130 140 150 90 100 110 120 130 140 pF1KE6 VSTLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLL :.:::::::::::.:. .:::.::. ...: .: : :....: .: : .:: : .:: CCDS58 VATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALL 160 170 180 190 200 210 150 160 170 180 190 pF1KE6 RRHRHQTKK------PIHRSLADIGKSVSTTN---RSPA-RSPGAGPSLHHSTEDLRMRQ .::.::..: :. ::.:::::. : . :. :: ..:. .... ... CCDS58 KRHHHQNEKRFTSRIPLVRSFADIGKKHSDPHLLERNGILASPQSAPGNLDNSKSGEIKG 220 230 240 250 260 270 200 210 220 230 240 250 pF1KE6 SANYGRLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFV ... : :: . .... ..:. .::.::: .:::::::::::::..:.:::: CCDS58 NGSGG------SRENSTVDFS-KVDM---NFMRKIPTGAEASNVLVGEVDFLERPIIAFV 280 290 300 310 320 260 270 280 290 300 310 pF1KE6 RLIQSAMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNR :: ...: :.:::::::::::.::::.:.: .:.::::.:::::.:..: ::::::..: CCDS58 RLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDR 330 340 350 360 370 380 320 330 340 350 360 370 pF1KE6 EDLIAGIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRK-SVFSLAELGQMNGSVGGG .::..:::::::.: :::::::::.:::::::.::: .::: :: :::. CCDS58 NDLLSGIDEFLDQVTVLPPGEWDPSIRIEPPKSVPSQEKRKIPVFH-------NGSTPTL 390 400 410 420 430 440 380 390 400 410 420 430 pF1KE6 GGAPGGGNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDI : .: : :. : :: :::.:::: ::: CCDS58 GETPK-------------------------------EAAHHAGPELQRTGRLFGGLILDI 450 460 470 440 450 460 470 480 490 pF1KE6 KRKLPWFPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAM ::: :.: ::: :.. .: ...:::.: .:.. .::::::::.::.. ...::..:... CCDS58 KRKAPFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASL 480 490 500 510 520 530 500 510 520 530 540 550 pF1KE6 AGSLFCLFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVA .: . ::.:::: ::.::::.:.:::.:. : . :.:. .: ::: .. :..::: CCDS58 TGIAYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVA 540 550 560 570 580 590 560 570 580 590 600 610 pF1KE6 TDASFIIKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECV :::: .. ::::::::.:..:: .::::.:..:.. . : .:: . . .:.:.: :. CCDS58 TDASSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCT 600 610 620 630 640 650 620 630 640 650 660 670 pF1KE6 APDTVNTTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----K : . .. .. : : : . .:. .: :. .:: . : .::..: CCDS58 EPPNPSNETL---AQWKKD-NITAHNI------SWRNLTVSECKKLRGVFLGSACGHHGP 660 670 680 690 700 680 690 700 pF1KE6 FIPDLALMSFILFFGTYSMTLTLKKFKFSRYFPTK------------------------- .:::. . :::: :. .. ::.:: .:::::: CCDS58 YIPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDYLVG 710 720 730 740 750 760 710 720 730 740 750 pF1KE6 -------------PTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVN ::.:.:::...:.: ::::. . .:::: ::::::::::::::.: CCDS58 VPSPKLHVPEKFEPTHPERGWIISPLGDNPWWTLLIAAIPALLCTILIFMDQQITAVIIN 770 780 790 800 810 820 760 770 780 790 800 810 pF1KE6 RKENKLKKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQ :::.::::.:::::::. ::.....:: :::::.:::::.::.:..:::.:.: :::::: CCDS58 RKEHKLKKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQ 830 840 850 860 870 880 820 830 840 850 860 870 pF1KE6 PQFLGVREQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCK :.:::.:::::::...::: :.:::.. .:: ::.::::::::::::.::.:::...: : CCDS58 PKFLGIREQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIK 890 900 910 920 930 940 880 890 900 910 920 930 pF1KE6 LFLMPAKHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVR :: :::::::: .::.::: ..:.::..:. ::..::..: ..::..::.:.:.:..:: CCDS58 LFGMPAKHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVR 950 960 970 980 990 1000 940 950 960 970 980 990 pF1KE6 RLLDFIFSQHDLAWIDNILPE-KEKKETDKKRKRKKGAH---EDCDEEPQFP--PPSVIK .:.:. :....:.:.:...:: :.::: :::.:.:. :. .: :. ..: :... CCDS58 KLMDLCFTKRELSWLDDLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQ 1010 1020 1030 1040 1050 1060 1000 1010 pF1KE6 IPMESVQSDPQNGIHCIARK--RSSSWSYSL ::..... . . .: :. . ....: CCDS58 IPVKALKYSVDPSIVNISDEMAKTAQWKALSMNTENAKVTRSNMSPDKPVSVKISFEDEP 1070 1080 1090 1100 1110 1120 >>CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040 aa) initn: 3137 init1: 1277 opt: 1878 Z-score: 1208.7 bits: 235.2 E(32554): 5.3e-61 Smith-Waterman score: 3094; 47.3% identity (72.1% similar) in 1056 aa overlap (4-1006:17-1004) 10 20 30 40 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQLQDILG-EEDEAPN :... : :: ... . .:. ...: ::: :::: CCDS73 MPLGRQSHRHHRTHGQKHRRRGRGKGASQGEEGLEALAHDTPS-QRVQFILGTEEDEEHV 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 P-TLFTEMDTL-QHDGDQMEWKESARWIKFEEKVEEGGERWSKPHVSTLSLHSLFELRTC : ::::.: . ...:.. ::::.:::.:::: ::.::::::::.:.:::::::::::.: CCDS73 PHELFTELDEICMKEGEDAEWKETARWLKFEEDVEDGGERWSKPYVATLSLHSLFELRSC 60 70 80 90 100 110 110 120 130 140 150 pF1KE6 LQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLRRHRHQTKK------ : .::::::. ..:. .: : ....: .. : .: .: .::..:.::..: CCDS73 LINGTVLLDMHANSIEEISDLILDQQELSSDLNDSMRVKVREALLKKHHHQNEKKRNNLI 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE6 PIHRSLADIGKSVSTTNRSPARSPGAGPSLHHSTEDLRMRQSANYGRLCHAQSRSMNDIS :: ::.:..::. : . .. ..:. : .:......: :. . ... .. CCDS73 PIVRSFAEVGKKQSDPHLMDKHGQTVSPQ-SVPTTNLEVKNGVN----CEHSPVDLSKVD 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE6 LTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFVRLIQSAMLGGVTEVPVPTR : .:::::: .:::::::::::.::.:..::::: ...:.:.::::.::: CCDS73 L---------HFMKKIPTGAEASNVLVGEVDILDRPIVAFVRLSPAVLLSGLTEVPIPTR 240 250 260 270 280 280 290 300 310 320 330 pF1KE6 FLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNREDLIAGIDEFLDEVIVLPP :::::::: :....:.::::..::.:.:..: ::::::..:.::.::::::::.: :::: CCDS73 FLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYKAKERDDLLAGIDEFLDQVTVLPP 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE6 GEWDPNIRIEPPKKVPSADKRKSVFSLAELGQMNGSVGGGGGAPGGGNGGGGGGGSGGGA :::::.:::::::.::: .::: : ::.: : ::..: CCDS73 GEWDPSIRIEPPKNVPSQEKRKMP------GVPNGNVCHIEQEPHGGHSG---------- 350 360 370 380 400 410 420 430 440 450 pF1KE6 GSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDIKRKLPWFPSDFYDGFHIQSI : :: :::.:::: :::::: ::. ::. :.. .: . CCDS73 ----------------P-------ELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQCL 390 400 410 420 460 470 480 490 500 510 pF1KE6 SAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAMAGSLFCLFSGQPLIILSSTG ...::.: .:.. .::::::::.::.. ...::..:..:.: . ::.:: : ::.::: CCDS73 ASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGSTG 430 440 450 460 470 480 520 530 540 550 560 570 pF1KE6 PILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVATDASFIIKYITRFTEEGFST :.:.:::.:: : : .:.:. .: ::: .: :..::::::: .. ::::::::.:.. CCDS73 PVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAFAS 490 500 510 520 530 540 580 590 600 610 620 630 pF1KE6 LISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECVAPDTVNTTVFNASAPLAPDT :: .::::.::.:.: . :::.: . . .. : :.:. :.. : : . : CCDS73 LICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPN----NHTLQYWKDH 550 560 570 580 590 600 640 650 660 670 680 690 pF1KE6 NASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----KFIPDLALMSFILFFGTYSMT : . . . :. :. .:: . :...:..: . ::. . : :::: :. .. CCDS73 N------IVTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILS 610 620 630 640 650 700 710 pF1KE6 LTLKKFKFSRYFPT--------------------------------------KPTRPDRG ::: :: :::::: :::: ::: CCDS73 STLKTFKTSRYFPTRVRSMVSDFAVFLTIFTMVIIDFLIGVPSPKLQVPSVFKPTRDDRG 660 670 680 690 700 710 720 730 740 750 760 770 pF1KE6 WFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVNRKENKLKKAAGYHLDLFWVG :.. :.: ::::. :.:.:::: ::::::::::::::.::::.::::. ::::::. :. CCDS73 WIINPIGPNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVA 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE6 ILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQPQFLGVREQRVTGIIVFILT :....::.:::::.:::::.::.:..:::.:.: :::::::.:::.:::::::...:.: CCDS73 IMLGVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLM 780 790 800 810 820 830 840 850 860 870 880 890 pF1KE6 GISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCKLFLMPAKHQPDHAFLRHVPL : :::.. ::: ::.::::::::::::.::.::::..: ::: :::::::: .:::::: CCDS73 GCSVFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPL 840 850 860 870 880 890 900 910 920 930 940 950 pF1KE6 RRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFIFSQHDLAWIDNILP :..:::::.:. ::..::..:.. :::.::.:.:.:..::...:. ::...:.:.:...: CCDS73 RKVHLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKVMDLCFSKRELSWLDDLMP 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KE6 EKEKKETDKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQ--SDPQNGIHCIARKRSSS :..::. : .:. : :. . : .. . :.:.:: . :.: ..: : CCDS73 ESKKKKLDDAKKKAK---EEEEAEKMLEIGGD-KFPLESRKLLSSPGKNISCRCDPSEIN 960 970 980 990 1000 1010 pF1KE6 WSYSL CCDS73 ISDEMPKTTVWKALSMNSGNAKEKSLFN 1020 1030 1040 >>CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093 aa) initn: 3137 init1: 1277 opt: 1878 Z-score: 1208.5 bits: 235.3 E(32554): 5.4e-61 Smith-Waterman score: 3094; 47.3% identity (72.1% similar) in 1056 aa overlap (4-1006:70-1057) 10 20 30 pF1KE6 MKVKEEKAGVGKLDHTNHRRRFPDQKGSPAAEQ :... : :: ... . .:. .. CCDS44 EELEGHRTLYVGVRMPLGRQSHRHHRTHGQKHRRRGRGKGASQGEEGLEALAHDTPS-QR 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE6 LQDILG-EEDEAPNP-TLFTEMDTL-QHDGDQMEWKESARWIKFEEKVEEGGERWSKPHV .: ::: :::: : ::::.: . ...:.. ::::.:::.:::: ::.::::::::.: CCDS44 VQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDVEDGGERWSKPYV 100 110 120 130 140 150 100 110 120 130 140 150 pF1KE6 STLSLHSLFELRTCLQTGTVLLDLDSGSLPQIIDDVIEKQIEDGLLRPELRERVSYVLLR .:::::::::::.:: .::::::. ..:. .: : ....: .. : .: .: .::. CCDS44 ATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLNDSMRVKVREALLK 160 170 180 190 200 210 160 170 180 190 200 pF1KE6 RHRHQTKK------PIHRSLADIGKSVSTTNRSPARSPGAGPSLHHSTEDLRMRQSANYG .:.::..: :: ::.:..::. : . .. ..:. : .:......: CCDS44 KHHHQNEKKRNNLIPIVRSFAEVGKKQSDPHLMDKHGQTVSPQ-SVPTTNLEVKNGVN-- 220 230 240 250 260 270 210 220 230 240 250 260 pF1KE6 RLCHAQSRSMNDISLTPNTDQRKNKFMKKIPKDSEASNVLVGEVDFLDQPFIAFVRLIQS :. . ... ..: .:::::: .:::::::::::.::.:..::::: . CCDS44 --CEHSPVDLSKVDL---------HFMKKIPTGAEASNVLVGEVDILDRPIVAFVRLSPA 280 290 300 310 320 270 280 290 300 310 320 pF1KE6 AMLGGVTEVPVPTRFLFILLGPSGRAKSYNEIGRAIATLMVDDLFSDVAYKARNREDLIA ..:.:.::::.::::::::::: :....:.::::..::.:.:..: ::::::..:.::.: CCDS44 VLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYKAKERDDLLA 330 340 350 360 370 380 330 340 350 360 370 380 pF1KE6 GIDEFLDEVIVLPPGEWDPNIRIEPPKKVPSADKRKSVFSLAELGQMNGSVGGGGGAPGG :::::::.: :::::::::.:::::::.::: .::: : ::.: : : CCDS44 GIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQEKRKMP------GVPNGNVCHIEQEPHG 390 400 410 420 430 390 400 410 420 430 440 pF1KE6 GNGGGGGGGSGGGAGSGGAGGTSSGDDGEMPAMHEIGEELIWTGRFFGGLCLDIKRKLPW :..: : :: :::.:::: :::::: :: CCDS44 GHSG--------------------------P-------ELQRTGRLFGGLVLDIKRKAPW 440 450 460 450 460 470 480 490 500 pF1KE6 FPSDFYDGFHIQSISAILFIYLGCITNAITFGGLLGDATDNYQGVMESFLGTAMAGSLFC . ::. :.. .: ....::.: .:.. .::::::::.::.. ...::..:..:.: . CCDS44 YWSDYRDALSLQCLASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYS 470 480 490 500 510 520 510 520 530 540 550 560 pF1KE6 LFSGQPLIILSSTGPILIFEKLLFDFSKGNGLDYMEFRLWIGLHSAVQCLILVATDASFI ::.:: : ::.::::.:.:::.:: : : .:.:. .: ::: .: :..::::::: . CCDS44 LFAGQALTILGSTGPVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSL 530 540 550 560 570 580 570 580 590 600 610 620 pF1KE6 IKYITRFTEEGFSTLISFIFIYDAIKKMIGAFKYYPINMDFKPNFITTYKCECVAPDTVN . ::::::::.:..:: .::::.::.:.: . :::.: . . .. : :.:. :.. : CCDS44 VCYITRFTEEAFASLICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPN 590 600 610 620 630 640 630 640 650 660 670 680 pF1KE6 TTVFNASAPLAPDTNASLYNLLNLTALDWSLLSKKECLSYGGRLLGNSC----KFIPDLA : . : : . . . :. :. .:: . :...:..: . ::. CCDS44 ----NHTLQYWKDHN------IVTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVL 650 660 670 680 690 690 700 pF1KE6 LMSFILFFGTYSMTLTLKKFKFSRYFPT-------------------------------- . : :::: :. .. ::: :: :::::: CCDS44 FWSCILFFTTFILSSTLKTFKTSRYFPTRVRSMVSDFAVFLTIFTMVIIDFLIGVPSPKL 700 710 720 730 740 750 710 720 730 740 750 760 pF1KE6 ------KPTRPDRGWFVAPFGKNPWWVYPASILPALLVTILIFMDQQITAVIVNRKENKL :::: ::::.. :.: ::::. :.:.:::: ::::::::::::::.::::.:: CCDS44 QVPSVFKPTRDDRGWIINPIGPNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKL 760 770 780 790 800 810 770 780 790 800 810 820 pF1KE6 KKAAGYHLDLFWVGILMALCSFMGLPWYVAATVISIAHIDSLKMETETSAPGEQPQFLGV ::. ::::::. :.:....::.:::::.:::::.::.:..:::.:.: :::::::.:::. CCDS44 KKGCGYHLDLLMVAIMLGVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGI 820 830 840 850 860 870 830 840 850 860 870 880 pF1KE6 REQRVTGIIVFILTGISVFLAPILKCIPLPVLYGVFLYMGVASLNGIQFWERCKLFLMPA :::::::...:.: : :::.. ::: ::.::::::::::::.::.::::..: ::: ::: CCDS44 REQRVTGLMIFVLMGCSVFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPA 880 890 900 910 920 930 890 900 910 920 930 940 pF1KE6 KHQPDHAFLRHVPLRRIHLFTLVQILCLAVLWILKSTVAAIIFPVMILGLIIVRRLLDFI ::::: .:::::::..:::::.:. ::..::..:.. :::.::.:.:.:..::...:. CCDS44 KHQPDFIYLRHVPLRKVHLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKVMDLC 940 950 960 970 980 990 950 960 970 980 990 1000 pF1KE6 FSQHDLAWIDNILPEKEKKETDKKRKRKKGAHEDCDEEPQFPPPSVIKIPMESVQ--SDP ::...:.:.:...::..::. : .:. : :. . : .. . :.:.:: . :.: CCDS44 FSKRELSWLDDLMPESKKKKLDDAKKKAK---EEEEAEKMLEIGGD-KFPLESRKLLSSP 1000 1010 1020 1030 1040 1050 1010 pF1KE6 QNGIHCIARKRSSSWSYSL ..: : CCDS44 GKNISCRCDPSEINISDEMPKTTVWKALSMNSGNAKEKSLFN 1060 1070 1080 1090 1019 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 16:10:00 2016 done: Tue Nov 8 16:10:00 2016 Total Scan time: 3.210 Total Display time: 0.360 Function used was FASTA [36.3.4 Apr, 2011]