FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3856, 1241 aa
1>>>pF1KB3856 1241 - 1241 aa - 1241 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.1729+/-0.000901; mu= 10.1469+/- 0.054
mean_var=165.6193+/-32.949, 0's: 0 Z-trim(112.1): 49 B-trim: 0 in 0/53
Lambda= 0.099660
statistics sampled from 12862 (12905) to 12862 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.396), width: 16
Scan time: 4.730
The best scores are: opt bits E(32554)
CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241) 8209 1193.2 0
CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227) 8090 1176.1 0
CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232) 8090 1176.1 0
CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232) 4504 660.5 7.5e-189
CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259) 4330 635.5 2.6e-181
CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093) 1714 259.3 3.9e-68
CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040) 1711 258.8 5e-68
CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090) 1705 258.0 9.5e-68
CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095) 1705 258.0 9.5e-68
CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131) 1705 258.0 9.8e-68
CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2 (1088) 1700 257.3 1.6e-67
CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2 (1099) 1700 257.3 1.6e-67
CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 ( 911) 1666 252.3 4e-66
CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3 (1206) 1369 209.7 3.6e-53
CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3 (1210) 1369 209.7 3.6e-53
CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3 (1214) 1369 209.7 3.6e-53
CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3 (1246) 1369 209.7 3.7e-53
CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3 (1259) 1369 209.7 3.7e-53
CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2 (1118) 1347 206.5 3e-52
CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035) 1190 183.9 1.8e-45
CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079) 1190 184.0 1.8e-45
CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094) 1190 184.0 1.9e-45
CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 945) 1155 178.9 5.4e-44
CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121) 964 151.5 1.1e-35
CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 959) 934 147.1 2e-34
CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 983) 934 147.1 2e-34
CCDS54446.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 875) 851 135.2 7.3e-31
CCDS13052.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 891) 851 135.2 7.4e-31
CCDS54445.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 918) 851 135.2 7.6e-31
CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 896) 827 131.7 8.1e-30
CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 638) 596 98.4 6.1e-20
CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 747) 596 98.4 7e-20
CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137) 553 92.4 7.1e-18
>>CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241 aa)
initn: 8209 init1: 8209 opt: 8209 Z-score: 6382.8 bits: 1193.2 E(32554): 0
Smith-Waterman score: 8209; 100.0% identity (100.0% similar) in 1241 aa overlap (1-1241:1-1241)
10 20 30 40 50 60
pF1KB3 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB3 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB3 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB3 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB3 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB3 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB3 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB3 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB3 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB3 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240
pF1KB3 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
:::::::::::::::::::::::::::::::::::::::::
CCDS59 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
1210 1220 1230 1240
>>CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227 aa)
initn: 8090 init1: 8090 opt: 8090 Z-score: 6290.4 bits: 1176.1 E(32554): 0
Smith-Waterman score: 8090; 100.0% identity (100.0% similar) in 1224 aa overlap (18-1241:4-1227)
10 20 30 40 50 60
pF1KB3 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE
:::::::::::::::::::::::::::::::::::::::::::
CCDS56 MTQPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE
10 20 30 40
70 80 90 100 110 120
pF1KB3 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB3 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB3 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB3 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB3 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB3 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB3 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV
410 420 430 440 450 460
490 500 510 520 530 540
pF1KB3 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA
470 480 490 500 510 520
550 560 570 580 590 600
pF1KB3 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT
530 540 550 560 570 580
610 620 630 640 650 660
pF1KB3 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL
590 600 610 620 630 640
670 680 690 700 710 720
pF1KB3 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL
650 660 670 680 690 700
730 740 750 760 770 780
pF1KB3 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS
710 720 730 740 750 760
790 800 810 820 830 840
pF1KB3 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF
770 780 790 800 810 820
850 860 870 880 890 900
pF1KB3 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT
830 840 850 860 870 880
910 920 930 940 950 960
pF1KB3 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ
890 900 910 920 930 940
970 980 990 1000 1010 1020
pF1KB3 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS
950 960 970 980 990 1000
1030 1040 1050 1060 1070 1080
pF1KB3 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK
1010 1020 1030 1040 1050 1060
1090 1100 1110 1120 1130 1140
pF1KB3 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH
1070 1080 1090 1100 1110 1120
1150 1160 1170 1180 1190 1200
pF1KB3 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR
1130 1140 1150 1160 1170 1180
1210 1220 1230 1240
pF1KB3 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
:::::::::::::::::::::::::::::::::::::::::
CCDS56 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
1190 1200 1210 1220
>>CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232 aa)
initn: 8090 init1: 8090 opt: 8090 Z-score: 6290.4 bits: 1176.1 E(32554): 0
Smith-Waterman score: 8090; 100.0% identity (100.0% similar) in 1224 aa overlap (18-1241:9-1232)
10 20 30 40 50 60
pF1KB3 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE
:::::::::::::::::::::::::::::::::::::::::::
CCDS56 MDFLLRPQPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB3 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB3 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB3 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB3 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB3 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB3 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB3 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB3 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL
600 610 620 630 640 650
670 680 690 700 710 720
pF1KB3 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL
660 670 680 690 700 710
730 740 750 760 770 780
pF1KB3 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS
720 730 740 750 760 770
790 800 810 820 830 840
pF1KB3 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF
780 790 800 810 820 830
850 860 870 880 890 900
pF1KB3 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT
840 850 860 870 880 890
910 920 930 940 950 960
pF1KB3 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KB3 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS
960 970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KB3 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK
1020 1030 1040 1050 1060 1070
1090 1100 1110 1120 1130 1140
pF1KB3 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH
1080 1090 1100 1110 1120 1130
1150 1160 1170 1180 1190 1200
pF1KB3 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR
1140 1150 1160 1170 1180 1190
1210 1220 1230 1240
pF1KB3 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
:::::::::::::::::::::::::::::::::::::::::
CCDS56 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
1200 1210 1220 1230
>>CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232 aa)
initn: 3774 init1: 1663 opt: 4504 Z-score: 3503.9 bits: 660.5 E(32554): 7.5e-189
Smith-Waterman score: 4611; 59.5% identity (77.8% similar) in 1267 aa overlap (8-1241:8-1232)
10 20 30 40 50
pF1KB3 MSSAPRRPAKGADSFCTPE---PESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSR
: ::. . :. : : .: :.:.:.: .::.: :: ..... .
CCDS24 MANGVIPPPGGASPL--PQVRVPLEEPPLSPDV-EEEDDDLGKTLAVSRFGDLISKPPAW
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 GGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRR-----PGA
:.:.:::.:.:::.::..::: :::::..::: . :. : .:. ::. .:
CCDS24 DPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSA
60 70 80 90 100 110
120 130 140 150 160
pF1KB3 SPTGETPTI-EEG------EEDEDEASEAEGARALTQPSPVSTPSSVQFFL--QEDDSAD
:. :: : ::: ::.:.: :.:. ..: .::....: . .::::
CCDS24 PPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPHSGTPQKAKFSIGSDEDDSPG
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB3 RKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGR
. :.. ..: : :: . .:. :... . .:.: .: : ..:
CCDS24 LPG-RAAVTKPLPSVGPHTDKSPQHSSSSPS----PRARASRLA-----------GEKSR
180 190 200 210 220
230 240 250 260 270 280
pF1KB3 PL-PKAQPGHRSYNLQERRRIGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFED
: :.: ::.:.:: :: : . .::::: ::: :..:::: :::::.::
CCDS24 PWSPSA-----SYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLED
230 240 250 260 270
290 300 310 320 330
pF1KB3 VPGVRRHLVRKNAKGSTQSGREGREPGPTP-----RARPRAPHKPHEVFVELNELLLDKN
::::::::.: .. ::.:: : : .: . . . ..:::::::::::.::..
CCDS24 NPGVRRHLVKKPSR--TQGGR-GSPSGLAPILRRKKKKKKLDRRPHEVFVELNELMLDRS
280 290 300 310 320 330
340 350 360 370 380 390
pF1KB3 QEPQWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLP
:::.::::::::::::::::::::::::::::::::::::::::.::::.::::.: :::
CCDS24 QEPHWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTIAHGAALLDLEQTTLP
340 350 360 370 380 390
400 410 420 430 440 450
pF1KB3 GVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPSDEKDFSF-PRNISAGSLGSLLGHH
:.:: ::: :..::::. ::::.:::.::::::::.:.:: .: ::: :..:..:.::.:
CCDS24 GIAHLVVETMIVSDQIRPEDRASVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNH
400 410 420 430 440 450
460 470 480 490 500 510
pF1KB3 HGQGAESDPHVTEPLMG---GVPETRLEVERE-RELPPPAPPAGITRSKSKHELKLLEKI
: ... : . : :. : : . . .: : : . :.:: :::::::
CCDS24 HPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS---LKLLEKI
460 470 480 490 500
520 530 540 550 560 570
pF1KB3 PENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAVLEVPVPVRFLFLLLGPSSANMDYH
::.::::::::::: :: .:. ::::: ::: :..::::::::::::..:::: .. :::
CCDS24 PEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYH
510 520 530 540 550 560
580 590 600 610 620 630
pF1KB3 EIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQ
:.::::.:::::: :::::: ::.:.:::.::. ::: :.:.:::::.:..:::::: ::
CCDS24 ELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQ
570 580 590 600 610 620
640 650 660 670 680
pF1KB3 RQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQMVEAAGAAEDDPLRRTGRPFGGLIR
:..:.::.: : .. : : .: : : :.. . .. ::::: ::: ::::.:
CCDS24 RELLRKRREREQTKVEMTTRG--GYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVR
630 640 650 660 670 680
690 700 710 720 730 740
pF1KB3 DVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPAITFGGLLGEKTQDLIGVSELIMST
::::::::: ::.:::: ::.:::.:::::::::::::::::::::. :.::::::.::
CCDS24 DVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVST
690 700 710 720 730 740
750 760 770 780 790 800
pF1KB3 ALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCSSNHLEYLVGRVWIGFWLVFLALLM
:. ::.: :::::::::.::::::::::::::.:: .. ::::.::::.:.::: ..: .
CCDS24 AVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLAL
750 760 770 780 790 800
810 820 830 840 850 860
pF1KB3 VALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKLVKIFQEHPLHGCSASNSSEVDGGE
:: :::::::..: :::::::::::::::::::::: :.: :::: ... ..:.
CCDS24 VAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPPEGA-LEGSL
810 820 830 840 850 860
870 880 890 900 910 920
pF1KB3 NMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFF
. :: : :.. .: : .::.:::::::::.:: ::::::::::::.::::.
CCDS24 D---AG----LEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFLRKFRNSRFL
870 880 890 900 910
930 940 950 960 970 980
pF1KB3 PGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKS
:. ::.:::::.::.::.:::::::: :::::::.::.:.:::.:.::.: : :::
CCDS24 GGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSAR
920 930 940 950 960 970
990 1000 1010 1020 1030 1040
pF1KB3 PFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICA
::: :::::. .::.::.::::::::::.::.:.: : : :::::::::::: ..::.:.
CCDS24 PFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCG
980 990 1000 1010 1020 1030
1050 1060 1070 1080 1090 1100
pF1KB3 LFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIG
:::::::.:::::::::.:::::: :.::::::.::::.::::::.:.: :::::::.:
CCDS24 LFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMG
1040 1050 1060 1070 1080 1090
1110 1120 1130 1140 1150 1160
pF1KB3 DLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFT
.::.::::::::::::::::::.:::. .:: :.::: ::::. :: ::.: ::::::
CCDS24 AVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFT
1100 1110 1120 1130 1140 1150
1170 1180 1190 1200 1210 1220
pF1KB3 ALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDE
.:: :.::::.: ::::::::::.:.:::::: .: :.: :::.. ::...::: :::
CCDS24 CIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDSEDAEPNFDE
1160 1170 1180 1190 1200 1210
1230 1240
pF1KB3 REGVDEYNEMPMPV
.: :::::. :::
CCDS24 -DGQDEYNELHMPV
1220 1230
>>CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259 aa)
initn: 3774 init1: 1663 opt: 4330 Z-score: 3368.6 bits: 635.5 E(32554): 2.6e-181
Smith-Waterman score: 4602; 58.9% identity (77.9% similar) in 1276 aa overlap (8-1241:8-1259)
10 20 30 40 50
pF1KB3 MSSAPRRPAKGADSFCTPE---PESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSR
: ::. . :. : : .: :.:.:.: .::.: :: ..... .
CCDS24 MANGVIPPPGGASPL--PQVRVPLEEPPLSPDV-EEEDDDLGKTLAVSRFGDLISKPPAW
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 GGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRR-----PGA
:.:.:::.:.:::.::..::: :::::..::: . :. : .:. ::. .:
CCDS24 DPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSA
60 70 80 90 100 110
120 130 140 150 160
pF1KB3 SPTGETPTI-EEG------EEDEDEASEAEGARALTQPSPVSTPSSVQFFL--QEDDSAD
:. :: : ::: ::.:.: :.:. ..: .::....: . .::::
CCDS24 PPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPHSGTPQKAKFSIGSDEDDSPG
120 130 140 150 160 170
170 180 190 200 210
pF1KB3 RKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEAEA-VAVASG-------TAGG
. :.. ..: : :: . .:. : .. ........ . .:..: .. .
CCDS24 LPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDGTTDLALSSPRLLCCLPSSPS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB3 DDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQALLPRVPTDEIEAQTLATADLD
. :: :..: ::.:.:: :: : . .::::: ::: :..::::
CCDS24 PRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLD
240 250 260 270 280 290
280 290 300 310 320
pF1KB3 LMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTP-----RARPRAPHKPHEVFVE
:::::.:: ::::::::.: .. ::.:: : : .: . . . ..:::::::
CCDS24 DMKSHRLEDNPGVRRHLVKKPSR--TQGGR-GSPSGLAPILRRKKKKKKLDRRPHEVFVE
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB3 LNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTLAHGAVL
::::.::..:::.::::::::::::::::::::::::::::::::::::::::.::::.:
CCDS24 LNELMLDRSQEPHWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTIAHGAAL
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB3 LDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPSDEKDFSF-PRNISAG
:::.: ::::.:: ::: :..::::. ::::.:::.::::::::.:.:: .: ::: :..
CCDS24 LDLEQTTLPGIAHLVVETMIVSDQIRPEDRASVLRTLLLKHSHPNDDKDSGFFPRNPSSS
420 430 440 450 460 470
450 460 470 480 490 500
pF1KB3 SLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-RELPPPAPPAGITRSKSK
:..:.::.:: ... : . : :. : : . . .: : : . :.::
CCDS24 SMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS-
480 490 500 510 520
510 520 530 540 550 560
pF1KB3 HELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAVLEVPVPVRFLFLLLG
:::::::::.::::::::::: :: .:. ::::: ::: :..::::::::::::..::
CCDS24 --LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLG
530 540 550 560 570 580
570 580 590 600 610 620
pF1KB3 PSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFLDCSVVLPPSEVQGEE
:: .. ::::.::::.:::::: :::::: ::.:.:::.::. ::: :.:.:::::.:..
CCDS24 PSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRD
590 600 610 620 630 640
630 640 650 660 670
pF1KB3 LLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQMVEAAGAAEDDPLRRT
:::::: :::..:.::.: : .. : : .: : : :.. . .. ::::: ::
CCDS24 LLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLELGGSEATPEDDPLLRT
650 660 670 680 690 700
680 690 700 710 720 730
pF1KB3 GRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPAITFGGLLGEKTQDLI
: ::::.:::::::::: ::.:::: ::.:::.:::::::::::::::::::::. :.
CCDS24 GSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLM
710 720 730 740 750 760
740 750 760 770 780 790
pF1KB3 GVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCSSNHLEYLVGRVWIGF
::::::.:::. ::.: :::::::::.::::::::::::::.:: .. ::::.::::.:.
CCDS24 GVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGL
770 780 790 800 810 820
800 810 820 830 840 850
pF1KB3 WLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKLVKIFQEHPLHGCSAS
::: ..: .:: :::::::..: :::::::::::::::::::::: :.: ::::
CCDS24 WLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPP
830 840 850 860 870 880
860 870 880 890 900 910
pF1KB3 NSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFL
... ..:. . :: : :.. .: : .::.:::::::::.:: :::::::::
CCDS24 EGA-LEGSLD---AG----LEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFL
890 900 910 920 930
920 930 940 950 960 970
pF1KB3 RKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGW
:::.::::. :. ::.:::::.::.::.:::::::: :::::::.::.:.:::.:.::.:
CCDS24 RKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSW
940 950 960 970 980 990
980 990 1000 1010 1020 1030
pF1KB3 VINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLL
: ::: ::: :::::. .::.::.::::::::::.::.:.: : : :::::::::::
CCDS24 FIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLL
1000 1010 1020 1030 1040 1050
1040 1050 1060 1070 1080 1090
pF1KB3 IVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVAL
: ..::.:.:::::::.:::::::::.:::::: :.::::::.::::.::::::.:.:
CCDS24 IGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIAS
1060 1070 1080 1090 1100 1110
1100 1110 1120 1130 1140 1150
pF1KB3 LVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKV
:::::::.: .::.::::::::::::::::::.:::. .:: :.::: ::::. :: ::
CCDS24 LVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKV
1120 1130 1140 1150 1160 1170
1160 1170 1180 1190 1200 1210
pF1KB3 RTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDA
.: :::::: .:: :.::::.: ::::::::::.:.:::::: .: :.: :::.. ::.
CCDS24 KTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDS
1180 1190 1200 1210 1220 1230
1220 1230 1240
pF1KB3 NEAEPVFDEREGVDEYNEMPMPV
..::: ::: .: :::::. :::
CCDS24 EDAEPNFDE-DGQDEYNELHMPV
1240 1250
>>CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093 aa)
initn: 2265 init1: 739 opt: 1714 Z-score: 1336.7 bits: 259.3 E(32554): 3.9e-68
Smith-Waterman score: 2320; 39.0% identity (67.9% similar) in 1044 aa overlap (218-1217:3-1005)
190 200 210 220 230 240
pF1KB3 KGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRRIGSMTGA
:.: : : ::. ... . .. :.
CCDS44 MPAAGSNEPD---GVLSYQRPDEEAVVDQGGT
10 20
250 260 270 280 290 300
pF1KB3 EQALLPRVPTDEIEAQTLATADLDL---MKSHRFEDVPGVRRHLVRKNAKGSTQSGREGR
: . .:.:.. . . . .::: . . : ..: : .::..: :.::
CCDS44 STILNIHYEKEELEGHRTLYVGVRMPLGRQSHRHHRTHG-QKHRRRGRGKGASQ-GEEGL
30 40 50 60 70 80
310 320 330 340 350
pF1KB3 EP--GPTPRARPR--------APHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVE
: :: : . : :::.:.::.:. . .... .:.:::::.:::::::
CCDS44 EALAHDTPSQRVQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDVE
90 100 110 120 130 140
360 370 380 390 400 410
pF1KB3 EETERWGKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAE
. :::.::.::.::..::.::: : .:.::::. ... .. ...:. .:....
CCDS44 DGGERWSKPYVATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLNDS
150 160 170 180 190 200
420 430 440 450 460 470
pF1KB3 DRANVLRALLLKHSHPSDEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG--
:..: .::: :: : ...: .. : : . .:. .::::. . :
CCDS44 MRVKVREALLKKHHHQNEKKRNNLIPIVRSFAEVGK---------KQSDPHLMDK-HGQT
210 220 230 240 250
480 490 500 510 520
pF1KB3 ----GVPETRLEVERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFL
.:: : :::. . :. . :: .:....::: .:::. :::: :..:
CCDS44 VSPQSVPTTNLEVKNGVNCEHS--PVDL----SKVDLHFMKKIPTGAEASNVLVGEVDIL
260 270 280 290 300 310
530 540 550 560 570 580
pF1KB3 SRPTMAFVRLREAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHE
.:: .::::: :: :... :::.:.::::.:::: . ...:::::::..:.:.:. ::.
CCDS44 DRPIVAFVRLSPAVLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHD
320 330 340 350 360 370
590 600 610 620 630 640
pF1KB3 AAYLADEREDLLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTG
.:: : ::.:::..:. ::: .::::.: . .. . : .::. : .:.:
CCDS44 VAYKAKERDDLLAGIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQ--EKRKMPG--VPNG
380 390 400 410 420
650 660 670 680 690 700
pF1KB3 AGLEPKSAQDKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQ
. .. : :. :.:::: ::::. :..:. : : ::.::::. :
CCDS44 NVCHIEQ----------EPHGGHSGPELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQ
430 440 450 460 470
710 720 730 740 750 760
pF1KB3 CLAAVIFIYFAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGF
:::. .:.: : .::.::::::::: :. :.. : ...... :... :...: : ..:
CCDS44 CLASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGS
480 490 500 510 520 530
770 780 790 800 810 820
pF1KB3 SGPLLVFEEAFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIF
.::.::::. .:.::.. : :: :. ::.: .:: ...:: ..: :: ...:::.: :
CCDS44 TGPVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAF
540 550 560 570 580 590
830 840 850 860 870
pF1KB3 AFLISLIFIYETFYKLVKIFQEHPLHGCSASNSSEV--------DGGENMT---WAGARP
: :: .:::::.. ::... . .:.: : . . .. .: : :
CCDS44 ASLICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPNNHTLQYWKDHNI
600 610 620 630 640 650
880 890 900 910 920
pF1KB3 TLGP---GNRSLAG-QSGQGKPRGQ---------PNTALLSLVLMAGTFFIAFFLRKFKN
. . .: ... : .:. :. :.. . : .:. ::... :. ::.
CCDS44 VTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILSSTLKTFKT
660 670 680 690 700 710
930 940 950 960 970 980
pF1KB3 SRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPL
::.:: :.: ...::.: ..:. ::..:. : . . ::.::: :. : . :::.:::.
CCDS44 SRYFPTRVRSMVSDFAVFLTIFTMVIIDFLI-GVPSPKLQVPSVFKPTRDD-RGWIINPI
720 730 740 750 760 770
990 1000 1010 1020 1030 1040
pF1KB3 GEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMG
: : : : ..:...::.: :::::. :::..::..::. :.:: :.:::::... :
CCDS44 G---PNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVAIML
780 790 800 810 820 830
1050 1060 1070 1080 1090 1100
pF1KB3 GICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLS
:.:...::::..:::: :.::.:.: . :. :::..::. ..:::::::.. .:.: :
CCDS44 GVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLMGCS
840 850 860 870 880 890
1110 1120 1130 1140 1150 1160
pF1KB3 IVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRM
. . .:. ::. ::.:.::::::.::.::::..::.:. :: ::.:: :...: ..
CCDS44 VFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPLRKV
900 910 920 930 940 950
1170 1180 1190 1200 1210 1220
pF1KB3 HLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEP
:::: .:: ::.:::.. .. :...::.... : .: : . :. ::.. ::
CCDS44 HLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKV-MDLCFSKRELSWLDDLMPES
960 970 980 990 1000 1010
1230 1240
pF1KB3 VFDEREGVDEYNEMPMPV
CCDS44 KKKKLDDAKKKAKEEEEAEKMLEIGGDKFPLESRKLLSSPGKNISCRCDPSEINISDEMP
1020 1030 1040 1050 1060 1070
>>CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040 aa)
initn: 2265 init1: 739 opt: 1711 Z-score: 1334.7 bits: 258.8 E(32554): 5e-68
Smith-Waterman score: 2317; 40.3% identity (69.4% similar) in 980 aa overlap (274-1217:6-952)
250 260 270 280 290 300
pF1KB3 MTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG
.::: . . : ..: : .::..: :.::
CCDS73 MPLGRQSHRHHRTHG-QKHRRRGRGKGASQ-GEEG
10 20 30
310 320 330 340 350
pF1KB3 REP--GPTPRARPR--------APHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDV
: :: : . : :::.:.::.:. . .... .:.:::::.::::::
CCDS73 LEALAHDTPSQRVQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDV
40 50 60 70 80 90
360 370 380 390 400 410
pF1KB3 EEETERWGKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKA
:. :::.::.::.::..::.::: : .:.::::. ... .. ...:. .:....
CCDS73 EDGGERWSKPYVATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLND
100 110 120 130 140 150
420 430 440 450 460 470
pF1KB3 EDRANVLRALLLKHSHPSDEKDFSFPRNISAGSLGSL--LGHHHGQGAESDPHVTEPLMG
:..: .::: :: : ...: :: . :. .:..... : :
CCDS73 SMRVKVREALLKKHHHQNEKK-----RNNLIPIVRSFAEVGKKQSDPHLMDKHGQTVSPQ
160 170 180 190 200
480 490 500 510 520 530
pF1KB3 GVPETRLEVERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPT
.:: : :::. . :. . :: .:....::: .:::. :::: :..:.::
CCDS73 SVPTTNLEVKNGVNCEH--SPVDL----SKVDLHFMKKIPTGAEASNVLVGEVDILDRPI
210 220 230 240 250 260
540 550 560 570 580 590
pF1KB3 MAFVRLREAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYL
.::::: :: :... :::.:.::::.:::: . ...:::::::..:.:.:. ::..::
CCDS73 VAFVRLSPAVLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYK
270 280 290 300 310 320
600 610 620 630 640 650
pF1KB3 ADEREDLLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLE
: ::.:::..:. ::: .::::.: . .. . : .::. : .:.: .
CCDS73 AKERDDLLAGIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQ--EKRKMPG--VPNGNVCH
330 340 350 360 370
660 670 680 690 700 710
pF1KB3 PKSAQDKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAA
.. : :. :.:::: ::::. :..:. : : ::.::::. ::::.
CCDS73 IEQ----------EPHGGHSGPELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQCLAS
380 390 400 410 420
720 730 740 750 760 770
pF1KB3 VIFIYFAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPL
.:.: : .::.::::::::: :. :.. : ...... :... :...: : ..: .::.
CCDS73 FLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGSTGPV
430 440 450 460 470 480
780 790 800 810 820 830
pF1KB3 LVFEEAFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLI
::::. .:.::.. : :: :. ::.: .:: ...:: ..: :: ...:::.: :: ::
CCDS73 LVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAFASLI
490 500 510 520 530 540
840 850 860 870 880
pF1KB3 SLIFIYETFYKLVKIFQEHPLHGCSASNSSEV--------DGGENMT---WAGARPTLGP
.:::::.. ::... . .:.: : . . .. .: : : . .
CCDS73 CIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPNNHTLQYWKDHNIVTAE
550 560 570 580 590 600
890 900 910 920
pF1KB3 ---GNRSLAG-QSGQGKPRGQ---------PNTALLSLVLMAGTFFIAFFLRKFKNSRFF
.: ... : .:. :. :.. . : .:. ::... :. ::.::.:
CCDS73 VHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILSSTLKTFKTSRYF
610 620 630 640 650 660
930 940 950 960 970 980
pF1KB3 PGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKS
: :.: ...::.: ..:. ::..:. : . . ::.::: :. : . :::.:::.:
CCDS73 PTRVRSMVSDFAVFLTIFTMVIIDFLI-GVPSPKLQVPSVFKPTR-DDRGWIINPIG---
670 680 690 700 710 720
990 1000 1010 1020 1030 1040
pF1KB3 PFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICA
: : : ..:...::.: :::::. :::..::..::. :.:: :.:::::... : :.:.
CCDS73 PNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVAIMLGVCS
730 740 750 760 770 780
1050 1060 1070 1080 1090 1100
pF1KB3 LFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIG
..::::..:::: :.::.:.: . :. :::..::. ..:::::::.. .:.: :. .
CCDS73 IMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLMGCSVFMT
790 800 810 820 830 840
1110 1120 1130 1140 1150 1160
pF1KB3 DLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFT
.:. ::. ::.:.::::::.::.::::..::.:. :: ::.:: :...: ..::::
CCDS73 AILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPLRKVHLFT
850 860 870 880 890 900
1170 1180 1190 1200 1210 1220
pF1KB3 ALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDE
.:: ::.:::.. .. :...::.... : .: : . :. ::.. ::
CCDS73 LIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKV-MDLCFSKRELSWLDDLMPESKKKK
910 920 930 940 950 960
1230 1240
pF1KB3 REGVDEYNEMPMPV
CCDS73 LDDAKKKAKEEEEAEKMLEIGGDKFPLESRKLLSSPGKNISCRCDPSEINISDEMPKTTV
970 980 990 1000 1010 1020
>>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090 aa)
initn: 2326 init1: 735 opt: 1705 Z-score: 1329.8 bits: 258.0 E(32554): 9.5e-68
Smith-Waterman score: 2324; 41.1% identity (70.0% similar) in 976 aa overlap (287-1217:68-1011)
260 270 280 290 300 310
pF1KB3 TDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG-REPGPTPRAR--
: ::. ... ..:::. :. :..
CCDS58 ESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQRVQFI
40 50 60 70 80 90
320 330 340 350 360
pF1KB3 -----PRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASL
: ::..:.:..:: ..: .:.:::::.:::::::. .::.::.::.:
CCDS58 LGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPYVATL
100 110 120 130 140 150
370 380 390 400 410 420
pF1KB3 SFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHS
:..::.::: . .:.:.::. .:: .: .:...:. : :. : :: .::: .:
CCDS58 SLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALLKRHH
160 170 180 190 200 210
430 440 450 460 470 480
pF1KB3 HPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGV---PET---RLEVER
: ..:: :. : . :.... :..: ::::. : .:. :.. :. .
CCDS58 H-QNEKRFT-SRIPLVRSFADI-GKKH-----SDPHLLE--RNGILASPQSAPGNLDNSK
220 230 240 250 260
490 500 510 520 530
pF1KB3 ERELPPPAPPAGITRSKS-----KHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRL
:. . .: .: .: : ......::: .:::. :::: :.:: :: .:::::
CCDS58 SGEIK--GNGSGGSRENSTVDFSKVDMNFMRKIPTGAEASNVLVGEVDFLERPIIAFVRL
270 280 290 300 310 320
540 550 560 570 580 590
pF1KB3 REAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADERED
:: : .. :::::.:::::::::.. .::::::::.:::.:. ::..:: : .:.:
CCDS58 APAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDRND
330 340 350 360 370 380
600 610 620 630 640 650
pF1KB3 LLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPT-GAGLEPKSAQ
::..:. ::: .::::.: . :. . . ..:. : .:. : : ..
CCDS58 LLSGIDEFLDQVTVLPPGEWDP-----SIRIEPPKSVPSQEK--RKIPVFHNGSTPTLGE
390 400 410 420 430
660 670 680 690 700 710
pF1KB3 DKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIY
::: : . :.:::: ::::: :..:. : .::::.:::. ::::...:.:
CCDS58 TPK-----EAAHHAGPE-LQRTGRLFGGLILDIKRKAPFFLSDFKDALSLQCLASILFLY
440 450 460 470 480 490
720 730 740 750 760 770
pF1KB3 FAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEE
: .::.::::::::: :. :.. : .....: :... :...::: ..: .::.::::.
CCDS58 CACMSPVITFGGLLGEATEGRISAIESLFGASLTGIAYSLFAGQPLTILGSTGPVLVFEK
500 510 520 530 540 550
780 790 800 810 820 830
pF1KB3 AFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFI
...:: . .: :: :. ::.: :: ...:: ..: :: ...:::.: :: :: .:::
CCDS58 ILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDASSLVCYITRFTEEAFAALICIIFI
560 570 580 590 600 610
840 850 860 870
pF1KB3 YETFYKLVKI-----FQEH------PLHGCSASN----SSEV------DG--GENMTWAG
::.. :: . :. : ..: .. :.:. :. ..:..: .
CCDS58 YEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPPNPSNETLAQWKKDNITAHNISWRN
620 630 640 650 660 670
880 890 900 910 920 930
pF1KB3 ARPTLGPGNRS--LAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFFPGRI
. :. :.. :. : :.. . ..:. :::.. ::..::..:.:: ..
CCDS58 LTVSECKKLRGVFLGSACGHHGPY-IPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKV
680 690 700 710 720 730
940 950 960 970 980 990
pF1KB3 RRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKSPFPV
: .:.::.: ..:.::: .:: . . . :: :: : : :: :::.:.:::.. :
CCDS58 RSTISDFAVFLTIVIMVTIDYLV-GVPSPKLHVPEKFEPTHPE-RGWIISPLGDN---PW
740 750 760 770 780
1000 1010 1020 1030 1040 1050
pF1KB3 WMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICALFGL
: .. . .::.: :::::. :::..::..::. :.::.:.:::::.. .: :.:...::
CCDS58 WTLLIAAIPALLCTILIFMDQQITAVIINRKEHKLKKGAGYHLDLLMVGVMLGVCSVMGL
790 800 810 820 830 840
1060 1070 1080 1090 1100 1110
pF1KB3 PWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIGDLLR
::..:::: :..:.:.: : :. :::..::. ..:::::::.. .:.:::. . ..:.
CCDS58 PWFVAATVLSISHVNSLKVESECSAPGEQPKFLGIREQRVTGLMIFILMGLSVFMTSVLK
850 860 870 880 890 900
1120 1130 1140 1150 1160 1170
pF1KB3 QIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFTALQL
::. ::.:.::::::.::.:::...:..:. :: ::.::. :.. : ..:.::..::
CCDS58 FIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPAKHQPDLIYLRYVPLWKVHIFTVIQL
910 920 930 940 950 960
1180 1190 1200 1210 1220 1230
pF1KB3 LCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDEREGV
::.:::.. .::...::.... : .: . . :: ::.. ::
CCDS58 TCLVLLWVIKVSAAAVVFPMMVLALVFVRKL-MDLCFTKRELSWLDDLMPESKKKKEDDK
970 980 990 1000 1010 1020
1240
pF1KB3 DEYNEMPMPV
CCDS58 KKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPVKALKYSPDKPVSVKISFEDEPRKKYVD
1030 1040 1050 1060 1070 1080
>>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095 aa)
initn: 2326 init1: 735 opt: 1705 Z-score: 1329.7 bits: 258.0 E(32554): 9.5e-68
Smith-Waterman score: 2324; 41.1% identity (70.0% similar) in 976 aa overlap (287-1217:73-1016)
260 270 280 290 300 310
pF1KB3 TDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG-REPGPTPRAR--
: ::. ... ..:::. :. :..
CCDS82 ESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQRVQFI
50 60 70 80 90 100
320 330 340 350 360
pF1KB3 -----PRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASL
: ::..:.:..:: ..: .:.:::::.:::::::. .::.::.::.:
CCDS82 LGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPYVATL
110 120 130 140 150 160
370 380 390 400 410 420
pF1KB3 SFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHS
:..::.::: . .:.:.::. .:: .: .:...:. : :. : :: .::: .:
CCDS82 SLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALLKRHH
170 180 190 200 210 220
430 440 450 460 470 480
pF1KB3 HPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGV---PET---RLEVER
: ..:: :. : . :.... :..: ::::. : .:. :.. :. .
CCDS82 H-QNEKRFT-SRIPLVRSFADI-GKKH-----SDPHLLE--RNGILASPQSAPGNLDNSK
230 240 250 260 270
490 500 510 520 530
pF1KB3 ERELPPPAPPAGITRSKS-----KHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRL
:. . .: .: .: : ......::: .:::. :::: :.:: :: .:::::
CCDS82 SGEIK--GNGSGGSRENSTVDFSKVDMNFMRKIPTGAEASNVLVGEVDFLERPIIAFVRL
280 290 300 310 320 330
540 550 560 570 580 590
pF1KB3 REAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADERED
:: : .. :::::.:::::::::.. .::::::::.:::.:. ::..:: : .:.:
CCDS82 APAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDRND
340 350 360 370 380 390
600 610 620 630 640 650
pF1KB3 LLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPT-GAGLEPKSAQ
::..:. ::: .::::.: . :. . . ..:. : .:. : : ..
CCDS82 LLSGIDEFLDQVTVLPPGEWDP-----SIRIEPPKSVPSQEK--RKIPVFHNGSTPTLGE
400 410 420 430 440
660 670 680 690 700 710
pF1KB3 DKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIY
::: : . :.:::: ::::: :..:. : .::::.:::. ::::...:.:
CCDS82 TPK-----EAAHHAGPE-LQRTGRLFGGLILDIKRKAPFFLSDFKDALSLQCLASILFLY
450 460 470 480 490
720 730 740 750 760 770
pF1KB3 FAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEE
: .::.::::::::: :. :.. : .....: :... :...::: ..: .::.::::.
CCDS82 CACMSPVITFGGLLGEATEGRISAIESLFGASLTGIAYSLFAGQPLTILGSTGPVLVFEK
500 510 520 530 540 550
780 790 800 810 820 830
pF1KB3 AFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFI
...:: . .: :: :. ::.: :: ...:: ..: :: ...:::.: :: :: .:::
CCDS82 ILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDASSLVCYITRFTEEAFAALICIIFI
560 570 580 590 600 610
840 850 860 870
pF1KB3 YETFYKLVKI-----FQEH------PLHGCSASN----SSEV------DG--GENMTWAG
::.. :: . :. : ..: .. :.:. :. ..:..: .
CCDS82 YEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPPNPSNETLAQWKKDNITAHNISWRN
620 630 640 650 660 670
880 890 900 910 920 930
pF1KB3 ARPTLGPGNRS--LAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFFPGRI
. :. :.. :. : :.. . ..:. :::.. ::..::..:.:: ..
CCDS82 LTVSECKKLRGVFLGSACGHHGPY-IPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKV
680 690 700 710 720 730
940 950 960 970 980 990
pF1KB3 RRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKSPFPV
: .:.::.: ..:.::: .:: . . . :: :: : : :: :::.:.:::.. :
CCDS82 RSTISDFAVFLTIVIMVTIDYLV-GVPSPKLHVPEKFEPTHPE-RGWIISPLGDN---PW
740 750 760 770 780 790
1000 1010 1020 1030 1040 1050
pF1KB3 WMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICALFGL
: .. . .::.: :::::. :::..::..::. :.::.:.:::::.. .: :.:...::
CCDS82 WTLLIAAIPALLCTILIFMDQQITAVIINRKEHKLKKGAGYHLDLLMVGVMLGVCSVMGL
800 810 820 830 840 850
1060 1070 1080 1090 1100 1110
pF1KB3 PWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIGDLLR
::..:::: :..:.:.: : :. :::..::. ..:::::::.. .:.:::. . ..:.
CCDS82 PWFVAATVLSISHVNSLKVESECSAPGEQPKFLGIREQRVTGLMIFILMGLSVFMTSVLK
860 870 880 890 900 910
1120 1130 1140 1150 1160 1170
pF1KB3 QIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFTALQL
::. ::.:.::::::.::.:::...:..:. :: ::.::. :.. : ..:.::..::
CCDS82 FIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPAKHQPDLIYLRYVPLWKVHIFTVIQL
920 930 940 950 960 970
1180 1190 1200 1210 1220 1230
pF1KB3 LCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDEREGV
::.:::.. .::...::.... : .: . . :: ::.. ::
CCDS82 TCLVLLWVIKVSAAAVVFPMMVLALVFVRKL-MDLCFTKRELSWLDDLMPESKKKKEDDK
980 990 1000 1010 1020 1030
1240
pF1KB3 DEYNEMPMPV
CCDS82 KKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPVKALKYSPDKPVSVKISFEDEPRKKYVD
1040 1050 1060 1070 1080 1090
>>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131 aa)
initn: 2326 init1: 735 opt: 1705 Z-score: 1329.5 bits: 258.0 E(32554): 9.8e-68
Smith-Waterman score: 2324; 41.1% identity (70.0% similar) in 976 aa overlap (287-1217:73-1016)
260 270 280 290 300 310
pF1KB3 TDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG-REPGPTPRAR--
: ::. ... ..:::. :. :..
CCDS58 ESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQRVQFI
50 60 70 80 90 100
320 330 340 350 360
pF1KB3 -----PRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASL
: ::..:.:..:: ..: .:.:::::.:::::::. .::.::.::.:
CCDS58 LGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPYVATL
110 120 130 140 150 160
370 380 390 400 410 420
pF1KB3 SFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHS
:..::.::: . .:.:.::. .:: .: .:...:. : :. : :: .::: .:
CCDS58 SLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALLKRHH
170 180 190 200 210 220
430 440 450 460 470 480
pF1KB3 HPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGV---PET---RLEVER
: ..:: :. : . :.... :..: ::::. : .:. :.. :. .
CCDS58 H-QNEKRFT-SRIPLVRSFADI-GKKH-----SDPHLLE--RNGILASPQSAPGNLDNSK
230 240 250 260 270
490 500 510 520 530
pF1KB3 ERELPPPAPPAGITRSKS-----KHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRL
:. . .: .: .: : ......::: .:::. :::: :.:: :: .:::::
CCDS58 SGEIK--GNGSGGSRENSTVDFSKVDMNFMRKIPTGAEASNVLVGEVDFLERPIIAFVRL
280 290 300 310 320 330
540 550 560 570 580 590
pF1KB3 REAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADERED
:: : .. :::::.:::::::::.. .::::::::.:::.:. ::..:: : .:.:
CCDS58 APAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDRND
340 350 360 370 380 390
600 610 620 630 640 650
pF1KB3 LLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPT-GAGLEPKSAQ
::..:. ::: .::::.: . :. . . ..:. : .:. : : ..
CCDS58 LLSGIDEFLDQVTVLPPGEWDP-----SIRIEPPKSVPSQEK--RKIPVFHNGSTPTLGE
400 410 420 430 440
660 670 680 690 700 710
pF1KB3 DKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIY
::: : . :.:::: ::::: :..:. : .::::.:::. ::::...:.:
CCDS58 TPK-----EAAHHAGPE-LQRTGRLFGGLILDIKRKAPFFLSDFKDALSLQCLASILFLY
450 460 470 480 490
720 730 740 750 760 770
pF1KB3 FAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEE
: .::.::::::::: :. :.. : .....: :... :...::: ..: .::.::::.
CCDS58 CACMSPVITFGGLLGEATEGRISAIESLFGASLTGIAYSLFAGQPLTILGSTGPVLVFEK
500 510 520 530 540 550
780 790 800 810 820 830
pF1KB3 AFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFI
...:: . .: :: :. ::.: :: ...:: ..: :: ...:::.: :: :: .:::
CCDS58 ILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDASSLVCYITRFTEEAFAALICIIFI
560 570 580 590 600 610
840 850 860 870
pF1KB3 YETFYKLVKI-----FQEH------PLHGCSASN----SSEV------DG--GENMTWAG
::.. :: . :. : ..: .. :.:. :. ..:..: .
CCDS58 YEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPPNPSNETLAQWKKDNITAHNISWRN
620 630 640 650 660 670
880 890 900 910 920 930
pF1KB3 ARPTLGPGNRS--LAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFFPGRI
. :. :.. :. : :.. . ..:. :::.. ::..::..:.:: ..
CCDS58 LTVSECKKLRGVFLGSACGHHGPY-IPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKV
680 690 700 710 720 730
940 950 960 970 980 990
pF1KB3 RRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKSPFPV
: .:.::.: ..:.::: .:: . . . :: :: : : :: :::.:.:::.. :
CCDS58 RSTISDFAVFLTIVIMVTIDYLV-GVPSPKLHVPEKFEPTHPE-RGWIISPLGDN---PW
740 750 760 770 780 790
1000 1010 1020 1030 1040 1050
pF1KB3 WMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICALFGL
: .. . .::.: :::::. :::..::..::. :.::.:.:::::.. .: :.:...::
CCDS58 WTLLIAAIPALLCTILIFMDQQITAVIINRKEHKLKKGAGYHLDLLMVGVMLGVCSVMGL
800 810 820 830 840 850
1060 1070 1080 1090 1100 1110
pF1KB3 PWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIGDLLR
::..:::: :..:.:.: : :. :::..::. ..:::::::.. .:.:::. . ..:.
CCDS58 PWFVAATVLSISHVNSLKVESECSAPGEQPKFLGIREQRVTGLMIFILMGLSVFMTSVLK
860 870 880 890 900 910
1120 1130 1140 1150 1160 1170
pF1KB3 QIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFTALQL
::. ::.:.::::::.::.:::...:..:. :: ::.::. :.. : ..:.::..::
CCDS58 FIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPAKHQPDLIYLRYVPLWKVHIFTVIQL
920 930 940 950 960 970
1180 1190 1200 1210 1220 1230
pF1KB3 LCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDEREGV
::.:::.. .::...::.... : .: . . :: ::.. ::
CCDS58 TCLVLLWVIKVSAAAVVFPMMVLALVFVRKL-MDLCFTKRELSWLDDLMPESKKKKEDDK
980 990 1000 1010 1020 1030
1240
pF1KB3 DEYNEMPMPV
CCDS58 KKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPVKALKYSVDPSIVNISDEMAKTAQWKAL
1040 1050 1060 1070 1080 1090
1241 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:04:04 2016 done: Thu Nov 3 14:04:05 2016
Total Scan time: 4.730 Total Display time: 0.550
Function used was FASTA [36.3.4 Apr, 2011]