FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5815, 865 aa
1>>>pF1KE5815 865 - 865 aa - 865 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.4834+/-0.00114; mu= 16.3388+/- 0.069
mean_var=114.1795+/-22.955, 0's: 0 Z-trim(104.4): 45 B-trim: 44 in 1/52
Lambda= 0.120027
statistics sampled from 7853 (7886) to 7853 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.592), E-opt: 0.2 (0.242), width: 16
Scan time: 4.250
The best scores are: opt bits E(32554)
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 5660 992.1 0
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 4292 755.2 1.2e-217
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 648 124.1 8.9e-28
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 648 124.1 9e-28
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 648 124.1 9.1e-28
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 648 124.1 9.1e-28
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 631 121.1 6.2e-27
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 624 120.0 1.6e-26
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 605 116.7 1.5e-25
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 605 116.7 1.6e-25
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 559 108.7 4.1e-23
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 554 107.9 7.3e-23
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 533 104.2 8.8e-22
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 520 102.0 4.4e-21
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 520 102.0 4.9e-21
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 486 96.0 1.9e-19
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 464 92.2 3.4e-18
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 342 71.1 7.3e-12
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 342 71.1 7.3e-12
>>CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 (865 aa)
initn: 5660 init1: 5660 opt: 5660 Z-score: 5301.6 bits: 992.1 E(32554): 0
Smith-Waterman score: 5660; 99.8% identity (100.0% similar) in 865 aa overlap (1-865:1-865)
10 20 30 40 50 60
pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 QCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL
::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 QCRCSWHRFLRCVLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 IPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLKVSPFNNGQLVMGSFVKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 IPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLKVSPFNNGQLVMGSFVKN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 EFSAPSYLMGYNKSLSVVATTTFLTGIIQIIGFTVIANKISMATETSQTLIDMIPYSFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 EFSAPSYLMGYNKSLSVVATTTFLTGIIQIIGFTVIANKISMATETSQTLIDMIPYSFLL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 PVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVSSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 PVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVSSF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 FRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIILSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 FRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIILSN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 VIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHRAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 VIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHRAK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 ILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKVPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 ILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKVPL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE5 KEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSVNLIHCS
:::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::
CCDS48 KEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSINLIHCS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE5 HFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAESQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 HFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAESQG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE5 RRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHSSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 RRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHSSI
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE5 VRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETDKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 VRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETDKN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE5 DNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELEPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 DNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELEPE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE5 MEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQTQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 MEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQTQT
790 800 810 820 830 840
850 860
pF1KE5 RTWSVERRRHPMDSYSPEGNSNEDV
:::::::::::::::::::::::::
CCDS48 RTWSVERRRHPMDSYSPEGNSNEDV
850 860
>>CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 (970 aa)
initn: 4282 init1: 4282 opt: 4292 Z-score: 4020.7 bits: 755.2 E(32554): 1.2e-217
Smith-Waterman score: 4946; 88.2% identity (88.3% similar) in 897 aa overlap (74-865:74-970)
50 60 70 80 90 100
pF1KE5 SSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVG
::::::::::::::::::::::::::::::
CCDS48 SSSGNMNINITTFRHHVQCRCSWHRFLRCVLTIFPFLEWMCMYRLKDWLLGDLLAGISVG
50 60 70 80 90 100
110 120 130 140 150 160
pF1KE5 LVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 LVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLK
110 120 130 140 150 160
170 180 190 200
pF1KE5 VSPFNNGQLVMGSFVKNEFSAPSYLMGYNKSLSVVATTTFLTGIIQ--------------
::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 VSPFNNGQLVMGSFVKNEFSAPSYLMGYNKSLSVVATTTFLTGIIQLIMGVLGLGFIATY
170 180 190 200 210 220
pF1KE5 ------------------------------------------------------------
CCDS48 LPESAMSAYLAAVALHIMLSQLTFIFGIMISFHAGPISFFYDIINYCVALPKANSTSILV
230 240 250 260 270 280
210 220 230
pF1KE5 -------------------------------IIGFTVIANKISMATETSQTLIDMIPYSF
:::::::::::::::::::::::::::::
CCDS48 FLTVVVALRINKCIRISFNQYPIEFPMELFLIIGFTVIANKISMATETSQTLIDMIPYSF
290 300 310 320 330 340
240 250 260 270 280 290
pF1KE5 LLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 LLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVS
350 360 370 380 390 400
300 310 320 330 340 350
pF1KE5 SFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 SFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIIL
410 420 430 440 450 460
360 370 380 390 400 410
pF1KE5 SNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 SNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHR
470 480 490 500 510 520
420 430 440 450 460 470
pF1KE5 AKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 AKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKV
530 540 550 560 570 580
480 490 500 510 520 530
pF1KE5 PLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSVNLIH
:::::::::::::::::::::::::::::::::::::::::::::::::::::::.::::
CCDS48 PLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSINLIH
590 600 610 620 630 640
540 550 560 570 580 590
pF1KE5 CSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 CSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAES
650 660 670 680 690 700
600 610 620 630 640 650
pF1KE5 QGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 QGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHS
710 720 730 740 750 760
660 670 680 690 700 710
pF1KE5 SIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 SIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETD
770 780 790 800 810 820
720 730 740 750 760 770
pF1KE5 KNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 KNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELE
830 840 850 860 870 880
780 790 800 810 820 830
pF1KE5 PEMEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 PEMEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQT
890 900 910 920 930 940
840 850 860
pF1KE5 QTRTWSVERRRHPMDSYSPEGNSNEDV
:::::::::::::::::::::::::::
CCDS48 QTRTWSVERRRHPMDSYSPEGNSNEDV
950 960 970
>--
initn: 500 init1: 494 opt: 494 Z-score: 466.3 bits: 97.5 E(32554): 1.2e-19
Smith-Waterman score: 494; 98.6% identity (100.0% similar) in 73 aa overlap (1-73:1-73)
10 20 30 40 50 60
pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 QCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL
::::::::::::.
CCDS48 QCRCSWHRFLRCVLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL
70 80 90 100 110 120
>>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa)
initn: 1081 init1: 613 opt: 648 Z-score: 612.1 bits: 124.1 E(32554): 8.9e-28
Smith-Waterman score: 904; 27.2% identity (59.4% similar) in 739 aa overlap (63-703:40-735)
40 50 60 70 80 90
pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL
.:: : .: .: : :. : ..:::
CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL
10 20 30 40 50 60
100 110 120 130 140 150
pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF
:::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.:
CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA
70 80 90 100 110 120
160 170 180
pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN
..:... .: . ..: .:.. :. .: .:: .
CCDS46 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT
130 140 150 160 170 180
190 200
pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT-----------------
.: : .:..: . : ::.. :
CCDS46 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV
190 200 210 220 230 240
210 220 230
pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY
:. ..:.. . :: : :. ... . .. ::
CCDS46 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA
250 260 270 280 290 300
240 250 260 270 280 290
pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV
... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :.
CCDS46 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL
310 320 330 340 350 360
300 310 320 330 340 350
pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI
....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.:
CCDS46 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI
370 380 390 400 410 420
360 370 380 390 400 410
pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS
:. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::.
CCDS46 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT
430 440 450 460 470 480
420 430 440 450 460 470
pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV
. . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. .
CCDS46 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV-
490 500 510 520 530 540
480 490 500 510 520 530
pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVN
:... .. . . . ..:. : .. :..... .:...::.
CCDS46 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVS
550 560 570 580
540 550 560 570 580 590
pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV
. . .:.: .... :: . ::: ..: . . :. :..:. .. :::.
CCDS46 INVNTSLEDMRSNNV--EDCKMMQVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ-
590 600 610 620 630 640
600 610 620 630 640 650
pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG
:. :..:::.. . .::. : :..: . :.. .. . .:.
CCDS46 ------------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAA
650 660 670 680
660 670 680 690 700 710
pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETY
::: .: .: . ::::.::: .:: :::::: :::.. . . .: .:.
CCDS46 CHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
690 700 710 720 730
720 730 740 750 760 770
pF1KE5 SETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLD
>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa)
initn: 1081 init1: 613 opt: 648 Z-score: 612.1 bits: 124.1 E(32554): 9e-28
Smith-Waterman score: 871; 26.8% identity (58.1% similar) in 738 aa overlap (63-703:61-737)
40 50 60 70 80 90
pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL
.:: : .: .: : :. : ..:::
CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL
40 50 60 70 80 90
100 110 120 130 140 150
pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF
:::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.:
CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA
100 110 120 130 140
160 170 180
pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN
..:... .: . ..: .:.. :. .: .:: .
CCDS46 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT
150 160 170 180 190 200
190 200
pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT-----------------
.: : .:..: . : ::.. :
CCDS46 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV
210 220 230 240 250 260
210 220 230
pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY
:. ..:.. . :: : :. ... . .. ::
CCDS46 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA
270 280 290 300 310 320
240 250 260 270 280 290
pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV
... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :.
CCDS46 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL
330 340 350 360 370 380
300 310 320 330 340 350
pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI
....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.:
CCDS46 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI
390 400 410 420 430 440
360 370 380 390 400 410
pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS
:. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::.
CCDS46 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT
450 460 470 480 490 500
420 430 440 450 460 470
pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV
. . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. .
CCDS46 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV-
510 520 530 540 550 560
480 490 500 510 520 530
pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSVNL
:... .. . . . ..:. : .. :..... : :.
CCDS46 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAGPLLSA---
570 580 590 600
540 550 560 570 580 590
pF1KE5 IHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVA
: . .:..: :.. .... :: :. :..:. .. :::.
CCDS46 --C-----LAPQQVSSGDKMEDATAN------GQ-----EDSKAPDGSTLKAL-GLPQ--
610 620 630 640
600 610 620 630 640 650
pF1KE5 ESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGC
:. :..:::.. . .::. : :..: . :.. .. . .:.:
CCDS46 -----------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAAC
650 660 670 680
660 670 680 690 700 710
pF1KE5 HSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETYS
:: .: .: . ::::.::: .:: :::::: :::.. . . .: .:.
CCDS46 HSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
690 700 710 720 730 740
720 730 740 750 760 770
pF1KE5 ETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDR
>>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa)
initn: 1086 init1: 618 opt: 648 Z-score: 612.0 bits: 124.1 E(32554): 9.1e-28
Smith-Waterman score: 899; 27.2% identity (59.4% similar) in 739 aa overlap (63-703:61-755)
40 50 60 70 80 90
pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL
.:: : .: .: : :. : ..:::
CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL
40 50 60 70 80 90
100 110 120 130 140 150
pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF
:::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.:
CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA
100 110 120 130 140
160 170 180
pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN
..:... .: . ..: .:.. :. .: .:: .
CCDS46 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT
150 160 170 180 190 200
190 200
pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT-----------------
.: : .:..: . : ::.. :
CCDS46 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV
210 220 230 240 250 260
210 220 230
pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY
:. ..:.. . :: : :. ... . .. ::
CCDS46 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA
270 280 290 300 310 320
240 250 260 270 280 290
pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV
... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :.
CCDS46 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL
330 340 350 360 370 380
300 310 320 330 340 350
pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI
....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.:
CCDS46 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI
390 400 410 420 430 440
360 370 380 390 400 410
pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS
:. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::.
CCDS46 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT
450 460 470 480 490 500
420 430 440 450 460 470
pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV
. . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. .
CCDS46 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV-
510 520 530 540 550 560
480 490 500 510 520 530
pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVN
:... .. . . . ..:. : .. :..... .:...::.
CCDS46 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVS
570 580 590 600 610
540 550 560 570 580 590
pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV
. . .:.: .... :: . ::: ..: . . :. :..:. .. :::.
CCDS46 INVNTSLEDMRSNNV--ED-CKMMVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ-
620 630 640 650 660
600 610 620 630 640 650
pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG
:. :..:::.. . .::. : :..: . :.. .. . .:.
CCDS46 ------------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAA
670 680 690 700
660 670 680 690 700 710
pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETY
::: .: .: . ::::.::: .:: :::::: :::.. . . .: .:.
CCDS46 CHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
710 720 730 740 750
720 730 740 750 760 770
pF1KE5 SETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLD
>>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa)
initn: 1081 init1: 613 opt: 648 Z-score: 612.0 bits: 124.1 E(32554): 9.1e-28
Smith-Waterman score: 904; 27.2% identity (59.4% similar) in 739 aa overlap (63-703:61-756)
40 50 60 70 80 90
pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL
.:: : .: .: : :. : ..:::
CCDS43 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL
40 50 60 70 80 90
100 110 120 130 140 150
pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF
:::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.:
CCDS43 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA
100 110 120 130 140
160 170 180
pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN
..:... .: . ..: .:.. :. .: .:: .
CCDS43 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT
150 160 170 180 190 200
190 200
pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT-----------------
.: : .:..: . : ::.. :
CCDS43 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV
210 220 230 240 250 260
210 220 230
pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY
:. ..:.. . :: : :. ... . .. ::
CCDS43 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA
270 280 290 300 310 320
240 250 260 270 280 290
pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV
... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :.
CCDS43 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL
330 340 350 360 370 380
300 310 320 330 340 350
pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI
....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.:
CCDS43 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI
390 400 410 420 430 440
360 370 380 390 400 410
pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS
:. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::.
CCDS43 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT
450 460 470 480 490 500
420 430 440 450 460 470
pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV
. . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. .
CCDS43 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV-
510 520 530 540 550 560
480 490 500 510 520 530
pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVN
:... .. . . . ..:. : .. :..... .:...::.
CCDS43 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVS
570 580 590 600 610
540 550 560 570 580 590
pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV
. . .:.: .... :: . ::: ..: . . :. :..:. .. :::.
CCDS43 INVNTSLEDMRSNNV--EDCKMMQVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ-
620 630 640 650 660
600 610 620 630 640 650
pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG
:. :..:::.. . .::. : :..: . :.. .. . .:.
CCDS43 ------------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAA
670 680 690 700
660 670 680 690 700 710
pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETY
::: .: .: . ::::.::: .:: :::::: :::.. . . .: .:.
CCDS43 CHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
710 720 730 740 750
720 730 740 750 760 770
pF1KE5 SETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLD
>>CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 (651 aa)
initn: 1058 init1: 618 opt: 631 Z-score: 597.0 bits: 121.1 E(32554): 6.2e-27
Smith-Waterman score: 999; 28.9% identity (63.6% similar) in 686 aa overlap (22-703:21-648)
10 20 30 40 50
pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEET--FQQEHKRKASSSGNMNINITTFRH
:.:..:. :. : ..::: .. . :. : .
CCDS63 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAP---RTHQW
10 20 30 40 50
60 70 80 90 100 110
pF1KE5 HVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLAR
.. .:: : .: .: : :. : ..::::::::.:.::...:.::::. .:::
CCDS63 RTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 QLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLKVSPFNNGQLVMGSFV
.::. :..: :: .::. ...:. .: :. . : .: .. .
CCDS63 --LPPVFGLYSSFYPVFIYFLFGTSRHISV--------VLEVCWKLPQSKVGTVVTAAVA
120 130 140 150 160
180 190 200 210 220 230
pF1KE5 KNEFSAPSYLMGYNKSLSVVATTTFLTGIIQIIGFTVIANKISMATETSQTLIDMIPYSF
. . . : : .:. . .. .:: : :. ... . .. :: ..
CCDS63 GVVLVVVKLL---NDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE5 LLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVS
. ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :...
CCDS63 VPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIG
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE5 SFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIIL
..:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.::.
CCDS63 GIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIII
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE5 SNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHR
:. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::..
CCDS63 VNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQM
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE5 AKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKV
. .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. .
CCDS63 PHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV---
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE5 PLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVNLI
:... .. . . . ..:. : .. :..... .:...::..
CCDS63 --------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVSIN
470 480 490 500
540 550 560 570 580 590
pF1KE5 HCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAE
. .:.: .... :: . ::: ..: . . :. :..:. .. :::.
CCDS63 VNTSLEDMRSNNV--ED-CKMMVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ---
510 520 530 540 550
600 610 620 630 640 650
pF1KE5 SQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCH
:. :..:::.. . .::. : :..: . :.. .. . .:.::
CCDS63 ----------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACH
560 570 580 590 600
660 670 680 690 700 710
pF1KE5 SSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETYSE
: .: .: . ::::.::: .:: :::::: :::.. . . .: .:.
CCDS63 SPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
610 620 630 640 650
720 730 740 750 760 770
pF1KE5 TDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRE
>>CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 (723 aa)
initn: 1055 init1: 613 opt: 624 Z-score: 589.8 bits: 120.0 E(32554): 1.6e-26
Smith-Waterman score: 909; 27.3% identity (59.9% similar) in 741 aa overlap (26-703:26-720)
10 20 30 40 50
pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETF-QQEHKRKASSSGNMNINITTFRHH
.:. . :. . .::: .. . :. : . .
CCDS63 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAP---RTHQWR
10 20 30 40 50
60 70 80 90 100 110
pF1KE5 VQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQ
. .:: : .: .: : :. : ..::::::::.:.::...:.::::. .:::
CCDS63 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG-
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 LIPPLNIAYAAFCSSVIYVIFGSCHQMSI---GSFFLVSALLINVLKVSPFN---NGQLV
.::. :..: :: .::. ...:. : . :..: . ..: :.:
CCDS63 -LPPVFGLYSSFYPVFIYFLFGTSRHISVATPGPLPLLTAPGRPTGGAGPDPLRLRGHLP
120 130 140 150 160 170
180 190 200
pF1KE5 MGSFVKNEF--------------------------SAPSYLMGYNKSL--SVVAT--TTF
. . . ..: :. .: : :.: :.
CCDS63 VRTSCPRLYHSCSCAGLRLTAQVCVWPPSEQPLWATVPHLLLEVCWKLPQSKVGTVVTAA
180 190 200 210 220 230
210 220 230
pF1KE5 LTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPYSFL
..:.. . :: : :. ... . .. :: ...
CCDS63 VAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLV
240 250 260 270 280 290
240 250 260 270 280 290
pF1KE5 LPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVSS
::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :....
CCDS63 PPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGG
300 310 320 330 340 350
300 310 320 330 340 350
pF1KE5 FFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIILS
.:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.::.
CCDS63 IFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIV
360 370 380 390 400 410
360 370 380 390 400 410
pF1KE5 NVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHRA
:. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::..
CCDS63 NLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMP
420 430 440 450 460 470
420 430 440 450 460 470
pF1KE5 KILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKVP
. .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. .
CCDS63 HYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV----
480 490 500 510 520 530
480 490 500 510 520 530
pF1KE5 LKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVNLIH
:... .. . . . ..:. : .. :..... .:...::..
CCDS63 -------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVSINV
540 550 560 570
540 550 560 570 580 590
pF1KE5 CSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAES
. .:.: .... :: . ::: ..: . . :. :..:. .. :::.
CCDS63 NTSLEDMRSNNV--EDCKMMQVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ----
580 590 600 610 620
600 610 620 630 640 650
pF1KE5 QGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHS
:. :..:::.. . .::. : :..: . :.. .. . .:.:::
CCDS63 ---------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHS
630 640 650 660 670
660 670 680 690 700 710
pF1KE5 SIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETYSET
.: .: . ::::.::: .:: :::::: :::.. . . .: .:.
CCDS63 PVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
680 690 700 710 720
720 730 740 750 760 770
pF1KE5 DKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDREL
>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa)
initn: 792 init1: 557 opt: 605 Z-score: 572.3 bits: 116.7 E(32554): 1.5e-25
Smith-Waterman score: 694; 25.4% identity (56.1% similar) in 697 aa overlap (70-662:57-685)
40 50 60 70 80 90
pF1KE5 KRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIF-PFLEWMCMYRLKDWLLGDLLA
.: .. .: :. .:. :..:...::::..
CCDS43 VLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVS
30 40 50 60 70 80
100 110 120 130 140 150
pF1KE5 GISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALL
:::.:..:.::::....:: .::. :..: ..: ..:. ...::: : ..: ..
CCDS43 GISTGVLQLPQGLAFAMLA--AVPPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMI
90 100 110 120 130 140
160 170 180
pF1KE5 INV-LKVSPFN----------NG----------------------QLVMG----SFVKNE
.: ... : . :: :. .: .::
CCDS43 GGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIY
150 160 170 180 190 200
190 200
pF1KE5 FSAP------------------SYLMG-----YNKSLSVVATTTFLT-----------GI
.. : .::.: :. .::: .:. . :.
CCDS43 LTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGV
210 220 230 240 250 260
210 220 230
pF1KE5 -IQIIGF-------------------------TVIANKISMATETSQTL-IDMI---PYS
....:. .:... :: . . ... .:.. : .
CCDS43 GLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLG
270 280 290 300 310 320
240 250 260 270 280 290
pF1KE5 FLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVV
.: :..:: ::. . ..:.....:. . : ..: .:. :.:.:..::.:::.:::: .
CCDS43 LLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSI
330 340 350 360 370 380
300 310 320 330 340 350
pF1KE5 SSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGII
.:.:.. .. ...:...:. .::. :.:. ... ..::... : .: .::.:::..:.
CCDS43 GSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIV
390 400 410 420 430 440
360 370 380 390 400 410
pF1KE5 LSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSH
. :. .. .:.:: .:: .. . ..:. :: ::.::::: ::: .:. :.. . :..
CCDS43 IVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQ
450 460 470 480 490 500
420 430 440 450 460 470
pF1KE5 RAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVK
. .::..:.:..: .:. :.:. :::.:::: . : ..: :. .
CCDS43 SPSYKVLGKLPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANS-----------DLYS
510 520 530 540 550
480 490 500 510 520 530
pF1KE5 VPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFEN--KLDPEASSVN
::.. . .: : ... : . : :....:
CCDS43 NALKRK--------TGVN-------------------PAVIMGARRKAMRKYAKEVGNAN
560 570 580
540 550 560 570 580 590
pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV
: .. ... : . :. .. . :: :: : ... :
CCDS43 ---------MANATVVKAD------AEVDGEDATKPEEEDGEVKYPPIVIKSTFP-----
590 600 610 620
600 610 620 630 640 650
pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG
: . : ..: .: .:::.::::..:...:: :. .: : . . ...: . .::
CCDS43 -EEMQR--FMPPGD-----NVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAG
630 640 650 660 670
660 670 680 690 700 710
pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYS
: . : :
CCDS43 CSAFIQR
680
>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa)
initn: 864 init1: 557 opt: 605 Z-score: 571.8 bits: 116.7 E(32554): 1.6e-25
Smith-Waterman score: 779; 25.9% identity (56.3% similar) in 742 aa overlap (70-707:57-730)
40 50 60 70 80 90
pF1KE5 KRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIF-PFLEWMCMYRLKDWLLGDLLA
.: .. .: :. .:. :..:...::::..
CCDS57 VLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVS
30 40 50 60 70 80
100 110 120 130 140 150
pF1KE5 GISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALL
:::.:..:.::::....:: .::. :..: ..: ..:. ...::: : ..: ..
CCDS57 GISTGVLQLPQGLAFAMLAA--VPPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMI
90 100 110 120 130 140
160 170 180
pF1KE5 INV-LKVSPFN----------NG----------------------QLVMG----SFVKNE
.: ... : . :: :. .: .::
CCDS57 GGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIY
150 160 170 180 190 200
190 200
pF1KE5 FSAP------------------SYLMG-----YNKSLSVVATTTFLT-----------GI
.. : .::.: :. .::: .:. . :.
CCDS57 LTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGV
210 220 230 240 250 260
210 220 230
pF1KE5 -IQIIGF-------------------------TVIANKISMATETSQTL-IDMI---PYS
....:. .:... :: . . ... .:.. : .
CCDS57 GLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLG
270 280 290 300 310 320
240 250 260 270 280 290
pF1KE5 FLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVV
.: :..:: ::. . ..:.....:. . : ..: .:. :.:.:..::.:::.:::: .
CCDS57 LLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSI
330 340 350 360 370 380
300 310 320 330 340 350
pF1KE5 SSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGII
.:.:.. .. ...:...:. .::. :.:. ... ..::... : .: .::.:::..:.
CCDS57 GSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIV
390 400 410 420 430 440
360 370 380 390 400 410
pF1KE5 LSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSH
. :. .. .:.:: .:: .. . ..:. :: ::.::::: ::: .:. :.. . :..
CCDS57 IVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQ
450 460 470 480 490 500
420 430 440 450 460 470
pF1KE5 RAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVK
. .::..:.:..: .:. :.:. :::.:::: . : ..: :. .
CCDS57 SPSYKVLGKLPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANS-----------DLYS
510 520 530 540 550
480 490 500 510 520 530
pF1KE5 VPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFEN--KLDPEASSVN
::.. . .: : ... : . : :....:
CCDS57 NALKRK--------TGVN-------------------PAVIMGARRKAMRKYAKEVGNAN
560 570 580
540 550 560 570 580 590
pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV
: .. ... : . :. .. . :: :: : ... :
CCDS57 ---------MANATVVKAD------AEVDGEDATKPEEEDGEVKYPPIVIKSTFP-----
590 600 610 620
600 610 620 630 640 650
pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG
: . : ..: .: .:::.::::..:...:: :. .: : . . ...: . .::
CCDS57 -EEMQR--FMPPGD-----NVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAG
630 640 650 660 670
660 670 680 690 700 710
pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYS
: ...: . :: ::. :: :.::::: . :.... .: : :.
CCDS57 CSAQVVNDLTRNRFFENPALWELLFHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNAT
680 690 700 710 720 730
720 730 740 750 760 770
pF1KE5 ETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDR
CCDS57 PATPEA
740
865 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 06:52:54 2016 done: Tue Nov 8 06:52:55 2016
Total Scan time: 4.250 Total Display time: 0.280
Function used was FASTA [36.3.4 Apr, 2011]