FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5815, 865 aa 1>>>pF1KE5815 865 - 865 aa - 865 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4834+/-0.00114; mu= 16.3388+/- 0.069 mean_var=114.1795+/-22.955, 0's: 0 Z-trim(104.4): 45 B-trim: 44 in 1/52 Lambda= 0.120027 statistics sampled from 7853 (7886) to 7853 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.592), E-opt: 0.2 (0.242), width: 16 Scan time: 4.250 The best scores are: opt bits E(32554) CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 5660 992.1 0 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 4292 755.2 1.2e-217 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 648 124.1 8.9e-28 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 648 124.1 9e-28 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 648 124.1 9.1e-28 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 648 124.1 9.1e-28 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 631 121.1 6.2e-27 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 624 120.0 1.6e-26 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 605 116.7 1.5e-25 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 605 116.7 1.6e-25 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 559 108.7 4.1e-23 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 554 107.9 7.3e-23 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 533 104.2 8.8e-22 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 520 102.0 4.4e-21 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 520 102.0 4.9e-21 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 486 96.0 1.9e-19 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 464 92.2 3.4e-18 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 342 71.1 7.3e-12 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 342 71.1 7.3e-12 >>CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 (865 aa) initn: 5660 init1: 5660 opt: 5660 Z-score: 5301.6 bits: 992.1 E(32554): 0 Smith-Waterman score: 5660; 99.8% identity (100.0% similar) in 865 aa overlap (1-865:1-865) 10 20 30 40 50 60 pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 QCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL ::::::::::::.::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 QCRCSWHRFLRCVLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 IPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLKVSPFNNGQLVMGSFVKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 IPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLKVSPFNNGQLVMGSFVKN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 EFSAPSYLMGYNKSLSVVATTTFLTGIIQIIGFTVIANKISMATETSQTLIDMIPYSFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 EFSAPSYLMGYNKSLSVVATTTFLTGIIQIIGFTVIANKISMATETSQTLIDMIPYSFLL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 PVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVSSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 PVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVSSF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 FRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIILSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 FRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIILSN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 VIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHRAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 VIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHRAK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 ILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKVPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 ILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKVPL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 KEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSVNLIHCS :::::::::::::::::::::::::::::::::::::::::::::::::::::.:::::: CCDS48 KEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSINLIHCS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 HFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAESQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 HFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAESQG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 RRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHSSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 RRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHSSI 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE5 VRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETDKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 VRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETDKN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE5 DNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELEPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 DNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELEPE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE5 MEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQTQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 MEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQTQT 790 800 810 820 830 840 850 860 pF1KE5 RTWSVERRRHPMDSYSPEGNSNEDV ::::::::::::::::::::::::: CCDS48 RTWSVERRRHPMDSYSPEGNSNEDV 850 860 >>CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 (970 aa) initn: 4282 init1: 4282 opt: 4292 Z-score: 4020.7 bits: 755.2 E(32554): 1.2e-217 Smith-Waterman score: 4946; 88.2% identity (88.3% similar) in 897 aa overlap (74-865:74-970) 50 60 70 80 90 100 pF1KE5 SSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVG :::::::::::::::::::::::::::::: CCDS48 SSSGNMNINITTFRHHVQCRCSWHRFLRCVLTIFPFLEWMCMYRLKDWLLGDLLAGISVG 50 60 70 80 90 100 110 120 130 140 150 160 pF1KE5 LVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 LVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLK 110 120 130 140 150 160 170 180 190 200 pF1KE5 VSPFNNGQLVMGSFVKNEFSAPSYLMGYNKSLSVVATTTFLTGIIQ-------------- :::::::::::::::::::::::::::::::::::::::::::::: CCDS48 VSPFNNGQLVMGSFVKNEFSAPSYLMGYNKSLSVVATTTFLTGIIQLIMGVLGLGFIATY 170 180 190 200 210 220 pF1KE5 ------------------------------------------------------------ CCDS48 LPESAMSAYLAAVALHIMLSQLTFIFGIMISFHAGPISFFYDIINYCVALPKANSTSILV 230 240 250 260 270 280 210 220 230 pF1KE5 -------------------------------IIGFTVIANKISMATETSQTLIDMIPYSF ::::::::::::::::::::::::::::: CCDS48 FLTVVVALRINKCIRISFNQYPIEFPMELFLIIGFTVIANKISMATETSQTLIDMIPYSF 290 300 310 320 330 340 240 250 260 270 280 290 pF1KE5 LLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 LLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVS 350 360 370 380 390 400 300 310 320 330 340 350 pF1KE5 SFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 SFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIIL 410 420 430 440 450 460 360 370 380 390 400 410 pF1KE5 SNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 SNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHR 470 480 490 500 510 520 420 430 440 450 460 470 pF1KE5 AKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 AKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKV 530 540 550 560 570 580 480 490 500 510 520 530 pF1KE5 PLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSVNLIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::: CCDS48 PLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSINLIH 590 600 610 620 630 640 540 550 560 570 580 590 pF1KE5 CSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 CSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAES 650 660 670 680 690 700 600 610 620 630 640 650 pF1KE5 QGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 QGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHS 710 720 730 740 750 760 660 670 680 690 700 710 pF1KE5 SIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 SIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYSETD 770 780 790 800 810 820 720 730 740 750 760 770 pF1KE5 KNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 KNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRELE 830 840 850 860 870 880 780 790 800 810 820 830 pF1KE5 PEMEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 PEMEPKAETETKTQTEMEPQPETEPEMEPNPKSRPRAHTFPQQRYWPMYHPSMASTQSQT 890 900 910 920 930 940 840 850 860 pF1KE5 QTRTWSVERRRHPMDSYSPEGNSNEDV ::::::::::::::::::::::::::: CCDS48 QTRTWSVERRRHPMDSYSPEGNSNEDV 950 960 970 >-- initn: 500 init1: 494 opt: 494 Z-score: 466.3 bits: 97.5 E(32554): 1.2e-19 Smith-Waterman score: 494; 98.6% identity (100.0% similar) in 73 aa overlap (1-73:1-73) 10 20 30 40 50 60 pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETFQQEHKRKASSSGNMNINITTFRHHV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 QCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL ::::::::::::. CCDS48 QCRCSWHRFLRCVLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQL 70 80 90 100 110 120 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 1081 init1: 613 opt: 648 Z-score: 612.1 bits: 124.1 E(32554): 8.9e-28 Smith-Waterman score: 904; 27.2% identity (59.4% similar) in 739 aa overlap (63-703:40-735) 40 50 60 70 80 90 pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL .:: : .: .: : :. : ..::: CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 10 20 30 40 50 60 100 110 120 130 140 150 pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF :::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.: CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA 70 80 90 100 110 120 160 170 180 pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN ..:... .: . ..: .:.. :. .: .:: . CCDS46 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT 130 140 150 160 170 180 190 200 pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT----------------- .: : .:..: . : ::.. : CCDS46 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV 190 200 210 220 230 240 210 220 230 pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY :. ..:.. . :: : :. ... . .. :: CCDS46 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV ... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :. CCDS46 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL 310 320 330 340 350 360 300 310 320 330 340 350 pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI ....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.: CCDS46 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI 370 380 390 400 410 420 360 370 380 390 400 410 pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS :. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::. CCDS46 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT 430 440 450 460 470 480 420 430 440 450 460 470 pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV . . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. . CCDS46 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV- 490 500 510 520 530 540 480 490 500 510 520 530 pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVN :... .. . . . ..:. : .. :..... .:...::. CCDS46 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVS 550 560 570 580 540 550 560 570 580 590 pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV . . .:.: .... :: . ::: ..: . . :. :..:. .. :::. CCDS46 INVNTSLEDMRSNNV--EDCKMMQVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ- 590 600 610 620 630 640 600 610 620 630 640 650 pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG :. :..:::.. . .::. : :..: . :.. .. . .:. CCDS46 ------------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAA 650 660 670 680 660 670 680 690 700 710 pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETY ::: .: .: . ::::.::: .:: :::::: :::.. . . .: .:. CCDS46 CHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 690 700 710 720 730 720 730 740 750 760 770 pF1KE5 SETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLD >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1081 init1: 613 opt: 648 Z-score: 612.1 bits: 124.1 E(32554): 9e-28 Smith-Waterman score: 871; 26.8% identity (58.1% similar) in 738 aa overlap (63-703:61-737) 40 50 60 70 80 90 pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL .:: : .: .: : :. : ..::: CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 40 50 60 70 80 90 100 110 120 130 140 150 pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF :::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.: CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA 100 110 120 130 140 160 170 180 pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN ..:... .: . ..: .:.. :. .: .:: . CCDS46 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT 150 160 170 180 190 200 190 200 pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT----------------- .: : .:..: . : ::.. : CCDS46 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV 210 220 230 240 250 260 210 220 230 pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY :. ..:.. . :: : :. ... . .. :: CCDS46 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA 270 280 290 300 310 320 240 250 260 270 280 290 pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV ... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :. CCDS46 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL 330 340 350 360 370 380 300 310 320 330 340 350 pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI ....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.: CCDS46 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI 390 400 410 420 430 440 360 370 380 390 400 410 pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS :. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::. CCDS46 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT 450 460 470 480 490 500 420 430 440 450 460 470 pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV . . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. . CCDS46 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV- 510 520 530 540 550 560 480 490 500 510 520 530 pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKLDPEASSVNL :... .. . . . ..:. : .. :..... : :. CCDS46 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAGPLLSA--- 570 580 590 600 540 550 560 570 580 590 pF1KE5 IHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVA : . .:..: :.. .... :: :. :..:. .. :::. CCDS46 --C-----LAPQQVSSGDKMEDATAN------GQ-----EDSKAPDGSTLKAL-GLPQ-- 610 620 630 640 600 610 620 630 640 650 pF1KE5 ESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGC :. :..:::.. . .::. : :..: . :.. .. . .:.: CCDS46 -----------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAAC 650 660 670 680 660 670 680 690 700 710 pF1KE5 HSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETYS :: .: .: . ::::.::: .:: :::::: :::.. . . .: .:. CCDS46 HSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 690 700 710 720 730 740 720 730 740 750 760 770 pF1KE5 ETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDR >>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa) initn: 1086 init1: 618 opt: 648 Z-score: 612.0 bits: 124.1 E(32554): 9.1e-28 Smith-Waterman score: 899; 27.2% identity (59.4% similar) in 739 aa overlap (63-703:61-755) 40 50 60 70 80 90 pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL .:: : .: .: : :. : ..::: CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 40 50 60 70 80 90 100 110 120 130 140 150 pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF :::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.: CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA 100 110 120 130 140 160 170 180 pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN ..:... .: . ..: .:.. :. .: .:: . CCDS46 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT 150 160 170 180 190 200 190 200 pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT----------------- .: : .:..: . : ::.. : CCDS46 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV 210 220 230 240 250 260 210 220 230 pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY :. ..:.. . :: : :. ... . .. :: CCDS46 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA 270 280 290 300 310 320 240 250 260 270 280 290 pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV ... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :. CCDS46 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL 330 340 350 360 370 380 300 310 320 330 340 350 pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI ....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.: CCDS46 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI 390 400 410 420 430 440 360 370 380 390 400 410 pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS :. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::. CCDS46 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT 450 460 470 480 490 500 420 430 440 450 460 470 pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV . . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. . CCDS46 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV- 510 520 530 540 550 560 480 490 500 510 520 530 pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVN :... .. . . . ..:. : .. :..... .:...::. CCDS46 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVS 570 580 590 600 610 540 550 560 570 580 590 pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV . . .:.: .... :: . ::: ..: . . :. :..:. .. :::. CCDS46 INVNTSLEDMRSNNV--ED-CKMMVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ- 620 630 640 650 660 600 610 620 630 640 650 pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG :. :..:::.. . .::. : :..: . :.. .. . .:. CCDS46 ------------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAA 670 680 690 700 660 670 680 690 700 710 pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETY ::: .: .: . ::::.::: .:: :::::: :::.. . . .: .:. CCDS46 CHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 740 750 720 730 740 750 760 770 pF1KE5 SETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLD >>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa) initn: 1081 init1: 613 opt: 648 Z-score: 612.0 bits: 124.1 E(32554): 9.1e-28 Smith-Waterman score: 904; 27.2% identity (59.4% similar) in 739 aa overlap (63-703:61-756) 40 50 60 70 80 90 pF1KE5 ETFQQEHKRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWL .:: : .: .: : :. : ..::: CCDS43 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 40 50 60 70 80 90 100 110 120 130 140 150 pF1KE5 LGDLLAGISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFF :::::.:.::...:.::::. .::: .::. :..: :: .::. ...:.:.: CCDS43 LGDLLSGLSVAIMQLPQGLAYALLAG--LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFA 100 110 120 130 140 160 170 180 pF1KE5 LVSALLINVLK-VSP--FNNG-------------------------QLVMG----SFVKN ..:... .: . ..: .:.. :. .: .:: . CCDS43 VMSVMVGSVTESLAPQALNDSMINETARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVT 150 160 170 180 190 200 190 200 pF1KE5 EFSAP------------------SYLMGYNKS-----LSVVAT----------------- .: : .:..: . : ::.. : CCDS43 YLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVV 210 220 230 240 250 260 210 220 230 pF1KE5 TTFLTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPY :. ..:.. . :: : :. ... . .. :: CCDS43 TAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPA 270 280 290 300 310 320 240 250 260 270 280 290 pF1KE5 SFLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNV ... ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :. CCDS43 GLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNL 330 340 350 360 370 380 300 310 320 330 340 350 pF1KE5 VSSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGI ....:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.: CCDS43 IGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAI 390 400 410 420 430 440 360 370 380 390 400 410 pF1KE5 ILSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRS :. :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::. CCDS43 IIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRT 450 460 470 480 490 500 420 430 440 450 460 470 pF1KE5 HRAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMV . . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. . CCDS43 QMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV- 510 520 530 540 550 560 480 490 500 510 520 530 pF1KE5 KVPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVN :... .. . . . ..:. : .. :..... .:...::. CCDS43 ----------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVS 570 580 590 600 610 540 550 560 570 580 590 pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV . . .:.: .... :: . ::: ..: . . :. :..:. .. :::. CCDS43 INVNTSLEDMRSNNV--EDCKMMQVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ- 620 630 640 650 660 600 610 620 630 640 650 pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG :. :..:::.. . .::. : :..: . :.. .. . .:. CCDS43 ------------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAA 670 680 690 700 660 670 680 690 700 710 pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETY ::: .: .: . ::::.::: .:: :::::: :::.. . . .: .:. CCDS43 CHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 740 750 720 730 740 750 760 770 pF1KE5 SETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLD >>CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 (651 aa) initn: 1058 init1: 618 opt: 631 Z-score: 597.0 bits: 121.1 E(32554): 6.2e-27 Smith-Waterman score: 999; 28.9% identity (63.6% similar) in 686 aa overlap (22-703:21-648) 10 20 30 40 50 pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEET--FQQEHKRKASSSGNMNINITTFRH :.:..:. :. : ..::: .. . :. : . CCDS63 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAP---RTHQW 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 HVQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLAR .. .:: : .: .: : :. : ..::::::::.:.::...:.::::. .::: CCDS63 RTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 QLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALLINVLKVSPFNNGQLVMGSFV .::. :..: :: .::. ...:. .: :. . : .: .. . CCDS63 --LPPVFGLYSSFYPVFIYFLFGTSRHISV--------VLEVCWKLPQSKVGTVVTAAVA 120 130 140 150 160 180 190 200 210 220 230 pF1KE5 KNEFSAPSYLMGYNKSLSVVATTTFLTGIIQIIGFTVIANKISMATETSQTLIDMIPYSF . . . : : .:. . .. .:: : :. ... . .. :: .. CCDS63 GVVLVVVKLL---NDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE5 LLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVS . ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :... CCDS63 VPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIG 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 SFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIIL ..:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.::. CCDS63 GIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIII 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 SNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHR :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::.. CCDS63 VNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQM 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE5 AKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKV . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. . CCDS63 PHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV--- 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE5 PLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVNLI :... .. . . . ..:. : .. :..... .:...::.. CCDS63 --------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVSIN 470 480 490 500 540 550 560 570 580 590 pF1KE5 HCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAE . .:.: .... :: . ::: ..: . . :. :..:. .. :::. CCDS63 VNTSLEDMRSNNV--ED-CKMMVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ--- 510 520 530 540 550 600 610 620 630 640 650 pF1KE5 SQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCH :. :..:::.. . .::. : :..: . :.. .. . .:.:: CCDS63 ----------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACH 560 570 580 590 600 660 670 680 690 700 710 pF1KE5 SSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETYSE : .: .: . ::::.::: .:: :::::: :::.. . . .: .:. CCDS63 SPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 610 620 630 640 650 720 730 740 750 760 770 pF1KE5 TDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDRE >>CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 (723 aa) initn: 1055 init1: 613 opt: 624 Z-score: 589.8 bits: 120.0 E(32554): 1.6e-26 Smith-Waterman score: 909; 27.3% identity (59.9% similar) in 741 aa overlap (26-703:26-720) 10 20 30 40 50 pF1KE5 MAQLERSAISGFSSKSRRNSFAYDVKREVYNEETF-QQEHKRKASSSGNMNINITTFRHH .:. . :. . .::: .. . :. : . . CCDS63 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAP---RTHQWR 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 VQCRCSWHRFLRCMLTIFPFLEWMCMYRLKDWLLGDLLAGISVGLVQVPQGLTLSLLARQ . .:: : .: .: : :. : ..::::::::.:.::...:.::::. .::: CCDS63 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 LIPPLNIAYAAFCSSVIYVIFGSCHQMSI---GSFFLVSALLINVLKVSPFN---NGQLV .::. :..: :: .::. ...:. : . :..: . ..: :.: CCDS63 -LPPVFGLYSSFYPVFIYFLFGTSRHISVATPGPLPLLTAPGRPTGGAGPDPLRLRGHLP 120 130 140 150 160 170 180 190 200 pF1KE5 MGSFVKNEF--------------------------SAPSYLMGYNKSL--SVVAT--TTF . . . ..: :. .: : :.: :. CCDS63 VRTSCPRLYHSCSCAGLRLTAQVCVWPPSEQPLWATVPHLLLEVCWKLPQSKVGTVVTAA 180 190 200 210 220 230 210 220 230 pF1KE5 LTGIIQI------------------------IGFTVIANKISMATETSQTLIDMIPYSFL ..:.. . :: : :. ... . .. :: ... CCDS63 VAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLV 240 250 260 270 280 290 240 250 260 270 280 290 pF1KE5 LPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVVSS ::.:. .:. :.. .::....:. . : ::: .: :.: :.:::.:.:.:: :.... CCDS63 PPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGG 300 310 320 330 340 350 300 310 320 330 340 350 pF1KE5 FFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGIILS .:. . ...:...:...:: .: :. ... .::..::.:..:. ::.::::.::. CCDS63 IFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIV 360 370 380 390 400 410 360 370 380 390 400 410 pF1KE5 NVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSHRA :. .:. .:.. :::. .. : .:..::...:.:.::.::...:. ......::.. CCDS63 NLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMP 420 430 440 450 460 470 420 430 440 450 460 470 pF1KE5 KILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVKVP . .:::.:.:.:::.. .: : . :::.:. ... :.:. . . : .. . CCDS63 HYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGV---- 480 490 500 510 520 530 480 490 500 510 520 530 pF1KE5 LKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFENKL-DPEASSVNLIH :... .. . . . ..:. : .. :..... .:...::.. CCDS63 -------------DVDFLISQKKKLLKKQEQLK-LKQLQKEEKLRKQAASPKGASVSINV 540 550 560 570 540 550 560 570 580 590 pF1KE5 CSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDVAES . .:.: .... :: . ::: ..: . . :. :..:. .. :::. CCDS63 NTSLEDMRSNNV--EDCKMMQVSS-GDKMEDATANGQEDSKAPDGSTLKAL-GLPQ---- 580 590 600 610 620 600 610 620 630 640 650 pF1KE5 QGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAGCHS :. :..:::.. . .::. : :..: . :.. .. . .:.::: CCDS63 ---------------PDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHS 630 640 650 660 670 660 670 680 690 700 710 pF1KE5 SIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSR-KVIGSSELSIDESETVIRETYSET .: .: . ::::.::: .:: :::::: :::.. . . .: .:. CCDS63 PVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 680 690 700 710 720 720 730 740 750 760 770 pF1KE5 DKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDREL >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 792 init1: 557 opt: 605 Z-score: 572.3 bits: 116.7 E(32554): 1.5e-25 Smith-Waterman score: 694; 25.4% identity (56.1% similar) in 697 aa overlap (70-662:57-685) 40 50 60 70 80 90 pF1KE5 KRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIF-PFLEWMCMYRLKDWLLGDLLA .: .. .: :. .:. :..:...::::.. CCDS43 VLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVS 30 40 50 60 70 80 100 110 120 130 140 150 pF1KE5 GISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALL :::.:..:.::::....:: .::. :..: ..: ..:. ...::: : ..: .. CCDS43 GISTGVLQLPQGLAFAMLA--AVPPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMI 90 100 110 120 130 140 160 170 180 pF1KE5 INV-LKVSPFN----------NG----------------------QLVMG----SFVKNE .: ... : . :: :. .: .:: CCDS43 GGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIY 150 160 170 180 190 200 190 200 pF1KE5 FSAP------------------SYLMG-----YNKSLSVVATTTFLT-----------GI .. : .::.: :. .::: .:. . :. CCDS43 LTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGV 210 220 230 240 250 260 210 220 230 pF1KE5 -IQIIGF-------------------------TVIANKISMATETSQTL-IDMI---PYS ....:. .:... :: . . ... .:.. : . CCDS43 GLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLG 270 280 290 300 310 320 240 250 260 270 280 290 pF1KE5 FLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVV .: :..:: ::. . ..:.....:. . : ..: .:. :.:.:..::.:::.:::: . CCDS43 LLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSI 330 340 350 360 370 380 300 310 320 330 340 350 pF1KE5 SSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGII .:.:.. .. ...:...:. .::. :.:. ... ..::... : .: .::.:::..:. CCDS43 GSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIV 390 400 410 420 430 440 360 370 380 390 400 410 pF1KE5 LSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSH . :. .. .:.:: .:: .. . ..:. :: ::.::::: ::: .:. :.. . :.. CCDS43 IVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQ 450 460 470 480 490 500 420 430 440 450 460 470 pF1KE5 RAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVK . .::..:.:..: .:. :.:. :::.:::: . : ..: :. . CCDS43 SPSYKVLGKLPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANS-----------DLYS 510 520 530 540 550 480 490 500 510 520 530 pF1KE5 VPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFEN--KLDPEASSVN ::.. . .: : ... : . : :....: CCDS43 NALKRK--------TGVN-------------------PAVIMGARRKAMRKYAKEVGNAN 560 570 580 540 550 560 570 580 590 pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV : .. ... : . :. .. . :: :: : ... : CCDS43 ---------MANATVVKAD------AEVDGEDATKPEEEDGEVKYPPIVIKSTFP----- 590 600 610 620 600 610 620 630 640 650 pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG : . : ..: .: .:::.::::..:...:: :. .: : . . ...: . .:: CCDS43 -EEMQR--FMPPGD-----NVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAG 630 640 650 660 670 660 670 680 690 700 710 pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYS : . : : CCDS43 CSAFIQR 680 >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 864 init1: 557 opt: 605 Z-score: 571.8 bits: 116.7 E(32554): 1.6e-25 Smith-Waterman score: 779; 25.9% identity (56.3% similar) in 742 aa overlap (70-707:57-730) 40 50 60 70 80 90 pF1KE5 KRKASSSGNMNINITTFRHHVQCRCSWHRFLRCMLTIF-PFLEWMCMYRLKDWLLGDLLA .: .. .: :. .:. :..:...::::.. CCDS57 VLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVS 30 40 50 60 70 80 100 110 120 130 140 150 pF1KE5 GISVGLVQVPQGLTLSLLARQLIPPLNIAYAAFCSSVIYVIFGSCHQMSIGSFFLVSALL :::.:..:.::::....:: .::. :..: ..: ..:. ...::: : ..: .. CCDS57 GISTGVLQLPQGLAFAMLAA--VPPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMI 90 100 110 120 130 140 160 170 180 pF1KE5 INV-LKVSPFN----------NG----------------------QLVMG----SFVKNE .: ... : . :: :. .: .:: CCDS57 GGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIY 150 160 170 180 190 200 190 200 pF1KE5 FSAP------------------SYLMG-----YNKSLSVVATTTFLT-----------GI .. : .::.: :. .::: .:. . :. CCDS57 LTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGV 210 220 230 240 250 260 210 220 230 pF1KE5 -IQIIGF-------------------------TVIANKISMATETSQTL-IDMI---PYS ....:. .:... :: . . ... .:.. : . CCDS57 GLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLG 270 280 290 300 310 320 240 250 260 270 280 290 pF1KE5 FLLPVTPDFSLLPKIILQAFSLSLVSSFLLIFLGKKIASLHNYSVNSNQDLIAIGLCNVV .: :..:: ::. . ..:.....:. . : ..: .:. :.:.:..::.:::.:::: . CCDS57 LLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSI 330 340 350 360 370 380 300 310 320 330 340 350 pF1KE5 SSFFRSCVFTGAIARTIIQDKSGGRQQFASLVGAGVMLLLMVKMGHFFYTLPNAVLAGII .:.:.. .. ...:...:. .::. :.:. ... ..::... : .: .::.:::..:. CCDS57 GSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIV 390 400 410 420 430 440 360 370 380 390 400 410 pF1KE5 LSNVIPYLETISNLPSLWRQDQYDCALWMMTFSSSIFLGLDIGLIISVVSAFFITTVRSH . :. .. .:.:: .:: .. . ..:. :: ::.::::: ::: .:. :.. . :.. CCDS57 IVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQ 450 460 470 480 490 500 420 430 440 450 460 470 pF1KE5 RAKILLLGQIPNTNIYRSINDYREIITIPGVKIFQCCSSITFVNVYYLKHKLLKEVDMVK . .::..:.:..: .:. :.:. :::.:::: . : ..: :. . CCDS57 SPSYKVLGKLPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANS-----------DLYS 510 520 530 540 550 480 490 500 510 520 530 pF1KE5 VPLKEEEIFSLFNSSDTNLQGGKICRCFCNCDDLEPLPRILYTERFEN--KLDPEASSVN ::.. . .: : ... : . : :....: CCDS57 NALKRK--------TGVN-------------------PAVIMGARRKAMRKYAKEVGNAN 560 570 580 540 550 560 570 580 590 pF1KE5 LIHCSHFESMNTSQTASEDQVPYTVSSVSQKNQGQQYEEVEEVWLPNNSSRNSSPGLPDV : .. ... : . :. .. . :: :: : ... : CCDS57 ---------MANATVVKAD------AEVDGEDATKPEEEDGEVKYPPIVIKSTFP----- 590 600 610 620 600 610 620 630 640 650 pF1KE5 AESQGRRSLIPYSDASLLPSVHTIILDFSMVHYVDSRGLVVLRQICNAFQNANILILIAG : . : ..: .: .:::.::::..:...:: :. .: : . . ...: . .:: CCDS57 -EEMQR--FMPPGD-----NVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAG 630 640 650 660 670 660 670 680 690 700 710 pF1KE5 CHSSIVRAFERNDFFDAGITKTQLFLSVHDAVLFALSRKVIGSSELSIDESETVIRETYS : ...: . :: ::. :: :.::::: . :.... .: : :. CCDS57 CSAQVVNDLTRNRFFENPALWELLFHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNAT 680 690 700 710 720 730 720 730 740 750 760 770 pF1KE5 ETDKNDNSRYKMSSSFLGSQKNVSPGFIKIQQPVEEESELDLELESEQEAGLGLDLDLDR CCDS57 PATPEA 740 865 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:52:54 2016 done: Tue Nov 8 06:52:55 2016 Total Scan time: 4.250 Total Display time: 0.280 Function used was FASTA [36.3.4 Apr, 2011]