FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6702, 758 aa 1>>>pF1KE6702 758 - 758 aa - 758 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8067+/-0.00106; mu= 17.7682+/- 0.064 mean_var=77.0239+/-15.417, 0's: 0 Z-trim(104.1): 35 B-trim: 0 in 0/51 Lambda= 0.146137 statistics sampled from 7707 (7737) to 7707 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.605), E-opt: 0.2 (0.238), width: 16 Scan time: 4.080 The best scores are: opt bits E(32554) CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 4887 1040.5 0 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 4875 1038.0 0 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 4745 1010.6 0 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 3879 828.0 0 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 3249 695.1 8.9e-200 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 3222 689.5 5e-198 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1769 383.1 7.9e-106 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1769 383.1 8.5e-106 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 1726 374.1 4.8e-103 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 1726 374.1 5.3e-103 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1536 333.9 3.8e-91 CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1291 282.3 1.8e-75 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1261 276.0 1.5e-73 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1212 265.7 2e-70 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 1047 230.9 5.1e-60 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 1047 230.9 5.1e-60 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 990 218.9 2.2e-56 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 979 216.6 1.2e-55 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 947 209.8 9.9e-54 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 879 195.5 3.3e-49 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 855 190.3 4.4e-48 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 648 146.8 1.4e-34 CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 585 133.5 1e-30 CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 448 104.5 3.1e-22 CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 343 82.2 9.8e-16 >>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa) initn: 4887 init1: 4887 opt: 4887 Z-score: 5565.5 bits: 1040.5 E(32554): 0 Smith-Waterman score: 4887; 100.0% identity (100.0% similar) in 758 aa overlap (1-758:1-758) 10 20 30 40 50 60 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE6 AASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAPDGSTLKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 AASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAPDGSTLKAL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE6 GLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHF 670 680 690 700 710 720 730 740 750 pF1KE6 FDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL :::::::::::::::::::::::::::::::::::::: CCDS46 FDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 730 740 750 >>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa) initn: 4048 init1: 4048 opt: 4875 Z-score: 5551.8 bits: 1038.0 E(32554): 0 Smith-Waterman score: 4875; 99.9% identity (99.9% similar) in 759 aa overlap (1-758:1-759) 10 20 30 40 50 60 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ 550 560 570 580 590 600 610 620 630 640 650 pF1KE6 AASPKGASVSINVNTSLEDMRSNNVEDCKMM-VSSGDKMEDATANGQEDSKAPDGSTLKA ::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::: CCDS43 AASPKGASVSINVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKA 610 620 630 640 650 660 660 670 680 690 700 710 pF1KE6 LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGH 670 680 690 700 710 720 720 730 740 750 pF1KE6 FFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL ::::::::::::::::::::::::::::::::::::::: CCDS43 FFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 730 740 750 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 3918 init1: 3918 opt: 4745 Z-score: 5403.9 bits: 1010.6 E(32554): 0 Smith-Waterman score: 4745; 99.9% identity (99.9% similar) in 738 aa overlap (22-758:1-738) 10 20 30 40 50 60 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL ::::::::::::::::::::::::::::::::::::::: CCDS46 MDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL 10 20 30 70 80 90 100 110 120 pF1KE6 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE6 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE6 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE6 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE6 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE6 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA 340 350 360 370 380 390 430 440 450 460 470 480 pF1KE6 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT 400 410 420 430 440 450 490 500 510 520 530 540 pF1KE6 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV 460 470 480 490 500 510 550 560 570 580 590 600 pF1KE6 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ 520 530 540 550 560 570 610 620 630 640 650 pF1KE6 AASPKGASVSINVNTSLEDMRSNNVEDCKMM-VSSGDKMEDATANGQEDSKAPDGSTLKA ::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::: CCDS46 AASPKGASVSINVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKA 580 590 600 610 620 630 660 670 680 690 700 710 pF1KE6 LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGH 640 650 660 670 680 690 720 730 740 750 pF1KE6 FFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL ::::::::::::::::::::::::::::::::::::::: CCDS46 FFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 700 710 720 730 >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 4681 init1: 3856 opt: 3879 Z-score: 4417.1 bits: 828.0 E(32554): 0 Smith-Waterman score: 4646; 96.2% identity (97.0% similar) in 758 aa overlap (1-758:1-740) 10 20 30 40 50 60 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE6 AASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAPDGSTLKAL :. .: .. ..::::::::::::::::::::::::::::: CCDS46 AGPLLSACLA------------------PQQVSSGDKMEDATANGQEDSKAPDGSTLKAL 610 620 630 640 670 680 690 700 710 720 pF1KE6 GLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHF 650 660 670 680 690 700 730 740 750 pF1KE6 FDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL :::::::::::::::::::::::::::::::::::::: CCDS46 FDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 740 >>CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 (651 aa) initn: 3239 init1: 3239 opt: 3249 Z-score: 3700.1 bits: 695.1 E(32554): 8.9e-200 Smith-Waterman score: 4005; 85.9% identity (85.9% similar) in 758 aa overlap (1-758:1-651) 10 20 30 40 50 60 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALNDSMINETARDAAR :::::::::::::::::::::::: CCDS63 FGLYSSFYPVFIYFLFGTSRHISV------------------------------------ 130 140 190 200 210 220 230 240 pF1KE6 VQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLS CCDS63 ------------------------------------------------------------ 250 260 270 280 290 300 pF1KE6 SHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 -----------VLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELL 150 160 170 180 190 310 320 330 340 350 360 pF1KE6 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 TLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAI 200 210 220 230 240 250 370 380 390 400 410 420 pF1KE6 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGA 260 270 280 290 300 310 430 440 450 460 470 480 pF1KE6 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 ISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVT 320 330 340 350 360 370 490 500 510 520 530 540 pF1KE6 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 FTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGV 380 390 400 410 420 430 550 560 570 580 590 600 pF1KE6 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQ 440 450 460 470 480 490 610 620 630 640 650 660 pF1KE6 AASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAPDGSTLKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 AASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAPDGSTLKAL 500 510 520 530 540 550 670 680 690 700 710 720 pF1KE6 GLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHF 560 570 580 590 600 610 730 740 750 pF1KE6 FDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL :::::::::::::::::::::::::::::::::::::: CCDS63 FDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 620 630 640 650 >>CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 (723 aa) initn: 3378 init1: 2394 opt: 3222 Z-score: 3668.6 bits: 689.5 E(32554): 5e-198 Smith-Waterman score: 4128; 87.3% identity (90.7% similar) in 761 aa overlap (1-758:1-723) 10 20 30 40 50 60 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 QCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPV 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMV--GSVTESLAPQALNDSMINETARDA ::::::::::::::::::::::::.: . . ... : : . .:. : : CCDS63 FGLYSSFYPVFIYFLFGTSRHISVATPGPLPLLTAPGRPTGGAGPDPL---------RLR 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 ARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLH ... : .. : : : . : .: : :. . . ... CCDS63 GHLPVRTSCPRL------------------YHSCSCA-GLRLTAQVCVWPPSEQPLWA-- 180 190 200 210 240 250 260 270 280 290 pF1KE6 LSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGE .. . .:::::::::::::::::::::::::::::::::::::::::::::: CCDS63 --------TVPHLLLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGE 220 230 240 250 260 300 310 320 330 340 350 pF1KE6 LLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAI 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE6 AISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 AISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVA 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE6 GAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWL 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE6 VTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 VTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVR 450 460 470 480 490 500 540 550 560 570 580 590 pF1KE6 GVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLR 510 520 530 540 550 560 600 610 620 630 640 650 pF1KE6 KQAASPKGASVSINVNTSLEDMRSNNVEDCKMM-VSSGDKMEDATANGQEDSKAPDGSTL ::::::::::::::::::::::::::::::::: :::::::::::::::::::::::::: CCDS63 KQAASPKGASVSINVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTL 570 580 590 600 610 620 660 670 680 690 700 710 pF1KE6 KALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEA 630 640 650 660 670 680 720 730 740 750 pF1KE6 GHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL ::::::::::::::::::::::::::::::::::::::::: CCDS63 GHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 690 700 710 720 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 1731 init1: 1330 opt: 1769 Z-score: 2013.4 bits: 383.1 E(32554): 7.9e-106 Smith-Waterman score: 1833; 41.6% identity (75.5% similar) in 687 aa overlap (29-707:16-679) 10 20 30 40 50 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE-LGRWGSAPRT--HQWR :..:::.... :.: : ..: . . . CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLK 10 20 30 40 60 70 80 90 100 110 pF1KE6 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGL . :. . .. . ::. ::: : ....::::.::.:....:::::::.:.::.. CCDS43 QAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAV 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE6 PPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALN-DSMINET-- ::.::::::::::..: ..:::::::.: :::.:.:.:.:. :.:. . . .: : CCDS43 PPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE6 --ARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLK :::: ::.:: ....: :..: ::. .::::. ::.::::::.::::::.::.:.:: CCDS43 TEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 YVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLP :.::.. . .:: .:..:... : .. . .: .. .. .. .:. : .:......:: CCDS43 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 MPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIA ::: :..... .:::: :..::. ..:::::..: ::.::. :.:.:: . .:..:: CCDS43 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 VVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTG .:::...::..: .: .:::.::.::::.:::: : ::..:: : .:::.:::::::.:: CCDS43 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 GNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRA :..:.:: ..::.:::.:. : ::..::.:::.::.:::::::. :.::. .:.... CCDS43 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE6 DLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYS .: :::.::.....:.:: ::..:::..:: :. ::: : :.:::..:.::.: :. : CCDS43 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE6 EAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQ :.::. :.:.:. .: .:.::...::.:::.. ::. ... ..: ..: CCDS43 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYA-------- 530 540 550 560 570 600 610 620 630 640 650 pF1KE6 KEEKLRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAP : .: ... :. ..... :: . . :: .. :. . . : : CCDS43 ---KEVGNANMANATVVKADAEVDGEDATKPEEEDGEV------KYPPIVIK----STFP 580 590 600 610 620 660 670 680 690 700 710 pF1KE6 DGSTLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVV . .. . : . :..:::. ..:.:.: .:.: .: ... .. . ::.:.: CCDS43 E--EMQRFMPPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQ 630 640 650 660 670 680 720 730 740 750 pF1KE6 SQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL CCDS43 R >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 1908 init1: 1330 opt: 1769 Z-score: 2012.9 bits: 383.1 E(32554): 8.5e-106 Smith-Waterman score: 1902; 41.5% identity (75.1% similar) in 718 aa overlap (29-738:16-710) 10 20 30 40 50 pF1KE6 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE-LGRWGSAPRT--HQWR :..:::.... :.: : ..: . . . CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLK 10 20 30 40 60 70 80 90 100 110 pF1KE6 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGL . :. . .. . ::. ::: : ....::::.::.:....:::::::.:.::.. CCDS57 QAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAV 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE6 PPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALN-DSMINET-- ::.::::::::::..: ..:::::::.: :::.:.:.:.:. :.:. . . .: : CCDS57 PPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE6 --ARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLK :::: ::.:: ....: :..: ::. .::::. ::.::::::.::::::.::.:.:: CCDS57 TEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 YVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLP :.::.. . .:: .:..:... : .. . .: .. .. .. .:. : .:......:: CCDS57 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 MPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIA ::: :..... .:::: :..::. ..:::::..: ::.::. :.:.:: . .:..:: CCDS57 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 VVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTG .:::...::..: .: .:::.::.::::.:::: : ::..:: : .:::.:::::::.:: CCDS57 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 GNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRA :..:.:: ..::.:::.:. : ::..::.:::.::.:::::::. :.::. .:.... CCDS57 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE6 DLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYS .: :::.::.....:.:: ::..:::..:: :. ::: : :.:::..:.::.: :. : CCDS57 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE6 EAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQ :.::. :.:.:. .: .:.::...::.:::.. ::. ... ..: ..: CCDS57 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYA-------- 530 540 550 560 570 600 610 620 630 640 650 pF1KE6 KEEKLRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAP : .: ... :. ..... :: . . :: .. :. . . : : CCDS57 ---KEVGNANMANATVVKADAEVDGEDATKPEEEDGEV------KYPPIVIK----STFP 580 590 600 610 620 660 670 680 690 700 710 pF1KE6 DGSTLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVV . .. . : . :..:::. ..:.:.: .:.: .: ... .. . ::.:.: . :: CCDS57 E--EMQRFMPPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVV 630 640 650 660 670 680 720 730 740 750 pF1KE6 SQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL ..: ..::. . :: :.:::: CCDS57 NDLTRNRFFENPALWELLFHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA 690 700 710 720 730 740 >>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa) initn: 1316 init1: 1178 opt: 1726 Z-score: 1963.5 bits: 374.1 E(32554): 4.8e-103 Smith-Waterman score: 1726; 37.3% identity (73.1% similar) in 713 aa overlap (51-748:32-744) 30 40 50 60 70 80 pF1KE6 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW : .. :. ..:: :. :... :::: : CCDS30 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW 10 20 30 40 50 60 90 100 110 120 130 140 pF1KE6 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR ::.: ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: . CCDS30 LPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH 70 80 90 100 110 120 150 160 170 180 190 pF1KE6 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG .. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :.. CCDS30 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV ..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...: CCDS30 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE6 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM ...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: : CCDS30 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE6 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY . .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .::: CCDS30 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE6 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK ::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... .. CCDS30 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV 370 380 390 400 410 420 440 450 460 470 480 490 pF1KE6 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG :: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: : CCDS30 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG 430 440 450 460 470 480 500 510 520 530 540 550 pF1KE6 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA ..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .::: CCDS30 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA 490 500 510 520 530 540 560 570 580 590 600 610 pF1KE6 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN :.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. . CCDS30 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD 550 560 570 580 590 600 620 630 640 650 660 pF1KE6 V-NTSLEDMRSNNVEDCKMMVS----SGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD :. : .:.. :: : :. : .. ...:: . : . : : CCDS30 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE6 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI ::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:. CCDS30 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL 670 680 690 700 710 720 730 740 750 pF1KE6 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL ::.: :.:::: :: . : : CCDS30 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS 730 740 750 760 770 780 >>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa) initn: 1316 init1: 1178 opt: 1726 Z-score: 1962.7 bits: 374.1 E(32554): 5.3e-103 Smith-Waterman score: 1726; 37.3% identity (73.1% similar) in 713 aa overlap (51-748:32-744) 30 40 50 60 70 80 pF1KE6 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW : .. :. ..:: :. :... :::: : CCDS30 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW 10 20 30 40 50 60 90 100 110 120 130 140 pF1KE6 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR ::.: ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: . CCDS30 LPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH 70 80 90 100 110 120 150 160 170 180 190 pF1KE6 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG .. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :.. CCDS30 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV ..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...: CCDS30 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE6 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM ...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: : CCDS30 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE6 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY . .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .::: CCDS30 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE6 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK ::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... .. CCDS30 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV 370 380 390 400 410 420 440 450 460 470 480 490 pF1KE6 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG :: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: : CCDS30 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG 430 440 450 460 470 480 500 510 520 530 540 550 pF1KE6 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA ..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .::: CCDS30 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA 490 500 510 520 530 540 560 570 580 590 600 610 pF1KE6 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN :.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. . CCDS30 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD 550 560 570 580 590 600 620 630 640 650 660 pF1KE6 V-NTSLEDMRSNNVEDCKMMVS----SGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD :. : .:.. :: : :. : .. ...:: . : . : : CCDS30 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE6 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI ::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:. CCDS30 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL 670 680 690 700 710 720 730 740 750 pF1KE6 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL ::.: :.:::: :: . : : CCDS30 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS 730 740 750 760 770 780 758 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 15:30:25 2016 done: Tue Nov 8 15:30:25 2016 Total Scan time: 4.080 Total Display time: 0.280 Function used was FASTA [36.3.4 Apr, 2011]