FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6475, 473 aa 1>>>pF1KE6475 473 - 473 aa - 473 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0882+/-0.00104; mu= 18.7556+/- 0.062 mean_var=64.5304+/-13.249, 0's: 0 Z-trim(102.7): 29 B-trim: 0 in 0/49 Lambda= 0.159659 statistics sampled from 7023 (7048) to 7023 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.578), E-opt: 0.2 (0.217), width: 16 Scan time: 1.870 The best scores are: opt bits E(32554) CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 3032 707.8 9.5e-204 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 2827 660.5 1.2e-189 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 2827 660.5 1.5e-189 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 2827 660.6 1.6e-189 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 2109 495.0 5.2e-140 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1291 306.8 5.1e-83 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1291 306.8 5.2e-83 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1291 306.8 5.3e-83 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1291 306.8 5.3e-83 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1251 297.6 3.1e-80 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1224 291.3 2.4e-78 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 1123 268.1 2.4e-71 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 1123 268.1 2.7e-71 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 822 198.7 1.5e-50 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 822 198.7 1.6e-50 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 815 197.0 4.2e-50 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 736 178.9 1.6e-44 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 697 170.0 9.9e-42 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 695 169.5 1e-41 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 608 149.4 1.1e-35 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 598 147.1 5.7e-35 CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 396 100.6 5e-21 CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 331 85.3 7.2e-17 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 310 80.8 6.1e-15 >>CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 (712 aa) initn: 3032 init1: 3032 opt: 3032 Z-score: 3771.4 bits: 707.8 E(32554): 9.5e-204 Smith-Waterman score: 3032; 100.0% identity (100.0% similar) in 472 aa overlap (1-472:1-472) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 ILLVILATGFLFESLPQTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQR :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ILLVILATGFLFESLPQTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLG 430 440 450 460 470 480 CCDS55 KLPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARR 490 500 510 520 530 540 >>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 (516 aa) initn: 3022 init1: 2826 opt: 2827 Z-score: 3518.2 bits: 660.5 E(32554): 1.2e-189 Smith-Waterman score: 2958; 93.7% identity (93.7% similar) in 504 aa overlap (1-472:1-504) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM 370 380 390 400 410 420 430 440 pF1KE6 ILLVILATGFLFESLPQ--------------------------------TIWLTTFVSSL ::::::::::::::::: ::::::::::: CCDS43 ILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSL 430 440 450 460 470 480 450 460 470 pF1KE6 FLGLDYGLITAVIIALLTVIYRTQR :::::::::::::::::::::::: CCDS43 FLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP 490 500 510 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 3022 init1: 2826 opt: 2827 Z-score: 3516.4 bits: 660.5 E(32554): 1.5e-189 Smith-Waterman score: 2958; 93.7% identity (93.7% similar) in 504 aa overlap (1-472:1-504) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM 370 380 390 400 410 420 430 440 pF1KE6 ILLVILATGFLFESLPQ--------------------------------TIWLTTFVSSL ::::::::::::::::: ::::::::::: CCDS43 ILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSL 430 440 450 460 470 480 450 460 470 pF1KE6 FLGLDYGLITAVIIALLTVIYRTQR :::::::::::::::::::::::: CCDS43 FLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVKEIPGIKIFQI 490 500 510 520 530 540 >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 3022 init1: 2826 opt: 2827 Z-score: 3515.9 bits: 660.6 E(32554): 1.6e-189 Smith-Waterman score: 2958; 93.7% identity (93.7% similar) in 504 aa overlap (1-472:1-504) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM 370 380 390 400 410 420 430 440 pF1KE6 ILLVILATGFLFESLPQ--------------------------------TIWLTTFVSSL ::::::::::::::::: ::::::::::: CCDS57 ILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSL 430 440 450 460 470 480 450 460 470 pF1KE6 FLGLDYGLITAVIIALLTVIYRTQR :::::::::::::::::::::::: CCDS57 FLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVKEIPGIKIFQI 490 500 510 520 530 540 >>CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 (335 aa) initn: 2109 init1: 2109 opt: 2109 Z-score: 2627.1 bits: 495.0 E(32554): 5.2e-140 Smith-Waterman score: 2109; 99.7% identity (100.0% similar) in 325 aa overlap (1-325:1-325) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT ::::::::::::::::::::::::. CCDS57 TGISAGFNLKESYNVDVVGTLPLGFHTEMTRRWRP 310 320 330 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 1385 init1: 868 opt: 1291 Z-score: 1603.9 bits: 306.8 E(32554): 5.1e-83 Smith-Waterman score: 1340; 43.8% identity (75.5% similar) in 489 aa overlap (16-472:8-488) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI :..:::.... :.: : ..: . . . . :. . . CCDS46 MDLRRRDYHMERPLLNQEHLEE-LGRWGSAPRT--HQWRTWLQCSRARAYAL 10 20 30 40 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV . . ::. ::: : ....::::.::.:....:::::::.:.::..::.:::::::::: CCDS46 LLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM ..: ..:::::::.: :::.:.:.:.:. :.:. . . .: : :::: ::.:: CCDS46 FIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALN-DSMINET----ARDAARVQVAS 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE6 SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI ....: :..: ::. .::::. ::.::::::.::::::.::.:.:::.::.. . .:: CCDS46 TLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGP 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE6 FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG .:..:... : .. . .: .. .. .. .:. : .:......:: ::: :..... . CCDS46 LSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGA 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE6 TGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT :::: :..::. ..:::::..: ::.::. :.:.:: . .:..::.:::...::..: CCDS46 TGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKI 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE6 LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM .: .:::.::.::::.:::: : ::..:: : .:::.:::::::.:::..:.:: ..::. CCDS46 FALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLF 350 360 370 380 390 400 430 440 pF1KE6 ILLVILATGFLFESLPQT--------------------------------IWLTTFVSSL :::.:. : ::..::.. :::.::.... CCDS46 ILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATI 410 420 430 440 450 460 450 460 470 pF1KE6 FLGLDYGLITAVIIALLTVIYRTQR .:.:: ::..:::..:: :. ::: CCDS46 LLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRS 470 480 490 500 510 520 >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1385 init1: 868 opt: 1291 Z-score: 1603.8 bits: 306.8 E(32554): 5.2e-83 Smith-Waterman score: 1340; 43.8% identity (75.5% similar) in 489 aa overlap (16-472:29-509) 10 20 30 40 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLK :..:::.... :.: : ..: . . . CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE-LGRWGSAPRT--HQWR 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 QAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAV . :. . .. . ::. ::: : ....::::.::.:....:::::::.:.::.. CCDS46 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 PPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNG ::.::::::::::..: ..:::::::.: :::.:.:.:.:. :.:. . . .: : CCDS46 PPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALN-DSMINET-- 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 TEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK :::: ::.:: ....: :..: ::. .::::. ::.::::::.::::::.::.:.:: CCDS46 --ARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP :.::.. . .:: .:..:... : .. . .: .. .. .. .:. : .:......:: CCDS46 YVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLP 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA ::: :..... .:::: :..::. ..:::::..: ::.::. :.:.:: . .:..:: CCDS46 MPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG .:::...::..: .: .:::.::.::::.:::: : ::..:: : .:::.:::::::.:: CCDS46 VVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTG 360 370 380 390 400 410 410 420 430 pF1KE6 GKTQLAGCLASLMILLVILATGFLFESLPQT----------------------------- :..:.:: ..::.:::.:. : ::..::.. CCDS46 GNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRA 420 430 440 450 460 470 440 450 460 470 pF1KE6 ---IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQR :::.::.....:.:: ::..:::..:: :. ::: CCDS46 DLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYS 480 490 500 510 520 530 CCDS46 EAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQ 540 550 560 570 580 590 >>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa) initn: 1385 init1: 868 opt: 1291 Z-score: 1603.7 bits: 306.8 E(32554): 5.3e-83 Smith-Waterman score: 1340; 43.8% identity (75.5% similar) in 489 aa overlap (16-472:29-509) 10 20 30 40 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLK :..:::.... :.: : ..: . . . CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE-LGRWGSAPRT--HQWR 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 QAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAV . :. . .. . ::. ::: : ....::::.::.:....:::::::.:.::.. CCDS46 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 PPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNG ::.::::::::::..: ..:::::::.: :::.:.:.:.:. :.:. . . .: : CCDS46 PPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALN-DSMINET-- 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 TEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK :::: ::.:: ....: :..: ::. .::::. ::.::::::.::::::.::.:.:: CCDS46 --ARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP :.::.. . .:: .:..:... : .. . .: .. .. .. .:. : .:......:: CCDS46 YVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLP 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA ::: :..... .:::: :..::. ..:::::..: ::.::. :.:.:: . .:..:: CCDS46 MPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG .:::...::..: .: .:::.::.::::.:::: : ::..:: : .:::.:::::::.:: CCDS46 VVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTG 360 370 380 390 400 410 410 420 430 pF1KE6 GKTQLAGCLASLMILLVILATGFLFESLPQT----------------------------- :..:.:: ..::.:::.:. : ::..::.. CCDS46 GNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRA 420 430 440 450 460 470 440 450 460 470 pF1KE6 ---IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQR :::.::.....:.:: ::..:::..:: :. ::: CCDS46 DLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYS 480 490 500 510 520 530 CCDS46 EAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQ 540 550 560 570 580 590 >>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa) initn: 1385 init1: 868 opt: 1291 Z-score: 1603.7 bits: 306.8 E(32554): 5.3e-83 Smith-Waterman score: 1340; 43.8% identity (75.5% similar) in 489 aa overlap (16-472:29-509) 10 20 30 40 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLK :..:::.... :.: : ..: . . . CCDS43 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE-LGRWGSAPRT--HQWR 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 QAFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAV . :. . .. . ::. ::: : ....::::.::.:....:::::::.:.::.. CCDS43 TWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 PPIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNG ::.::::::::::..: ..:::::::.: :::.:.:.:.:. :.:. . . .: : CCDS43 PPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALN-DSMINET-- 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 TEARDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK :::: ::.:: ....: :..: ::. .::::. ::.::::::.::::::.::.:.:: CCDS43 --ARDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP :.::.. . .:: .:..:... : .. . .: .. .. .. .:. : .:......:: CCDS43 YVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLP 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA ::: :..... .:::: :..::. ..:::::..: ::.::. :.:.:: . .:..:: CCDS43 MPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG .:::...::..: .: .:::.::.::::.:::: : ::..:: : .:::.:::::::.:: CCDS43 VVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTG 360 370 380 390 400 410 410 420 430 pF1KE6 GKTQLAGCLASLMILLVILATGFLFESLPQT----------------------------- :..:.:: ..::.:::.:. : ::..::.. CCDS43 GNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRA 420 430 440 450 460 470 440 450 460 470 pF1KE6 ---IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQR :::.::.....:.:: ::..:::..:: :. ::: CCDS43 DLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYS 480 490 500 510 520 530 CCDS43 EAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQ 540 550 560 570 580 590 >>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa) initn: 1329 init1: 760 opt: 1251 Z-score: 1553.8 bits: 297.6 E(32554): 3.1e-80 Smith-Waterman score: 1288; 42.0% identity (72.2% similar) in 500 aa overlap (15-472:8-504) 10 20 30 40 50 60 pF1KE6 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI .: : ::..: ...: . . .. :.:: .:.:.: . : CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV . ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:. CCDS57 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA 60 70 80 90 100 110 130 140 150 160 170 pF1KE6 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR :.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : : CCDS57 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK :.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . CCDS57 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI . .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.:: CCDS57 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG :.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:. CCDS57 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.::::: CCDS57 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT 360 370 380 390 400 410 420 430 pF1KE6 QLAGCLASLMILLVILATGFLFESLPQT-------------------------------- :.:: ......:.:.:: :::. : .. CCDS57 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL 420 430 440 450 460 470 440 450 460 470 pF1KE6 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQR ::. ::. .. ::: :: ..: . :::...::: CCDS57 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY 480 490 500 510 520 530 CCDS57 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVT 540 550 560 570 580 590 473 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:39:41 2016 done: Tue Nov 8 13:39:41 2016 Total Scan time: 1.870 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]