FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2739, 672 aa 1>>>pF1KE2739 672 - 672 aa - 672 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2548+/-0.000847; mu= 20.5562+/- 0.051 mean_var=78.7477+/-15.999, 0's: 0 Z-trim(107.5): 32 B-trim: 0 in 0/52 Lambda= 0.144529 statistics sampled from 9748 (9771) to 9748 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.292), width: 16 Scan time: 1.710 The best scores are: opt bits E(33420) CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 ( 672) 4529 954.3 0 CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 ( 664) 2809 595.7 7.2e-170 CCDS30709.2 SLC5A9 gene_id:200010|Hs109|chr1 ( 681) 2532 537.9 1.8e-152 CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 ( 659) 2483 527.7 2.1e-149 CCDS58805.1 SLC5A1 gene_id:6523|Hs109|chr22 ( 537) 2236 476.1 5.7e-134 CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 675) 2230 475.0 1.6e-133 CCDS42275.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 596) 2185 465.5 9.7e-131 CCDS11201.2 SLC5A10 gene_id:125206|Hs109|chr17 ( 612) 2143 456.8 4.3e-128 CCDS44136.1 SLC5A9 gene_id:200010|Hs109|chr1 ( 706) 2136 455.4 1.3e-127 CCDS58439.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 611) 2069 441.3 1.9e-123 CCDS33549.1 SLC5A3 gene_id:6526|Hs109|chr21 ( 718) 2048 437.0 4.5e-122 CCDS58438.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 605) 1625 348.8 1.4e-95 CCDS58437.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 640) 1617 347.1 4.6e-95 CCDS59278.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 569) 1343 289.9 6.7e-78 CCDS59277.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 560) 1299 280.8 3.8e-75 CCDS58440.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 519) 714 158.8 1.9e-38 CCDS74008.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 566) 615 138.1 3.3e-32 CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19 ( 643) 297 71.9 3.3e-12 CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11 ( 618) 288 70.0 1.2e-11 >>CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 (672 aa) initn: 4529 init1: 4529 opt: 4529 Z-score: 5101.6 bits: 954.3 E(33420): 0 Smith-Waterman score: 4529; 100.0% identity (100.0% similar) in 672 aa overlap (1-672:1-672) 10 20 30 40 50 60 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 ELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 NEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 TLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMNEPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMNEPQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 APAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNALLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 APAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNALLM 610 620 630 640 650 660 670 pF1KE2 MAVAVFLWGFYA :::::::::::: CCDS10 MAVAVFLWGFYA 670 >>CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 (664 aa) initn: 2712 init1: 1600 opt: 2809 Z-score: 3163.4 bits: 595.7 E(33420): 7.2e-170 Smith-Waterman score: 2809; 60.4% identity (85.6% similar) in 659 aa overlap (19-672:22-664) 10 20 30 40 50 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL :: : ::: .:. ::..:..::::.: ::::::::.:: CCDS13 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY :::::::::.:::::::::::::::::::::::::.:..::::::: .:..:::::.:.: CCDS13 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS . :::.:::.::::::::.::..:::.:::.::::::::.:.::::.::. ::: :.: . CCDS13 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA .. ::.:: .::.::::::..::::.:: ..: :. :: :.::::::::.....::. : CCDS13 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 TSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSD .. ::. :: ..: :: :: ::.:..: :.:::::::....:..:.. ::::.: CCDS13 PTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 QVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRV ::::::::..:...:.:.:::::::::: :::.:::::::::::: ...::::: :.. CCDS13 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 CGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLR :::.:::.::::: :::.:::::::::::.::::.:::::.:::::.:::::::::...: CCDS13 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 PRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLA ::...::...:::... .. .:.::.:.::.::.::::::::...:::.::..:::.:: CCDS13 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 LFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLF .: :::: ::::::: :::.:..:.: ::..:.:::..:: ::...::::::::::.:: CCDS13 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 FCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAM : . ...:: : ::: ::.:: .:::.::::: ::::.:.. .:.: :. .. CCDS13 AISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEEN-----IQEG-PKETI 540 550 560 570 580 600 610 620 630 640 650 pF1KE2 EMNEPQAPAPS--LFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARV :. : :.: . .::. :::. . :. : .:.:: : .. : :: : : : CCDS13 EI-ETQVPEKKKGIFRRAYDLFCGLEQHGA---PKMTEEEEKAMKMKMTDTSEKPLWRTV 590 600 610 620 630 640 660 670 pF1KE2 VNLNALLMMAVAVFLWGFYA .:.:......:::: ...: CCDS13 LNVNGIILVTVAVFCHAYFA 650 660 >>CCDS30709.2 SLC5A9 gene_id:200010|Hs109|chr1 (681 aa) initn: 2489 init1: 1363 opt: 2532 Z-score: 2851.1 bits: 537.9 E(33420): 1.8e-152 Smith-Waterman score: 2532; 54.2% identity (81.4% similar) in 673 aa overlap (9-672:21-681) 10 20 30 40 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTN .::... .. . . :: :.. ::..::.::.:: :.. CCDS30 MSKELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRAS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 RGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLL :::.:::::::::: :::.::::..::.::: :.::::::::.::::.:::::: ...: CCDS30 RGTIGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 LGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQ :::.:.:::..:::.::::::.:::::.::..:.:::::.::::::::.:.::::.:::. CCDS30 LGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQM 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 ALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSG :::::.: :. :: .: .::..::: :..:::..:: ...::: .:: .:..:: : : CCDS30 ALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE2 LFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSG : ..: : ..:: : .. :. ::::..:.:: ::.::.:::.:..:::... CCDS30 LEQRYRQAIPNVTV---P-----NTTCHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLAT 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 WYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVP : ::.::::::: :..:::.: :.: .: ::::. :::..:::::::: :.::::.:: : CCDS30 WCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDP 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 EVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMD .::.:.::..:::::::::.::. ::: ::::::.::..:::::::.:::::::::::.: CCDS30 DVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTID 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 IYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVS .. :.: .. ..::..:::..:::.::.:. :.:..:....::::::::::.::::::.. CCDS30 VWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPIT 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE2 AVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLY :.:.::.: ::.: ::::::. :: .:: :.: :::. . .: . . :: : :::: CCDS30 ALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLY 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE2 FAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRH---SKEEREDLDA----DEQQGS :::.: .... . :::::.:::...: ::.. :. :. :.: .. .:. .. CCDS30 FAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAG 540 550 560 570 580 590 590 600 610 620 630 pF1KE2 SLPVQNGCPE-SAMEMNEPQAPAPSLFRQCLLWFCGMSRGGVGSPPP-LTQEEAAAAARR :. .: : :.. ...:.::. : . ::::.: :.: :. : :: .. CCDS30 ECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLS----GTPEQALSPAEKAALEQK 600 610 620 630 640 640 650 660 670 pF1KE2 LEDISEDPSWARVVNLNALLMMAVAVFLWGFYA : .: :.: : .: :.::.:..:. .::::..: CCDS30 LTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA 650 660 670 680 >>CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 (659 aa) initn: 2666 init1: 1531 opt: 2483 Z-score: 2796.1 bits: 527.7 E(33420): 2.1e-149 Smith-Waterman score: 2641; 56.5% identity (83.4% similar) in 662 aa overlap (11-672:14-659) 10 20 30 40 50 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL :: . : : ::: ::. :::.:..::::.: .:::::.::.:: CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY :::.:.:::.:::::::::::.:.:::::::::::.:.. :::.. ..:.:::.:.:.: CCDS13 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS . .::.:::.::.:::::.:...:::.::::. . ::.:.:.::.::. ::: ..: . CCDS13 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA .. ::..: .::.:::::...::::.::...: :. ::::.::.::::: .. .::..:. CCDS13 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI :.. ... . ::. :: :: ::.:..: ::::.:::....:. :.. ::::..::: CCDS13 PSVVEGDNLT---ISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVI 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT ::::: ::...:.::.::.:.:::: :::::::::::::::: : :::::: : . ::. CCDS13 VQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA .:::.: ::: .:..:::.:::::::.::::.:::::.:::::.:::::.:.::..: .: CCDS13 DVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV ...:::..::..:....:::..:.:.::..:.:::. : ...::::.::..::::::.: CCDS13 SEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFC 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS :::::::::::. :: ::: :.: ::..:.:::. :: :: ..::::::::.::::: : CCDS13 KRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGS 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMN :.:: .:: : ::: ::.:: . ::.: ::: :.::.:. :. ...: .: . CCDS13 MLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEK--SQEETDDG-----VEED 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 EPQAPAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNA :. : .. :::...: : ::.:: : ...: : :: ::: .::.:: CCDS13 YPEKSRGCL-KKAYDLFCGLQKG-----PKLTKEEEEALSKKLTDTSERPSWRTIVNINA 600 610 620 630 640 660 670 pF1KE2 LLMMAVAVFLWGFYA .:..::.::. :.:: CCDS13 ILLLAVVVFIHGYYA 650 >>CCDS58805.1 SLC5A1 gene_id:6523|Hs109|chr22 (537 aa) initn: 2248 init1: 1600 opt: 2236 Z-score: 2518.9 bits: 476.1 E(33420): 5.7e-134 Smith-Waterman score: 2236; 57.7% identity (84.3% similar) in 553 aa overlap (125-672:1-537) 100 110 120 130 140 150 pF1KE2 VAGFEWNALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTK ::.::::::::.::..:::.:::.:::::: CCDS58 MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK 10 20 30 160 170 180 190 200 210 pF1KE2 ISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACI ::.:.::::.::. ::: :.: ... ::.:: .::.::::::..::::.:: ..: :. : CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI 40 50 60 70 80 90 220 230 240 250 260 270 pF1KE2 LMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVT : :.::::::::.....::. : .. ::. :: ..: :: :: ::.:..: :.: CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLT 100 110 120 130 140 280 290 300 310 320 330 pF1KE2 GDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP ::::::....:..:.. ::::.:::::::::..:...:.:.:::::::::: :::.:::: CCDS58 GDLPWPGFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMP 150 160 170 180 190 200 340 350 360 370 380 390 pF1KE2 GMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALM :::::::: ...::::: :.. :::.:::.::::: :::.:::::::::::.::::.:: CCDS58 GMISRILYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLM 210 220 230 240 250 260 400 410 420 430 440 450 pF1KE2 SSLASIFNSSSTLFTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQ :::.:::::.:::::::::...: ::...::...:::... .. .:.::.:.::.::.:: CCDS58 SSLTSIFNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQ 270 280 290 300 310 320 460 470 480 490 500 510 pF1KE2 LFDYIQAVSSYLAPPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSC ::::::...:::.::..:::.::.: :::: ::::::: :::.:..:.: ::..:.::: CCDS58 LFDYIQSITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSC 330 340 350 360 370 380 520 530 540 550 560 570 pF1KE2 VQPSACPAFLCGVHYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEERE ..:: ::...::::::::::.:: : . ...:: : ::: ::.:: .:::.::::: CCDS58 MEPSNCPTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERI 390 400 410 420 430 440 580 590 600 610 620 pF1KE2 DLDADEQQGSSLPVQNGCPESAMEMNEPQAPAPS--LFRQCLLWFCGMSRGGVGSPPPLT ::::.:.. .:.: :. ..:. : :.: . .::. :::. . :. : .: CCDS58 DLDAEEEN-----IQEG-PKETIEI-ETQVPEKKKGIFRRAYDLFCGLEQHGA---PKMT 450 460 470 480 490 630 640 650 660 670 pF1KE2 QEEAAAAARRLEDISEDPSWARVVNLNALLMMAVAVFLWGFYA .:: : .. : :: : : :.:.:......:::: ...: CCDS58 EEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCHAYFA 500 510 520 530 >>CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 (675 aa) initn: 2244 init1: 1301 opt: 2230 Z-score: 2510.8 bits: 475.0 E(33420): 1.6e-133 Smith-Waterman score: 2281; 49.2% identity (77.4% similar) in 691 aa overlap (1-672:1-675) 10 20 30 40 50 pF1KE2 MEEHTEAGSAPEMGAQKALIDN---PADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL :: : . . :.. :. .. :.:: :.. :::.:..::::: .:.: :: :::: CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDTVKGYFL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY :: .::::::::::::::.:::::.::::.:::.:..:...: :.:: ::.:.:.: :.: CCDS10 AGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPIY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS ... : :::.:::::::: :: . :.:: ::.::::::::::..::.::::.: ..: . CCDS10 IAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYLA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA ...::.:: .:::.:::::..:::..::...: :: ::::.: :::. :: .::. : CCDS10 IVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLAL 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI .: . ::. : : :: :..:..: :.:.:::::..:.:..: : ::::.:::: CCDS10 AS-NRSEN-------SSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVI 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT ::: ::.:.:.: :.: .. .:::. :.:.::.:::.::::.::.:::. ::.:...:.. CCDS10 VQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKICSN 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA :::.::::.::..:.:.::::::.:::.:::::::.:::::.::.::::....::::: CCDS10 PSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV ...::..:::..:...:.::. :.:::::.:::::: :::..:::: :::..::... : CCDS10 SEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMGCFW 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS :.::.:::::::.:::.::.::. .: . . : ::. :... ..:::::...: . CCDS10 KRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILSTVT 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPV-QNGCPESA--- . . ::: : : .. . .:.. ::. ... .: :: . ::: ::.. CCDS10 LITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKE-QAPPAAPLSLTLSQNGMPEASSSS 540 550 560 570 580 590 600 610 620 630 640 pF1KE2 ---MEMNEPQA---------PAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLE .:: . .. : : . .::.::... : .: : : . CCDS10 SVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQEKG-------KEELPARAEAIIV 600 610 620 630 640 650 660 670 pF1KE2 DISEDPSWARVVNLNALLMMAVAVFLWGFYA .. :.: ....: .. .. :.:.::..: CCDS10 SLEENPLVKTLLDVNLIFCVSCAIFIWGYFA 650 660 670 >>CCDS42275.1 SLC5A10 gene_id:125206|Hs109|chr17 (596 aa) initn: 2290 init1: 1277 opt: 2185 Z-score: 2460.8 bits: 465.5 E(33420): 9.7e-131 Smith-Waterman score: 2185; 59.6% identity (84.3% similar) in 527 aa overlap (24-550:19-537) 10 20 30 40 50 60 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::.::..:: : ..::.:: ::..:.::.::::::: CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA .:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:... CCDS42 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA ..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.: CCDS42 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::: .::..:::::..:::..::.... :: :: :: ..:::. : : : : CCDS42 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :.. .. :. :: :..:..: : :::::: .. .::::.. ::::.::::::: CCDS42 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 350 360 pF1KE2 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG :....:.: ::: :: .:::. :: :..::::::: :.::.:.:::: : :.::.::: CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE2 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR :::::::.::..::: ::::::.:::::::::::.::::::::::::::. :::::.:.: CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE2 ELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRV :::::::: .: .. :::::.::.: ...:::: :.:.:.: :::::.:::::..: :. CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE2 NEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLL ::::::::::.::..: .::. :: . : .:.. :: : ..:::.::..:: :: . CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV 470 480 490 500 510 520 550 560 570 580 590 600 pF1KE2 TLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMNEPQ ... :: : : CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV 530 540 550 560 570 580 >>CCDS11201.2 SLC5A10 gene_id:125206|Hs109|chr17 (612 aa) initn: 2246 init1: 921 opt: 2143 Z-score: 2413.3 bits: 456.8 E(33420): 4.3e-128 Smith-Waterman score: 2143; 57.8% identity (81.8% similar) in 543 aa overlap (24-550:19-553) 10 20 30 40 50 60 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::.::..:: : ..::.:: ::..:.::.::::::: CCDS11 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA .:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:... CCDS11 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA ..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.: CCDS11 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::: .::..:::::..:::..::.... :: :: :: ..:::. : : : : CCDS11 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :.. .. :. :: :..:..: : :::::: .. .::::.. ::::.::::::: CCDS11 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 pF1KE2 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYP----------------DEVA :....:.: ::: :: .:::. :: :..::::::: :.: :.:. CCDS11 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPGAHVYEERHQVSVSRTDDVG 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE2 CVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTL :::: : :.::.::::::::::.::..::: ::::::.:::::::::::.::::::::: CCDS11 CVVPSECLRACGAEVGCSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTL 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE2 FTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLA :::::. :::::.:.::::::::: .: .. :::::.::.: ...:::: :.:.:.: :: CCDS11 FTMDIWRRLRPRSGERELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLA 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE2 PPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGV :::.:::::..: :.::::::::::.::..: .::. :: . : .:.. :: : .. CCDS11 PPVTAVFVLGVFWRRANEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSI 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE2 HYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLP :::.::..:: :: .... :: : : CCDS11 HYLHFAVALFALSGAVVVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHA 530 540 550 560 570 580 >>CCDS44136.1 SLC5A9 gene_id:200010|Hs109|chr1 (706 aa) initn: 2475 init1: 1363 opt: 2136 Z-score: 2404.6 bits: 455.4 E(33420): 1.3e-127 Smith-Waterman score: 2472; 52.3% identity (78.5% similar) in 698 aa overlap (9-672:21-706) 10 20 30 40 pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTN .::... .. . . :: :.. ::..::.::.:: :.. CCDS44 MSKELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRAS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 RGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWN------- :::.:::::::::: :::.::::..::.::: :.::::::::.::::.::::: CCDS44 RGTIGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSG 70 80 90 100 110 120 110 120 130 140 pF1KE2 ------------------ALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLS : ...: :::.:.:::..:::.::::::.:::::.::..:.: CCDS44 GDRGIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMS 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE2 VLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTV ::::.::::::::.:.::::.:::.:::::.: :. :: .: .::..::: :..:::.. CCDS44 VLSLILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDAL 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE2 QTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSY :: ...::: .:: .:..:: : :: ..: : ..:: : .. :. ::::.. CCDS44 QTVIMVGGALVLMFLGFQDVGWYPGLEQRYRQAIPNVTV---P-----NTTCHLPRPDAF 250 260 270 280 290 270 280 290 300 310 320 pF1KE2 HLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLT :.:: ::.::.:::.:..:::... : ::.::::::: :..:::.: :.: .: ::::. CCDS44 HILRDPVSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKIL 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE2 PMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLML :::..:::::::: :.::::.:: :.::.:.::..:::::::::.::. ::: ::::::. CCDS44 PMFFIVMPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMI 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE2 AVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPV ::..:::::::.:::::::::::.:.. :.: .. ..::..:::..:::.::.:. :.:. CCDS44 AVIMAALMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPI 420 430 440 450 460 470 450 460 470 480 490 500 pF1KE2 VQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPE .:....::::::::::.::::::..:.:.::.: ::.: ::::::. :: .:: :.: : CCDS44 IQSSNSGQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILE 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE2 FSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSL ::. . .: . . :: : :::::::.: .... . :::::.:::...: ::.. CCDS44 FSYPAPACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWT 540 550 560 570 580 590 570 580 590 600 610 pF1KE2 RH---SKEEREDLDA----DEQQGSSLPVQNGCPE-SAMEMNEPQAPAPSLFRQCLLWFC :. :. :.: .. .:. .. :. .: : :.. ...:.::. : . ::: CCDS44 RNCPLSELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFC 600 610 620 630 640 650 620 630 640 650 660 670 pF1KE2 GMSRGGVGSPPP-LTQEEAAAAARRLEDISEDPSWARVVNLNALLMMAVAVFLWGFYA :.: :.: :. : :: ..: .: :.: : .: :.::.:..:. .::::..: CCDS44 GLS----GTPEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA 660 670 680 690 700 >>CCDS58439.1 SLC5A11 gene_id:115584|Hs109|chr16 (611 aa) initn: 2092 init1: 1301 opt: 2069 Z-score: 2330.0 bits: 441.3 E(33420): 1.9e-123 Smith-Waterman score: 2120; 49.8% identity (78.3% similar) in 627 aa overlap (62-672:1-611) 40 50 60 70 80 90 pF1KE2 YFLLVIGVGLWSMCRTNRGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAAS ::::::::::::::.:::::.::::.:::. CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT 10 20 30 100 110 120 130 140 150 pF1KE2 GLAVAGFEWNALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYI :..:...: :.:: ::.:.:.: :.:... : :::.:::::::: :: . :.:: ::.:: CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE2 FTKISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGG ::::::::..::.::::.: ..: ....::.:: .:::.:::::..:::..::...: : CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE2 ACILMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVT : ::::.: :::. :: .::. : .: . ::. : : :: :..:..: :.: CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-NRSEN-------SSCGLPREDAFHIFRDPLT 160 170 180 190 200 280 290 300 310 320 330 pF1KE2 GDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP .:::::..:.:..: : ::::.::::::: ::.:.:.: :.: .. .:::. :.:.::.: CCDS58 SDLPWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFP 210 220 230 240 250 260 340 350 360 370 380 390 pF1KE2 GMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALM ::.::::.::.:::. ::.:...:.. :::.::::.::..:.:.::::::.:::.:::: CCDS58 GMVSRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALM 270 280 290 300 310 320 400 410 420 430 440 450 pF1KE2 SSLASIFNSSSTLFTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQ :::.:::::.::.::::....:::::...::..:::..:...:.::. :.:::::.:::: CCDS58 SSLTSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQ 330 340 350 360 370 380 460 470 480 490 500 510 pF1KE2 LFDYIQAVSSYLAPPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSC :: :::..:::: :::..::... : :.::.:::::::.:::.::.::. .: . . : CCDS58 LFIYIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRC 390 400 410 420 430 440 520 530 540 550 560 570 pF1KE2 VQPSACPAFLCGVHYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEERE ::. :... ..:::::...: . . . ::: : : .. . .:.. ::. .. CCDS58 DQPDERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQK 450 460 470 480 490 500 580 590 600 610 pF1KE2 DLDADEQQGSSLPV-QNGCPESA------MEMNEPQA---------PAPSLFRQCLLWFC . .: :: . ::: ::.. .:: . .. : : . .::.: CCDS58 E-QAPPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLC 510 520 530 540 550 560 620 630 640 650 660 670 pF1KE2 GMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNALLMMAVAVFLWGFYA :... : .: : : . .. :.: ....: .. .. :.:.::..: CCDS58 GIQEKG-------KEELPARAEAIIVSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA 570 580 590 600 610 672 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Dec 9 23:15:36 2018 done: Sun Dec 9 23:15:36 2018 Total Scan time: 1.710 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]